晶片作為半導體行業的核心產物,可以說是整個資訊時代發展的基礎,在人們衣食住行越來越數字化升級的今天,小到工作使用的手機和筆記本,家庭用到的路由器、冰箱、空調、電視,大到交通路網的訊號燈系統、車輛的控制系統,都離不開晶片這個“大腦”,透過接收資訊和發出指令,維持著整個系統的正常運轉。
在雲計算領域,尤其是混合雲場景所依賴的通用伺服器市場,同時存在著X86、ARM、RISC-V、MIPS等多種不同指令集型別的晶片,這就讓希望上雲和在雲上的企業主們犯了難,自己機房裡已經有了很多X86架構的伺服器,未來擴容或新增某些產品時還能不能引入新的晶片架構?企業改變晶片路線只能放棄原有的伺服器資產?
一些雲廠商給出的方案是將每一種型別的晶片叢集都單獨建雲,在形成多雲後透過雲管理平臺從軟體層面進行統一管理。看似是透過多雲協作解決了不同晶片架構的問題,但仔細思考下會發現仍然有很多需求無法滿足,例如:多朵雲分資源池化後難以進行資源統一排程,無法充分地利用到不同業務的峰值和低谷來進行彈性,建多雲、或多個AZ對客戶的機房規劃、建設預算等都有一定要求,多雲的方案並不能解決所有的問題。
除此之外多朵雲還會導致運維複雜,包括部署、升級和擴容等需要單獨管理,運維管理成本高,租戶操作體驗差。
針對上述這些痛點,阿里雲混合雲給出了“一雲多芯”的答案。針對客戶業務特點及業務發展規劃,提供不同維度的混部能力滿足客戶“多芯”需求。
什麼是一雲多芯?
所謂一雲多芯是指用一套雲作業系統來管理不同架構的硬體伺服器叢集,飛天雲作業系統可以將伺服器晶片等硬體封裝成標準算力,無論底層是X86與ARM的並存、ARM不同廠商架構間並存、亦或是計算節點與儲存節點不同晶片架構並存,都能給客戶提供體驗一致的雲計算服務。簡單來說,就是從根本上解決不同型別晶片共存所帶來的多雲管理問題,真正形成一朵雲,最大限度利用雲上資源池的強大算力。
一雲多芯主要適用的場景有如下兩個:
- 新建雲平臺時為了滿足合規要求,企業進行強管控規避與單一晶片進行繫結,需要在單機房使用兩種及以上型別晶片,或一雲多Region下主Region和單元Region使用不同型別晶片;
- 已有云平臺擴容,滿足業務規模增長或新業務上雲的需求,需要在雲平臺擴容新的產品,或者已有的雲產品進行擴容,無論是新增產品還是已有產品擴容都可以使用不同晶片;擴容另外一個單元Region與已有云平臺形成多Region架構,或者容災AZ與已有云平臺形成同城容災架構,都支援使用不同的晶片。
一雲多芯提供哪些能力?
針對客戶不同的業務場景,以不同粒度(產品單叢集、產品多叢集、AZ、Region、雲)劃分不同層次的混部能力,提供一雲多芯的全棧混合雲產品,在功能、效能、可靠性、安全性等使用體驗一致的前提下,釋放異構多元算力。
在單機房場景中,支援從產品間、產品叢集內、產品多叢集的混布。
1. 產品間混布:一朵雲內,可支援將不同產品部署在不同的晶片上,例如根據業務需求可以在OSS和RDS等雲產品上分別部署不同型別晶片;
2. 多叢集混布:一個產品如果有多個叢集,可支援不同叢集部署在不同的晶片上,使用者使用/建立資源時可以選擇不同的晶片叢集;
3. 叢集內混布:叢集內支援部署在不同的晶片上,由系統自動排程,租戶無需感知硬體型別,更易於管理或者業務擴容。
在多機房場景中,針對典型的一雲多Region場景和同城容災場景提供支撐。
1. 多Region混部:主Region和單元Region選擇不同的晶片進行部署,適合在多個地區有分公司的集團型或大型企業;
2. 多可用區混部:多個可用區支援使用不同晶片建設,組建同城容災混部,每個可用區可以部署一種晶片,是業界首家實現一雲多Region的多叢集的複雜場景的混布。
除混布能力外,對於一雲多芯的雲平臺來講,環境底層硬體、上層作業系統和軟體都是異構多樣化的,期間任何一個環節的細小問題,都可能影響一雲多芯生產環境使用,如何做到正確識別、有效管理,進而達成高效協同是相當大的挑戰。為了尋求在穩定性與效能間的最佳平衡,阿里雲混合雲團隊堅持從底層到上層的各項功能除錯最佳化,專業保障前期驗證適配工作,使生產環境可以快速就緒。
結語
隨著今年雲棲大會現場平頭哥的自研雲晶片倚天710釋出,以及眾多新興廠商的晶片釋出,將有越來越多的型別晶片進入到主流市場,“多芯”的架構將在資料中心中越來越常見,阿里雲混合雲在安全和穩定的基礎上,將“多芯”的差異轉變為“一雲”的標準化雲服務,助力企業業務跑的更快、更穩。
阿里雲混合雲(Apsara Stack)建管用一體化的混合雲平臺,助力企業級客戶全棧建雲、智慧管雲、極致用雲,致力於成為 #政企數智創新的同行者#