簡介:1月11日,在上海的雲原生實戰峰會上,阿里雲智慧研究員丁宇釋出了“應用多活技術白皮書”,同時為了推動業界容災的發展,建立雲原生業務容災標準,阿里雲開源了“應用多活”專案AppActive。
1月11日,在上海的雲原生實戰峰會上,阿里雲智慧研究員丁宇釋出了“應用多活技術白皮書”,同時為了推動業界容災的發展,建立雲原生業務容災標準,阿里雲開源了“應用多活”專案AppActive。
至此,阿里雲已經發布了Sentinel、ChaosBlade、AppActive三款高可用開源產品,致力於助力行業落地安全生產實踐,幫助企業構建高可用的企業級生產系統,提高企業面對容災、容錯、容量等問題的穩態系統建設能力。
為什麼釋出應用多活技術白皮書和開源AppActive
2021年,國內外多家知名公司、雲平臺出現較嚴重服務中斷、宕機事件。這也為企業敲響警鐘,越來越多的企業把容災建設提上日程。在解決容災問題的同時,為了保持對成本的控制、支撐未來的多雲架構演進和災難容災的確定性,許多企業選擇以多活容災的方式進行嘗試。
但是業內對於多活沒有統一的認知,對於“多活”這個詞不同企業有不同的定義,很多企業往往以為已經實現了“多活”,可當故障來臨的時候,才發現當前系統的故障逃逸能力非常弱,業務恢復和故障定位無法解耦,拖累了企業生產,造成了外部輿情、資金損失等問題;另外,有的企業在瞭解“多活”之後,下意識想要企業內部先投入資源進行技術預演,但由於缺少經驗,往往會造成人力物力等資源的重複浪費。 隨著雲原生技術發展,越來越多的客戶採用雲原生技術進行系統構建。如何在雲原生上構建穩定高可用的系統,是一個核心挑戰。“多活”的認知偏差會加劇企業在基礎設施成本、應用改造成本、運維成本等成本面的投入,但存在效率低下、錯用甚至無用或者不用的問題,從而享受不到“多活”帶來的穩定性紅利。因此“多活”需要一個相對統一的標準與認知,加深使用者對它的理解和使用,從而提高業務系統的穩定性。
在當前雲原生髮展的現狀和市場認知下,我們認為應用多活的開源和解讀,可以初步定義“多活”的標準和實現,幫助開發者形成統一的“多活”認知。在企業構建多活架構時,基於應用多活共享已有的成熟經驗,避免多餘的資源浪費。同時,不同的企業具備不同的業務場景和優勢,反向推動應用多活進一步完善和演進成熟的多活形態及能力。我們希望依靠社群的力量,讓“多活”成為一項事實意義的普惠技術,而不是望而卻步的部分人可用技術,幫助更多的企業和個人構建生產級別的高可用架構。
應用多活在架構中的標準設計
在解決企業流量路由一致性、資料讀寫一致性、多活運維一致性等問題的同時,逐步衍生了一套“多活”的衡量標準,應用多活架構的標準架構,需要滿足以下4個設計標準:
l 業務流量多活(BFA,Business Flow Active):應用多活的最終呈現是業務,多活容災系統具備按照業務特徵進行生產流量的精細化調配;
l 同城多活(LRA,Local Region Active):應用是分散式系統的最小服務集合,當主中心出現問題進入容災態時,要具備全域性或區域性應用的多活切換能力;
l 異地多活(UDA,Ultra Distance Active):在超遠距離(機房間距超過300公里)時,業務系統仍具備較好的訪問效能。進入容災態時,RTO、RPO在分鐘級;
l 混合雲多活(HCA,Hybrid Cloud Active):向上對業務遮蔽容災細節,提供統一的多活程式設計正規化。向下對雲平臺技術保持相容,支援公有云、私有云、託管私有云、邊緣計算節點等不同部署模式的多活場景。
圖 應用多活架構設計標準
應用多活的技術能力
遵循應用多活的設計標準,AppActive分別從應用層、資料層和雲平臺三部分元件支撐應用構建應用多活的架構能力。
應用層是業務應用流量主經的鏈路,基本構成可分為三部分:
l 接入閘道器。接入閘道器作為業務流量打入機房的第一跳,負責應用多活入口流量的識別和分發,具備機房路由和應用路由兩個核心能力;
l 微服務。業務流量在機房內部和跨機房的同步呼叫方式,一般有 Consumer、Provider、註冊中心等角色,具備流量路由、流量保護、故障隔離三個核心能力;
l 訊息。業務流量在機房內部和跨機房的非同步呼叫方式,基於訊息削峰填谷,一般有Producer、Consumer、Broker等角色。
資料層涵蓋業務應用資料讀寫、資料儲存和資料同步,其具備流量路由、資料一致性保護、資料同步三個核心能力。
雲平臺是支撐業務應用執行的核心基石,基本構成覆蓋單雲、單機房、多雲、混合雲等形態。
圖 應用多活的整體技術方案
應用多活的價值
容災:分鐘級 RTO ,“業務恢復時間”和“故障恢復時間”解耦,在優先業務恢復的前提下,進行故障定位修復。
圖 應用多活應對的6大災難故障
容量:突破地域限制,在路由一致性和資料一致性的基礎上,支援跨地域的叢集拆分和靈活流量排程
創新:依託於應用多活,企業可以擴展出全域變更強管控、全域故障演練、重點流量保障等多種穩定效能力。
是不是想要探尋更多關於“應用多活”技術的解讀呢?更多精彩,歡迎下載閱讀 >>點選此處免費下載《應用多活技術白皮書》!<<
AppActive開源討論群(釘釘群號):34222602
阿里雲多活容災MSHA 交流群(釘釘群號):31623894
AppActive Github地址:https://github.com/alibaba/Appactive
版權宣告:本文內容由阿里雲實名註冊使用者自發貢獻,版權歸原作者所有,阿里雲開發者社群不擁有其著作權,亦不承擔相應法律責任。具體規則請檢視《阿里雲開發者社群使用者服務協議》和《阿里雲開發者社群智慧財產權保護指引》。如果您發現本社群中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社群將立刻刪除涉嫌侵權內容。