中國農業銀行骨幹網技術架構升級大致歷經了三個階段,從LDP MPLS到SR-MPLS,再到現在的SRv6 Policy,整個骨幹網實現了閉環的SRv6 Policy SD-WAN架構,透過統一的IPv6資料平面承載全行業務流量,同時支援總行間、總分間多維度的智慧流量排程,顯著提升了骨幹網的品質和服務水平。
但隨著越來越多的應用集中部署在總行雲計算環境中,比如新郵件、公文、網路學院等,一級分行訪問這些系統時會大量佔用一級骨幹網的頻寬,每家分行僅透過雙線上聯總行,無論是頻寬容量還是線路冗餘度都面臨嚴峻的挑戰,因此農行啟動了一級骨幹網“二變三”的架構最佳化工程,引入第三家運營商和線路,充分利用骨幹網SRv6 Policy的智慧排程能力,將業務流量均衡分佈在三條線路上,並大幅提升了一級骨幹網的災備能力。
總體拓撲
農行骨幹網分為“核心”和“一級”兩層,核心骨幹網由ABC三個總行節點組成,一級骨幹網由數十個與一級分行對應的節點組成,隨著“二變三”專案的順利收官,實現了每個一級節點“三線三運營商”上聯三核心節點的高度冗餘架構,總體拓撲如圖1所示。
由於三條線分屬於三家運營商,並連線不同的核心節點,因此能自如應對線路級、運營商級、園區級的各種災難,確保分行使用者的業務訪問連續性。
架構升級
骨幹網全面部署SRv6 Policy以後,形成了Underlay+Overlay的兩層網路架構,Underlay對應物理組網結構,由節點和鏈路組成,Overlay對應邏輯組網結構,由SRv6 Policy隧道和VPN組成,上下兩層是完全解耦的,中間透過基於意圖Color的自動引流技術將業務流量對映到合適的SRv6 Policy上,並由Underlay網路根據SRv6 Policy攜帶的路徑資訊逐跳轉發,如圖2所示。
一級骨幹網“二變三”最佳化主要涉及Underlay層面,基本上不影響SRv6 Policy策略,更無關VPN,但還是要考慮SRv6 Policy與底層鏈路的對映關係,也就是鏈路的管理組引數設定,具體如圖3所示。
分行至核心節點A和節點B鏈路的管理組分別為X、Y,為了保護分行至核心節點B的關鍵生產業務頻寬,分行至核心節點A的SRv6 Policy的親和屬性設定為排除管理組=Y的鏈路,避免流量排程到核心節點B的線路上,但故障逃生場景例外。同時透過鏈路管理組染色,還可以將總行間SRv6 Policy流量限制在核心骨幹網內,否則會嚴重影響一級分行線路安全。增加分行至核心節點C的線路後,新鏈路的管理組設定為X,這樣分行至核心節點A、B的流量都有機會排程到該鏈路上,可以明顯緩解核心節點A線路的流量壓力。
調優策略
一級骨幹網升級為三線結構後,正常情況下分行至三個核心的SRv6 Policy都優選最短路徑,也就是直連的廣域網線路,下面分閾值調優和故障調優兩個場景介紹一級骨幹網的調優策略。
閾值調優,假設分行至核心節點A的鏈路利用率超閾值,便會觸發控制器的定期全域性調優計算,以降低利用率至閾值範圍內為目標,結合頻寬和親和屬性等約束條件,計算結果為分裂出經過核心節點C的分段列表,業務流量以UCMP非等價負載均衡方式雜湊到兩條轉發路徑上,控制器還會定期檢查原鏈路是否具備路徑回收的條件,防止業務流量長時間迂迴,具體如圖4所示。
故障調優,假設分行至核心節點A的線路中斷,首先會觸發路由器本地的TI-LFA拓撲無關快速重路由,將分行至核心節點A的SRv6 Policy報文切換至核心節點C轉發,然後路由器的SRv6 Policy頭端檢測功能生效,將分行至核心節點A的業務流量切換至SRv6 BE轉發,最後控制器透過BGP-LS獲悉鏈路故障,進行故障調優計算,將路徑更新為分行-核心節點C-核心節點A,整個過程不超過3秒鐘,業務基本無感知,故障恢復後過程同全域性調優,具體如圖5所示。
總結展望
一級骨幹網架構最佳化後,兼顧多線冗餘和流量排程,最大程度發揮了骨幹網IPv6+1.0技術底座的價值,並初步嘗試了華為iFit隨流檢測技術,體驗了IPv6+2.0技術的魅力。未來的網路規劃建設過程中,還要進一步研究利用網路切片、iFit等更高階的IPv6+技術,打造集智慧排程、流量可視、輔助決策於一體的全功能IPv6+骨幹承載網,為全行業務提供統一融合、靈活安全、智慧穩固的網路平臺。
文 / 中國農業銀行資料中心專家 許青邦
中國農業銀行資料中心資深專員 馬超