12月19—20日,由鵬城實驗室和新一代人工智慧產業技術創新戰略聯盟主辦的“2021新一代人工智慧院士高峰論壇暨啟智開發者大會”在深圳舉辦,期間,華為技術有限公司承辦的新一代人工智慧院士高峰論壇昇騰人工智慧應用專場於20日成功舉行。深耕基礎,厚植技術。近年來,華為昇騰以“硬體開放、軟體開源、使能夥伴、發展人才”16字方針不斷髮展產業,攜手各行各業的開發者們進行賦能升級,助推人工智慧的應用落地。本次昇騰人工智慧應用專場,華為更是邀請了多位昇騰技術專家,從一線的AI應用挑戰出發,與開發者們研討交流,共創機遇。
與開發者共成長,共築AI技術生態
會上,華為昇騰生態首席專家張存燕以行業的人才培養為切入點,向大家分享了昇騰面向開發者們的offering發展戰略,以及面向行業、高校、初創、個人不同型別開發者的權益和計劃。張存燕介紹到,華為深耕根技術,一直致力於打破算力消耗的鴻溝。在昇騰基礎軟硬體平臺上,昇騰一共打造了技術和商業兩個生態。技術生態為科研機構、高校、企業、合作伙伴的研發人員提供技術支撐,加速科研創新;商業生態則注重與合作伙伴一起打造面向各行各業的解決方案,真正讓AI走入到千行百業,賦能各個產業的智慧化改造和智慧化升級。
在這兩個生態的帶動下,昇騰希望打造一個人工智慧的“黑土地”,合力為每位AI開發者及每個行業的應用開發者提供強大引擎,共同繁榮國內人工智慧產業新生態。
構築澎湃AI算力,CANN5.0效能再提升
在洶湧的AI時代浪潮中,人工智慧技術領域無疑面臨著重重困難和挑戰。AI算力設施昂貴、專業人才稀缺,整個行業對計算效率和程式設計易用性的訴求愈發強烈。昇騰CANN運營總監田曉亮便從新計算正規化出現、異構計算興起和大叢集等行業新挑戰引導發問,介紹了CANN的基礎架構及其適配場景。自2018年CANN1.0釋出面世,經過三年發展,CANN在技術和生態上都已經有了長足的進步。在效能方面,CANN5.0透過軟硬體結合最佳化,充分發揮了昇騰晶片的算力效能。這主要源自於多項關鍵技術的突破,如自動流水、運算元深度融合、自適應梯度切分、智慧計算調優帶來的更高效的任務角度和切分策略。
在發展過程中,CANN還非常注重生態發展,透過社群運作,CANN不斷創新最佳化,迭代出了新的產業、新的軟體。回應開發者訴求、助力解決行業困境,CANN未來將持續在基礎和關鍵技術上進行突破,“只有基礎打得牢、根扎得深,才會有人工智慧的繁榮發展”,田曉亮這樣強調。
全場景AI計算框架,MindSpore超大模型訓練落地實踐
近段時間,中文大規模預訓練語言模型層出不窮,已經成長到僅載入就需要TB級記憶體或視訊記憶體的生態。昇思MindSpore架構師ZOMI醬就針對MindSpore超大模型訓練的一些關鍵技術,進行了一些稍為“硬核”的內容分享。MindSpore在2020年3月份開始開源,到現在的1.5版本,總下載量已經接近100萬。快速部署、靈活除錯,現在的MindSpore已經能夠支撐像鵬城盤古NLP、鵬城神農氨基酸序列生成、華為雲NLP模型、紫東太初多模態模型這樣的千億大模型。對於大模型面臨的“記憶體、效能、效率、調優”挑戰,MindSpore則分別對應給出了圖算融合、Scale out、叢集調優等解決方案。
講起核心技術,ZOMI醬表示,除了透過圖的編譯把多維度並行融合到框架,“多維度混合自動並行”是MindSpore做得比較好的地方。現今,MindSpore自動並行已經實現5維的並行方式,實現對超大規模的分散式訓練及超大規模中文預訓練模型的探索。
MxIndex: 更快、更便捷、更友好的資料檢索SDK
將物理世界中的非結構化資料,如圖片、影片、音訊透過AI模型轉換為特徵,是眾多AI業務的核心邏輯。昇騰MindX技術專家李明舉在給大家介紹資料檢索的SDK時,就用簡單的語言闡釋了普通開發者如何用AI來解決生活中的問題。讓AI從學術成果到產業落地,昇騰MindX總結了三座問題大山——演算法開發難、應用開發難和業務部署難,而MindX的四個元件“ MindX DL”“ MindX Edge”“MindX Zoo”和“MindX SDK”則對應這三座大山給出瞭解決方案。
“大資料”“區塊鏈”“元宇宙”,各行各業的概念正潛移默化地改變著我們的生活,昇騰MindX SDK mxIndex更是將目光聚焦在了非結構化資料上。李明舉提到,非結構化資料有著非常多潛在的發展空間,在推薦系統、資料探勘等領域都有良好的發展前景。但同時,機遇與挑戰並存,演算法問題常常會演化成更大的工程問題,如何在如此多的技術之下去搭建業務,mxIndex在這裡給出了答卷。“更快”——帶來更高的QPS,更大的吞吐量和更大的底庫資料規模;“更便捷”——昇騰擁有開源中最受歡迎的框架之一,而mxIndex在使用者遷移上更是兼具了輕體量與便捷性兩項優點;“更友好”——清晰操作、線上交流,在使用者體驗上,mxIndex擁有簡明的介面定義,豐富詳實的手冊和活躍的社群支援。對於大規模特徵檢索或聚類的應用場景需求,mxIndex能夠提供極簡易用、高效能的API,助力昇騰AI處理器賦能各類應用。
Sedna,分散式協同AI框架
邊緣AI在如今的工業網際網路、智慧園區等場景已有著越來越多的應用,但同時還存在著諸多挑戰,包括軟硬體異構、邊緣資源受損、邊緣資料異構、邊緣小樣本和隱私安全等常見問題。會上,華為雲邊緣雲創新Lab高階工程師普傑從應用的角度,向開發者們介紹了華為雲在邊緣計算尤其是邊雲協同AI領域的相關探索。
2018年,華為雲開源了邊緣計算平臺專案KubeEdge。作為業界首個雲原生的邊緣計算平臺,KubeEdge透過開放的社群治理連線雲原生和邊緣計算生態,旨在提供應用協同、資源協同以及資料協同和裝置協同的統一標準。
在邊緣計算場景中,AI應用需要面對個性化的邊緣場景,資源碎片化、資料異構、小樣本、資料隱私等問題急需解決。2020年底,KubeEdge社群成立了特別興趣小組SIG AI,聚焦邊緣AI相關的技術討論、API定義、參考架構、開源實現等,使能AI應用在邊緣更好的執行。
2021年初,華為雲進一步開源了邊雲協同AI框架Sedna,基於KubeEdge,實現邊與雲的協同推理、增量學習、終身學習、聯邦學習等核心邊緣AI能力,能有效提升模型準確度,降低邊緣資源的消耗,保護資料隱私和安全。
普傑提到,Sedna不是想做一個TensorFlow這樣的框架,而是基於KubeEdge提供的邊雲協同的能力,支援現有的AI應用無縫地下沉到邊緣,降低邊雲協同AI應用的構建和部署成本、提升模型的效能並保護資料隱私。
相比傳統的公有云AI方式,分散式協同AI具備個性化的邊緣場景、更低的響應延遲和更安全的資料隱私保護三大優點。在分散式協同AI領域的探索上,Sedna也遇到了資源碎片化、樣本少的技術挑戰,KubeEdge社群的特別興趣小組SIG AI也因此成立。普傑提到,SIG AI不是想做一個TensorFlow這樣的框架,而是基於KubeEdge這樣的底座提供邊緣協同的能力,支援現有的AI類應用,無縫地下沉到邊緣,降低構建和部署成本、提升模型的效能並保護資料隱私。
現場實操,線上體驗昇騰全棧AI魔力
當天下午,昇騰人工智慧應用專場進行了豐富有趣的案例分享和線上實驗。現場由昇騰CANN資深技術專家毛紅朝、昇騰MindX研發專家陳航、昇思MindSpore資深技術專家xavier和昇騰CANN資深技術專家鄭佳帶領,為開發者們帶來了“基於昇騰CANN的AI應用開發”、“使用MindX SDK開發智慧質檢應用”、“昇思MindSpore YOLO案例開發到部署介紹”和“基於昇騰CANN的模型遷移”四場實操課程。
共築AI新高地,共贏智慧新未來。伴隨著驚喜有趣的現場抽獎環節,開發者們於實踐中全方位感受華為面向“端、邊、雲”的全場景AI基礎設施方案,線上體驗來自昇騰的全棧AI魔力。
鳳凰網廣東 李冬秀