【雷峰網】2021年12月9日-2021年12月11日,2021第六屆全球人工智慧大會(GAIR 2021)於深圳開幕。本屆大會由粵港澳大灣區人工智慧與機器人聯合會、雷峰網聯合主辦,深圳市人工智慧與機器人研究院、深圳市機器人協會、深圳市人工智慧學會支援。
作為中國最具影響力和前瞻性的前沿科技活動之一, GAIR 大會已經度過了五次精彩而又輝煌的歷程。
大會第二天,以《直面數據安全風險和挑戰;挖掘隱私計算的100%可為》為主題的“資料安全與隱私計算”分論壇吸引了來自全國各地的專家、學者、企業家、投資人等,大家齊聚一堂共話新時代下“資料安全與隱私計算”的當下與未來。
其中同盾科技合夥人兼人工智慧研究院院長、中科院醫學所首席教授李曉林帶來了題為「知識聯邦——打造基於隱私計算的共享智慧平臺」的精彩演講。演講要點可概括為以下幾個方面:
- 政策法規對於資料安全和隱私保護的合規性要求進一步加劇了資料孤島效應,成為資料共享瓶頸。資料的價值沒有充分發揮。資料也同樣有時間價值,要實現價值就必須透過時間和空間上安全合規的流通。
- 實現知識的共享互通機制來充分發揮資料的價值,首要問題是保障一致性。包括資料、內容一致性和連線上的一致性。
- 為了真正實現打破資料孤島,同盾科技打造了基於隱私計算的開放共享平臺。核心是智邦平臺iBond,下層是智邦的核心iCore。
- 知識聯邦是一個統一的多層次框架,從資訊層、模型層、認知層到認知層,融合了多種安全多方功能,比如基於資料安全交換協議FLEX等等,有效利用多個參與方的協議標準,真正實現資料可用不可見,知識共創和共享。
- 打造全面互聯互通參考模型FIRM模型。這是一個多層次的互聯互通參考模型,把互聯互通分為五個層次,包括平臺層、通訊層、資料交換層、演算法層、應用層。
- 基於知識聯邦的理論框架、互聯互通的FIRM模型、智邦平臺iBond的支撐,近一步打通資料流通,那麼無論是資料的提供方、使用方還是應用開發者、提供方或使用方,都可以在上面釋出資料、應用模型。使用者可以按使用付費,實現價值變現。
- 同盾科技的目標是想為中國在下一代可信AI引領全球的道路上作出貢獻。
同盾科技合夥人兼人工智慧研究院院長、中科院醫學所首席教授李曉林
以下是李曉林演講全文,雷峰網做了不改變原意的整理與編輯:
大家好,我是李曉林,來自同盾科技,今天我分享的主題是“知識聯邦——打造基於隱私計算的共享智慧平臺”。我將從建設這個平臺的行業背景、平臺的架構、平臺的理論框架和平臺的應用幾個層面逐一展開解釋。
資料隱私保護已成為各界的關注重點,尤其從最近推出的一系列的法律法規,比如《資料安全法》、《個人資訊保護法》等中可以體現。對於資料安全和隱私保護的合規性要求進一步加劇了資料孤島效應,成為資料共享瓶頸。同時,國家也把資料作為一個重要的新型生產要素,提升到了國家戰略級別。保護資料和資料共享有一定的衝突。資料作為一種生產要素和其他生產要素有很大區別,比如容易失控,保護更難,而且資料的複製幾乎是零成本。目前資料共享的程度比較低,資料生命力在各個孤島上面,價值沒有充分發揮。
我們說資料是新型“石油”或者新型“貨品”,金融的價值是空間和時間上的流通,從銀行貸款是把錢從銀行轉到你的口袋裡,你用貸款來的錢做一些事情,未來再返還回去,是要付出代價的,今年的價值和未來一年後的價值是有時間差別的。資料也同樣有時間價值,要實現價值就必須透過時間和空間上的安全合規的流通。比如說電力系統有很多用電的資料,這些資料是用來收費的,資料價值有用但比較有限。如果我們把它的資料價值充分發揮出來,用來做企業信用分析,比如對企業經營狀況的判斷和參考,價值就非常大了,而且資料價值是有時間差別的,去年的企業用電量和今年的企業用電量這一資料價值是不一樣的。
為了保護資料隱私,還要發揮資料價值,實現資料的安全合規流通。我們已經知道業界推出了一系列的隱私計算技術手段,例如多方安全計算(MPC)、聯邦學習(FL)、可信執行環境(TEE)等等,透過打破資料孤島來增強資料的流通價值。而與此同時,隨著各家隱私計算平臺的推出,每個平臺也是孤立的,又形成了新的資料群島。此時就迫切需要打破平臺之間群島的壁壘。
要真正實現知識的共享互通機制,從而來充分發揮資料的價值,首要問題是保障一致性。一致性包括兩個方面,一個方面是連線上的一致性,另一方面是資料、內容的一致性。連線上的一致性包括任務一致和同時啟動,同時做同一個任務,計算節點一致、狀態一致。流通內容包括引數、演算法、模型,加密的流程、手段、順序等都要一致,以及日誌一致,以方便監管。
為了真正實現打破資料孤島、資料群島,我們打造了基於隱私計算的開放共享平臺。核心是智邦平臺iBond,下層是智邦的核心iCore。這一整套系統是基於雲原生的平臺,目前有一系列的元件,包括管理資料市場i-data、管理應用市場SAFE和資料沙箱FORT,管理演算法市場Caffeine、資料安全流通機制FLEX協議,以及聯邦通訊框架—離子鍵 Ionic Bond。我們可以看到,FLEX提供了資料安全流通的一系列協議,Caffeine提供了演算法運算元的演算法庫,SAFE提供了API和開發的SDK。上面是知識聯邦的理論框架,從資訊層、模型層、認知層到認知層,全方位的來融合知識。
知識聯邦是一個統一的多層次框架,融合了多種安全多方功能,比如基於資料安全交換協議等等,有效利用多個參與方的協議,真正實現資料可用不可見,知識共創和共享。
知識聯邦的資訊層有兩項MPC,做一些安全計算查詢、密文上的訓練。模型層有點像聯邦學習,這兩個和既有的技術有一些重合,但是從認知層和知識層看,有我們的獨創性。知識聯邦超越了國外的初級聯邦學習,是國產原創引領的一個可信AI原框架。認知層能夠分流知識,這個知識本身不會因為一次性使用丟失,而是能夠傳遞下去,能夠進一步進行知識推理、知識融合、知識表達。
我們為了支援各方面的流通,打通孤立的資料頻道,打通平臺間的壁壘。去年我們提出了FLEX協議,這是一整套的開源標準化的聯邦協議,是可信AI的HTTPS。HTTP是是因特網上應用最為廣泛的一種網路傳輸協議,所有的 WWW 檔案都必須遵守這個標準。我們提出FLEX協議,也是希望能夠在一個互聯互通的標準下去使用資料,這也是業內首個聯邦平臺的互聯互通協議,已經開源了,PPT右下角是我們的開源連結,我們也釋出了FLEX白皮書。FLEX本身包括一個應用協議和公共元件,以及各種密碼安全協議等等。
在此基礎上,我們進一步提出全面互聯互通參考模型FIRM模型。這是一個多層次的互聯互通參考模型,把互聯互通分為五個層次,包括平臺層、通訊層、資料交換層、演算法層、應用層。比如說平臺層,我們是智邦iCore核心,通訊層是智邦Caffeine元件,在通訊層資料流通的速度是開源的6倍左右。平臺層是做一些使用者的同步,啟動任務、停止任務等等。通訊層是資訊傳輸,是資料安全交換,前面已經提到了。演算法層可以做一些演算法的儲存型別及演算法延伸。SAFE是場景的產生背景,場景的APE、SDK。
有了互聯互通,有了iBond,有了智邦平臺的支撐,有了知識聯邦的理論框架,我們就可以進一步打通資料流通。基於合規的互聯互通,我們進一步打造出資料的要素市場,即智邦iData。透過iData可以安全合規地使用多種多樣的資料,提升各種模型演算法的精度,有一系列可以自主程式設計、自主建模的輔助工具。下面是iCore,它能夠實現公有云、私有云、混合雲,支援億級別乃至十億級別的資料,是一站式資料安全合規的市場。
無論是資料的提供方、使用方還是應用開發者、提供方或使用方,都可以在上面釋出資料、應用模型。使用者可以按使用付費,實現價值變現。我們也有一系列按照市場機制的資料定價,或者根據資料貢獻度的判斷來給出合理的價格。
有了這些平臺和資料,我們就可以支援很多應用。剛才所說的知識聯邦的四個層次都有豐富的應用,例如資訊層,我們可以做一些安全合規的保護條件的查詢,比如說SQL很簡單的select,從A和B的資料,或者兩個表去合join。對查詢方也做一些安全措施,例如密語分享、同態加密等。
上面是模型層,我們可以打通資料來源和金融機構的資料,做跨樣本或跨特質的聯邦學習。透過運營商或電網的資料能夠對企業徵信進行豐富描述,更準確地判斷企業的運營情況,作出合適的風控建模和風險評估。
在認知層,可以透過多方預測來判斷。例如做反欺詐,有了資訊層的多方資料融合和計算,模型層有一些模型的判斷,這時候從認知層的知識分流提出了分流巢狀特徵,作為支撐來更進一步提升反欺詐評分卡,結合其他徵信機構的資料,一起來做行業內部和行內的聯邦信用風險的模組,作出最後的判斷。
在知識層,我們可以透過聯邦社交推薦來做精準營銷。例如電商公司A和遊戲公司B,或者透過不同的企業業主、企業社交網路、企業高管的社交網路來判斷企業本身的經營狀況以及是否存在欺詐團伙。
剛才說的知識聯邦模型、互聯互通協議以及我們的智邦產品和iData要素市場,都能夠在私有云、公有云和混合雲上做隱私計算和模型學習,提高交換的安全性。前面雲原生的服務,我們同盾也有豐富的經驗,例如我們的平均響應達到了200毫秒級別的,已經打造了T4級別的毫秒級的機房,可以做到杭州和上海一體雙戶,並註冊了上萬臺的虛擬機器,日流量超過一億。所以我們有充分的技術積累和經驗來支撐複雜的隱私計算共享智慧平臺。
同盾科技是智慧分析決策的佈道者、國產化的開拓者,已經服務了一萬多家企業客戶,覆蓋了非常多的行業,包括政務、網際網路、銀行、保險等等,積累了豐富的客戶經驗。我們的目標還是比較遠大的,希望為中國在下一代可信AI方面引領全球作出貢獻。要達到這個目標需要群策群力,需要社群一起努力。
所以我們在去年的全球人工智慧技術大會上創立了“知識聯邦產學研聯盟AKF”,透過企業、產業和研究院所、大學,形成知識聯盟,企業的應用場景給研究院所,還能夠向學生和教授團隊提供前沿的技術方案和智慧演算法。同時一些前沿的研究也能夠給企業帶來新的方向,指引戰略方向、輸出人才。透過AKF和知識聯邦,我們希望可以共同打造中國特有的下一代可信AI。目前已經有知名的高校和企業加入我們,我們也歡迎在座各位企業或者大學、世界頂尖的研究院所加入我們,共同打造下一代可信AI,為中國下一代可信AI作出貢獻。
下面我來做一個總結。同盾的目標是做一個聯結器,透過聯防聯控的獨立第三方角色,聯邦安全交換和充分互聯互通,來幫助各個行業充分發揮資料的價值,透過人工智慧持續強化學習,透過前沿演算法來支撐智慧,同時開源、開放聯盟,合作共贏。
謝謝大家!