近日,NatureMachine Intelligence發表了由華中科技大學人工智慧與自動化學院發起,英國劍橋大學、美國斯坦福大學、約翰霍普金斯大學、MD安德森腫瘤醫院,同濟醫學院附屬同濟醫院,附屬協和醫院,國家藥物篩選中心等國內外權威科研機構聯合發展的聯邦學習(Federated learning)開源醫學人工智慧(AI)計算框架(Unified CT AI Diagnostic Initiative UCADI)。
人工智慧技術正在變革傳統醫療。但當前人工智慧模型普遍泛化性差:模型在訓練過的資料集上表現優異,但是對於未曾見過的資料,表現差別大。這個根本性的缺陷導致AI技術在醫學、醫療應用中表現出的侷限性,甚至安全問題更加突出。
為解決這個根本性問題,華中科技大學人工智慧學院夏天教授與白翔教授團隊提出基於聯邦學習(Federated learning)開源醫學人工智慧計算框架(UCADI)。此架構在保證資料安全與隱私前提下,無需傳輸資料,能在不同物理地點共享訓練醫學資料,構建泛化性強的醫學AI模型。基於UCADI,夏天與白翔聯合同濟醫學院附屬同濟醫院、附屬協和醫院、武漢天佑醫院、武漢中心醫院、武漢兒童醫院、國家藥物篩選中心與英國劍橋大學醫學中心(維護全歐盟新冠影像資料,包括全英23家醫院)發起國際大合作,實現真正全球分散式共享新冠影像資料AI模型訓練與構建。
基於中英23家醫院近萬張的胸部CT掃描資料,研究團隊驗證了UCADI能夠在保證使用者資料隱私的情況下,多快好省地進行人工智慧輔助診斷模型的訓練和推理,實現跨國多中心的新冠病毒智慧診斷。基於UCADI訓練的AI新冠診斷模型相對於單個醫院資料訓練出的模型,不僅效能遠超,同時在多個不同醫院的驗證資料集上表現出良好的泛化性。
團隊進一步分析了模型的可解釋性和不確定性,團隊驗證了訓練的AI模型能夠捕捉到類似磨玻璃樣陰影、小葉間隔增厚等新冠病人獨有的CT特徵。在此基礎上,團隊成員研究了資料異質性對模型效能的影響。劍橋大學博士生,文章的共同一作王瀚宸發現“除了不同的醫生、醫院在CT的採集步驟上有所不同,國家與國家之間的差異更大。中英兩國的CT資料有一個很大的區別是,中國的資料都是平掃,而英國的CT有很大一部分是注入造影劑後進行的增強掃描,此外兩國病人在年齡等屬性上的分佈也很不同,英國患者中的老年人比例非常高。這種資料上的異質性,對模型的訓練是個很大的挑戰。
為了應對這種資料異質性,團隊首先進行了很多模型上的篩選和嘗試,在幾種常見的3D卷積網路架構中,最後選擇3DDenseNet。不僅是因為其較好的泛化效能,同時模型尺寸偏小,非常方便聯邦學習中進行傳輸。但值得注意的是,3DDenseNet也需要更多的計算資源。在此基礎上,團隊還嘗試用CycleGAN在增強和平掃的CT間進行轉換,取得了一些效能上的改善,但還是有相當的可提升空間。
此工作中,UCADI框架初步展示了對於全球新冠資料的整合能力,基於全球範圍資料構建的新冠診斷預測模型完全向全球開放使用,各國醫療機構可以在此基礎上,利用UCADI進一步共享、更新、演進、最佳化預測模型。同時UCADI框架完全開源,可用於其他型別醫療資料,為未來的跨國智慧診斷系統的研究與發展提供了基礎設施。團隊已與劍橋大學和世界衛生組織10月份在德國新設立的疫情智慧防控中心(WHO Hub for Pandemic and Epidemic Intelligence)建立進一步合作,重點研究現有的AI診療模型對識別新變種Omicron的魯棒性,以及探索用持續學習(Continual Learning)等方法來開發一個可不斷進化的聯邦學習診療框架。
此次研究由華中科技大學人工智慧與自動化學院發起。人工智慧與自動化學院科研實力雄厚,擁有國家一級重點學科——控制科學與工程,是全校擁有國家一級重點學科的七個院系之一;2019年獲批人工智慧交叉學科博士學位授權點,華中大成為全國三所具備人工智慧本碩博人才完整培養鏈條的高校之一。
面向國家重大戰略需求和國際科技發展前沿,學院2020年新增人工智慧本科專業,著力打造人工智慧高階人才培養基地。本科還設有人工智慧創新實驗班、自動化卓越工程師計劃實驗班、人工智慧本碩博貫通班。
關注“華中科技大學本科招生”頭條號,獲取更多精彩資訊!
素材來源:華中科技大學新聞網、華中科技大學招生辦公室官微