《科創板日報》(上海,記者 朱潔琰)訊,“現在關於醫學方面的論文超過3500萬篇,這個體量的學習是人力無法窮盡的,基於超級計算機的人工智慧卻可以做到。”中科院計算所•哲源—圖靈•達爾文實驗室副主任、哲源科技聯合創始人兼COO趙宇說。
日前,在由中共嘉興市委、嘉興市人民政府、《麻省理工科技評論》中國主辦,中共嘉興市委/人才工作領導小組辦公室、中共南湖區委、南湖區人民政府,以及DeepTech承辦的“TALENTS南湖暢想-前沿產業發展趨勢論壇”上,趙宇在接受《科創板日報》記者專訪時表示,哲源科技依託中科院計算所高效能中心的中國超算,研發團隊從全球發表的論文中解構後建立“知識顆粒”,再根據問題設計“感知神經元機器人”,進而產生新的認知。根據全資料和人工智慧演算法生成模型,建立起藥物研發數字實驗室。
計算醫學是什麼概念?
哲源科技聯合中國科學院計算技術研究所科研團隊,在圖靈-達爾文實驗室首倡“計算醫學”。根據哲源科技官網的介紹,所謂計算醫學,是基於臨床資訊及疾病基因組資訊,應用數學、工程學、計算科學智慧化理解疾病機理,基於工業化的資料、演算法、算力及生物醫學技術體系解決腫瘤臨床疑難問題,協助臨床提高腫瘤患者用藥精準分組、藥物臨床試驗入組、藥物適應性評估、複雜疾病狀態評估能力。
“人類在臨床上積累的資料越來越多,以基因組為代表的資料產生量呈指數上升,資料更新日益加快、獲取資料成本降低,當面對每個個體超百G的資料,累積資料超過PB級(1P=10的6次方G)時,如何快速高效地處理海量資料,便成為了關鍵。”趙宇表示,哲源科技透過模型、超算技術來突破解讀,認知的瓶頸。
不同於循證醫學和精準醫學,計算醫學是一個全新的概念,高度依賴高效能的資料分析平臺,是建立在超算基礎之上的新興科學。
趙宇告訴《科創板日報》記者,循證醫學是找規律、講機率得用藥,計算醫學則更像是個方法論,“藥企大部分做的事其實是試錯,那現在藥物研發80%的工作都可以用計算機完成,藥企再去做驗證就行了。”
方法論賦能醫藥產業
更具體一些,趙宇舉例表示,“針對乳腺癌的分類和治療方案的選擇,就涉及3000多個基因,在目前實際場景中,如果說患者沒有標誌物,即便是精準醫學也沒有辦法。而在計算醫學的方法論下,哲源科技不再是依賴某個單獨的基因作為判斷藥物療效的關鍵,而是系統性地看待生命,最終哲源均能夠給出用藥建議方案,用超算手段去挖掘驅動找到新重點,再結合人工智慧的方法做演算法迭代輸出。
按趙宇的描述,訓練這個模型的資料體量已經超過PB(1P=10的6次方G)量級,每次系統迭代都需要耗費千萬級的電費。
在採訪中,趙宇還屢次提及數字實驗室的概念,這是哲源科技目前正在踐行的專案,“以計算機模擬人體內的資訊互動,將生命變得可資料化,從而解讀人體的生命資料,再利用其進行藥企新藥研發等方面的應用。”
據臨床試驗的資料,可推測出藥物優勢人群的特徵,並可據特徵,推斷該藥還對哪些疾病有效。
一種藥研發成功來之不易,市場上10%的藥能拓展適應症,透過平臺可擴大上億人市場,能大大增加藥的價值。例CDK4/6抑制劑,輝瑞、諾華、禮來三家已經在激素陽性Her2陰性乳腺癌下展示了巨大商業價值,全球也開展了上百組新適應症臨床探索,但耗費巨大,而且臨床試驗曠日持久。而計算醫學指導下的藥物數字研發平臺,以新技術可以幫助CDK4/6抑制劑“算出”其他可能適應症。
出於商業考慮,哲源科技目前只披露了一個新適應症:全球無藥罕見病—脊索瘤,並已在臨床獲得了驗證。但趙宇表示,“我們已經統計了幾十種癌症型別上百種病理亞型,目前已經明確了幾種癌症型別可能獲益顯著優於乳腺癌患者。”
另值得一提的是,全球每個月都有大量失敗的創新藥,可透過計算醫學平臺發現未知靶點,創造新的產業叢集,重建臨床失敗藥的價值。
AI製藥的無人區
新藥研發主要包括藥物發現、臨床前研究、臨床研究以及審批與上市四個階段。其中,藥物發現階段主要涉及疾病選擇、靶點發現,而臨床前研究階段則以化合物合成、化合物篩選、晶型預測、化合物驗證為主。
目前以化合物合成和化合物篩選為重點的AI+新藥應用發展最快,並且在多家頭部企業開展業務中均有體現。
據趙宇的講述,哲源科技在做的事則是藥物研發的兩頭,一頭是靶點發現,在藥物IP方面的工作;另一頭是已經進入真實世界了,臨床I/II/III期,甚至是臨床後研究,即藥物上市後挖掘新的適應症。“所以可以說,我們進入了AI輔助藥物研發的無人區。”
不過,趙宇也強調,計算醫學的數字藥物實驗室不會取代藥企,就是二八原則,80%上超算幹,20%還得人做。