蛋白質是生命的基石,幾乎支援著人體所有功能。同時,蛋白質又是大型複雜分子,由多種氨基酸以不同長度排列迅速摺疊組成,蛋白質的作用很大程度上取決於其獨特的三維結構。準確預測蛋白質三維結構對生命科學和醫學無疑是一大福音,這意味著加快人們對細胞組成部分的理解。
事實上,“蛋白質摺疊問題”是生物學中的一大挑戰。半個世紀以來,科學家一直在尋找解決蛋白質摺疊問題的方法。而現在,這一難題在人工智慧技術及深度學習演算法協助下逐漸得到突破。
人工智慧應用於蛋白質結構的最新進展,能在幾天、甚至分鐘級預測出具有高置信度的蛋白質結構,這在以前用核磁共振、X射線、冷凍電鏡等傳統方式測定,要花費數月到數年的時間。
近日,國內人工智慧企業天壤宣佈,其自研的深度學習蛋白質摺疊預測平臺TRFold在基於CASP14(2020年第14屆國際蛋白質結構預測競賽)蛋白質測試集的評估中獲得82.7/100的成績,位列全球第二。
“我們透過兩年半的時間掌握了蛋白質摺疊核心技術,並以此參與到國際最前沿的生物醫學領域的應用中,希望能夠開闢出一條AI生物學的應用之路。”天壤公司創始人薛貴榮介紹說。
據瞭解,天壤是研究通用人工智慧的公司,專注於自研核心技術,先後在AI圍棋、城市級交通排程等領域落地。“基於天壤自主研發的迭代升級神經網路技術,可以大幅降低超大規模網路模型的算力消耗,能夠以最小的計算資源,透過漸進式的迭代,獲得最佳演算法模型。”薛貴榮說。
雖然此前DeepMind公司開源了AlphaFold2的預測模型,然而對於像天壤這樣一直投入在該領域的團隊而言,開源帶來便利的同時,也帶來了一定挑戰。天壤XLab團隊負責人苗洪江認為,假如沒有深入探索過程,就無法對不同的方法優勢進行量化,也不能將最有價值的創新進行更大範圍的應用。需要從頭搭建一套自研演算法,才能展開後續的工作。 團隊透過持續的努力,終於交上了這份優秀的答卷。
蛋白質摺疊預測是全方位的創新專案,它覆蓋了交叉學科的創新、行業的創新、基礎科學的創新以及AI演算法和工程能力的創新。
天壤Xlab團隊表示,後續將重點挖掘蛋白質與蛋白質相互作用的精準鏈路,希望對人類疾病的治療、藥物的研製等方向做出貢獻。
AI應用於生物科技領域的創新革命正在不斷繼續。針對未來行業發展,薛貴榮表示,算力和資料也是支撐行業發展的關鍵要素。未來幾年內,將有大量的機構和公司加入到技術創新與生命科學研究的熱潮中。(IT分析師 陵鋒)
來源: 光明網