近日,昇思MindSpore【1】團隊與昌平實驗室、北京大學生物醫學前沿創新中心(BIOPIC)和化學與分子工程學院、深圳灣實驗室高毅勤教授課題組聯合推出基於AlphaFold2演算法的蛋白質結構預測推理工具。該工具首次提供了基於昇騰AI基礎軟硬體平臺的解決方案,並且端到端效能優於原版AlphaFold2 2-3倍。相關模型程式碼將依託於華為全場景AI框架昇思MindSpore進行開源、並將定期擴充套件與維護,旨在為全球產、學、研界領域夥伴提供優質的昇騰AI軟硬體解決方案。
蛋白質在分子生物學的中心法則中具有十分重要的地位,在各種生命過程中不可或缺。傳統的藥物設計一般要透過大批次篩選,尋找易與目標蛋白質分子緊密結合、易合成且沒有毒副作用的化合物來完成的,因此研發週期長、費用高,而在瞭解蛋白質的空間結構後可減少尋找藥物的盲目性,從而縮短研發週期並降低成本。因此,準確、快速的蛋白質結構預測不僅可以在學術研究領域幫助科學家快速獲得或驗證關鍵蛋白結構,促進人們對重要生命過程中分子機理的理解,而且在醫療健康和生物工程領域也能作為有力的工具,引發藥物靶點發現、功能蛋白設計(如抗體和人工酶)以及大分子(蛋白)或小分子藥物高通量虛擬篩選的革命。
傳統蛋白質結構預測方法一直存在計算精度不足的缺陷,直至2020年穀歌DeepMind團隊基於AlphaFold2【2】利用計算機高效準確獲取蛋白質空間結構取得CASP14比賽(全球蛋白質結構預測比賽)中蛋白質3D結構預測的榜首,才讓這一缺陷得到彌補。蛋白質結構預測工具精度可與實驗方法相媲美,這一成就被Nature等雜誌喻為“前所未有的進步”。
本次北大高毅勤課題組成功推出基於昇騰AI的蛋白結構預測工具,再次證明了國產AI軟硬體的可用與好用。該工具大大降低了廣大生物醫療實驗工作者的使用門檻,也將為生物蛋白質領域的基礎研究與應用工作提供助力。
該工具依託昇思MindSpore,可對氨基酸序列長度2000+的蛋白質結構解析,能覆蓋約99%以上的蛋白序列【3】。同時,藉助異構計算架構CANN(Compute Architecture for NeuralNetwork)釋放昇騰AI處理器的澎湃算力,透過軟硬體協同最佳化大大提高了蛋白質預測的計算效率。參考DeepMind於2021年7月份開源的蛋白質結構預測模型AlphaFold2【4】,本次開源的蛋白質結構預測推理工具模型部分與其相同,在多序列比對階段,採用了MMseqs2進行序列檢索【5】,相比於原版演算法端到端運算速度有2-3倍的提升。
圖1 昇思MindSpore模型與AlphaFold2精度對比
圖2 透過昇思MindSpore預測的T1079
蛋白結構(綠色代表實驗獲得,紅色代表預測獲得)
針對蛋白質結構預測及摺疊問題,聯合團隊未來還會發布創新的全棧(演算法+軟體+硬體)國產自主可控技術,同時也會牽手更多的學術科研界合作伙伴,期望能夠在蛋白質結構預測領域上共同探索和進步,助力醫學、生物科學等領域的發展,促進國內相關基礎研究的發展。
引用:
【1】Chen L. Deep Learning and Practice with MindSpore[M]. Springer Nature, 2021.
【2】Jumper J, Evans R, Pritzel A, et al. Applying and improving AlphaFold at CASP14[J]. Proteins: Structure, Function, and Bioinformatics, 2021.
【3】https://ftp.uniprot.org/pub/databases/uniprot/previous_releases/release-2021_02/knowledgebase/UniProtKB_TrEMBL-relstat.html
【4】Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589.
【5】Mirdita M, Ovchinnikov S, Steinegger M. ColabFold-Making protein folding accessible to all[J]. BioRxiv, 2021.
程式碼開源路徑:https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/mindsponge/fold
昇思MindSpore開源地址:
Gitee:https://gitee.com/mindspore/mindspore
Github:https://github.com/mindspore-ai/mindspore