一種新的人工智慧演算法可以從錯誤的結構中挑選出正確的RNA分子的三維結構。計算機預測RNA摺疊結構通常是重要且困難的——因為我們已知的結構太少了。 (圖片來源:Camille L.L. Townshend)
確定生物分子的三維結構是現代生物學和醫學發現最具挑戰的問題之一。企業和研究機構經常花費幾百萬美元去確定一個分子的結構,而即使是如此大的努力也常常面臨著失敗的結果。
斯坦福大學的博士生Stephan Eismann和Raphael Townshend在計算機科學副教授Ron Dror的指導下,利用聰明的、新的機器學習技術開發了一種方法,利用計算機預測精準結構來攻克這一難題。
尤其值得關注的是,儘管只學習了幾個已知的結構,他們的方法就已經很成功了,這使得這一方法適用於那些難以透過實驗來確定結構的分子。
他們研究成果分別發表在2021年8月27日的《科學》(Science)上和2020年十二月的《蛋白質》(Proteins)上,論文詳細地介紹了RNA分子和多蛋白複合體。發表於《科學》(Science)的那篇論文是與斯坦福大學生物化學副教授Rhiju Das一起合作完成的。
“結構生物學是一門研究分子形狀的學科,它有一個信條:結構決定功能。”Townshend說。
研究人員設計的演算法可以預測精確的分子結構,科學家便可以透過這種方法來解釋不同分子是如何工作的。這種方法的應用範圍從基礎生物學研究到藥物設計的實踐。
蛋白質的各級結構。因為盤曲摺疊,蛋白質的結構在空間上非常的複雜。 (圖片來源:Thought Co.)
“蛋白質是承擔著各種各樣功能的分子機器。為了執行這些功能,蛋白質往往會結合在一起,”Eismann說。“如果你知道一對蛋白質與某種疾病相關,並且知道它們是怎樣在三維層面結合的,那麼你可以嘗試用一種非常具有針對性的靶向藥物來影響它們之間的相互作用。”
Eismann和Townshend與Das實驗室的斯坦福博士後學者Andrew Watkins共同撰寫了發表於《科學》(Science)的論文,同時與前斯坦福博士生Nathaniel Thomas共同撰寫了發表於《蛋白質》(Proteins)的論文。
設計算法
研究人員沒有明確指定什麼能使得結構預測更準確,而是讓演算法自己去發現這些分子特徵。之所以這樣做,是因為他們發現提供這種知識的傳統技術,會使演算法傾向於某些特徵,從而阻礙它去發現其他的資訊特徵。
“在演算法中手動篩選特徵的問題是演算法會因此變得有偏向性——偏向於篩選者認為重要的那方面。你有可能因此錯過一些你需要的、讓研究更加全面的資訊。”Eismann說。
“在沒有明確指示的情況下,網路學會了尋找對分子結構形成至關重要的基本概念。”Townshend說,“令人興奮之處在於,演算法已經清晰地獲得了那些我們已知的重要的事情,並且還發現了一些我們聞所未聞的特性。”
在蛋白質的研究上取得了成功之後,研究人員接下來把演算法運用到了另一大類重要的生物分子——RNA上。他們在一系列“RNA謎題”中測試了他們的演算法,這些謎題來自於他們領域的一個存在已久的競賽。在每個案例中,這個工具都比所有其他謎題參與者表現得更好,而且演算法本身並不是專門針對RNA結構設計的。
更廣闊的應用
這項研究目前已經在蛋白質複合體和RNA分子方面取得了成功,研究人員很激動看到它還可以在其他地方派上用場。
“大部分近期在機器學習上取得了突破性進展的研究都是需要大量的資料來訓練的。而我們的方式僅在很少量的訓練資料下成功——這告訴我們:相關的方法是可以在缺乏資料的領域幫助我們解決尚未被解決的問題的。”《蛋白質》(Proteins)論文的資深作者和《科學》(Science)論文的共同高階作者Dror如是說道。
利用人工智慧開發的新分子可以被應用在藥物研究與開發上。 (圖片來源:Pixabay)
特別在結構生物學方面,研究團隊表示,就待取得的科學進展而言他們只是觸及了皮毛。“一旦你掌握了這項基本技術,你便將你的理解能力提高到了另一個層面,然後便可以開始追問後續的一連串問題了。”Townshend說,“舉個例子,有了這類資訊,你就能夠開始設計新的分子和藥物了,那是一個所有人都很期待的領域。”
翻譯:龍霏霏
審校:白德凡
引進來源:斯坦福大學
本文來自:中國數字科技館