蛋白質 來源:pixabay
所有的生物都離不開蛋白質,蛋白質是一類複雜分子的總稱。它們能執行很多種功能,能讓植物利用太陽能產生氧氣,能幫助你的免疫系統對抗病原體,能讓你的肌肉進行體力活動。許多藥物也是蛋白質。
然而,在生物醫學研究和藥物開發的許多領域,還沒有合適的天然蛋白質可以作為構建新蛋白質的起點。無論是研究人員開發預防新冠病毒感染的新藥,還是研發能夠控制基因表達,又或是將細胞轉變為計算機,這些都需要從頭開始創造新的蛋白質。
這種從頭設計蛋白質的過程很難得到期待的結果。像我這樣的蛋白質工程師一直在試圖找到更高效、更準確地設計出具有我們需要特性的新蛋白質的方法。幸運的是,一種被稱為深度學習的人工智慧可能會是一種準確高效的方式來創造以前不存在的蛋白質——“幻想”。
從頭開始設計蛋白質
蛋白質是由成百上千個被稱為氨基酸的分子組成的。這些氨基酸相互連線組成長鏈,經摺疊後形成蛋白質。這些氨基酸相互連線的順序決定了一個蛋白質獨特的結構和功能。
蛋白質工程師在設計一種新蛋白質時面臨的最大挑戰是找到一種能夠執行所需功能的蛋白質結構。為了解決這個問題,研究人員通常會以具有類似功能的天然蛋白質為模板。這些模板對於如何創造出特定蛋白質的獨特摺疊方式有著指導意義。然而,由於必須為每個單獨的摺疊方式建立一種模板,這種策略是耗時耗力的,並且受到自然界中可用蛋白質的限制。
在過去幾年裡,很多研究組,包括我所在的實驗室,已經開發了許多專門的深度神經網路——一種使用多個處理層從輸入資料中“學習”,從而對需要的輸出結果做出預測的計算機程式。
當需要的輸出結果是一種新的蛋白質時,描述一種蛋白質不同層面的數百萬個引數就會被輸入到網路中。我們所預測的是一個隨機選擇的氨基酸序列透過對映最有可能形成的3D結構。對於隨機氨基酸序列的網路預測是模糊的,這意味著蛋白質的最終結構不是非常清晰,然而自然形成的蛋白質和從頭構建的蛋白質都能產生更加清晰的蛋白質結構。
幻想出新蛋白質
這些觀測結果暗示了一種從零開始生成蛋白質的方法——透過調整網路的隨機輸入,直到預測產生一個清晰明確的結構。
我和我的同事開發的蛋白質生成方法在概念上類似於計算機視覺方法,比如谷歌的DeepDream,它可以發現並增強影象中的樣式。這些方法的工作原理是,將經過訓練能夠識別人臉或其他影象模式(如動物或物體的形狀)的網路進行反向,讓它們學會識別這些不存在的模式。例如,在DeepDream中,它會對任意輸入的影象進行調整,直到能夠識別出影象中的人臉或其他形狀。儘管最終的影象對於人來說並不太像一張臉,但是對於神經網路來說卻很像。
DeepDream中透過調整影象進行識別。來源:Scientific American
這種技術的產物通常被稱作幻覺,同樣被用來命名我們所設計的蛋白質。
我們的方法是先使一個隨機氨基酸序列透過深度神經網路。最初的預測結果是模糊的,結構不清晰,正如我們對隨機序列所預期的那樣。然後,我們引入一個突變,將鏈中的一個氨基酸換成另一個氨基酸,並將這個新序列再次透過深度神經網路。如果這種改變使蛋白質的結構更加清晰,那麼我們就保留這個氨基酸,並在序列中引入另一個突變。
使用幻覺方法構建蛋白質。來源:Nature
隨著這個過程的每一次重複,蛋白質會越來越接近它們在自然條件下形成的真實形狀。要創造一種全新的蛋白質需要成千上萬次的重複。
利用這個過程,我們生成了2000個預計可以摺疊成明確結構的新蛋白質序列。其中,我們挑選了100個形狀最獨特的,在實驗室中進行物理重構。最後,我們選擇了三個最佳候選物件進行詳細分析,並確認它們與我們幻覺模型預測的形狀非常接近。
為什麼要幻想新蛋白質?
我們的幻覺方法極大地簡化了蛋白質設計流水線。透過消除對模板的需求,研究人員可以直接專注於根據所需功能建立蛋白質,並讓神經網路來為他們找出結構。
我們的工作為研究人員開闢了多種探索途徑。我們的實驗室目前正在研究如何利用這種幻覺方法來生成功能上更具特異性的蛋白質。我們的方法也能夠非常容易地擴充套件到使用其他最近開發的深度神經網路來設計新蛋白質。
這種從頭設計全新蛋白質的方法具有廣泛的應用前景。有了深度神經網路,研究人員將能夠創造更多的蛋白質,這些蛋白質可以降解塑膠以減少對環境的汙染,識別和應對病變的細胞,並改進疫苗來對抗現有的和新的病原體——這僅僅只是其中的幾個例子。
撰文:Ivan Anishchenko
翻譯:雲楷傑
審校:黃靜
引進來源:theconversation
本文來自:中國數字科技館