近日,諾貝爾化學獎得主、復旦大學複雜體系多尺度研究院名譽院長邁克爾·萊維特走進復旦光華樓,為本科生上了兩節課。這門選修課名叫“定量生物物理學前沿導論”,由萊維特、馬劍鵬等5位教授講課。定量生物物理學又名計算生物學,學科交叉性很強,生物、物理、化學、數學、藥學、計算機等專業的年輕人都可學習,成為這一前沿交叉學科的後備人才。
解放日報·上觀新聞記者發現,選修這門課的本科生來自多個理工科專業,不少研究生也來聽課。“‘阿爾法摺疊’(AlphaFold)對蛋白質結構的精準預測,讓計算生物學從輔助性學科升級為主導性學科,它的科學和應用價值非常大。”萊維特的話,在復旦學子心頭撒下了從事前沿基礎研究的種子。
萊維特是世界頂尖科學家協會副主席,2013年,他與另兩位計算生物學先驅因“為複雜化學系統創立多尺度模型”分享了諾貝爾化學獎。那年獲獎,標誌著用計算機軟體研究生物化學這一方向得到了科學界高度認可;2020年“阿爾法摺疊2”橫空出世,則標誌著計算生物學在蛋白質結構預測、藥物研發等領域具備了實用價值。
這位諾獎得主告訴同學們,蛋白質由氨基酸摺疊而成,氨基酸長鏈如何自發地摺疊成蛋白質三維結構,這個問題堪稱分子生物學“皇冠上的明珠”。對科學家來說,測定氨基酸序列相對容易,但解析蛋白質結構的難度很大,因為蛋白質結構取決於幾千個氨基酸各原子間的相互作用力。能否開發出演算法強大的計算機軟體,精準預測蛋白質結構?萊維特研究這一問題長達55年。
隨著深度學習等人工智慧技術的成熟,蛋白質結構預測問題迎來了突破。去年11月,谷歌旗下深度思維公司(DeepMind)開發的“阿爾法摺疊2”在國際蛋白質結構預測競賽上奪冠,預測精度非常接近實驗測定水平。這件事在科學界引起的轟動,超過了“阿爾法圍棋”擊敗柯潔和李世石,被美國《科學》雜誌評為“2020年十大科學突破”之一。
“阿爾法摺疊2”預測(藍色)和實驗測定(綠色)的蛋白質結構幾乎完全吻合。來源:DeepMind
“沒想到我能在有生之年看到這個突破!”萊維特感嘆。在他看來,公司龐大的研發團隊、強大算力資源的支撐以及前人研究成果的積累,是谷歌和深度思維成功的原因。
與大學生分享科研“緣分”
如何打造龐大的計算生物學團隊?人才培養是第一要務。復旦大學複雜體系多尺度研究院院長馬劍鵬表示,為培養青年人才,本學期研究院牽頭開設了“定量生物物理學前沿導論”課。除了萊維特和他,來自數學科學學院、化學系、生物醫學院和生命科學學院的3位教授也會授課,讓本科生感受前沿交叉學科的魅力。
作為最大牌教授,萊維特的講課內容偏向宏觀,也很有思想性。除了計算生物學發展史和蛋白質摺疊問題,他還分享了摘得諾獎的成功經驗、培養諾獎級人才的環境條件等人生感悟。在回答一名學生“如何找到自己的科研興趣”這個問題時,他說了一個詞——serendipity(可譯作“緣分”)。他用自己的人生經歷,詮釋了什麼是科研道路上的“緣分”。
上世紀60年代,萊維特看了諾獎得主約翰·肯德魯主講的電視節目《生命之線:分子生物學導論》後,寫信給在劍橋大學工作的肯德魯,希望做他的博士生。然而肯德魯回信說,博士生名額已滿。萊維特的一個朋友得知此事後告訴他:“在商業上,當別人對你說‘不’時,你要給他另一個可以說‘是’的選擇。”於是,他又寫信給肯德魯:“如果明年不能做您的博士生,那以後可以嗎?”看到這個年輕人如此執著,肯德魯邀他來劍橋面談,並推薦他到魏茨曼科學研究所研究計算生物學。在研究所,萊維特遇到了46年後與他分享諾獎的合作者亞利耶·瓦謝爾。“這就是serendipity。你們要對事業充滿熱情,堅持不懈,善於創新,還要做善良的人。”
諾獎得主生動而富有哲理的講課,讓同學們收穫滿滿。“這堂課令人眼界大開,比如讓我意識到,可以從強化學習角度理解分子生物學的中心法則。”生物專業大四學生肖揚帆告訴記者,“邁克爾的講課方法也很有特色,每講一刻鐘,就會讓我們圍繞剛才聽到的內容討論兩三分鐘,這對提高學習效率很有幫助。”
如何加快發展計算生物學
據瞭解,萊維特今年3月來滬後的主要工作,是指導復旦團隊研究計算生物學。目前,復旦大學複雜體系多尺度研究院研發的“作品摺疊”(OPUS-Fold)軟體,在蛋白質側鏈結構預測精度上超越了“阿爾法摺疊2”,相關論文將發表在英國《生物資訊學簡報》上。馬劍鵬介紹,以蛋白質為靶點的藥物分子大多與側鏈發生作用,只有獲得高精度的側鏈結構,才可能設計出藥物分子,所以這一突破對新藥研發具有重要意義。
復旦團隊根據已知主鏈進行側鏈建模的結果:藍色為目標結構,紅色為預測結構。
不過,從整個系統來看,“阿爾法摺疊2”仍處於全球領先地位。深度思維執行長德米斯·哈薩比斯近日宣佈,公司與歐洲生物資訊學研究所合作建立蛋白質結構資料庫,提供35萬種以上蛋白質結構的資料訪問許可權。深度思維計劃將資料庫擴大至1億種以上蛋白質的結構,覆蓋人類已知的幾乎所有蛋白質。
“阿爾法摺疊2”讓計算生物學駛入了快車道,很多科研團隊在開發這類軟體。今年7月,華盛頓大學團隊在《科學》雜誌發表論文,介紹了開源軟體“羅塞塔摺疊”(RoseTTAFold),它不僅能預測蛋白質結構,還能預測多種蛋白質的結合形式。8月,斯坦福大學團隊發表《科學》封面論文,介紹了人工智慧演算法預測RNA(核糖核酸)三維結構的突破性進展。
很多科學家認為,蛋白質結構的精準預測是一場科技革命,將引發生物醫藥、新材料等產業變革。上海交通大學Med-X研究院副院長殷衛海說:“從預測蛋白質結構、尋找藥物靶點到藥物分子設計,再到臨床試驗設計,人工智慧正在全面進入醫藥行業,開始發揮關鍵作用。”科學家還能利用人工智慧軟體研發新材料,如設計出自然界不存在的蛋白質材料,用於化工、能源、環保等行業。
在萊維特看來,中國可以有更多的研究型大學為本科生開設計算生物學課程,激發他們的興趣,吸引他們今後投身這一前沿科技領域。他還建議上海加快發展計算生物學,為科研團隊提供更強大的算力資源,並擴大科研團隊規模,讓“作品摺疊”等具有自主智慧財產權的軟體加速迭代。
欄目主編:黃海華 文字編輯:俞陶然
來源:作者:俞陶然