近期,阿里達摩院釋出了2022年十大科技趨勢預測。其中第一條就是“AI for Science”。達摩院認為,人工智慧成為科學家的新生產工具,催生科研新正規化。
其理由是:實驗科學和理論科學是數百年來科學界的兩大基礎正規化,而人工智慧正在催生新的科研正規化。機器學習能夠處理多維度、多模態的海量資料,解決複雜場景下的科學難題,帶領科學探索抵達過去無法觸及的新領域。人工智慧不僅將加速科研流程,還將幫助發現新的科學規律。預計未來三年,人工智慧將在應用科學中得到普遍應用,在部分基礎科學中開始成為科學家的生產工具。
AI在助力科研方面,近期最知名的例子莫過於谷歌DeepMind釋出的AlphaFold 2。今年7月,DeepMind在Nature上開源了利用AI對蛋白質結構進行預測的AlphaFold 2。
AlphaFold 2的主要邏輯是:依據氨基酸之間的距離和連線這些氨基酸的化學鍵之間的角度,經過深度神經網路模型,推斷出蛋白質摺疊之後的角度和距離資訊,從而推斷出整個蛋白質的結構。目前,AlphaFold 2釋出了來自人類和20種其他生物共350000種蛋白質結構的預測結果。
谷歌的AlphaFold 2之所以受到業界關注,是因為其解決了生物科學領域一個非常重要而讓人頭疼的問題——蛋白質摺疊問題。在過去的50年裡,蛋白質摺疊問題一直是生物學的一個巨大挑戰。
據估計,一個典型的蛋白質可能有10的300種摺疊形式,如果只是透過蠻力計算列舉出典型蛋白質的所有可能構型,所需的時間比已知宇宙的年齡還要長。另一方面,解決蛋白質摺疊的問題意義重大。透過研究蛋白質摺疊,瞭解其3D結構,是解開生命之謎的重要途徑,直接關係到各類疾病和和藥物的研究。
正因為AI在科研當中小試牛刀,開始取得一些進展,阿里達摩院預測在未來的三年內,人工智慧技術在應用科學中將得到普遍應用,在部分基礎科學中開始成為研究工具,甚至AI將催生科研新正規化。
雖然AI可以幫助科研,但現在就斷言AI催生科研新正規化還為時尚早。所謂科研正規化,是關係到科研方法的整體性變革。科研正規化大概分為幾個階段:
第一正規化,經驗科學,主要用來描述自然現象,方法以基於實驗或經驗的歸納為主。典型代表是伽利略的如比薩斜塔實驗;
第二正規化,理論科學,在自然現象基礎上進行了抽象簡化,主要透過構建數學模型進行研究。典型的如牛頓力學、愛因斯坦相對論;
第三正規化,計算科學,以計算機模擬模擬取代實驗,比如核試驗模擬;
第四正規化,資料驅動的科研。將資料和資料(資訊)儲存在資料庫中,採用資料探勘、機器學習等方法來分析相關資料,並發現其中的相關知識和規律。
AI驅動的科研,不僅僅是提升資料處理能力,而是在“智力”上也能提供幫助。然而,現在的AI系統,“智力”水平是不夠的。在科研中,還是處於科研輔助者的角色。並且,AI目前只在少數幾個科研領域開始應用,並沒有大面積普及開來。等物理學、化學、生物學等多個領域都開始大面積應用AI系統,併產生顯著效果,AI成為科學家的必備工具時,才能夠說AI催生了新的科研正規化。現在是“小荷才露尖尖角”,到底AI科研能走多遠,其實還有很大不確定性。