文/陳根
當前,新藥研發正面臨著成本高企、收益率下降的雙重困境,而人工智慧是否能解放新藥研發的艱難景況,還是個謎題。
眾所周知,一款新藥的研發是一個風險大、週期長、成本高的艱難歷程。國際上有一個傳統的“雙十”說法——10年時間,10億美金,才可能成功研發出一款新藥。即使如此,大約只有10%新藥能被批准進入臨床期,最終只有更小比例的藥物分子可以上市,甚至有人將這個過程形容為“死亡之谷”。
2017年德勤釋出的報告指出,成功上市一個新藥的成本從2010年的11.88億美元已經增加到20億美元。而2017年全球TOP12製藥巨頭在研發上的投資回報率低到3.2%,處於8年來的最低水平。面對投入越來越高的製藥領域,人工智慧作為一種新興技術,被視為新藥研發實現降本增效的重要方式之一。
然而,人們寄希望於人工智慧,但至今,似乎未聽到什麼突破性的結果。早在1981年就被《Discovery》雜誌看好的人工智慧新藥研發——“化學家們再也不用整週、甚至是整月地呆在實驗室,去測試那些計算機認為難以成功的分子”——為什麼在40年後依然步伐緩慢?傳統制藥與機器製藥的明天又在哪裡?
傳統制藥的窮途末路
儘管現代醫學的高速發展拯救了越來越多的生命,但一個不可否認的事實是,當前,現代醫學已研發出的藥物,與現存的疾病數目相比,依然是九牛一毛。有許多疾病至今無藥可治,而新的病毒又層出不窮。
製藥業是危險與迷人並存的行業,昂貴且漫長。一款新型藥物的推出,需要經過藥物發現、臨床前研究、臨床研究和審批上市等多階段,而這往往需要耗費十幾年乃至數十年的時間,以及數十億美元的成本。即便如此,其失敗率依然高達90%以上。
通常,一款藥物的研發可以分為藥物發現和臨床研究兩個階段。在藥物發現階段,需要科學家先建立疾病假說,發現靶點,設計化合物,再是展開臨床前研究。其中,僅發現靶點、設計化合物環節,就障礙重重,包括苗頭化合物篩選、先導化合物最佳化、候選化合物的確定、合成等,每一步都面臨高淘汰率。
阿爾茨海默症(Alzheimer’s disease,AD),俗稱老年痴呆,是一種神經系統退行性疾病,在1906年由一位德國醫生首次發現並且報道。阿爾茨海默症臨床表現為漸進性記憶障礙、認知功能障礙和語言障礙等,出現失語、失用、失認等病症表現,就像是記憶的橡皮擦,一點點擦去患者與其家人、朋友的記憶。
遺憾的是,到目前為止,仍沒有明確的治療阿爾茨海默症的方法。也就是說,我們等待了100年,還是沒有找到更好的藥。2019年,國際阿爾茨海默病協會估計全球有超過5000萬人患有阿爾茨海默症,到2050年,這一數字將飆升至1.52億。沒有可以治療阿爾茨海默症的藥,就意味著2050年,這1.52億人群仍要遭受阿爾茨海默症的困擾。
《Nature》在2017年發表了題為The drug-maker’s guide to the galaxy的文章,文章指出:經過化學家的分析,在整個化學空間裡面,人們可以找到的藥物分子的個數,可能性是10的60次方。
要知道,太陽系裡面所有的原子加到一起,數量大概也只有10的54次方。更不用說在傳統實驗室裡,透過傳統的藥物篩選辦法能夠接觸到的分子數量,大概僅有10的11次方。11和60,這兩個數字中間,就是橫亙在一款新藥走向臨床道路的巨大天塹。
並且,一種藥物,即便是經過成千上萬種化合物的篩選,也僅有幾種能順利進入最後的研發環節,大約只有10%新藥能被批准進入臨床期,最終只有更小比例的藥物分子可以上市。在這樣的篩選比例下,無怪投資人將新藥“從實驗室進入臨床試驗階段”描述為“死亡之谷”。
並且,隨著現代醫學的精進,其所研發新藥的難度也日益提升。一方面,2017年全球TOP12製藥巨頭在研發上的投資回報率僅有3.2%,處於8年來的最低水平。過去公認的高投入和高回報,似乎落到了低谷。另一方面,全球新藥管線中處於後期階段的專案越來越少,2016年尚有189個III期專案,2017年則落到159個III期專案。傳統的製藥似乎已經走到窮途末路。
開啟製藥行業的新篇章
面對傳統制藥行業高成本、高投入、高風險的困境,人工智慧作為一種新興技術,被寄予希望成為擰動這一難題的好鑰匙。
事實上,人工智慧進發製藥並不是近來才有的事情。1981年的《Discovery》雜誌就已經清楚地解釋了計算機對於製藥業的重要性:“平均下來,醫藥公司每篩選出的8000個藥用分子中,只有1款能最終問世。計算機有望能提高這個比例——化學家們再也不用整週、甚至是整月地呆在實驗室,去測試那些計算機認為難以成功的分子。”
幾個月後,《財富》雜誌的封面則對計算機輔助的藥物發現進行了專題報道,並稱這項技術為“下一次工業革命”。人工智慧被製藥業寄予顛覆性的期望並不是沒有原因的,面對似乎已經走到窮途末路的傳統制藥,用人工智慧製藥無疑是實現製藥業降本增效的重要方式之一。
一方面,人工智慧可以幫助尋找疾病、基因和藥物之間的深層次聯絡,以降低高昂的研發費用和失敗率。基於疾病代謝資料、大規模基因組識別、蛋白組學、代謝組學,人工智慧可以對候選化合物進行虛擬高通量篩選,尋找藥物與疾病、疾病與基因的連結關係,提升藥物開發效率,提高藥物開發的成功率。
具體而言,科研人員可以使用人工智慧的文字分析功能搜尋並剖析海量文獻、專利和臨床結果,找出潛在的、被忽視的通路、蛋白、機制等與疾病的相關關係,進一步提出新的可供測試的假說,從而找到新機制和新靶點。
漸凍人症(ALS)就是由特定基因引起的一類罕見病,而IBMWatson使用人工智慧技術來檢測數萬個基因與ALS的關聯性,成功發現了5個與ALS相關的基因,推進了人類對漸凍人症的研究進展(此前醫學已發現了3個與ALS相關基因)。
目前,人工智慧演算法模型被諸多學者提出,隨著藥物研發資料的高速累積和數字化轉型,以及人工智慧技術的加速發展,決策樹(DT)、隨機森林(RF)和支援向量機(SVM)等機器學習模型以及深度神經網路(DNN)、卷積神經網路(CNN)和迴圈神經網路(FNN)等深度學習演算法逐漸被應用於藥物發現領域。
另一方面,工智慧可以虛擬篩選候選藥物,幫助科研人員高效找到活性較高的化合物,提高潛在藥物的篩選速度和成功率。人工智慧可以透過模擬小分子化合物的藥物特性,在較短時間內挑選出最佳模擬化合物進行合成試驗,大幅提高化學合成路線設計速度,以降低操作成本。
比如,美國Atomwise公司使用深度卷積神經網路AtomNet來支援基於結構的藥物設計輔助藥品研發,透過人工智慧分析藥物資料庫模擬研發過程,預測潛在的候選藥物,評估新藥研發風險,預測藥物效果。
當前,人工智慧已經實現在生物醫藥產業自上游到下游的投入使用,且虛擬篩選、靶點發現等部分應用場景也能夠為企業帶來實際收益。新型冠狀病毒肺炎疫情發生後,越來越多的生物醫藥企業和研究機構透過將其業務與人工智慧結合來完成創新突破,在新藥開發、生產運營,甚至商業戰略中都有所應用。
今年3月,總部位於中國香港的國際知名AI製藥公司Insilico Medicine(英矽智慧)就宣佈,他們透過人工智慧發現了治療肺纖維化的新靶點,然後從無到有設計了一個新的藥物分子來靶向這個靶點。這也是全球首次利用人工智慧發現新機制特發性肺纖維化藥物。
這一突破標誌著業界首次對人工智慧發現的藥物進行科學驗證,並將其用於新藥研發,直至候選化合物的臨床前研究。而且,整個研發過程只花了不到18個月的時間和大約200萬美元,重新整理了速度和最低成本記錄,在大大加快和推進臨床前開發的同時,節約了大量藥物發現成本。
AI製藥,步伐緩慢
當然,人們雖然寄希望於人工智慧,但人工智慧所獲得的突破與人們對人工智慧報以的高漲的熱情似乎並不成正比。計算機設計新藥的程式已經存在了好幾十年,但在醫藥行業,研發產出率非但沒有上升,反而還逐年下降。藥物發現的時間沒有縮短,成本也沒有變得更低。
這並不是說這些程式阻礙了新藥的研發,而是說它們尚未給行業帶來大幅的可喜改觀。四十年來,人工智慧在製藥行業前進的步伐依然緩慢。新藥發現和研發所面臨的挑戰數不勝數,人工智慧可以解決的部分實在有限。
這背後涉及到至少兩方面的原因。一方面,當今的人工智慧存在其固有侷限。對於目前的人工智慧來說,其主要還是透過在資料中尋找模式來學習的。通常,輸入的資料越多,人工智慧就越智慧。這也意味著,這些資料也具有限制了人工智慧製藥的可能。
要實現超自然的效能,一般來說,必須輸入模擬特定行為的高質量資料對系統進行訓練。這在圍棋等遊戲中容易實現,每一步都有明確的引數,但在不太可預測的現實生活場景中則要困難得多。這也令人工智慧在應用到現實場景的過程中,經常會遇到困難。
疫情期間,在法國、美國和英國等地,人工智慧之所以也未能支援政府建立有效的接觸者追蹤系統的努力,很大一部分原因就是缺少必要的“原料”:在英國,由於缺乏系統的資料採集來追蹤和溯源新冠病例,在短期內幾乎不可能使用人工智慧技術實施接觸者追蹤干預。
在我國,醫藥大資料也存在資料量少、資料體系不完整、資料標準不統一、資料共享機制不完善等問題。諸如病歷、隨訪記錄目前還很難標準化、數字化;國內創新藥研發起步較晚,原始資料積累有限;國內藥品資料儲存分散,儲存格式不一,完整藥物資料獲取比較困難;新藥研發領域的核心資料來源於藥企,考慮到商業機密的問題,企業不願公開核心資料。醫藥資料的數量和質量成為人工智慧在製藥行業發展的主要障礙。
另一方面,我們不得不充滿敬畏地說,生物是一個非常複雜的體系。理論上能起效的新分子,在人體中可能有毒性,可能有脫靶效應,可能有副作用,可能與其他分子發生複雜的反應。更何況,沒有兩名患者的身體特徵完全一致,這進一步增加了藥物研發的複雜程度。事實上,人工智慧再具有潛力,也只能是作為工具存在,我們不必神話它。
上個世紀的人類基因組計劃是一個偉大的計劃,是人類嘗試在分子層面上去理解人類生命是如何自我表達、代際之間怎麼去溝通,人體如何透過遺傳物質,讓一代人和下一代人進行對話。這才有了現代醫學對於鹼基可以形成DNA的序列,然後DNA透過生物學的過程去指導蛋白質的合成的瞭解。現在,人工智慧要扮演的,就是這樣的角色。
人類智慧所能做的,是嘗試理解生物學語言,嘗試理解化學語言,然後把這兩個語言合到一起,從而能夠找到和疾病相關的蛋白質最匹配的那個化學分子,最終治癒人體的疾病。而人工智慧所要做的,就是和藥物化學家一起合作,來讓人類可以去發現更好的藥物。
製藥業就是這樣一個一路荊棘一路玫瑰的行業,危險但迷人,昂貴且漫長。人工智慧製藥作為一個新生的跨學科的複雜行業,每一天都需要面對複雜的問題。在人工智慧探究新藥上,人們將會綜合化學、生物、計算機、數學、統計等多個學科的經驗。如何實現如此多學科的彼此對話和彼此理解,也是人工智慧研發新藥的未竟之路。
好在一切才剛開始。和任何一個新生的技術一樣,人工智慧製藥也會經歷一個成長爬坡期。未來,人工智慧藥物研發將不再是生物醫藥行業中一個概念性技術,而是成為行業中非常核心的存在。