文 | 學術頭條
當下的我們,無疑都享受著科技的福利,感受著科技的魅力,陶醉其中……生活在科技時代的幸福指數不言而喻。
然而,科技是把雙刃劍,用好了,推動的是社會進步,用不好,刺傷的便是人類自己。
近年來,就有這樣一夥不法分子,濫用科技推動毒品的升級換代。被聯合國禁毒署定性為“新精神活性物質”(NPS, New psychoactive substances)的第三代毒品就大量的出現在非法市場上,其化學物質多樣性、高蔓延性、網際網路化等特徵,給禁毒工作帶來了極大的衝擊和困難。
那麼,隨著機器學習(ML, Machine Learning)的不斷髮展,對這項重任而言,能否助其一臂之力呢?
就在近日,Nature 旗下的專業學術期刊 Nature Machine Intelligence 發表了一項計算生物學的重要突破,論文標題為“A deep generative model enables automated structure elucidation of novel psychoactive substances”。主要團隊是加拿大英屬哥倫比亞大學(UBC, University of British Columbia)的一個小組。
在這項成果中,研究團隊研發了一種自動化、生成式的 ML 方法,實現了僅利用質譜就確定未知的 NPS 的化學結構。
人類的公共衛生事業,有望迎來新的得力助手。
阻止 NPS 進入“灰色市場”已迫在眉睫
今年早些時候,歐盟刑事司法合作署(Eurojust)釋出了一份報告,討論了“人造毒品”生產的急劇增長,給歐洲各地的檢察官所帶來的法律挑戰。
報告列舉了僅由該機構處理的 562 起跨境毒品販運案件,強調了合成和其他設計毒品便佔了近三分之一。
在 COVID-19 的大流行期間,這一現象更是有所增加。比如,美國因非法麻醉藥過量致死的人數增加了 6 倍。
因此,世界各地的執法部門都在探索一些具備前瞻性的方案,必須在這些藥物上市之前就有所準備。
NPS 又稱為策劃藥或實驗室毒品,通常是在現有毒品的化學結構上稍加修改而產生的,是不法分子為逃避打擊和規避監管而對管制毒品進行化學結構修飾而得到的毒品類似物,具有與管制毒品相似或更強的興奮、致幻、麻醉等效果,諸如合成大麻素(“香料”)、合成卡西酮(“浴鹽”)、迷幻色胺和苯乙胺、合成阿片類藥物等。
最可怕的是,NPS 是個十足的“偽裝者”,給人一種無害的假象,在傳播過程中往往被“包裝”成無害、無成癮性,目的是打消接觸者的警惕,尤其是針對充滿好奇心的青少年群體。
因此,NPS 不僅對個人的神經系統的損害特別大,還會造成嚴重的社會問題和公共衛生問題。
顯然,採取必要措施識別、監管、阻斷已刻不容緩。
UBC 的研究人員訓練計算機在下一種設計藥物上市前就對其進行預測,以最大限度挽救生命。執法機構也在衝破重重阻礙,競相識別和監管危險精神活性藥物的新版本。
從被查封的藥片或粉末中確定這些所謂的“合法興奮劑”可能需要幾個月的時間,然而在此期間,成千上萬的人可能已經使用了一種新的特製藥物,所以,其危害之大可想而知。
Skinnider 表示,“這是全世界急診部門關注的一個主要公共健康問題” 。由於毒品製造者不斷琢磨出新的物質,而且難以監管到,新毒品大約以每週一種的速度進入“灰色市場”。
好在新的研究已幫助世界各地的執法機構有效的縮短了鑑定時間,這對鑑定和監管 NPS 至關重要。
研發識別新設計毒品的 AI 工具——DarkNPS
一批科學家將目光聚焦到了 AI 身上。
在這篇論文中,UBC 研究團隊研發了一種名為 DarkNPS 的工具,這是一款支援深度學習的系統。透過 AI 工具進行簡單的分析,以快速提取 NPS 中化學結構的可能分子結構。
該工具可以完成兩件事。其一,預測不久的將來,可能出現在非法市場上的未知的新型毒品的化學結構;其二,使用質譜技術,闡明剛出現在非法市場上的新型毒品的完整化學結構。
Skinnider 和同事使用世界各地法醫實驗室眾包的保密資料,以訓練 ML 模型,產生結構和性質類似於近期人造毒品的分子,其靈感源自人類大腦的結構和功能。
其中,訓練集包括每種藥物的串聯質譜結果,即翻譯並分析部門重組蛋白資料,可以獲得有關分子質量以及包含元素的資訊。顯然,AI 便能夠識別出串聯質譜資料和化學結構間的模式資訊。
隨後,該模型產生了一個包含十億種潛在新型精神藥物的結構資料庫。
然後,這些分子與 196 種新的設計藥物進行測試,這些藥物是在模型經過訓練後出現在非法市場上的。研究人員發現,在生成的樣本中,有超過 90% 的樣本真實存在。
最後研究團隊得出結論,利用模型訓練結束後新收集的資料測試該模型發現,該方法可以僅用質譜就確定未知人造毒品。此外,在準確結構難以精確確定的例項中,該模型所建議的結構,與未知的人造毒品非常相似。
正如主要研究者之一的 Skinnider 所表示的,“藉助 AI 技術,我們的方法可以把識別新設計的毒品所需的時間從數週或數月,縮減到數小時,幫助法醫實驗室更快地識別新人造毒品,以幫助挽救生命。”
現在,還有一個問題:這個模型能否從零開始識別完全未知的物質,而不是根據一組資料進行預測?
Leonard Foster 博士表示:“我們想知道,是否可以利用這種可能性來確定一種未知的藥物是什麼,僅僅基於它的質量——化學家很容易用質譜法來測量任何藥片或粉末。”
因此,研究人員利用 196 種新型合成藥物的資料集來驗證這一假設。
僅使用質量,該模型就能以 72% 的準確率列出了十大最受歡迎藥物的化學結構。給定一種先前未知的 NPS 的串聯質譜資料,DarkNPS 可以猜測其分子結構,準確率約為 51%,如果 AI 能夠對其分子結構的前 10 項進行預測,那麼,準確率會提升至 86%!可以說,該模型能夠預測幾乎所有新發現的藥物。
除此之外,研究人員發現,該模型還可以瞭解到哪些毒品更可能出現在市場上,哪些則不太可能出現。
Skinnider 表示,“該模型如此出色的表現著實令我們為之震驚。因為僅透過精確的質量測量來闡明整個化學結構,往常被認為是一個遙不可及的問題。將數十億個結構的列表縮小到 10 個候選結構,可以大大加快化學家識別新設計藥物的速度。”
資深研究者、阿爾伯塔大學計算科學教授 David Wishart 博士表示,“事實上,我們可以在設計毒品真正出現之前就預測它們可能會出現在市場上,這有點類似於 2002 年的科幻電影《少數派報告》(Minority Report)。在該影片中,正是因為對即將發生的犯罪活動的預見,從而幫助顯著減少了未來世界的犯罪。”
他還說道,“從本質上講,這一研究成果讓執法機構和公共衛生專案對秘密化學家提供了一個所謂的‘先機’,讓他們知道應該注意什麼。”
同樣讓人興奮的是,雖然這一次該技術被用於鑑定藥物,但它完全可以擴充套件到其他分子結構的研究。
據 Skinnider 表示,用其他資料集訓練的類似生成方法,也可以幫助識別其他特定領域未知分子的結構,例如識別新型興奮劑或者環境汙染物等。
並且,他總結道:“現在,存在著一個化學‘暗物質’的世界,就存在於我們的指尖之外……我認為,正確的 AI 工具埋藏著巨大的潛力,以照亮這個未知的化學世界。”
- 參考資料:Nature Machine Intelligence