來自:DrugAI公眾號
作者:王建民
審稿:曾湘祥
人類可以設計一艘宇宙飛船精準到達38萬公里之外的月球,但卻無法設計出一枚直擊疾病的完美藥物分子。
2020年是AI製藥的元年,AI發現“史上最強抗生素”,AlphaFold2精準預測人類蛋白質結構。
2021年,我們看到了AI製藥的繼續爆發。人工智慧與生物醫藥擦出的美妙火花,正在點燃整個藥物研發過程,吸引著越來越多的企業和科研機構加入到“人機合作”中來。全球已披露超過30款AI/計算技術參與研發的藥物進入臨床試驗階段,資本市場上也受到認可, 全球已有10多家公司成功上市。隨著人工智慧技術的不斷髮展與成熟,一個高效且低成本的藥物研發時代,不再遙遠。接下來,DrugAI將回顧2021年AI在生物醫藥領域的一些突破性進展。
Contents
- 資料集
- 基於AI的蛋白結構預測和蛋白設計
- 基於AI的分子生成
- 分子表徵和性質預測
- AI逆合成
- 生物醫藥知識圖譜
- 生物大資料AI
- 量子計算與藥物發現
- 醫學與藥物重定位
新獨家報告(Drug Target Review) | 人工智慧和資訊學:藥物發現和開發
Drug Discov. Today | 從計算機輔助藥物發現到計算機驅動的藥物發現
Commun. Biol. | 人工智慧加速抗生素髮現
Drug Discovery Today | 人工智慧在藥物發現領域應該如何發展
1
資料集
Nucleic Acids Research | PROTAC-DB:PROTACs線上資料庫
Nucleic Acids Res | 代謝組學資料預處理
Nucleic Acids Res | 藥物代謝酶的相互作用
Nucleic Acids Res | 人體微生物群的內外源調控圖景
Genome Biology | 藥物基因組學資料庫
Nucleic Acids Res | ADMETlab 2.0:全面的藥代動力學和毒性線上預測平臺
Nucleic Acids Res | DrugComb更新:更全面的藥物敏感性資料儲存和分析門戶
Nucleic Acids Res. | DDInter:藥物-藥物相互作用資料庫
Nucleic Acids Res. | 合成結合蛋白資料及交叉分析平臺
Nucleic Acids Research | 療效藥物靶標的比較性研究與資料平臺構建
Nucleic Acids Research | 藥物轉運體三維結構可變性資訊分析
Nucleic Acids Res. | webTWAS:疾病候選易感基因新資源
Nucleic Acids Res. | AlphaFold DB:大規模擴充套件蛋白質序列空間的結構覆蓋範圍
Nature Protocols | 基於機器學習和平行計算的代謝組學資料處理新方法
2
基於AI的蛋白結構預測和蛋白設計
蛋白結構預測
Nature丨AlphaFold2帶著原始碼來了,開啟AI生命科學的新時代
Nature | AlphaFold預測98.5%人類蛋白結構,科學研究新正規化
讓子彈飛 | 院士深度解析Alphafold DB的未來影響
EMBO Reports | 生物學中的人工智慧革命:AlphaFold的優勢和劣勢
Science | 面對alphafold,學術界沒有躺平:RoseTTAFold挑戰蛋白複合物預測
Science | 蛋白質結構預測: now easier, faster
Nat.Commun. | DeepAccNet:基於深度學習的準確性估計改善蛋白質結構最佳化
Nat. Commun.| CopulaNet:直接從多序列聯配中學習殘基間距離以“從頭預測”蛋白質結構
Nat.Commun. | 用DiffNets探究蛋白質生化性質的結構決定因素
計算蛋白建模和下一個病毒大流行
蛋白質結構預測的突破
Nat. Commun. | 基於結構和GCN的蛋白質功能預測
QUARK的增強版C-QUARK問世,有效提升蛋白質結構從頭預測精度
蛋白設計
Nat. Biomed. Eng.| IBM利用深度生成模型和分子動力學模擬加速抗菌肽發現
Chem. Sci. | 機器學習設計非溶血性抗菌肽
Science | 以功能為核心的蛋白質設計
Nat.Mach.Intell | ProteinGAN:利用生成對抗網路擴充套件功能蛋白序列空間
Nat. Commun. | 人工蛋白質中帶電網路的設計
Nat. Commun.| 使用自迴歸生成模型進行蛋白質設計和變體預測
資料驅動的計算蛋白質設計
bioRxiv | ProteinBERT:專為蛋白質序列和功能設計的通用深度學習模型
Nat. Methods. | 高效資料最佳化Low-N蛋白質篩選工程
Nat. Commun. | 研究人員解決了設計更大蛋白質的難題
Nat. Chem. | 透過深度學習設計靶向核的非生物微蛋白
Nat. Commun. | arDCA:基於自迴歸模型的高效蛋白質序列生成模型
Nat. Commun.|機率蛋白質序列模型的生成能力
給我一串隨機序列,還你一個全新蛋白 ——David Baker團隊最新研究成果“想象蛋白”
基於條件生成模型的分層功能從頭蛋白質設計
抗體設計
Nat. Commun. | 抗體體細胞突變的機器學習分析預測免疫球蛋白輕鏈毒性
arXiv | 預測抗體抗原結合位點的神經訊息傳遞模型
BIB |免費通用且詳盡的計算抗體設計方案——IsAb
Nat. Biomed. Eng.| 深度學習最佳化治療抗體
Nat. Mach. Intell. | 基於深度學習的T細胞受體和抗原結合特異性預測
IgLM-條件式抗體序列生成模型
3
基於AI的分子生成
下一站:AlphaDrug?
Nat. Com. Sci. | 計算設計可合成分子
Chemistry42 | 一個基於AI的分子從頭設計平臺
MLST | GraphINVENT: 基於GNN的分子生成平臺
JCIM | DeepFrag: 程式設計小白都會用的深度學習先導最佳化APP
Nat. Commun. | 用於分子生成的遮掩圖生成模型
從頭設計的分子生成模型綜述
Sci. Advances | 基於深度生成模型和on-chip合成的全新藥設計
Advanced Sci | 打破生成式深度學習限制:低量資料下的“one-shot”藥設計法
JCIM| 透過以蛋白質結合位點3D資訊為條件的分子生成模型進行從頭分子設計
Chem. Sci. | 3D深度生成模型進行基於結構的從頭藥物設計
Nat. Mach. Intell. | 針對多目標最佳化的分子生成新方法MCMG
GEODIFF:用於分子構象生成的幾何擴散模型
CIKM 2021 | 基於IPCA的多屬性分子最佳化
用於分子生成的資料高效性圖語法學習
4
分子表徵和性質預測
分子表徵
J Cheminform.|GNN能否學習更好的分子表徵用於藥物發現?
MolCLR | 對比學習在分子圖表示任務中大有作為
arXiv | 圖表示方法驅動大分子計算研究
MG-BERT:面向藥物分子性質預測的大規模原子表徵預訓練模型
arXiv | 運算子自編碼器:學習編碼分子圖上的物理操作
Nat. Commun. | 深度機器學習:未表徵化合物的生物活性描述符
iLearnPlus:核酸和蛋白質序列分析、預測模型構建和資料視覺化的開源自動化機器學習平臺
Briefings in Bioinformatics | 基於SMILES的藥物分子表徵深度模型和資料增強策略研究
CVPR 2021 | dMaSIF:基於蛋白質表面資訊的高效端到端表徵學習
Nat. Mach. Intell. | 探索稀疏化學空間的化學語言模型新策略
NeurIPS 2021 | 透過動態圖評分匹配預測分子構象
基於化學元素知識圖的分子對比學習
Nat. Mach. Intell. | 用於預測分子結合構象的幾何深度學習方法
性質預測
J. Cheminform. | GraphSol:預測接觸圖助力蛋白質溶解度預測
Nat. Commun. | 採用DiffNets透過比較結構集來深度學習蛋白質生化特性的結構決定因素
Nat. Commun. | AGBT:將圖和雙向transformers融合的分子性質預測新工具
ACS Omega 2021 | KMPNN:利用知識嵌入提升分子屬性預測效能
NeurIPS-21 | MGSSL: 基於官能團的分子屬性預測圖網路自監督預訓練
5
基於AI的化學反應和逆合成預測
J Cheminform.|基於子結構的神經機器翻譯用於逆合成預測
Nat. Mach. Intel. | IBM RXN: 深度學習在化學反應分類上大放異彩
Nature | 貝葉斯最佳化演算法為合成化學帶來了哪些突破?
Nat. Mach. Intel. | 面向未來藥物化學家的Transformers
Nature | 突破優化合成反應瓶頸,機器學習提供新思路!
IBM RXN for Chemistry: 揭開有機化學語言的語法面紗
Nat. Mach. Intell. | 合成模型效能難提升?試試這個資料降噪策略
Nat. Commun.| 從化學反應文字表示中探究實驗過程
ICML2021 | 自提升策略規劃真實且可執行的分子逆合成路線
BIB重磅綜述 | 深度學習下的逆合成設計
Chem. Sci. | 用於定量建模有機化學反應的深度主動學習框架DeepReac+
ICLR 2022 under review|化學反應感知的分子表徵學習
J. Cheminform. | DrugEx v2:多重藥理學中基於pareto的多目標強化學習的藥物分子從頭設計
6
生物醫藥知識圖譜
藥物開發的社交圖譜
bioRxiv | 破譯疾病基因功能的單核跨組織分子參考圖譜
bioRxiv | 生物學見解知識圖譜(BIKG)助力藥物開發
COSB 2021 | 知識圖譜輔助藥物發現
Nat. Commun.|KGE_NFM:基於知識圖譜和推薦系統的藥物靶標相互作用預測框架
7
生物大資料AI
bioRxiv | 用於單細胞RNA-seq和ATAC-seq資料整合的轉移學習
Nat. Com. Sci.|穩定維護隱藏開關以提高基因表達的穩定性
MIT | 一種可解釋的PPI預測模型
Nat. Methods | 利用機器學習對蛋白質-肽相互作用和訊號網路進行生物物理預測
Nat. Commun. | 可多層次預測多肽-蛋白質相互作用的深度學習框架
Nat. Commun. | 多視角預測病毒和哺乳動物宿主的關聯
Arxiv | 預測新型蛋白質間相互作用的圖神經網路模型
PLOS. COMPUT. BIOL. | 深度幾何表示模擬突變如何影響蛋白質-蛋白質結合親和力
Nat. Commun.|DeepRank:蛋白質-蛋白質介面的深度學習框架
Nat.Biotechnol. | 機器學習揭示克服基因療法侷限的秘訣
基於計算學方法的蛋白質相互作用預測綜述
Nat.Biotechnol. | 單細胞資料整合的計算原理與挑戰
Nat. Mach. Intell. | 模組化深度學習實現了單克隆細胞系的自動識別
Nat. Biotechnol. | 利用深度學習從基因轉錄資料中預測藥物療效
Nat.Commun. | scGCN:用於單細胞組學知識轉移的圖卷積網路演算法
Nat. Biotechnol. | 創新演算法有助於推進單細胞基因組學
Nat. Comput. Sci. | 使用神經網路結構對基因調控網路進行建模
Genome Research | 用於對單細胞分類的半監督對抗式神經網路
Nat. Mach.Intell.| AI識別165個新癌症基因,有望助力個性化醫療領域
Nat. Commun. | 從單細胞轉錄組資料中學習可解釋的細胞和基因簽名嵌入
Nat. Biotechnol. | 透過遷移學習將單細胞資料對映到參考圖譜
Nat. Commun. | 用於推斷單細胞轉錄組學中的生物網路活躍度的可解釋模型VEGA
bioRxiv | SIMBA:基於圖嵌入的單細胞特徵提取模型
Nat. Methods | 一個可解釋可推廣的單細胞資料分析框架
高欣/王建新課題組NAR兩連發-重複序列檢測演算法和資料庫
8
量子計算與藥物發現
量子藥物發現的未來
IBM : 用於蛋白質摺疊的新型量子演算法
9
醫學與藥物重定位
針對阿片類藥物使用障礙的藥物重定位
Nat. Aging | 人工智慧在長壽醫療中的應用
Nat. Mach. Intel. | 基於真實世界患者資料的藥物重定位的深度學習框架
Nat. Rev. Drug Discov. | 最成功的腫瘤藥物組合
Nat.Commun. | 治療阿爾茨海默病——機器學習助力老藥新用
Nat. Biotechnol.| 基於生物活性建模識別抗SARS-CoV-2藥物
Nat. Methods | CryoDRGN: 利用神經網路重建異質cryo-EM結構
Nat. Commun. | 多工深度學習從縱向影象中預測治療反應
Nat. Commun. | 多尺度相互作用網路鑑定疾病治療機制
Nat.Commun.|基於深度生成神經網路進行精準的藥物反應推算
Nat. Commun. | DRUML:利用機器學習預測抗癌藥物療效
Nat. Mach. Intel. | 深度學習連提取冷凍電鏡圖蛋白質動力學資訊都搞定了!
WWW2021 | 多檢視圖對比表示學習用於藥物藥物相互作用預測
KDD2021 | 用於預測蛋白質-配體結合親和力的圖神經網路
Nat. Commun. | 用於持續學習心臟訊號的臨床深度學習框架
Nat. Biotechnol. | 透過對抗訓練和雙批次正則化提高神經網路的診斷效能和臨床可用性
Bioinformatics | CLEP:用於生成患者表徵的混合資料和知識驅動框架
Nat. Commun. | 基於深度學習將組織切片影象進行虛擬特殊染色,減少診斷時間和成本
PLoS Med. | 基於人工智慧的心臟-腫瘤學精準醫學研究
Nat. Methods|生物成像分析中的注意事項
PNAS | ComboNet:預測治療COVID-19的協同藥物組合
Front. Pharmacol. | 生成式AI助力藥物重定位
BIB | MDF-SA-DDI:基於多源藥物、特徵融合預測藥物相互作用事件
Nat. Methods | 利用深度學習進行基於生物物理學和資料驅動的分子機制建模
Nat. Rev.Clin.Oncol. |數字病理學中的人工智慧-診斷和精確腫瘤的新工具
Nat. Commun. | AIDE:用於醫學影象自動分割的標註高效深度學習模型
Nature|精準醫療的基礎:準確預測致病突變的深度生成模型
Sci. Adv. | 新演算法識別治療肺動脈高壓的候選抗癌藥物
Nat. Aging︱老藥新用重磅發現——西地那非有助於預防或治療老年痴呆
Nat. Biotechnol. | 基於大規模資料標註和深度學習對組織影象進行具有人類水平效能的全細胞分割
Nat. Commun.|半監督深度聚類方法Smile-GAN:從大腦結構中識別阿爾茨海默症
站在巨人的肩膀上?推出NeDRex平臺對現有藥物進行再利用
Nat. Commun.|基於重要性預測和化學基因組相互作用識別抗真菌靶點
10
其他
AI促進藥物發現:未來是多細胞研究
JCIM | 化學、生物和生物醫學科學的資訊學研究
OpenChem | 用於計算化學和藥物設計的深度學習工具包
針對大分子結構和動力學的生成式深度學習
Nat. Genet. | 人體蛋白質網路的疾病突變微擾理論系統性研究
arXiv | TorchMD:一種用於分子模擬的深度學習框架