編輯 | 蘿蔔皮
目錄
- PhosIDN:一種整合的深度神經網路,用於透過結合序列和蛋白質-蛋白質相互作用資訊來改善蛋白質磷酸化位點預測
- 透過多尺度卷積神經層進行遷移學習,用於人-病毒-蛋白質相互作用預測
- DeepTrio:使用掩碼多個並行卷積神經網路的蛋白質-蛋白質相互作用的三元預測系統
- pyconsFold:一種使用距離預測進行建模和對接的快速、簡單的工具
- 一種預測生物活性分子結合構象的幾何深度學習方法,可預測配體與蛋白質靶標的結合構象
- 使用奈米孔以單氨基酸解析度多次重讀單個蛋白質
PhosIDN:一種整合的深度神經網路,用於透過結合序列和蛋白質-蛋白質相互作用資訊來改善蛋白質磷酸化位點預測
磷酸化是研究最多的翻譯後修飾之一,在各種細胞過程中起著關鍵作用。研究蛋白質磷酸化可以增進對蛋白質互作的研究,對於醫療、疾病、製藥等均有幫助。
最近,深度學習方法在預測磷酸化位點方面取得了巨大成功,但其中大多數基於卷積神經網路,可能無法捕獲足夠的關於蛋白質序列中殘基之間的長程依賴關係的資訊。
此外,現有的深度學習方法僅利用序列資訊來預測磷酸化位點,因此非常需要開發一種深度學習架構,可以結合異質序列和蛋白質 - 蛋白質相互作用(PPI)資訊來更準確地預測磷酸化位點。
中國科學技術大學的研究人員提出了一種名為 PhosIDN 的新型整合深度神經網路,透過提取和組合序列和 PPI 資訊來預測磷酸化位點。
該研究以「PhosIDN: an integrated deep neural network for improving protein phosphorylation site prediction by combining sequence and protein–protein interaction information」為題,於 2021 年 12 月 15 日刊載於《Bioinformatics》。
在 PhosIDN 中,提出了一個序列特徵編碼子網路,不僅可以捕獲區域性模式,還可以捕獲蛋白質序列的遠端依賴性。同時,在 PhosIDN 中還透過採用多層深度神經網路的 PPI 特徵編碼子網路提取有用的 PPI 特徵。
此外,為了有效地結合序列和 PPI 資訊,引入了異構特徵組合子網路,以充分利用序列和 PPI 特徵之間的複雜關聯,並將它們的組合特徵用於最終預測。綜合實驗結果表明,所提出的 PhosIDN 顯著提高了磷酸化位點的預測效能,並且優於現有的通用和激酶特異性磷酸化位點預測方法。
PhosIDN 連結:https://github.com/ustchangyuanyang/PhosIDN
論文連結:https://academic.oup.com/bioinformatics/article/37/24/4668/6329824
透過多尺度卷積神經層進行遷移學習,用於人-病毒-蛋白質相互作用預測
為了補充常規實驗方法的資料,基於機器學習的計算方法在預測人-病毒的蛋白質-蛋白質相互作用(PPI)方面發揮著越來越重要的作用。此外,遷移學習可以有效地將從大型源資料集/任務中獲得的先驗知識應用於小型目標資料集/任務,從而提高預測效能。
為了預測人類和病毒蛋白質之間的相互作用,中國農業大學的研究團隊將進化序列特徵與連體卷積神經網路 (CNN) 架構和多層感知器相結合。該架構優於各種基於特徵編碼的機器學習和最先進的預測方法。
研究人員引入了兩種轉移學習方法(即「凍結」型和「微調」型),透過重新訓練 CNN 層,基於源人類-病毒域中的訓練,可靠地預測目標人類-病毒域中的相互作用。最後,研究人員利用「凍結」型別的轉移學習方法來預測人類-SARS-CoV-2 PPI,結果表明該預測在拓撲和功能上與實驗已知的相互作用相似。
該研究以「Transfer learning via multi-scale convolutional neural layers for human–virus protein–protein interaction prediction」為題,於 2021 年 12 月 15 日刊載於《Bioinformatics》。
原始碼和資料集:https://github.com/XiaodiYangCAU/TransPPI/
論文連結:https://academic.oup.com/bioinformatics/article-abstract/37/24/4771/6323357?redirectedFrom=fulltext
DeepTrio:使用掩碼多個並行卷積神經網路的蛋白質-蛋白質相互作用的三元預測系統
蛋白質-蛋白質相互作用(PPI)作為一種相對屬性,由兩個結合蛋白決定,這給設計具有無偏學習架構和優越泛化效能的專家模型帶來了巨大挑戰。此外,幾乎沒有努力允許 PPI 預測器區分相對屬性和內在屬性。
浙江大學的研究人員提出了一種基於序列的方法 DeepTrio,用於使用掩碼多個並行卷積神經網路進行 PPI 預測。實驗評估表明,就各種質量指標而言,DeepTrio 的效能優於幾種當前最先進的方法。此外,DeepTrio 被擴充套件以提供關於每個輸入神經元對預測結果的貢獻的更多見解。
該研究以「DeepTrio: a ternary prediction system for protein–protein interaction using mask multiple parallel convolutional neural networks」為題,於 2021 年 10 月 25 日釋出在《Bioinformatics》。
DeepTrio 線上申請:http://bis.zju.edu.cn/deeptrio
DeepTrio 模型和訓練資料:https://github.com/huxiaoti/deeptrio.git
論文連結:https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab737/6409848?redirectedFrom=fulltext
pyconsFold:一種使用距離預測進行建模和對接的快速、簡單的工具
蛋白質內的接觸預測最近已成為準確預測蛋白質結構的可行方法。在許多情況下,使用預測距離分佈已被證明優於僅使用二元接觸註釋。使用預測的蛋白質間距離也已被證明能夠對接一些蛋白質二聚體。
在這裡,瑞典斯德哥爾摩大學的研究人員介紹了一種使用距離預測進行建模和對接的工具 pyconsFold;它使用 CNS 作為其基本摺疊機制和預測接觸距離,該工具在 210 種蛋白質資料集上優於基於常規接觸預測的建模。它的效能比最先進的 pyRosetta 摺疊管道稍差,但平均每個模型快 20 倍。更重要的是,pyconsFold 還可以用作摺疊和停靠協議,透過使用預測的蛋白間接觸/距離同時摺疊和停靠兩條蛋白質鏈。
該研究以「pyconsFold: a fast and easy tool for modeling and docking using distance predictions」為題,於 2021 年 11 月 1 日刊載於《Bioinformatics》。
pyconsFold 是在 Python 3 中實現的,重點是使用盡可能少的依賴項以延長使用壽命。它既可以作為 Python 3 中的 pip 包使用,也可以作為 GitHub 上的原始碼使用,並在 GPLv3 許可下發布。
資料和原始碼:https://github.com/johnlamb/pyconsfold
論文連結:https://academic.oup.com/bioinformatics/article/37/21/3959/6317824
一種預測生物活性分子結合構象的幾何深度學習方法,可預測配體與蛋白質靶標的結合構象
瞭解配體與其分子靶標之間形成的相互作用是指導分子最佳化的關鍵。目前,已有多種不同的實驗和計算方法來揭示這些分子間相互作用。
在這裡,Janssen Research & Development 的研究人員報告了一種基於幾何深度學習的方法,該方法能夠預測配體與蛋白質靶標的結合構象。
該模型根據距離似然學習統計潛力,這是為每個配體-目標對量身定製的。這種潛力可以與全域性最佳化演算法相結合,以重現配體的實驗結合構象。
該團隊表明,此處描述的基於距離似然的潛力在對接和篩選任務中的表現與完善的評分函式相似或更好。總的來說,這種方法代表瞭如何使用人工智慧來改進基於結構的藥物設計的一個例子。
該研究以「A geometric deep learning approach to predict binding conformations of bioactive molecules」為題,於 2021 年 12 月 2 日釋出在《Nature Machine Intelligence》。
論文連結:https://www.nature.com/articles/s42256-021-00409-9
使用奈米孔以單氨基酸解析度多次重讀單個蛋白質
能夠識別單個蛋白質的蛋白質組學工具對於細胞生物學研究和應用非常重要。
在這裡,荷蘭代爾夫特理工大學的研究人員展示了一種基於奈米孔的單分子肽閱讀器,它對單個肽中的單氨基酸取代敏感。DNA-肽綴合物被DNA解旋酶Hel308拉過生物奈米孔MspA。透過奈米孔讀取離子電流訊號能夠區分單次讀取中的單氨基酸取代。
分子動力學模擬顯示這些訊號是由尺寸排阻和孔結合引起的。研究人員還展示了「倒帶」肽段讀數的能力,獲得同一分子的大量獨立讀數,在單氨基酸變體鑑定中產生 <10^-6 的錯誤率。這些概念驗證實驗為開發單分子蛋白質指紋圖譜和分析技術奠定了有希望的基礎。
該研究以「Multiple rereads of single proteins at single–amino acid resolution using nanopores」為題,於 2021 年 11 月 4 日釋出在《Science》。
論文連結:https://www.science.org/doi/10.1126/science.abl4381
相關報道:https://phys.org/news/2021-11-scanning-protein-amino-acid.html
https://techxplore.com/news/2021-11-individual-proteins-nanopores-supercomputers.html