12 月 4 日的《熱心腸日報》,我們解讀了 9 篇文獻,關注:奈米孔,人腸道菌群資料庫,益生菌,關聯分析,抗生素抗性,雞腸道菌群,16S rRNA基因測序,計算模型,多重擴增子測序
Nature子刊:奈米孔測序技術、生物資訊學及應用(綜述)
Nature Biotechnology——[54.908]
① 本文詳細介紹了納米孔測序技術的原理及發展並詳述了其測序建庫流程;② 進一步,作者概述了基於牛津奈米孔技術(ONT)測序資料的生物資訊學分析模組;③ 作者基於對近些年已發表文章的系統統計,詳述了ONT測序在11個主要方面的應用;④ 最後,作者指出了未來ONT測序需要改進的層面:更高的測序準確性(>99%)、更長的測序長度 (Megabase)、降低測序所需的DNA和RNA樣品量。
【主編評語】
2021年11月8日,美國俄亥俄州立大學(Ohio State University)區健輝(Kin Fai Au)研究組在Nature Biotechnology線上發表綜述論文Nanopore sequencing technology, bioinformatics and applications,該文章系統全面地回顧總結了奈米孔測序技術的發展歷史、技術原理、資料特徵、生物資訊學分析方法以及廣泛的應用, 同時也指出了目前存在的問題。(@劉永鑫-中科院-宏基因組)
【原文資訊】
Nanopore sequencing technology, bioinformatics and applications
2021-11-08, doi: 10.1038/s41587-021-01108-x
陳衛華+趙興明+赫麗傑:實現疾病標誌物識別和跨資料集比較的人類腸道菌群資料庫GMrepo v2
Nucleic Acids Research——[16.971]
① GMrepo v2(腸道菌群的資料儲存庫) 包含 353 個專案和 71,642 個測序樣本,與之前的版本相比顯著增加;② 這些樣本中,分別透過 16S rRNA基因擴增子和隨機宏基因組測序獲得 45,111 和 26,531 個,表型數量從 92 個增加到 133 個,還引入疾病標誌物識別和跨專案/表型比較;③ 首先為選定的專案確定兩種表型(例如健康與疾病)之間的疾病標誌物,然後比較跨資料集的每個表型對的已識別標記,並提供一個以標記為中心的檢視。
【主編評語】
GMrepo 是一個精心設計和一致註釋的人類腸道宏基因組資料庫,其主要目的是提高人類腸道宏基因組資料的可重用性和可訪問性,並實現跨專案和表型比較。華中科技大學陳衛華、復旦大學趙興明、中國醫科大學人民醫院赫麗傑作為共同通訊作者,在Nucleic Acids Research發表文章,介紹了 GMrepo 的更新版本GMrepo v2,在這個新版本中,作者收集了更多的專案、執行/樣本和表型。最重要的是,作者添加了疾病標記識別和已識別標記的跨專案/表型比較。GMrepo v2 可在以下網址免費獲得:https://gmrepo.humangut.info。(@劉永鑫-中科院-宏基因組)
【原文資訊】
GMrepo v2: a curated human gut microbiome database with special focus on disease markers and cross-dataset comparison
2021-11-12, doi: 10.1093/nar/gkab1019
張和平+張文羿+左永春:機器學習平臺iProbiotics助力益生菌快速篩選
Briefings in Bioinformatics——[11.622]
① 從益生菌資料庫(PROBIO)和文獻檢索到239個益生菌和412個非益生菌菌株基因組序列,對其進行k-mer(2-8)分析,識別到益生菌多於非益生菌基因組特徵(P-特徵);② 篩出184個核心特徵構建模型,10倍交叉驗證中預測精度和AUC值達97.77%,98.00%;③ 對多個數據庫註釋及宿主胃腸道存活和碳水化合物利用基因分析,發現P-特徵偏向益生菌功能相關基因/途徑分佈;④ 分析核心K-mers耐藥和毒力因子編碼基因,發現益生菌效應由K-mer基因組組合決定。
【主編評語】
益生菌的發現和實驗驗證需要大量的時間和精力,因此,開發有效的益生菌篩選方法具有重要意義。內蒙古農業大學張和平、張文羿和左永春作為共同通訊作者,在Briefings in Bioinformatics發表研究,開發了一個基於機器學習演算法的平臺,一種新穎且免費的線上生物資訊學工具 iProbiotics,用於從可用的全基因組測序資料中預測益生菌特徵,它將促進益生菌的快速篩選。作者構建了三個獨立模型,其可在 http://bib.oxfordjournals.org/ 上線上獲得,作者的研究結果為益生菌的鑑定和潛在機制提供了新的見解。(@劉永鑫-中科院-宏基因組)
【原文資訊】
iProbiotics: a machine learning platform for rapid identification of probiotic properties from whole-genome primary sequences
2021-11-27, doi: 10.1093/bib/bbab477
國內團隊:用於菌群關聯分析的R包-MZINBVA
Briefings in Bioinformatics——[11.622]
① 本研究綜述了分析稀疏和相關菌群資料的統計方法,並擴充套件了零膨脹負二項式 (ZINB)模型以對零膨脹和多級菌群計數資料進行關聯分析;② 作者提出了一種用於模型擬合和推理的變分近似(VA) 演算法 MZINBVA,它提供了引數估計協方差的穩健評估,併為關聯測試構建了 Wald 型檢驗統計量;③ 作者證明了 VA 是懲罰準似然 (PQL) 演算法、Laplace近似和隨機近似的一種有效且有吸引力的替代方法,用於基於似然的推理。
【主編評語】
上海交通大學王濤團隊近期在Briefings in Bioinformatics發表文章,提出了用於菌群研究中關聯分析的多級零膨脹負二項式模型,開發了一種用於最大似然估計和推理的變分逼近方法,其使用最佳化而不是抽樣來近似對數似然和計算引數估計,提供引數估計協方差的穩健估計,並構建用於關聯測試的 Wald 型檢驗統計量。作者開發了一個 R 包 MZINBVA 來實現所提出的方法,可從 GitHub 資源庫 https://github.com/liudoubletian/MZINBVA 上獲得。(@劉永鑫-中科院-宏基因組)
【原文資訊】
MZINBVA: variational approximation for multilevel zero-inflated negative-binomial models for association analysis in microbiome surveys
2021-10-26, doi: 10.1093/bib/bbab443
ARTS-DB:抗生素抗性靶標資料庫
Nucleic Acids Research——[16.971]
① 抗生素抗性靶標搜尋器(ARTS)資料庫使用靶向基因組挖掘(TDGM )方法,優先考慮編碼潛在新型抗生素的生物合成基因簇(BGC);② ARTS資料庫提供了超過 70,000 個基因組和宏基因組組裝基因組的預先計算的 ARTS 結果;③ 高階搜尋查詢允許使用者快速探索 TDGM 的基本標準,例如基本管家基因的 BGC 鄰近、複製和水平基因轉移;④ 此外,ARTS 資料庫提供了整個細菌界相互關聯的結果,以及與天然產物研究中已知資料庫的連結。
【主編評語】
本文中作者展示了 抗生素抗性靶標搜尋器(ARTS) 資料庫,這是一個綜合性儲存庫,包含來自 NCBI 的 RefSeq 和 GEM 目錄的高質量細菌基因組集,並使用靶向基因組挖掘(TDGM )策略進行處理。ARTS 資料庫允許研究人員快速訪問預先計算的 ARTS 結果並透過更廣泛的視野探索細菌界。作者相信 ARTS 資料庫將成為尋找新型天然產物的重要資源。ARTS 資料庫可在 https://arts-db.ziemertlab.com/ 上線上公開訪問,沒有訪問限制。(@劉永鑫-中科院-宏基因組)
【原文資訊】
ARTS-DB: a database for antibiotic resistant targets
2021-10-28, doi: 10.1093/nar/gkab940
中國農大團隊:雞腸道菌群的參考基因組和基因集用於解析耐藥基因
Communications Biology——[6.268]
① 該研究對來自中國和歐洲共十個國家的799個雞腸道菌群宏基因組資料進行了整合分析;② 組裝獲得了12339個菌株水平的參考基因組,涵蓋1978個物種;③ 透過物種註釋發現893個可能的新種和38個可能的新屬,最普遍的是鳥乳桿菌和捲曲乳桿菌;④ 研究進一步構建了一個含有1660萬個非冗餘基因的雞腸道菌群參考基因集;⑤ 透過對基因功能註釋發現,與歐洲來源的雞相比,中國來源的雞腸道菌群中含有的耐藥基因丰度相對較高,但多樣性較低。
【主編評語】
中國農業大學胡永飛團隊在Communications Biology發表研究,結合來自中國和歐洲國家的雞腸道菌群的宏基因組資料,構建了一個完整的雞腸道菌群參考基因集和基因組集,並使用多種生物資訊學工具和資料庫對組裝的基因和基因組集進行了註釋和分析,同時還使用新組裝的宏基因組組裝基因組 (MAGs)和基因集對雞腸道菌群中的耐藥基因 (ARGs)進行了分析,並比較了雞和人類腸道抗生素抗性組。這些整合的基因和基因組集資源對於更好地瞭解雞腸道菌群的結構和功能至關重要。本研究提供了迄今為止最大的雞腸道整合宏基因組資料集,並證明了其在探索雞腸道菌群基因方面的價值。(@劉永鑫-中科院-宏基因組)
【原文資訊】
Metagenome-assembled genomes and gene catalog from the chicken gut microbiome aid in deciphering antibiotic resistomes
2021-11-18, doi: 10.1038/s42003-021-02827-2
16S rRNA基因資料的變異識別軟體HashSeq
mSystems——[6.496]
① 在這項研究中,研究人員利用基於 HashMap 的快速方法來檢測六個公開可用的16S rRNA基因資料集中的序列變體;② 使用正態分佈結合區域性估計的散點圖平滑 (LOESS) 迴歸來估計背景錯誤率,作為單個序列簇的測序深度的函式;③ 這種方法在計算上是高效的,並且產生的推理產生了保守的並且被參考資料庫很好地支援的變體集;④ 這種推理方法快速、簡單且可擴充套件到大型資料集,並提供了一組高解析度的序列變體,這些變體不太可能是測序錯誤的結果。
【主編評語】
本文中作者介紹了一種快速且可擴充套件的演算法-HashSeq,該演算法基於作為測序深度函式的正態分佈背景誤差的估計來推斷序列變體。作者的流程具備有吸引力的效能特徵,可以獨立使用或與其他變體識別程式聯合使用,併為每個變體提供明確的 P 值來評估變體是由測序錯誤引起的可能性。(@劉永鑫-中科院-宏基因組)
【原文資訊】
HashSeq: a Simple, Scalable, and Conservative Variant Caller for 16S rRNA Gene Data Sets
2021-11-09, doi: 10.1128/mSystems.00697-21
腸道菌群的定向高斯混合模型闡明微生物空間結構
mSystems——[6.496]
① 本研究提出了一類混合成分之間具有空間依賴性的高斯混合模型(GMM),以便在計算上恢復菌群的相對空間排列;② 在盲腸和遠端結腸資料集上,作者發現該模型準確地概括了腸道菌群的已知空間行為,包括粘液和腔相關群體之間的組成差異;③ 作者的模型似乎也捕捉到了 pH 梯度對小鼠迴腸中菌群的作用,並提出了新的行為;④ 作者為所有資料集中存在空間結構提供了強有力的證據,具有明顯的區域特徵。
【主編評語】
作者開發了一類計算模型,以從 MaPS-seq 資料中恢復腸道菌群生物地理學的已知特徵,其模型建立在經典的高斯混合模型(GMM)之上,該方法採用微生物空間資料並學習許多經過實驗驗證的空間因素。作者的研究結果表明,腸道菌群雖然異常龐大,但具有可預測的空間模式,可用於幫助瞭解其在健康和疾病中的作用。作者表明,其提出的模型恢復了胃腸道內菌群的已知生物學行為,同時還提供了對腸道菌群空間結構的新見解。(@劉永鑫-中科院-宏基因組)
【原文資訊】
Directional Gaussian Mixture Models of the Gut Microbiome Elucidate Microbial Spatial Structure
2021-11-09, doi: 10.1128/mSystems.00817-21
新型多重擴增子測序法可實現汙水中新冠病毒RNA的精確定量
Environmental Science & Technology Letters——[7.653]
① ATOPlex 是華大智造(MGI)開發的多重PCR技術平臺,透過使用多重混合引物捕獲新冠病毒全基因組序列資訊,可實現對低濃度病毒的富集和高通量測序;② ATOPlex技術比常規的RT-qPCR更加靈敏,可實現更靈敏的病毒定量,可以更靈敏地檢測汙水中低濃度的病毒;③ RT-qPCR只能給出定量資訊,然而ATOPlex測序技術能夠儘可能的恢復病毒的基因組資訊,從而準確、快速的對病毒變種進行溯源。
【主編評語】
澳大利亞昆士蘭大學郭建華在Environmental Science & Technology Letters發表文章,介紹了一種基於多重擴增子的測序方法(Multiplexed Amplicon-based Sequencing) 來實現城市汙水中SARS-CoV-2 RNA的精確檢測,和常規的RT-qPCR相比,該方法不僅能夠對新冠病毒進行高靈敏度檢測,還能準確獲取病毒載量資訊和病毒基因組資訊,利用這些資訊可以對城市疫情流行程度進行判斷並對大流行的新冠病毒變種進行溯源。此外,研究結果表明城市汙水中的固相懸浮物或顆粒物中亦含有大量的SARS-CoV-2 RNA。該研究有望進一步推進基於汙水流行病學在公共衛生應急方面的應用。(@劉永鑫-中科院-宏基因組)
【原文資訊】
Novel Multiplexed Amplicon-Based Sequencing to Quantify SARS-CoV-2 RNA from Wastewater
2021-07-08, doi: 10.1021/acs.estlett.1c00408
感謝本期日報的創作者:劉永鑫-中科院-宏基因組,白藍木,CLEAP,勒布朗
點選閱讀過去10天的日報:
12-03 | 王軍軍等Microbiome:豬斷纖維,菌不聊生,木聚糖來相助!
12-02 | 蘭平+何真等Microbiome:鎖定腸繫膜脂肪的促炎細菌
12-01 | 11月,最值得看的30篇腸道健康文獻!
11-30 | 傅靜遠等Cell子刊:深度解碼菌群基因結構變異與膽汁酸代謝
11-29 | 改造細菌以抗癌,上海交大劉盡堯團隊NC發新突破
11-28 | 如何吃鹽更科學?NEJM里程碑綜述更新認知
11-27 | 9文聚焦:菌群與呼吸道疾病
11-26 | 今日Science重要綜述:腸腦之間的炎症訊號
11-25 | Nature雙發:菌群怎毀降糖藥效+中國減脂研究新突破
11-24 | 中農大連發2篇Microbiome:深度解碼蜂腸菌