1. 引言
由於第二代測序(next generation sequencing,NGS)的高敏感性,其在診斷呼吸道病原體中的應用愈加普及。由於樣本汙染而造成NGS假陽性混淆臨床診斷,亦或是檢測出病原菌無法區分定植菌和病原菌,或是臨床醫生缺少相關微生物知識,這都限制了NGS報告的正確解讀。當臨床工作人員遇到NGS報道的物種而無法確定其是否是病原菌時,常需要根據臨床經驗和既往關於此物種致病的報道進行判斷。對於物種致病的報道常透過檢索PubMed獲得,但是檢索PubMed常常獲得很多非臨床相關文獻,閱讀大量文獻花費臨床醫生大量時間,還可能導致臨床醫生無法快速獲取準確的文獻。為了更準確更快速解讀NGS報告中的呼吸道病原菌,中日醫院曹彬教授團隊藉助神經網路模型篩選了PubMed中報道呼吸道病原菌的文獻並建立了呼吸道病原菌檢索資料庫,結合文獻摘要資訊,為臨床醫生提供初步的病原判讀幫助。對該病原菌檢測資料庫介紹如下。
2. 病原菌檢索資料庫概述
如圖2-1所示,左側後臺端描述了呼吸道病原菌檢索資料庫產生和更新的流程。研究者使用美國微生物學會編撰的第11版《Manual of Clinical Microbiology》中涉及的細菌名稱在PubMed資料庫中進行檢索並下載相應文獻的摘要。將下載的文獻摘要分為兩組,分別進行人工標註和模型標註,標註過程為判斷文獻中提及的細菌是否為呼吸道致病原,並提取文獻中相關資訊(包括患者的人數、年齡、性別、免疫狀態、呼吸道基礎疾病、檢測此病原菌所用的標本、預後等資訊)。人工標註的文獻被進一步用於訓練神經網路模型,並使用訓練好的神經網路模型其餘的文獻(注:由於文獻原文無法批次獲取,人工標註和模型標註的過程中只使用了文獻的標題和摘要)。透過校對者的檢查,人工判斷呼吸道致病病原菌的準確度為92%。對模型進行交叉驗證,模型判斷呼吸道致病病原菌的準確度為87%,Precision為0.69,Recall為0.89,F1為0.78。後續定期對PubMed資料庫進行檢索以獲取新發表的文獻,並使用神經網路模型對新檢索的文獻進行標註以更新資料庫。右側Web端是面向使用者的網頁端檢索工具,使用者可透過「中國肺炎研究」官方網站首頁(https://www.chinapneumonia.cn/)選擇「病原檢索」進入或直接由https://www.chinapneumonia.cn/pathogens進入。
圖 2-1:軟體執行流程圖
3. 檢索工具使用說明
3.1 執行步驟
如圖3-1所示,在「中國肺炎研究」官方網站首頁(https://www.chinapneumonia.cn/)上方選擇「病原檢索」(位置如圖3-1中①所示)進入病原檢索頁面。
圖 3-1:進入檢索頁面
如圖3-2所示,進入病原檢索頁面後,在中部的搜尋欄中輸入目標細菌名稱,支援中文或英文名稱,且搜尋欄支援聯想功能,可以透過輸入部分細菌名稱以獲得聯想的細菌名稱。①處提供了幫助連結,包含了此工具的使用說明書。
圖 3-2:搜尋病原菌
圖3-3顯示了搜尋後的結果頁面。
①顯示了報道此細菌為呼吸道病原菌的文獻的數量。
②處為排序選項,可以以「物種英文名稱」、「物種中文名稱」,患者的「樣本量」、「年齡」、「免疫狀態」、「證據等級」(檢測病原菌所用的樣本型別),文獻的「發表日期」進行排序。
③處為篩選選項,點選此處可以顯示篩選欄.
④可以按照患者的「性別」、「樣本量」、「年齡」、「免疫狀態」、「證據等級」和文獻的「發表日期」進行篩選。
⑤處顯示了一篇文獻的資訊,包含了文中患者的「性別」、「樣本量」、「年齡」、「免疫狀態」、「證據等級」,文獻的「標註方式」、「發表日期」、「原文連結」的資訊。
圖 3-3:搜尋結果
3.2 結果解釋
每條搜尋結果為一篇報道了搜尋細菌為呼吸道病原菌的文獻的資訊概要。包括了細菌資訊(英文名稱、中文名稱),患者的基本資訊(樣本量、性別、年齡、免疫狀態)、證據等級、標註方式、文獻資訊(原文連結和發表日期)。如果細菌被判斷為呼吸道病原菌,則其「是否病原菌群」結果為「yes」,否則為「no」。患者樣本量被分為「1」、「1-10」、「11-100」、「100以上」及「none」(表示未獲取相關資訊);患者年齡被分為「1歲以下」、「1-17歲」、「18-65歲」、「65歲以上」及「none」(表示未獲取相關資訊);患者免疫狀態包括「正常」、「抑制」及「none」(表示未獲取相關資訊),符合以下的任一條件,便被定義為免疫受損:(1)患有血液癌或實體腫瘤及接受化療者;(2)因血液癌/骨髓移植/固體器官移植而進行免疫抑制治療;(4)慢性類固醇使用;(5) 患有艾滋病;(6) 再生障礙性貧血等其他導致免疫細胞數量或功能缺陷的血液類疾病;(7)無脾(8) 其他免疫功能不全(任何免疫功能不全狀態,包括先天性/遺傳免疫不妥協);證據等級是基於微生物學和病理學評價判斷細菌是否為呼吸道病原菌的標準,表3-1列舉了證據等級的分類標準。標註方式包括 「人工標註」和「模型標註」,「人工標註」表示此文獻中的細菌是否為致病菌由人工判讀結論確定,「模型標註」表示此文獻中的細菌是否為致病菌由神經網路模型判定。
3.3 注意事項
為了高效且全面地檢索文獻,同時由於文獻全文無法批次獲取,因此我們僅透過文獻的摘要判斷目標細菌是否為致病細菌,這可能導致部分資訊的缺失。另外,本資料庫尚未納入報道病毒與真菌在呼吸道致病的文獻,計劃將來補充相應資料。
表3-1 證據等級分類標準
證據等級 |
微生物學 |
病理學 |
1 |
無菌環境下獲取的呼吸道組織發現證據: |
中性粒細胞、巨噬細胞、淋巴細胞、嗜酸性粒細胞或漿細胞的浸潤 |
手術取樣 |
滲出或組織損傷 |
|
經皮活檢 |
- |
|
屍檢 |
- |
|
2 |
與證據等級1相同 |
N.A. |
3 |
無菌體液發現證據 |
N.A. |
血培養 |
||
胸、腹水 |
||
尿抗原 |
||
4 |
下述方式獲得證據: |
N.A. |
支氣管鏡活檢 |
||
肺泡灌洗液培養>104 CFU/ml |
||
5 |
下述方式獲得證據: |
N.A. |
肺泡灌洗液培養<104 CFU/ml |
||
痰培養 |
||
氣管吸出物培養 |
||
6 |
下述方式獲得證據: |
N.A. |
肺泡灌洗液分子學診斷* |
||
痰分子學診斷 |
||
氣管吸出物分子學診斷 |
* 分子學診斷包括PCR / RT-PCR和二代測序。
作者介紹
劉正平
清華大學臨床八年制醫學博士在讀,曾赴美國匹茲堡大學訪學兩年,現於北京協和醫院進行臨床學習。