編輯 | 蘿蔔皮
目錄
- 使用進化資料的深度生成模型進行疾病變異預測
- 對抗性影象攻擊下人工智慧診斷模型安全性的機器和人類閱讀器研究
- 使用人工智慧和舊報告來理解新的醫學影象
- 機器學習使用全基因組資料預測彎曲桿菌病的來源
使用進化資料的深度生成模型進行疾病變異預測
量化人類疾病相關基因中蛋白質變異的致病性將對臨床決策產生顯著影響,但這些變異中的絕大多數(超過 98%)仍然具有未知的後果。原則上,計算方法可以支援對遺傳變異的大規模解釋。然而,最先進的方法依賴於在已知疾病標籤上訓練機器學習模型。由於這些標籤稀疏、有偏見且質量參差不齊,因此結果模型被認為不夠可靠。
在這裡,Marks Group 系統生物學系的研究人員,提出了一種利用深度生成模型來預測變異致病性而不依賴標籤的方法。透過對跨生物體的序列變異分佈進行建模,研究人員隱含地捕獲了對保持適應性的蛋白質序列的約束。
該模型 EVE(變異效應的進化模型)不僅優於依賴標記資料的計算方法,而且與來自高通量實驗的預測相當甚至更好,後者越來越多地用作變異分類的證據。
研究人員預測了 3,219 個疾病基因中超過 3,600 萬個變異的致病性,併為超過 256,000 個意義不明的變異的分類提供了證據。該研究工作表明,進化資訊模型可以為變異解釋提供有價值的獨立證據,這將在研究和臨床環境中廣泛有用。
該研究以「Disease variant prediction with deep generative models of evolutionary data」為題,於 2021 年 10 月 27 日釋出在《Nature》。
模型程式碼:https://github.com/OATML-Markslab/EVE
https://doi.org/10.5281/zenodo.5389490
論文連結:https://www.nature.com/articles/s41586-021-04043-8
相關報道:https://medicalxpress.com/news/2021-10-ai-remarkable-capacity-gene-variants.html
對抗性影象攻擊下人工智慧診斷模型安全性的機器和人類閱讀器研究
在積極推動醫學人工智慧 (AI) 模型開發和臨床翻譯的同時,AI 模型的安全問題也出現了,但研究很少。
浙江大學和匹茲堡大學的研究人員合作進行了一項研究,研究 AI 診斷模型在生成對抗網路 (GAN) 模型生成的對抗性影象下的行為,並評估在視覺識別潛在對抗性影象時對人類專家的影響。
該 GAN 模型在基於深度學習的乳腺癌計算機輔助診斷(CAD)中對乳房 X 線照片影象的診斷敏感內容進行了有意修改。在實驗中,對抗樣本欺騙了 AI-CAD 模型,在最初由 AI-CAD 模型正確分類的 69.1% 的案例中輸出了錯誤的診斷。五名乳房成像放射科醫生在視覺上識別了 29%-71% 的對抗樣本。
該研究表明,迫切需要繼續研究醫療 AI 模型的安全問題,並開發針對對抗性攻擊的潛在防禦解決方案。
該研究以「A machine and human reader study on AI diagnosis model safety under attacks of adversarial images」為題,於 2021 年 12 月 14 日釋出在《Nature Communications》。
模型和原始碼:https://github.com/QianWeiZhou/Medical-AI-Adversarial-Attack
論文連結:https://www.nature.com/articles/s41467-021-27577-x
相關報道:https://medicalxpress.com/news/2021-12-cancer-spotting-ai-human-experts-image-tampering.html
使用人工智慧和舊報告來理解新的醫學影象
麻省理工學院的研究人員,透過最大化影象和文字的區域性特徵之間的互資訊,提出一種表示學習方法。這種方法的目標是透過利用包含在描述影象中發現的自由文字中的豐富資訊,來學習有用的影象表示。
該方法透過鼓勵結果表示展示高區域性互資訊來訓練影象和文字編碼器。研究人員利用神經網路鑑別器在互資訊估計方面的最新進展。研究人員認為區域性互資訊的總和通常是全域性互資訊的下限。該團隊在下游影象分類任務中的實驗結果,證明了使用區域性特徵進行影象文字表示學習的優勢。
該研究以「Multimodal Representation Learning via Maximization of Local Mutual Information」為題,於 2021 年 12 月 15 日釋出在《arXiv》預印平臺。
原始碼:https://github.com/RayRuizhiLiao/mutual_info_img_txt
論文連結:https://arxiv.org/abs/2103.04537
相關報道:https://techxplore.com/news/2021-09-ai-medical-images.html
機器學習使用全基因組資料預測彎曲桿菌病的來源
彎曲桿菌病是世界上最常見的食源性疾病之一,主要由空腸彎曲桿菌引起。有效的干預措施需要確定感染源,這具有挑戰性,因為傳播是透過多種來源(例如受汙染的肉類、家禽和飲用水)進行的。菌株變異允許基於多位點序列分型(MLST)基因中的等位基因變異進行源追蹤,從而可以將受感染個體的分離株歸因於特定的動物或環境宿主。然而,機率歸因模型的準確性受到僅基於 7 個 MLST 基因區分分離株的能力的限制。
在這裡,牛津大學的研究人員拓寬了輸入資料範圍以包括核心基因組 MLST (cgMLST)和全基因組序列(WGS),並實施多種機器學習演算法,從而實現更準確的來源歸因。使用他們命名為 aiSource 的分類器將歸因準確度從使用標準 iSource 群體遺傳方法的 64% 提高到 MLST 的 71%、cgMLST 的 85% 和 kmerized WGS 資料的 78%。
為了獲得超越源模型預測的洞察力,研究人員使用貝葉斯推理來分析空腸彎曲桿菌菌株感染人類的相對親和力,並確定了最常見疾病譜系(ST -21 克隆複合體)。該團隊提供了基於機器學習和種群遺傳學的通用計算高效方法,為全球疾病監測提供了一種可擴充套件的方法,該方法可以不斷整合新樣本以進行來源歸因,並識別傳播潛力的細微變化。
該研究以「Machine learning to predict the source of campylobacteriosis using whole genome data」為題,於 2021 年 10 月 18 日釋出在《PLOS GENETICS》。
可用資料:https://pubmlst.org/bigsdb?db=pubmlst_campylobacter_isolates&page=query&project_list=102&submit=1
論文連結:https://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1009436