人類細胞圖譜是世界上最大的的單細胞參考圖譜,而且還在不斷增長擴大中。它包含了跨組織、器官和發育階段的數百萬個細胞的參考。這些參考資料幫助醫生了解衰老、環境和疾病對細胞的影響--並最終更好地診斷和治療病人。然而,參考圖集並非沒有挑戰。單細胞資料集可能包含測量誤差(批處理效應),全球可用的計算資源有限,原始資料的共享往往受到法律限制。
為此,來自德國慕尼黑亥姆霍茲聯合研究中心和慕尼黑工業大學(TUM)的研究人員開發了一種名為“scArches”的新型演算法,是英文“single-cell architecture surgery”(單細胞結構手術)的簡稱。最大的優勢是:“該演算法不是在診所或研究中心之間共享原始資料,而是使用轉移學習將單細胞基因組學的新資料集與現有的參考資料進行比較,從而保留了隱私和匿名”。
該演算法的主要科學家 Mohammad Lotfollahi 說:“這也使得對新資料集的註釋和解釋變得非常容易,並使單細胞參考圖集的使用大大民主化”。
研究人員應用 scArches 來研究幾個肺部支氣管樣本中的 COVID-19。他們利用單細胞轉錄組學將 COVID-19 患者的細胞與健康參照物進行比較。該演算法能夠將患病的細胞從參照物中分離出來,從而使使用者能夠準確定位需要治療的細胞,對於輕度和重度 COVID-19 病例都是如此。患者之間的生物差異並沒有影響繪圖過程的質量。
Fabian Theis 表示“我們的願景是,未來我們將像現在的基因組參考一樣,輕鬆使用細胞參考。換句話說,就像你要考個蛋糕,你不需要想出自己的食譜,而是在食譜上找到一個。而透過 scArches,我們能大大簡化查詢過程”。
關於scArches 更多資訊可以訪問: https://github.com/theislab/scarches