不需數年 只要幾小時 機器學習能快速揭示細胞內部結構
科技日報北京10月10日電 (記者張夢然)藉由高功率顯微鏡和機器學習,美國科學家研發出一種新演算法,可在整個細胞的超高解析度影象中自動識別大約30種不同型別的細胞器和其他結構。相關論文發表在最新一期的《自然》雜誌上。
領導該COSEM(電子顯微鏡下細胞分割)專案團隊的奧布蕾·魏格爾說,這些影象中的細節幾乎不可能在整個細胞中手動解析。僅一個細胞的資料就由數萬張影象組成,透過這些影象追蹤該細胞的所有細胞器,需要一個人花60多年時間。但是新演算法可在數小時內繪製出整個細胞。
除了《自然》上兩篇文章外,研究團隊還發布了一個數據門戶“開放細胞器”,任何人都可透過該門戶訪問他們建立的資料集和工具。這些資源對於研究細胞器如何保持細胞執行非常寶貴,過去科學家們並不清楚不同細胞器和結構怎樣排列——它們如何相互接觸及佔據多少空間。現在,這些隱藏的關係首次變得可見。
在過去十年中,研究團隊使用高功率電子顯微鏡從多種細胞中收集了大量資料,包括哺乳動物細胞。
最新的機器學習工具可在電子顯微鏡資料中精確定位突觸,即神經元之間的連線。研究人員調整了演算法來繪製或分割細胞中的細胞器,該分割演算法為影象中的每個畫素分配一個數字,這個數字反映了畫素離最近的突觸有多遠,演算法使用這些數字來識別和標記影象中的所有突觸。COSEM演算法的工作方式與之類似,但維度更多。研究人員根據每個畫素與30種不同型別的細胞器和結構中的每一種的距離對每個畫素進行分類。然後,演算法整合所有這些數字來預測細胞器的位置。
研究人員表示,利用這些數字,該演算法還能判斷特定的數字組合是否合理。例如,一個畫素不能既位於內質網內,同時又位於線粒體內。
為了回答諸如細胞中有多少線粒體或它們的表面積是多少等問題,研究團隊構建的演算法結合了有關細胞器特徵的先驗知識。經過兩年的工作,COSEM研究團隊最終找到了一套演算法,可為迄今為止收集的資料生成良好的結果。
目前,研究團隊正在將成像提升到更高的細節水平,並進一步最佳化工具和資源,建立一個更為廣泛的細胞標註資料庫和更多種細胞和組織的詳細影象。這些成果將支援未來的新研究領域——4D細胞生理學,以瞭解細胞在構成有機體的不同組織中的相互作用。
總編輯圈點
工欲善其事,必先利其器。在科研領域尤其如此:無論是望遠鏡之於天文學,還是對撞機之於物理學,亦或是顯微鏡之於生物學,科學研究的不斷進步,總是伴隨著工具和方法的迭代升級。甚至不少諾貝爾獎的誕生,也直接來自於科研工具或方法的重大突破或進展,或者與其息息相關。所以,科研工具或方法類的研究進展值得引起重視,它們很有可能為整個領域的研究提供強大助力。