一個不爭的事實是,在醫學影像分析領域,華人學者的影響力越來越大。
近三年(2019、2020、2021),先後有六位該領域的華人學者當選IEEE Fellow(一年IEEE約有250名左右的Fellow產生,相當於會員總數的0.1%)。
IEEE全稱是電氣與電子工程師協會,醫學影像作為其中相對“小眾”的一個類別,獲此殊榮殊為不易。
論文的接受數量,也進一步佐證了這一現象。
2019年,華人學者沈定剛教授成為MICCAI大會主席,他曾以MICCAI為例,向雷峰網分享過一組資料:
在相當長的一段時間裡,國內(包括香港)每年有十篇左右的文章會被(MICCAI)接收,比例只有3%-4%。
但這個現象在2019年完全不同——亞洲的錄取文章比例已經達到37%(美洲為36%,歐洲為26%),超過了美洲。在亞洲的錄取文章裡,絕大多數(150篇左右)來自於中國。
在兩年後的今天,這種學術趨勢越來越明顯。對學者而言,如何做出有水平的研究成果,實現高效的產研轉化進而造福人類,是畢生的追求。
近日,由雷峰網與影象計算與數字醫學國際研討會(ISICDM)聯合主辦的"IEEE Fellow圓桌對話",邀請了近三年來當選IEEE Fellow的五位學者,圍繞醫學影像產學研融合的話題進行了深入探討。
中國科學院自動化所研究員蔣田仔
中國科學技術大學講席教授暨生物醫學工程學院創始執行院長周少華
電子科技大學電子工程學院教授李純明
東南大學腦科學與智慧技術研究院創院院長彭漢川
騰訊天衍實驗室主任鄭冶楓
圓桌由南方醫科大學生物醫學工程學院的馮前進院長擔任主持;MICCAI 2019大會主席、上海科技大學生物醫學工程學院創始院長沈定剛教授進行致辭,對青年AI學術人的治學提出了諸多建議。(文後附致辭詳細內容)
以下是圓桌論壇的現場內容,雷峰網《醫健AI掘金志》做了不改變原意的編輯和整理:
馮前進:近年來,越來越多華人在醫學影像分析領域做出了傑出成就而當選IEEE Fellow,包括在座各位專家。請大家談談科研的經驗與感想,如何做高水平、有影響力的學術研究?
蔣田仔:每個人對高水平定義肯定不一樣,我覺得對這個領域或社會有意義的事,才是高水平。
我原來搞數學,從本科、博士都是學數學,後來做腦科學,從2000-2010年這十年基本上以寫論文為主,發表了很多論文,卻不能解決現實問題。
我們申請科技部“973專案”的時候,分析了以前的問題。
發現腦科學研究缺乏一個靠譜的腦圖譜,所以,我們的專案設計了有三個主題:腦圖譜、腦連線、疾病的腦網路表徵。
該專案繪製的“腦網路組圖譜”臨床影響就很深遠,因為有很多臨床應用場景,包括精準診療的生物標誌、治療和調控靶區等等。
周少華:我非常同意蔣田仔教授觀點。我博士做人臉識別,後來“誤打誤撞”加入西門子醫療開始醫學影像的研究,研究了很多來自臨床實踐的問題。
我覺得臨床實踐才是醫學影像研究比較好的途徑,因為實際臨床問題是重要的問題來源。
真的能解決某個臨床問題、做出有影響力的工作才是高水平。
李純明:我結合個人背景談一下我的看法,我本碩都是數學,雖然博士讀的是電子工程,後來一直在工科領域工作,但還是受數學影響比較深一點。所以我的研究偏數學一些,看法可能有些偏頗。
針對做演算法的文章來講,我認為一篇有長久影響力的論文應該具備以下四個特徵:
第一,創新性。首先是文章的創新性,所提出的方法要新穎獨特,這樣才能成為作者的一張名片。
第二,有效性。文章裡的實驗結果首先要可復現,而且要有優勢,至少在某些方面要優於其它方法。
第三,理論性。文章要有很好的理論支援,在理論層面或數學模型上就能夠清晰地解釋方法的工作機制,這樣才能讓人知其然,還知其所以然,讓人心服口服,產生更深遠的影響力。
第四,簡潔性。文章的數學模型、公式和演算法的表達都要儘可能簡潔。
因為簡潔可以讓很多人在此基礎做進一步研究,用起來更方便,容易讓別人在你工作的基礎上做進一步的研究,也更容易被記住。一篇經典的論文或一個fundamental的貢獻往往具有簡潔性。
現在很多深度學習論文的同質化比較嚴重,就是創新性不高,即不滿足第一條特徵,而且大部分論文也不具備第三條和第四條特徵,往往只靠第二條。
即只依靠在某個資料集上的實驗結果取勝,就是人們常說的“刷分數”,但因為缺乏理論性而不能讓人心服口服,也許換一個數據集結果就分數很差。
而且,一個方法在某個資料集的挑戰賽上得了第一名,也許第二天就被別的方法比下去了,很難維持長久的影響力。
彭漢川:蔣田仔教授他們一直都是體量比較大的專案,比較容易看到臨床的巨大需求。但許多研究相對比較小眾,專案曝光不大。
這種情況下怎麼才能做出被大家關注的工作?
我曾經長期研究人工智慧專案,博士後階段後才開始做放射科學、醫學影像技術、從事臨床相關的資料探勘。
後來,在2002年接觸了新興的基因組、基因表達研究,還有單細胞影像資料等等,逐步意識到,生命科學影像資料可以比傳統醫學影像數量級大很多,迫切需要新方法新系統。
2005年左右,這些研究的資料集進一步擴大,於是我嘗試了很多方法學創新,其中也借鑑醫學影像方法改進,但大量創新研究導致了全新的多維影像大資料平臺並得到越來越廣泛應用,現在也開始對醫學影像資料處理產生了一些促進作用。
所以個人體會是,若想做出重要工作,需要經常跳出自己的視野,經常做一些跨界性研究,這個過程中會做很多不一樣的工作,產生不一樣的成果。
因此,我並不特別關注怎麼做出高水平、有影響工作,而是如何在不同領域中使工作更有趣,同時把這些資訊傳遞給合作伙伴,讓大家慢慢把研究做起來,這樣很多所謂的高水平工作就會自然產生。
鄭冶楓:我在工業界工作了十幾年,和周少華老師在西門子美國研究院共事十幾年,工業界和學術界研究不太一樣。
學術界比較自由,瞄準有意義的方向就容易出成果。但工業界沒有太多自由,但好處是課題都是臨床實際問題,都是醫生迫切需要解決的好問題。
研究目標就是解決這些需求,所以我們被逼著死磕這些問題,確實有些問題很重要,但解決起來非常難,一旦解決就能推進技術發展。
例如,我曾用五六年研究如何從CT抽取冠狀動脈,冠狀動脈非常細,只有CT解析度才能看清楚血管是否被堵住,想要解決非常難。
當時,我們參考了學術界方法,引入機器學習和深度學習,得到比較好的結果。
馮前進:深度學習興起後,醫學影像AI領域湧現一大波論文,這些論文與前深度學習時代論文相比有哪些不同?傳統方法該何去何從?
鄭冶楓:深度學習出來之後,最近5、6年所有方法都被深度學習覆蓋,已經很難看到傳統方法,我不希望某種方法一統江湖,壓抑其他方法改進。
例如,現在模型越來越大,達到千億、萬億級別引數的模型。搞得許多研究機構根本跟不上,像GPT那種需要幾百、幾千個GPU訓練的模型,大部分實驗室都沒有這樣的條件。
而且這種資料堆砌的方法不適用所有領域,例如醫學影像沒有那麼多優質資料,幾千個資料就是很大的資料集,這種情況下我會更聚焦演算法創新。
除此之外,深度學習時代還有很多同質化現象,許多研究只是在神經網路結構上做微調,這不是一個好的現象,研究方式手段還要豐富多彩。
在深度學習如此火熱的當下,之前舊的方法還是有很多可以探索的地方。之前我們更依賴於先驗知識,而不是資料,用先驗經驗設計模型,現在靠資料、靠模型,這不太一樣。
我最近就在研究把傳統方法和深度學習結合,在資料量比較少的情況下提高準確率。
比如,傳統的字典學習是生成模型,一般最佳化重建影象的損失,而在測試階段是作為分類模型使用的,訓練目標和測試目標不一致。
將字典學習和深度學習結合,我們可以做到端到端學習,訓練和測試的設定一致,可以提高準確率。我們將這個方法用於CT影象去金屬偽影,取得不錯的效果。
最近幾篇論文都是這個方向,因此我還是希望傳統方法能和機器學習有機結合起來,發揮兩者優點。
蔣田仔:深度學習只是一種方法,很多人把深度學習當作人工智慧,認為人工智慧就是深度學習。我覺得這值得思考,甚至要潑一些冷水。
2006年深度學習出來的時候,我就叫學生看了,但用處不明顯。因為深度學習需要大量高質量、有標籤的資料,對資料和人工要求都非常大,當時還不滿足條件。
後來的深度學習越來越熱是因為許多主要領域都有了資料積累。
即便如此,我還是要持不同的看法,很多問題是深度學習無法解決的,例如腦疾病問題需要最後追溯到哪個腦區和網路的損傷形成的,一般深度學習做不到,需要傳統方法給臨床提供一些幫助。
所以,未來也許有會出現深度學習更好的方法,但每個方法都有其優缺點。
彭漢川:我是1994年開始學習和使用人工智慧包括很多人工神經元網路模型等,用了8年時間在早期先驅的原始程式碼上做各種實驗也提出了一些新方法。
後來有幸又和做Bayesian Networks的首個學習演算法提出者合作兩年,做了醫學影象資料探勘的研究,之後大約進行了近20年的生物影像資訊學大資料新領域的開拓和研究。
針對主持人的問題,我現在認為當今腦科學、生命科學研究和深度學習有很大關係。
現在,許多研究都已經可以用Deep learning解決方案,確實在很多工作中取得很好效果。對此,還是應該保持歡迎趨勢而不是抗拒。
學術圈一種觀點認為,這雖然叫深度學習,但不一定有“深度”。但深度學習好不好,還需要看應用場景。
例如,透過資料整合,在單個顯示卡訓練或運算就能達到前所未有的效果,對學術研究是利好的,沒必要拒絕。
另一方面,我們也注意到醫學影像等現實需求中有大量問題,並不適用於深度學習方法。
例如,資料傳輸問題就不能被簡單使用分類策略解決,資料視覺化和標註也需要使用特定策略,不能簡單套用所謂深度學習的框架。
實際上,一套醫學影像AI系統不只是有深度學習模組,還有結果驗證、校驗、視覺化、再編輯等等問題,需要一整套系統,而不是隻是中間某個特定分類問題。
根據應用場景,我們可能不會只使用深度學習這一類方法;能解決問題同時又較少帶來新問題的方法是最好的方法。
李純明:我想說的有兩點。
第一,現在的深度學習文章或方法同質化比較嚴重,大家可能覺得每個文章都能提出創新點,但方法上都大同小異,同質化比較嚴重,大批文章都比較類似。
同質化也造成一個很嚴重的審稿問題:要拒就全部拒,要接受就全部接受,許多文章貌似有道理,就被成批成批錄用。
這樣會出現一個惡性迴圈,文章一多,審稿的需求就增加,帶來素質較差的審稿人。
第二,審稿人的不專業,許多本科生都來發頂刊文章,進入學術界,這些人進來之後就導致很多不好,水平比較差或沒創新的文章被錄用進來,產生惡性迴圈。
這和十幾年前的學術界很不一樣,當時的文章都比較注重理論創新,要有所突破。當然,其中也有人刻意加很多數學公式,把文章搞得很複雜,導致審稿非常困難,和現在正好相反。
周少華:我再補充一點,過去研究的很多都是臨床問題,這些問題從更大層面角度都是刻劃資料的分佈問題。
我認為,深度學習是目前發現的一個最好的方法,過去的先驗知識,或其它傳統方法也都是資料分佈的刻劃,這一點上深度學習或許是一個最完美的手段。
當然,我也不喜歡模型變得越大越深,這讓很多研究人員的工作越來越困難,所以深度學習還有很多問題,例如無法解決資料少的問題。
例如醫學影像即使使用分佈遷移的手段,也可能面臨魯棒性問題,讓之前的努力都前功盡棄。
馮前進:在產學研融合方面,醫學影像分析是一個交叉性質十分鮮明的學科,需要與醫生進行廣泛、深入的交流,要將一個好的模型轉化為醫生使用順手的工具有很長的路要走,能否分享你們與醫生合作印象較深的案例?
彭漢川:醫生本身也需要很多科研需求,希望藉助新方法在臨床樣本上看到不太一樣的東西。
例如,醫生需要利用自己的知識找到特定的資料樣本或臨床樣本並記錄下來,這就是一個標註,和樣本分類的需求,具體可分為幾個方面:
第一,對二維資料進行快速標註,這方面的工具有很多,需求和開發都比較簡單;
第二,三維或多維影像的資料的標註,需要開發全新的演算法。傳統處理三位資料標註需要逐層處理,但一張一張來做的話速度很慢,效率低下。
效率更高的方法是透過工具把三維或多維資料在三維或多維環境中進行直接標註。
這在生命科學領域是一個很常見的問題,我的小組十幾年前就做這方面工作,開發世界上第一套三維“虛擬手指”系統讓使用者(包括醫生)能夠有效對三維影像資料進行快速標註,不需要單獨逐層處理,得到越來越廣泛的應用。
8年前我們又開始做虛擬現實工作,結合雲計算把使用者和觀察者放到海量資料中間,做出這個領域的世界第一套標註系統。
相信這樣的系統未來會有很大應用,例如元宇宙,在虛擬世界裡加入各種各樣反饋,讓場景變得更加生動有趣。
我們的系統也可以做類似開發,讓影像科醫生更加快速準確地產生診斷報告,將各種需求、研究和實際使用者聯絡起來,產出實際價值。
蔣田仔:這是我選擇回國的主要原因之一,和醫生合作是中國的一個優勢。
我回國這20年時間裡,一直都是和醫生打交道,這讓我能知道哪些工作是有價值的,哪些工作是沒價值。
所以我最開始做973專案的時候,直接就選擇了神經精神疾病作為應用場景,雖然這件事到現在還沒有在臨床應用,可能有幾點原因:
第一,沒有靠譜的圖譜,所有人都拿著以前的圖譜做牽強解釋;
第二,缺乏大資料,精神疾病往往有不同亞型,精神分裂症也有不同亞型。
過去的一篇文章一共就二十個樣本,如果分成不同亞型,一種亞型就只有幾個樣本。所以,從科研角度好像有一些進展。但對於臨床醫生來說,根本沒意義,樣本量太小。
所以,醫學影像的科研,一定要透過和醫生合作,瞭解他們的反饋和需求,調整自己的研究方向,儘量滿足臨床需要。
李純明:我在這方面比較沒有發言權,因為我過去的研究更偏向演算法。
我覺得和醫生合作,不能只是把他們看作提供資料的來源, 要求他們去做一些標註就到此為止,後面自己做,然後發文章;這樣的研究既沒有利用醫生知識,也沒有解決他們臨床上的需求。
鄭冶楓:我過去幾十年都一直在工業界,參加了幾個產品開發,這些產品最後也都在醫院落地,有機會去看看醫生的使用情況和收集反饋。
所以我也列舉一個親身的案例——當時在西門子開發的一個主動脈瓣膜微創置換手術導航系統。
這個手術非常複雜,過去死亡率達到10%。主動脈瓣膜是一個單向流動的閥門,如果鈣化以後就會導致閥門關不嚴,血液迴流,最終導致全身缺血,嚴重到一定程度就需要置換。
這個手術以前都需要開胸,把心臟開啟,瓣膜縫進去,操作風險非常高。
在2009年以後,開始用微創的方法,在一根管子前方放置一個小瓣膜,從大腿根部動脈插進去,回溯到瓣膜位置,之後用氣球將人工瓣膜撐開,替代掉原來瓣膜,整個手術創傷非常小,死亡率也很低。
但要實現這樣的微創手術,就要能夠在體外重建出體內情況,找到瓣膜放置的位置,臨床上過去一直都是透過打造影劑,用X光照射觀察,但是造影劑會對腎臟造成傷害,出現急性腎衰竭的風險。
我們瞭解到這個需求之後,瞭解到他們需要一個儘量不開X光、不打顯影劑的導航系統,來找到瓣膜的位置,什麼時候可以放置。
記得當時和醫生溝通了很多次,去了很多家醫院參觀,甚至穿著鉛衣還觀看了幾次真正的手術。
最後得出的方案是將X光機繞病人旋轉一圈,生成一個CT,之後實時透過演算法將瓣膜影象重建,抽取出來,滿足在不打造影劑的情況下,就讓醫生知道人工瓣膜是不是在一個合適且匹配的位置,最後就可以撐開安裝;
這是非常關鍵的,因為瓣膜置換隻能做一次,如果放置不好,就需要轉成開胸手術,這樣死亡率又高達10%。
所以從產業的角度來說,和醫生交流之後,能夠知道他的需求,什麼樣的方案最合適,最後看到產品在臨床應用後,會覺得熬了這麼多夜做出來的東西確實真實有用,也很有成就感。
馮前進:2020年有多家公司的醫療AI產品獲得了醫療器械的三類證,但是這些AI產品的落地能力仍受到質疑,這其中有哪些因素導致?產學研融合的關鍵是什麼?
鄭冶楓:騰訊也是獲得三類證的企業其中之一,新冠肺炎輔助診斷演算法在八月份獲得藥監局的NMPA三類證。落地中,我們確實碰到了很多問題,有商業模式的,也有技術的。
商業模式上,國內醫療系統收費模式和國外有差別,例如,影像診斷是和裝置費用打包在一起,並不會獨立算影像診斷費用,因此,我們的AI演算法不能獨立收費。
而美國診斷費用和裝置費用是分開的,診斷費用和裝置費用基本等價的,所以美國的人工成本非常高,有一些AI演算法可以獨立收費,甚至專門有一個類別可以報銷,但國內的AI演算法沒法獨立收費。
所以,對醫院來說購買一個AI產品就增加了一項成本,真正採購的醫院比較少。當然,整體環境正在改變,收費模式可能也會改變。但就現階段而言,國內醫療AI企業的商業模式還有一些困難。
技術問題上,現在的AI演算法只能在幾個特定任務取得不錯成果,拿證也都是獨立病種一個個審批。
例如肺結節、肺炎,但法律要求影像科醫生閱片將影像中體現的所有疾病都必須在報告中寫出來,例如胸部不只看肺結節,還有心臟鈣化、骨折、骨瘤等等一系列疾病。
所以這就有一個矛盾,現在的產品只有單一能力,例如我們拿到的是肺炎三類證,可以提高醫生單點疾病診斷準確率,但不能節省工作量。醫生還需要自己詳細看一遍其它疾病,導致總體效率是降低的。
總體來說,現在的醫療AI演算法還是單點能力,不能全面幫助醫生,導致不能被臨床普遍接受。
蔣田仔:非常贊同鄭教授觀點,拿證只是其中一環,拿證之後怎樣被醫生接受才最關鍵。腦機互動、神經調控也是同理。
很多人都是自己先做東西,然後去找市場,最終能不能落地,有沒有人用這個產品都完全無法確定。
我們也有一個公司在做這方面研究,都選擇醫生看到這個需求和方向,我們在迅速跟進研究,這樣的產品出來之後,可能更容易在臨床落地。
中國科學技術大學講席教授暨生物醫學工程學院創始執行院長 周少華
周少華:AI落地最大痛點在於功能單一,除此之外醫療AI還有流程問題,醫生工作流程都非常標準化。
如果AI產品不能嵌入工作流程,或者沒有幫醫生減少工作量是不受歡迎的。此外,還有分佈遷移問題沒有解決,一些AI模型即使有很多訓練資料,做過很多測試,但還有魯棒性問題。
李純明:拿到證不見得能夠得到醫生認可,還要解決實際臨床問題。自己在2018年前曾經預測深度學習最多還能再火一兩年,現在看來其熱度應該還能再持續一兩年。
今年初我還覺得明年深度學習會降溫,但AlphaFold又在生物計算領域掀起了一輪熱潮,最近又有人工智慧公司商湯的上市,它又會激勵一些人繼續加入深度學習的學術研究和創業。
所以,我現在都不太敢預測了。所以大家即使看到深度學習有很多問題,但未來還會繼續發展,但應該會朝著更理性方向發展,比如進一步提高深度學習的可解釋性,或與傳統方法結合。
彭漢川:落地難題本質不只是AI產品問題,更多的是公司運營的問題。
AI產品本身是一個新技術,拿到證只是標誌它滿足了一定技術質量要求、得到了政策允許、可以推向市場,至於落地難本身就是運營的問題。
醫療AI創業很大成分不只是怎麼講好故事,更多的是如何更有效推廣,怎麼在企業運營中分配各方面資源,更好地分配收益,產生持續現金流,這些才是關鍵。
AI技術只是其中的一部分,AI技術的落地更多的是市場問題,是公司運營的問題。
至於深度學習的熱度會持續多久,我覺得會持續很久,因為現在深度學習參與者數量不斷增加,越來越多的人在湧進這個領域。
此外,在實際應用中,我們看到醫療AI的成功案例也比較多,包括臨床實驗突破,技術成功,創業成功,上市成功,這會吸引更多人湧進這個領域,所以深度學習的熱潮還會不斷地持續下去。
至於醫學影像發展,我的結論不太一樣,在這一領域發揮作用的可能不只是深度學習等機器學習方法,更重要的生命力可能來源於它們能不能和具體應用場景或新技術結合。
例如元宇宙、自動手術機器人等不斷拓寬應用場景和加強應用滲透度,和不同方法結合才能發揮更大前景。
鄭冶楓:深度學習會繼續持續一段時間,具體多久無法確定。
但事實上,現在的深度學習已經沒有以前那麼熱了,頂會論文增長沒有那麼快,現在這個市場容不下這麼多人。
至於深度學習會不會被取代,我記得80年代的時候神經網路技術也很火,但後來就直線下降,因為支援向量等替代技術,實際應用中比神經網路更好。
目前,我還沒有看到可以替代深度學習的技術,頂會論文還都是深度學習文章,至少三五年內沒有看到替代深度學習的理論。
我覺得深度學習的產業化情況總體趨勢還比較好,在人臉識別、語音識別上都有很多成功應用。雖然醫學影像的AI應用發展要慢一些,但至少大家都已經拿到證了,至於商業化是否成功,還需要幾年觀察。
沈定剛教授致辭:對青年AI學術人的建議
簡介:沈定剛教授在美國工作20年(從Hopkins,UPenn,到UNC,都在醫學院的放射科);在此期間,為國內培養近200位留學生/博士後/訪問學者,有40位左右成為國內的院長/副院長、系主任/副系主任、放射科主任/副主任,還有不少人獲得國家級和地方人才計劃。回國前,沈定剛教授在UNC的 IDEA Lab 有70-80人,去年11月,他在上科大重建IDEA Lab,現在已有50多人,歡迎各位加入。
作為行業的權威學者,沈定剛教授在頂刊IEEE TMI、Medical Image Analysis雜誌和頂會MICCAI上發表了全世界最多的論文,分別是72篇、64篇及411篇。
MICCAI 2019大會主席、上海科技大學生物醫學工程學院創始院長 沈定剛
以下為詳細內容:
今天的 “IEEE Fellow圓桌對話“ 裡的每一個人,我都非常熟悉。
主持人馮前進,2021年剛成為長江學者。前進2008年到我UNC的IDEA Lab做博士後;博士後期間,不光在學術研究方面得到了全面的、深入的訓練,更重要的是也學到了做研究、指導學生的新方法,這為他回國後有效領導他的研究小組起了很大的作用。
回國以後,他的研究組發表越來越多的 international journal papers,他們發表在 頂級影像雜誌IEEE TMI上的文章在國內名列前茅。前進BME學院裡的很多老師、學生都在我原來的UNC IDEA Lab訓練過。
蔣田仔是我20多年的朋友,我們2000年在CVPR上認識,成為好朋友。田仔一直專注於醫學影象的研究,他是腦網路研究的引領者,國內不少有名的腦網路研究者來自他的實驗室;
我之前的不少博士後也來自於田仔的實驗室。田仔在科研上堅持做原創工作,取得很多世界領先的水平成果(特別是腦圖譜研究),相信田仔將來會獲得更多的成果。
周少華,2006年在丹麥的MICCAI認識他。少華在醫學影象領域一直做著創新的研發工作,他早期的image regression研究已在不同方面得到了廣泛應用。同時,少華是我們領域的熱心者,建立了很多專業微信群,促進同行的交流。
李純明和彭漢川都來自我美國的同一個Lab,算是我的師弟了。
漢川當年從香港去Johns Hopkins做博士後時,我去機場接他的,他非常早到機場。漢川后來去了UC Berkeley,他那時做的mRMR特徵選擇方法,已被引用了一萬多次。
後來漢川又開始做新領域,特別是轉做腦大資料採集、視覺化、分析、知識挖掘、腦圖譜建立等工作,做得越來越好,在Nature、Cell等上發表了很多論文,包括最在Nature又發表的論文等。
李純明,在我離開UPenn 的 Lab以後加入的;當然,我們很早就認識了。純明的工作,之前的國內研究者應該比較熟悉,不少人跟著他做level set,他的好幾篇level set方面的論文都被引用了幾千次。
純明近年了組織的 "影象計算與數字醫學國際研討會“,在領域中有較大的影響力。
鄭冶楓,因為與我在同一領域——MICCAI領域,我們認識很長時間。冶楓的 “投影空間學習法” 在領域內比較有名,在醫學影像的器官快速檢測與分割中有較好的表現。
從我們指導學生、帶領年輕從業者的實際經驗來看,我們在學習AI的過程中,應該注意下面3個現象:
1) 跟風:大家可能都跟熱點,包括應用場景和具體方法。基本上是跟著論文、比賽走。從論文中學到方法和應用,然後找論文中的問題,解決一個小問題,發表文章。
也就是從文章中來,回到文章中去,在文章裡迴圈;沒有從實際中找問題,為實際問題提供解決方案。也就是,沒有做 "來自臨床、高於臨床、迴歸臨床“ 的工作。
要解決這個問題,導師的作用非常重要,需要導師在初期引導學生/年輕人到正確的方向(包括臨床場景、研究方法等)。
導師開始時要帶著學生做研究,而不是給學生簡單說一下方向,讓沒有經驗的學生自己去做;那樣的話,找好的臨床問題、好的研究方法的可能性比較低。
2) 不深入:很多時候我們做完一個工作(可能只是其中的一個小問題),馬上move到另外一個方向/課題,或者使用另外一個popular的方法,這樣工作沒有延續性。這個問題跟上面提到的 "跟風“ 問題非常相關。
正因為沒有一個具體的臨床問題去解決,看到新的文章、新的方法、新的比賽資料,拿過來就做;等到畢業的時候,做的問題很難成為一個體系,也解決不了具體問題。
應該以一個問題為中心,所有的方法都是為解決這個問題而服務;做完一個階段性的工作,然後來深入review當前方法的limitation。
再來propose新的方法(這些方法也許是最近提出的新方法,或者經典的老方法),來解決當前的limitation,這樣做的工作會越來越深入,最後的工作也會有體系、整體性。
3) 不實際:這個問題跟 "跟風“ 也有關係。如果我們在文章中找問題、公開資料中找方法,對於資料是怎麼來的、怎麼做預處理、怎麼考慮從資料到結果的整體解決方案,都沒有機會去學習、沒有能力去解決。
這樣沒法跟醫生做真正的合作,因為我們知道的只是其中一步,而醫生需要解決的實際問題可能更復雜。其實,我們需要對問題的整體有全面的瞭解,雖然我們具體 focus的問題可能是其中一個問題。
另外,解決實際問題時,影像只是其中一部分的資訊,我們需要考慮臨床中用到的其他資訊,來有效解決臨床痛點。
歸納一下,我們應該做我通常強調的 "全棧全譜” 的工作。
上面講了我們學習、工作初期的3種現象,大家可能也關心AI的前途,特別是當前AI的熱度,以及可能的工資、待遇變化等。其實:
1) 過去AI被炒作得過分熱。在醫療上面的應用,以前鼓吹AI要代替醫生,這其實是門外漢的自我想象。
我們2017年就指出,這是不可能的;AI只能解決臨床流程中的某些點上的某些問題,還沒有能力去解決複雜的問題,還是需要醫生作為AI工具的使用者,在臨床流程中幫助醫生,幫助病人,幫助醫院管理,甚至醫聯體的管理。所有的AI都需要與實際臨床問題緊密結合,才能很好解決臨床問題。
2) 另外我們還需要深耕、練功。接地氣的AI有廣泛的應用,所以AI的前途非常光明;與垂直領域有機結合,我們可以一個問題一個問題去解決。
為了做到這些,我們還需要深耕臨床場景、練好我們解決實際問題的功夫,這樣我們的benefit(包括工資、待遇)都會越來越好。