發表在《柳葉刀》的一項最新研究顯示,目前用於訓練面板病診斷演算法的公共面板影象資料集缺乏足夠的膚色資訊。在提供膚色資訊的資料集中,只有極少數影象的膚色較深——如果使用這些資料集構建演算法,對於白人以外的其他人種的診斷可能並不準確。
研究人員研究了21個可免費訪問的面板狀況影象資料集,這些資料集一共包含超過 10萬張影象。研究人員寫道,這些的面板影象資料集越來越多地用於開發面板癌診斷的機器學習演算法。
該論文的研究背景部分寫道,機器學習在醫療領域的應用中,醫學影象分類尤其是面板科領域,近年來取得了長足的進步,比如透過面板鏡或照片診斷面板癌。機器學習演算法具有透過數字影象分析來自動診斷面板惡性腫瘤的能力,在過去5年中,機器學習演算法的診斷準確性已被證明在實驗環境中可與面板科醫生媲美,甚至超過面板科醫生。
然而,這項研究對10萬張面板影象進行統計後發現,其中只有1400多張標註了有關患者種族的資訊,只有2236張標註了膚色資訊。研究人員認為,在這些面板影象資料集中,深色面板型別的代表性嚴重不足——在具有膚色資訊的影象中,只有11個來自Fitzpatrick量表(一個對膚色分類的量表)上膚色最暗的兩個類別的患者。在標註了種族的影象中,沒有來自非洲、非洲裔加勒比或南亞的患者的影象。
研究人員認為,這有可能導致演算法的偏差,用這些資料集訓練出來的面板病診斷演算法在深膚色患者中很可能不準確。
今年9月,斯坦福大學面板病學臨床學者Roxana Daneshjou也曾發表一項研究,她發現大多數面板病診斷演算法都沒有提到所用資料集中種族或膚色的資訊,同時,她也得出了和《柳葉刀》新論文類似的結論——演算法對深膚色的代表性不足。
“最理想的情況是在臨床問診時注意膚色。”Daneshjou說。她建議在患者面板問題的影象進入資料庫之前對其進行標記,這樣可以方便研究人員開發演算法,確保演算法是用包含了不同面板型別的足夠樣本的資料集構建的。
《柳葉刀》最新的這篇論文提到了“健康資料貧困”這一概念,在人工智慧+醫療領域,由於資料系統的差異,導致了不同年齡、性別、種族、社會經濟地位的群體在醫療體系中存在實際的不平等。該論文強調,需要確保資料集的多樣性、透明度和可用性。
Daneshjou也認為,應該提高資料集的透明度和清晰度,這將有利於發展更公平的人工智慧工具。“我希望看到更多開放資料和更多標記良好的資料。”她說。
編譯/綜合:南都記者李婭寧