中國科學院科技論文預釋出平臺(ChinaXiv)9月22日發表一項基於新的大資料分析方法得到的溯源結果顯示,美國新冠“零號病人”大機率出現在2019年9月前後,最早是羅德島州首例感染髮生機率50%的日期為2019年4月26日,遠早於美國官方公佈的全美首例確診日期2020年1月20日。
當前,新冠病毒溯源是全人類面臨的共同挑戰。一系列研究已顯示,美國、西班牙、法國、義大利、巴西等多國早在中國疫情暴發前就已出現遭病毒侵襲的痕跡。為快速、精準地推進溯源,數學家開始嘗試基於大資料分析的溯源方法,和生物學家共同尋找“零號病人”。
最新這項大資料分析工作中,科研人員基於已公開資料並根據傳染病模型和統計方法,建立最最佳化模型,對美國部分州和中國武漢市、浙江省等地的疫情起源時間進行了推斷。該研究論文提出,結合數學模型和人工智慧技術對傳染病進行定性和定量分析,可以揭示傳染病流行規律。目前,根據傳染病模型和資料進行疫情預測的研究比較多,但是利用大資料分析的方法建立數學模型“倒推”疫情變化的研究,中外都比較少。
在論文中,科研人員主要根據經典傳染病模型和統計方法,建立“模型與資料混合驅動的疫情傳播模型”,並且應用最小二乘估計和核密度估計方法,得到模型引數。他們利用美國東北部12州每日公佈的疫情資料,分別求出美國東北部這12州的初期疫情傳播模型所對應的引數。在此基礎上,推斷出它們各自的首例、50例和100例的感染時間及其對應的機率。
計算結果顯示,對於美國東北部的12州,新冠疫情首例感染髮生大機率出現在2019年9月前後,最早是羅德島州首例感染髮生機率50%的日期為2019年4月26日,最晚是特拉華州首例感染髮生機率50%的日期為2019年11月30日,均早於美國官方公佈的全美首例確診日期2020年1月20日。
此外,為驗證這一新方法,論文研究團隊還利用同一模型和中國的公開資料,推斷了中國武漢市和浙江省首例、50例和100例病例感染時間。武漢市首例感染髮生機率50%的日期為2019年12月20日,浙江省首例感染髮生機率50%的日期為2019年12月23日。據此推斷,中國新冠疫情大機率從2019年12月下旬開始流行,這一結論與流行病學調查結果基本相符,證明該計算方法準確可靠。
該研究論文表明,如果其他國家或地區疫情傳播初期檢測資料比較準確,可以利用該方法對疫情起源時間進行推斷,在給定機率意義下計算出首例和若干例的感染時間。
盡在瀋陽晚報影片號,歡迎關注
編輯:高杉 實習生:孫禕童 責編:閆繼偉 高薇