新京報訊(記者 周懷宗)農作物累積是農業汙染物從土壤進入人類食物鏈的重要途徑。近日,記者從中國農科院植物保護研究所獲悉,我科研人員首次利用機器學習模型直接預測植物根部從土壤中吸收累積農藥等有機汙染物的量,為農產品在產地環境化學汙染的預測提供了新的工具和手段。
機器學習模型預測植物吸收累積農業汙染物的示意流程圖。中國農科院供圖
據介紹,準確預測植物吸收和累積農業汙染物對保障食品安全、產地修復和人類健康暴露評估具有重要的意義。然而,由於汙染物-土壤-植物根系之間複雜的相互作用,建立穩健可靠的預測模型仍然具有很大挑戰性。傳統的線性預測模型難以預測汙染物-土壤-植物間的非線性關係,導致預測值與實際值差異較大。
在此次研究中,科研人員對比了四種不同的機器學習演算法,透過對341個數據點、72個化合物的資料集進行訓練,預測植物根系富集值,證明了新構建的GBRT-ECFP模型為最優預測模型,並透過5倍交叉驗證評估了預測效能,其中R2值為0.77,平均絕對誤差(MAE)為0.22。此外,本研究解析了化學分子、土壤與植物特性之間的非線性關係。
研究成功利用機器學習作為新興手段預測農田作物對農藥等汙染物的吸收累積,展現了預測工具的先進性和通用性,為未來新農藥植物吸收潛能評估和農田農藥汙染安全評價提供新的可靠工具。
該研究得到了國家重點研發計劃、青年英才計劃等專案的資助。研究成果先後發表在《環境科學與技術(Environmental Science & Technology)》和《危害性材料學報(Journal of Hazardous Materials)》上。
新京報記者 周懷宗
編輯 唐崢 校對 陳荻雁