洪水是地球上最常見的自然災害,影響著全球數億人的生活,每年造成約 100 億美元的損失。在我們往年工作的基礎上,本週早些時候,我們宣佈了我們最近為改進印度和孟加拉國洪水預報所做的一些努力,將覆蓋範圍擴大到超過 2.5 億人,並提供前所未有的提前期、準確性和清晰度。
為了實現這些突破,我們設計了一種新的淹沒建模方法,稱為形態淹沒模型,它將基於物理的建模與機器學習 (ML) 相結合,以在現實環境中建立更準確和可擴充套件的淹沒模型。此外,我們新的警報定位模型允許使用端到端機器學習模型和全球公開的資料,以前所未有的規模識別有洪水風險的區域。在這篇文章中,我們還描述了稱為HydroNets 的下一代洪水預報系統的 發展(在ICLR AI for Earth Sciences和EGU 今年),這是一種專為跨多個盆地的水文建模而構建的新架構,同時仍在最佳化每個位置的準確性。
預測水位
洪水預測系統的第一步是確定一條河流是否預計會發生洪水。長期以來,政府和災害管理機構一直使用水文模型(或儀表到儀表模型)來提高預測的準確性和延長提前期。這些模型接收諸如降水或上游水位測量值(即海平面以上水的絕對高程)等輸入,並輸出未來某個時間河流中水位(或流量)的預測。
本週關鍵字帖子中描述的洪水預報系統的水文模型元件使覆蓋超過 7500 萬人口的地區的洪水警報提前期增加了一倍。這些模型不僅增加了前置時間,而且提供了前所未有的準確性,在我們覆蓋的所有盆地中實現了超過 99%的R 2分數,並且在超過 90% 的時間內預測水位在 15 釐米誤差範圍內。一旦預測河流將達到洪水水位,生成可操作警告的下一步是將河流水位預測轉換為對洪泛區將如何影響的預測。
形態淹沒建模
在之前的工作中,我們開發了基於衛星影象的高質量高程圖,並執行基於物理的模型來模擬流經這些數字地形的水流,從而在資料稀缺的地區以前所未有的解析度和準確性發出警告。透過與我們的衛星合作伙伴Airbus、Maxar和Planet 合作,我們現在已將高程圖擴充套件到數億平方公里。然而,為了在保持高精度的同時將覆蓋範圍擴大到如此大的區域,我們不得不重新發明我們開發淹沒模型的方式。
大規模洪水建模面臨三個重大挑戰。由於此類模型涉及的面積大且解析度高,因此它們必然具有很高的計算複雜度。此外,大多數全球高程地圖不包括河床水深測量,這對於準確建模很重要。最後,需要了解和糾正現有資料中的誤差,包括軌距測量誤差、高程圖中缺失的特徵等。糾正此類問題可能需要收集額外的高質量資料或手動修復錯誤資料,這兩種方法都不能很好地擴充套件。
我們將淹沒建模的新方法稱為形態學模型,它透過使用多種創新技巧來解決這些問題。我們不是實時模擬水流的複雜行為,而是計算對高程圖形態的修改,允許使用簡單的物理原理(例如描述靜水系統的原理)來模擬洪水。
首先,我們訓練了一個純 ML 模型(沒有基於物理的資訊),以從儀表測量中估計一維河流剖面。該模型將河流上特定點的水位作為輸入(河流水位計)並輸出河流剖面,即河流中所有點的水位。我們假設如果水位增加,水位單調增加,即河流其他點的水位也增加。我們還假設河流剖面的絕對高程向下遊減小(即,河流向下流動)。
然後,我們使用這個學習模型和一些啟發式方法來編輯高程圖,以近似“消除”如果該區域被淹沒時可能存在的壓力梯度。這個新的合成高程圖為我們使用簡單的洪水填充演算法模擬洪水行為奠定了基礎。最後,我們將生成的洪水地圖與基於衛星的洪水範圍與原始流規測量值相匹配。
這種方法摒棄了經典物理模型的一些現實約束,但在現有方法目前難以解決的資料稀缺地區,其靈活性允許模型自動學習正確的水深測量並修復基於物理模型敏感的各種錯誤。這種形態學模型將準確度提高了 3%,這可以顯著提高對大面積區域的預測,同時還可以透過減少手動建模和校正的需要來更快地開發模型。
警報定位
許多人居住在形態淹沒模型未涵蓋的區域,但仍然迫切需要獲得準確的預測。為了覆蓋這一人群並增加我們的洪水預測模型的影響,我們設計了一種基於 ML 的端到端方法,幾乎完全使用全球公開可用的資料,例如流量測量、公共衛星影象和低解析度高程圖。我們訓練模型使用它接收的資料直接實時推斷淹沒圖。
當模型只需要預測在先前觀察到的事件範圍內的事件時,這種方法“開箱即用”效果很好。外推到更極端的條件更具挑戰性。儘管如此,正確使用現有的高程圖和實時測量值可以使警報比目前針對更詳細的形態淹沒模型未涵蓋的區域的警報更準確。由於此模型具有高度可擴充套件性,因此我們僅在幾個月的工作後就能夠在整個印度推出它,我們希望很快將其推廣到更多國家/地區。
改進水位預測
為了繼續改進洪水預測,我們開發了HydroNets——一種專門為水位預測構建的專門的深度神經網路架構——它使我們能夠在現實世界的操作中利用基於 ML 的水文學的一些令人興奮的最新進展環境。它與標準水文模型的區別有兩個突出特點。首先,它能夠區分在站點之間很好地概括的模型元件,例如降雨徑流過程的建模,以及那些特定於給定站點的元件,例如評級曲線,將預測的排放量轉換為預期的水位。這使模型能夠很好地泛化到不同的站點,同時仍然可以對每個位置的效能進行微調。其次,HydroNets 考慮了正在建模的河流網路的結構,透過訓練一個大型架構,該架構實際上是一個由較小神經網路組成的網路,每個網路代表沿河的不同位置。這允許對上游站點建模的神經網路將嵌入編碼的資訊傳遞給下游站點的模型,這樣每個模型都可以知道它需要的一切,而不會大幅增加引數。
下面的動畫說明了 HydroNets 中的結構和資訊流。上游子流域建模的輸出被組合成一個給定流域狀態的單一表示。然後由共享模型元件處理,該元件由網路中的所有盆地通知,並傳遞給標籤預測模型,該模型計算水位(和損失函式)。然後將網路迭代的輸出傳遞給下游模型,依此類推。