1分鐘預(yù)測10天天氣數(shù)據(jù) DeepMind 90%指標超越人類最強模型
谷歌DeepMind實驗室推出的天氣預(yù)測大模型,已在Science雜志發(fā)表。
只需要不到1分鐘,它就能直接預(yù)測出未來10天的天氣。
準確度上,它在90%的指標上超越了最先進的人類系統(tǒng),在AI氣象模型中屬首次!
DeepMind的這個氣象模型名叫GraphCast,目前已經(jīng)開源。
它的分辨率為0.25度經(jīng)度/緯度(在赤道處約為28 x 28公里),而目前的最高分辨率為1度。
這樣的分辨率相當于將地球表面分割成了超過100萬個網(wǎng)格,而每個網(wǎng)格又可以產(chǎn)生數(shù)百條預(yù)測數(shù)據(jù),總計數(shù)量達到了上億規(guī)模。
不同于傳統(tǒng)的預(yù)測方式,GraphCast預(yù)測主要依靠數(shù)據(jù)中的規(guī)律進行預(yù)報,而不使用人類建立的物理方程。
相比于人類最準確的HRES預(yù)報,GraphCast在1380個測試指標中,90%的預(yù)測結(jié)果都更為準確。
如果把預(yù)測范圍限制在對流層,GraphCast擊敗HRES的指標比例更是高達99.7%。
YC上有網(wǎng)友表示,用“impressive”已經(jīng)不足以形容這項成果了。
那么,GraphCast的預(yù)測表現(xiàn)具體是怎樣的呢?
90%指標超越人類最好方法
在劃分出的100萬多個網(wǎng)格上,GraphCast劃分出的每個網(wǎng)格都能夠產(chǎn)生227條預(yù)測數(shù)據(jù)。
其中包括了37個不同高度上,每個高度的6個大氣變量(包括比濕度、風速和風向以及溫度等)。
在地球表面,GraphCast還可以預(yù)測包括溫度、風速和風向以及平均海平面壓力等在內(nèi)的5個變量。
完整的變量種類和具體高度(以氣壓表示,單位:hPa)如下表所示:
為了比較GraphCast和HRES的表現(xiàn),研究人員從歐洲中期天氣預(yù)報中心(ECMWF)的ERA5再分析數(shù)據(jù)中選取了2018年(GraphCast訓(xùn)練數(shù)據(jù)截止2017年)的歷史數(shù)據(jù)。
研究者分別讓HRES和GraphCast站在當時的情況下進行“預(yù)測”,然后比較它們的“預(yù)測”和ERA5進行比較。
在500hPa高度場上,GraphCast的RMSE(均方根誤差,數(shù)值越低表現(xiàn)越好)和ACC(異常相關(guān)系數(shù))指標都顯著優(yōu)于HRES。
而在研究人員選取的50-1000hPa的1380個數(shù)據(jù)點中,GraphCast有90.3%優(yōu)于HRES,89.9%優(yōu)勢顯著(下圖d組中,藍色表示GraphCast優(yōu)于HRES,越深優(yōu)勢越明顯)。
除了這些數(shù)據(jù),GraphCast在極端天氣的預(yù)測上也有明顯優(yōu)勢。
對于熱帶氣旋路徑,GraphCast中位誤差低于HRES,特別是在前4.75天開始,優(yōu)勢開始變得明顯(下圖a、b)。
在根據(jù)大氣河流(Atmospheic River)進行水汽通量預(yù)測時,GraphCast的RMSE值也明顯低于HRES(下圖c)。
預(yù)測熱浪時,GraphCast在提前12小時、5天、10天時,準確度也都比HRES高(下圖d)。
今年9月,GraphCast成功在登陸前9天預(yù)測了北大西洋的颶風Lee,而使用傳統(tǒng)方法最多提前6天預(yù)報。
GraphCast不僅準確度高,預(yù)測速度也非常快。
在一臺Google TPU v4機器上使用GraphCast進行10天預(yù)測,只需不到一分鐘就能完成。
相比之下,使用HRES等傳統(tǒng)方法,即使在超級計算機上也要花費數(shù)個小時。
那么,GraphCast是如何實現(xiàn)高效準確的氣象預(yù)測的呢?
不使用物理方程,預(yù)測全靠數(shù)據(jù)分析
工作流程上,輸入從6小時前開始到當前的氣象數(shù)據(jù),GraphCast就可以預(yù)測未來6小時的天氣。
而預(yù)測出的數(shù)據(jù)可以作為新的“當前”態(tài),繼續(xù)往后迭代預(yù)測,最長可以預(yù)測到10天后的天氣狀況。
原理層面,GraphCast使用機器學習方式和圖神經(jīng)網(wǎng)絡(luò)(GNN)架構(gòu),其中包括編碼器和解碼器各一層,以及中間層16層,參數(shù)量為3670萬。
它僅通過學習已有氣象數(shù)據(jù)實現(xiàn)預(yù)測,不依賴人類建立的物理方程。
GraphCast將0.25度網(wǎng)格的氣象數(shù)據(jù)進行編碼映射到神經(jīng)網(wǎng)絡(luò),經(jīng)過傳遞計算后的結(jié)果再由解碼器還原為氣象數(shù)據(jù)。
訓(xùn)練時,GraphCast使用的是來自ERA5數(shù)據(jù)集中的1979-2017這近四十年天氣的再分析數(shù)據(jù),包括了衛(wèi)星圖像、雷達和氣象站測結(jié)果。
ERA5是基于4DVar方法和同化觀測生成的全球最優(yōu)重構(gòu)資料,涵蓋時間從上世紀40年代至今,空間則覆蓋全球。
而如果使用更近期的數(shù)據(jù),GraphCast的預(yù)測結(jié)果準確度還能繼續(xù)提高。
下一步,DeepMind計劃構(gòu)建集合預(yù)報模型,以適應(yīng)實際情況中天氣的不確定性,進一步增強預(yù)報準確性。
論文地址:https://www.science.org/doi/10.1126/science.adi2336
參考鏈接:
[1]https://deepmind.google/discover/blog/graphcast-ai-model-for-faster-and-more-accurate-global-weather-forecasting/
[2]https://www.ft.com/content/ca5d655f-d684-4dec-8daa-1c58b0674be1
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com