[討論] neuralGCM 基於神經網路的通用循環模型

看板 TY_Research
作者 aabaabaabaab (衝擊樂透)
時間 2024-01-04 20:52:58
留言 1則留言 (1推 0噓 0→)

本篇論文一樣由google的研究發表,包含以下幾點特點 1. 相較於graphcast直接對數據擬合,此模型同時採用物理核心與神經網路,預測過程受 ODE等物理條件限制,並採用類似數值模式的時間積分型式。 https://imgur.com/fiau2Af.jpg
https://imgur.com/Jw0qWRE.jpg
2. 模型輸入包含外力(地形、時間、經緯度、太陽輻射、海冰密集度、海表溫度、隨機噪 聲及ERA5,由於使用sigma座標,採用神經網路濾除重力波。 https://imgur.com/pjie69J.jpg
3. 訓練預報時長由6小時延長到3-5天,並用於氣候預報,對於長期預報特徵的模糊性有 較好的改善(大氣河流) https://imgur.com/dcZI2FC.jpg
https://imgur.com/cj1zfFF.jpg
4.誤差表現 https://imgur.com/8jwfzNF.jpg
總結: NeuralGCM最大的不同是以動力框架提供的物理關系為核心,進而從源頭上解決了AI模 型的最大問題:物理一致性。 可以像數值模式一樣根據空間分辨率設置相應的時間積分步長。即使是神經網絡部分 ,也可以說擬合的是物理過程而不是統計關係。 保證輸出的大氣環流具備物理可解釋性,與觀測到的天氣、氣候現象始終保持一致。 在物理方程的約束下,僅用3~5天預報時間的數據即可訓練出在幾十年模擬上保持穩定 的模型。 由於其監督學習的本質沒有改變,其中仍然存在一些問題: 仍然以ERA5為基準訓練模型。類似數值模式的動力框架置入NeuralGCM後,要超越數值 模式的預報,某種程度上其成功的核心仍然是替代參數化方案的神經網絡部分。同時 ,ERA5也依賴數值模式,則NeuralGCM的學習目標其實限於ERA5對觀測的同化。換句話 說,NeuralGCM的本質仍然是利用神經網絡擬合觀測,且上限仍受同化效果的約束。 仍存在大量“魔法數字”的設置。如不同變量損失的平衡,參數化方案輸出的放縮, 不同損失項的權重等。這些參數的影響很難評估。當然,對於次網格尺度過程而言, 這些經驗性超參數即使在數值模式中也不可避免。 進一步,我們可以從不同角度理解NeuralGCM的設計: 從AI角度,NeuralGCM將代表物理過程的基本方程組嵌入神經網絡,訓練出受物理約束 的AI預報模型。 從數值模式角度,則是用神經網絡代替數值模式中的參數化方案。 甚至,我們可以將NeuralGCM中的神經網絡視作“訂正模型”,只是將訂正直接嵌入 數值模式的時間積分過程中,針對每一步的結果訂正,而不是訂正最終的輸出。 參考資料: https://blog.csdn.net/qq_33431368/article/details/135143616 https://arxiv.org/abs/2311.07222 https://imgur.com/0BNN9nU.jpg
--
※ 批踢踢實業坊(ptt.cc), 來自: 140.115.200.156 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/TY_Research/M.1704372781.A.5D0.html

Chang0212 : 推 02/17 11:39

您可能感興趣