[討論] neuralGCM 基於神經網路的通用循環模型

看板	TY_Research
作者	aabaabaabaab (衝擊樂透)
時間	2024-01-04 20:52:58
留言	1則留言 (1推 0噓 0→)

看板TY_Research

本篇論文一樣由google的研究發表，包含以下幾點特點 1. 相較於graphcast直接對數據擬合，此模型同時採用物理核心與神經網路，預測過程受 ODE等物理條件限制，並採用類似數值模式的時間積分型式。 https://imgur.com/fiau2Af.jpg

https://imgur.com/Jw0qWRE.jpg

2. 模型輸入包含外力(地形、時間、經緯度、太陽輻射、海冰密集度、海表溫度、隨機噪聲及ERA5，由於使用sigma座標，採用神經網路濾除重力波。 https://imgur.com/pjie69J.jpg

3. 訓練預報時長由6小時延長到3-5天，並用於氣候預報，對於長期預報特徵的模糊性有較好的改善(大氣河流) https://imgur.com/dcZI2FC.jpg

https://imgur.com/cj1zfFF.jpg

4.誤差表現 https://imgur.com/8jwfzNF.jpg

總結: NeuralGCM最大的不同是以動力框架提供的物理關系為核心，進而從源頭上解決了AI模型的最大問題：物理一致性。可以像數值模式一樣根據空間分辨率設置相應的時間積分步長。即使是神經網絡部分，也可以說擬合的是物理過程而不是統計關係。保證輸出的大氣環流具備物理可解釋性，與觀測到的天氣、氣候現象始終保持一致。在物理方程的約束下，僅用3~5天預報時間的數據即可訓練出在幾十年模擬上保持穩定的模型。由於其監督學習的本質沒有改變，其中仍然存在一些問題：仍然以ERA5為基準訓練模型。類似數值模式的動力框架置入NeuralGCM後，要超越數值模式的預報，某種程度上其成功的核心仍然是替代參數化方案的神經網絡部分。同時，ERA5也依賴數值模式，則NeuralGCM的學習目標其實限於ERA5對觀測的同化。換句話說，NeuralGCM的本質仍然是利用神經網絡擬合觀測，且上限仍受同化效果的約束。仍存在大量“魔法數字”的設置。如不同變量損失的平衡，參數化方案輸出的放縮，不同損失項的權重等。這些參數的影響很難評估。當然，對於次網格尺度過程而言，這些經驗性超參數即使在數值模式中也不可避免。進一步，我們可以從不同角度理解NeuralGCM的設計：從AI角度，NeuralGCM將代表物理過程的基本方程組嵌入神經網絡，訓練出受物理約束的AI預報模型。從數值模式角度，則是用神經網絡代替數值模式中的參數化方案。甚至，我們可以將NeuralGCM中的神經網絡視作“訂正模型”，只是將訂正直接嵌入數值模式的時間積分過程中，針對每一步的結果訂正，而不是訂正最終的輸出。參考資料: https://blog.csdn.net/qq_33431368/article/details/135143616 https://arxiv.org/abs/2311.07222 https://imgur.com/0BNN9nU.jpg

※ 批踢踢實業坊(ptt.cc), 來自: 140.115.200.156 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/TY_Research/M.1704372781.A.5D0.html

推 Chang0212 : 推 02/17 11:39

[討論] neuralGCM 基於神經網路的通用循環模型

您可能感興趣

熱門文章