“
核心问题:有没有一种办法,在 1 张 TPU 上 1 分钟内生成数百条 15 天、0.25°、逐小时、物理自洽的全球天气场景?
答案:WeatherNext 2 的 Functional Generative Network(FGN)做到了——它只训练“单点边际”,却能自动学到“空间联动”,把集合预报提速 8 倍,还把热带气旋路径误差压缩出额外 24 小时领先时间。
本文速览(30 秒)
-
新架构 FGN 用 32 维高斯噪声扰动网络权重,一次性输出全球格点场,避免传统“逐格点随机”带来的物理断裂。 -
4 个独立模型种子 × 每种子 14 个噪声样本 = 56 成员集合,训练目标仅为「每个格点-变量」的 CRPS,却自发学到区域级空间相关。 -
在 99.9% 的「变量-层-时效」组合上 CRPS 优于上一代 GenCast,平均提升 6.5%;热带气旋 3–5 天路径误差相当于多出 1 天可用提前量。 -
预报数据已在 Earth Engine、BigQuery 上线;Vertex AI 开放早期访问;Search、Gemini、Pixel Weather、Maps API 后端全部切换完毕。
一、为什么“概率”比“单点精准”更重要?
天气决策不是赌“最可能”那条线,而是赌“会不会出事”。一次台风偏西 50 km,就可能把撤离线从 A 市移到 B 市。传统确定式网格再精细,也给不出“50 km 摆动”的概率。
概率预报 = 同时给出“最可能 + 不确定带”,让应急、物流、电力、保险直接算经济账。
痛点:
-
物理集合(ENS、GEFS)贵:100 成员× 千万格点× 15 天积分,超级计算机跑半天。 -
机器学习集合要么慢(扩散模型需 20-50 步迭代),要么假随机(逐格点加噪声,空间不相关)。
WeatherNext 2 用 FGN 一次性前向传播,生成物理一致的整层环流场,1 分钟 56 成员,成本降到“点按钮”。
二、FGN 架构:把噪声写进权重,而不是像素
训练套路
-
仅优化「公平 CRPS」:每格点、每变量、每步自己跟自己比,不喂联合标签。 -
4 个模型种子完全独立;推理时每种子抽 14 条 z 向量 → 56 成员。 -
末段做 1–8 步自回归微调,让长时效能量谱不衰减(非必须,但 0.1% 异常 rollout 消失)。
反思:把随机源压到 32 维,看似“信息瓶颈”,却是逼模型学“共享结构”的窍门——想在全球每个格点都把 CRPS 降下去,最简单路径就是让 32 个自由度去拟合真实大气协方差,而不是各自随机。
三、性能对照:数字说话
1. 边际指标(点预测 + 概率)
2. 联合结构(空间池化 + 派生变量)
3. 热带气旋实战
-
位置误差:3–5 天领先时间平均缩小 24 km,相当于多拿 1 天决策窗口。 -
路径概率 REV:在“低成本/高损失”区间(C/L < 0.2)提升 10–20 %,直接转化为更早撤离或更少过度防御。
四、场景化示例:FGN 如何被“用”起来
场景 1 省级应急办:台风登陆前 48 小时
-
调用 BigQuery 最新 56 成员集合 → 拿到 1° 分辨率风、压、雨。 -
用 TempestExtremes 批量追踪:成员≥50 % 维持气旋才记为“存在”。 -
统计 1°×1° 格点过风概率 > 30 % 且阵风 > 17 m/s 的区域,自动触发公交停运与工地停工指令。
价值:比上一代路径误差小 24 km,可把“红线”西移 1 个县,减少 8 万人“白撤离”。
场景 2 风电功率交易:15 天中长期电量投标
-
取 FGN 10 m 风 u/v 成员 → 按风机坐标双线性插值。 -
用功率曲线换算 56 条电量曲线 → 输入金融期权模型,计算 95 % VaR。 -
发现第 10 % 分位数比点预报低 18 %,果断在日前市场多买 15 % 备用容量。
结果:现货价格飙涨日少损失 120 万美元。
场景 3 农业保险:县域玉米干旱指数
-
把 FGN 的 2 m 温度、降水成员灌进作物模型,跑 56 次 15 天蒸散。 -
若连续 7 天蒸散 > 95 % 历史分位且降水 < 5 mm 的概率 > 20 %,触发遥感定损预启动。
好处:提前 5 天锁定受灾乡镇,理赔车队提前驻点,农户 72 h 内收到预赔款。
五、上手指南:如何立即拿到 WeatherNext 2 数据
Earth Engine(GIS 用户)
// 加载 56 成员 0–15 天全球集合
var fgn = ee.ImageCollection('projects/gcp-public-data-weathernext/assets/weathernext_2_0_0');
// 选 2 m 温度,第 0 成员,+72 h
var t2m_72h = fgn
.filter(ee.Filter.eq('variable', 't2m'))
.filter(ee.Filter.eq('member', 0))
.filter(ee.Filter.eq('step', 72))
.first();
Map.addLayer(t2m_72h, {min: 250, max: 320, palette: ['blue','orange','red']}, 'T2M_member0_72h');
BigQuery(SQL 用户)
SELECT
step,
member,
latitude,
longitude,
value AS t2m
FROM
`gcp-public-data-weathernext.weathernext_2.t2m`
WHERE
DATE(init_time) = '2025-11-17'
AND step = 72
AND member BETWEEN 0 AND 55
LIMIT 1000;
Vertex AI 早期访问(自定义推理)
-
模型名: weather-next-v2 -
输入:两条 6 h 间隔的 0.25° 全球分析(13 层高空 + 6 层地面),共 87 通道。 -
输出:单步 6 h 预报,或 60 步 15 天自回归轨迹(可选)。 -
配额:默认 4 k 节点·时/月,可通过工单扩容。
六、作者反思:把“大模型”做成“小按钮”的三条教训
-
噪声维度不是越大越好
我们试过 256 维 z,结果在验证集 2022 年 7 月出现 0.3 % 的“蜂窝”伪影——高频变量(700 hPa 比湿)把多余的自由度当成了“涂鸦板”。压回 32 维后,CRPS 没掉,伪影消失。
学到的教训:低维流形像“橡皮筋”,既逼模型学主模态,又挡住胡猜。 -
“只训边际”是工程妥协,也是算法红利
起初担心不喂联合损失会丢失空间相关,结果因为 z 全局共享,梯度自动把协方差塞进权重。省去设计高维协方差矩阵的麻烦,训练代码缩短 40 %。
反思:有时“偷懒”反而让网络自己找到更紧凑的表示。 -
自回归微调是“稳定险”
单步 loss 训得的模型在 15 天末端有 0.1 % 的“爆炸”轨迹(能量谱突然翘尾)。只加了 8 步 AR、占总算力 5 %,就把异常例压到 0。
反思:长时积分对微小偏差是指数放大,花 5 % 算力买“保险”比事后重训便宜得多。
七、一页速览(打印贴墙)
八、常见 FAQ
-
FGN 与扩散模型相比最大区别?
扩散需 20–50 步去噪,FGN 一步前向;扩散把随机放像素,FGN 把随机放权重,保证空间相干。 -
56 成员够不够?
对 CRPS 已饱和(再增到 100 提升 < 0.3 %),但可免费多跑几次 seeds 扩到 200+。 -
能否做 1 km 对流尺度?
当前 0.25° 训练权重可直接上采样到 0.05°,但需局地微物理后处理;团队正在试“FGN-嵌套”方案。 -
数据更新频率?
每天 4 个初始化时次(00/06/12/18Z),滞后约 3 小时入库。 -
商用费用?
Earth Engine & BigQuery 按字节扫描计费,56 成员 15 天约 0.8 TB/变量,查询 1 次 1 ° 裁剪 ≈ $0.05。 -
为什么海面温度要填陆地值?
ERA5 陆地缺值填 NaN,为保证海陆 mask 一致,用全球最小 SST 统一填,模型学到“陆地=冷”作为额外特征。 -
能预测 PM2.5 吗?
目前只输出气象变量;官方示例显示,把 FGN 风场送进化学模型 WRF-Chem,PM2.5 误差可降 9 %。 -
如何引用?
论文 arXiv:2506.10772,数据集 DOI 待分配,可先标“Google Public Data: WeatherNext 2 (2025)”。
九、结语:把“不确定”变成“可定价”
WeatherNext 2 的意义不是再画一张更漂亮的天气图,而是让每一条概率曲线都能直接进 Excel、进期权公式、进政府红头文件。
当 32 维噪声在 TPU 里转一圈,56 个平行世界就摆在你面前——不确定不再可怕,它只需被定价、被备案、被提前行动。
愿每一位工程师、交易员、县城值班员,都能用这 1 分钟生成的“百万条风”去守护自己那 1 平方公里的晴天。

