可靠的地球系统预测对于推动人类进步和预防自然灾害至关重要。人工智能(AI)为提高该领域的预测精度和计算效率提供了巨大潜力,但在许多领域仍未得到充分开发。
为了应对这一挑战,来自微软的研究团队及其合作者推出了首个大规模大气基础模型 Aurora,其可以更准确、更高效地预测空气质量、热带气旋路径和海浪动态以及高分辨率天气预报。值得注意的是,与最先进的数值预报系统 IFS 相比,Aurora 的计算速度提升了约5000 倍。
此外,由于能够根据不同的应用领域进行微调,且计算成本不高,Aurora 代表了在使任何人都能够进行可操作的地球系统预测方面取得的重大进展。
相关研究论文以“A foundation model for the Earth system”为题,已发表在权威科学期刊 Nature 上。
这项研究凸显了 AI 在环境预测方面的变革潜力,且有助于更广泛地获取高质量的气候和天气信息。
Aurora 基于 100 多万小时的多样化天气和气候模拟地球物理数据训练,其可以全面了解大气动力学。该模型在广泛的预测任务中都表现出色,即使在数据稀疏的地区或极端天气的情况下。通过以 0.1°(赤道处约 11 公里)的高空间分辨率运行,Aurora 可以捕捉大气过程的复杂细节,提供比以往更准确的预报。
Aurora 的架构旨在处理异构的黄金标准输入,并以不同的分辨率和保真度生成预测。该模型由一个灵活的3D Swin Transformer和基于 Perceiver 的编码器和解码器组成,使其能够处理和预测一系列跨空间和压力水平的大气变量。
图|Aurora 架构
通过对大量多样化数据进行预训练并针对特定任务进行微调,Aurora 学会了捕捉大气中的复杂模式和结构,即使在有限的训练数据下对特定任务进行微调时,它仍然有出色的表现。
而且,由于之前已经从传统方法中积累了大量数据,训练 Aurora 所需的实验从开始到结束大约只需要 4-8 周的时间,而目前开发基线模型则需要数年的时间。
研究结果显示,Aurora 在空气质量、海浪、热带气旋轨迹和高分辨率天气方面的表现均优于现有模型,而计算成本却低于目前的预测方法。而且,Aurora 相较于最先进的数值预报系统,可提升约 5000 倍的计算速度。
Aurora 不仅拥有极高的预报准确性和效率,还具有多功能性,可以预测温度、风速、空气污染水平和温室气体浓度等各种大气变量。Aurora 在以下关键预测领域实现了 SOTA:
图|在业务环境中,Aurora 在全球多个机构和地区的热带气旋预测系统中表现出色。
更重要的是,Aurora 的预测能力还可以得到进一步的改进。首先,Aurora 可以很容易地扩展到生成集合预测,这在预测不确定的情况下非常重要,例如对较长的前置时间或局部现象的预测。同时,研究团队的扩展结果表明,Aurora 尚未达到性能上限,通过将预训练扩展到更多样化的数据以及将模型扩展到更大的规模,可以获得更好的微调结果。虽然 Aurora 在所有实验中都可以完全运行,但仍然依赖于传统数据同化系统的初始条件。随着端到端天气预报技术的不断进步,Aurora 可以扩展到直接对观测数据进行操作。此外,研究团队还可以对 Aurora 的可解释性进行研究,旨在了解该模式学习到的特定模式是否能与物理过程联系起来。
研究团队表示,Aurora 的影响力远不止于大气预报领域,他们的研究为开发覆盖整个地球系统的综合模型奠定了基础。基础模型可以在数据稀缺的情况下出色地完成下游任务,有望使得在数据稀缺地区(例如发展中国家和极地地区)的人们也能够获取准确的天气和气候信息。同时,这一进展也将对农业、交通、能源开发以及灾害应对等多个领域产生深远影响,让人们能够更好地适应气候变化带来的挑战。
尽管研究团队只展示了 Aurora 在 4 个领域中的应用,但它可以针对任何期望的地球系统预测任务进行微调,从而以极低的成本做出优于现有业务系统的预测。其中一些例子包括:预测海洋环流、地方和区域天气、季节性天气、植被生长和物候、洪水和野火等极端天气模式、授粉模式、农业生产力、可再生能源生产和海冰范围等。
https://www.microsoft.com/en-us/research/articles/aurora/