AI驱动的天气预测未来前景光明。一些基于历史天气数据训练的深度学习模型已经能够与传统的天气模型相媲美,这些传统模型通常在大规模超级计算机上模拟物理过程,通常很少有人能访问这些超级计算机。
在与NASA合作并结合橡树岭国家实验室的贡献下,IBM开发了Prithvi WxC,一个可定制的、开源的基础模型,用于天气和气候相关的应用。根据IBM研究院的说法,这个模型设计为能够在台式计算机上运行,现在已经在Hugging Face上可用。
训练模型需要几周时间和数十个GPU,基于NASA的MERRA-2 和谐数据集中的40年历史天气数据训练而成。现在,这个模型可以快速针对不同的使用案例进行调整,并可以在几秒钟内在台式计算机上运行。潜在的应用包括从本地天气数据中创建有针对性的预测、预测极端天气事件、提高全球气候模拟的空间分辨率以及增强传统天气和气候模型中物理过程的表示。
“我们设计的基础模型可以使前期花费的大量工作和GPU小时数得到回报,让人们能够快速推出和运行新的应用,”IBM气候研究人员Campbell Watson说,他参与了模型的开发。
在一项实验中,这个模型从一个微小的局部天气数据样本中准确地重建了全球表面温度,填补了95%的缺失值。IBM研究欧洲部门主任和IBM气候与可持续性项目负责人Juan Bernabé-Moreno说:“从高质量历史数据的小样本进行概括到整个地球的能力,对于广泛的天气和气候预测任务非常有用。”
降尺度、飓风预测和捕捉地球难以捉摸的重力波
新的天气和气候基础模型在arXiv上发表的一篇新论文中得到了详细描述。研究人员详细介绍了他们如何构建模型并对其进行微调,以创建三个对预报人员具有直接相关性的应用。
第一个应用程序旨在对低分辨率数据进行放大,以获取更多细节,这种方法被称为降尺度。通过本地化天气和气候预测,降尺度可以提供极端洪水事件或飓风风力的早期预警。IBM的降尺度应用程序获取各种分辨率和类型的数据,如温度和降雨,将其放大最多12倍。降尺度应用程序可通过IBM的Granite地理空间模型在Hugging Face上获取。
第二个应用集中在飓风预测上。研究人员利用这个模型准确重建了2021年袭击路易斯安那州的飓风艾达的路径,该飓风造成了750亿美元的损失,是记录中第四大代价高昂的大西洋飓风。未来,该模型可以更准确地追踪防御即将到来的飓风的位置。
第三个应用旨在提高重力波的估算。在地球的大气层中,重力波影响云的形成和全球天气模式,如飞机湍流出现的位置。传统的气候模型无法在高分辨率下正确捕捉重力波,增加了天气和气候预测的不确定性。这对于全球供应链的协调可能具有变革性的影响。
此外,IBM正在与加拿大气候环境部门合作,定制基础模型用于降水现在预测,即利用实时雷达数据进行几小时后的本地降雨预测。希望这种数据驱动的基础模型方法能够可能使用较少的计算资源并提供更准确的结果。
学习像预报员一样“思考”
这一新的天气和气候基础模型加入了一个日益壮大的开源模型家族,旨在使NASA的卫星和其他地球观测数据集的分析更快和更容易。该模型的灵活性归功于其混合架构和特殊的训练流程。
它基于一个视觉变压器和一个掩码自动编码器,使模型能够编码随时间 unfolding 的空间数据。通过扩展模型的注意机制以包括时间维度,它能够分析MERRA-2再分析数据,该数据整合了多个观测数据流。
该模型能够在球体上运行,像传统的格网气候模型一样,也能够在平面的矩形表面上运行。这些双重表示使模型能够在不牺牲分辨率的情况下从全球视图切换到区域视图。
在训练过程中,研究人员向模型输入了格网化的、被大量遮挡的气候再分析数据,并让它逐像素地重建每个图像。他们还让模型将被遮挡的图像投射到未来。IBM研究人员Johannes Schmude说:“模型实际上学会了大气层随时间的演变。”
要求模型拼凑不完整的天气数据并设想其未来状态有两个好处。它减少了研究人员训练模型所需的数据量,减少了GPU和能耗。它还教会了模型如何填补当前和未来的缺失信息。这本质上就是天气预报员所做的事情。
Schmude说:“天气数据本质上是稀疏的。要学会预测天气,你就必须学会如何填补空白。”
接下来是什么
IBM和NASA计划查看他们现有的用于分析地球观测数据的开源地理空间AI模型是否可以与他们的新天气和气候模型结合使用。去年推出的Prithvi地球观测模型已经开发成多种应用,累计下载次数超过10,000次。这些应用程序被用来估算过去的洪水范围和从烧伤痕迹推断过去野火的强度。
地球观测模型与天气和气候模型结合后,可以应用于同样具有挑战性的任务,从预测预期的农作物产量到预测极端洪水事件及其对社区的影响。
欲了解更多信息,请访问IBM研究院的原始来源。
Image source: Shutterstock