NVIDIA Grace CPU:利用 Polars 和 Apache Spark 提升 ETL 效率

realtime news   Mar 12, 2025 10:29  UTC 02:29

1 Min Read

NVIDIA 的 Grace CPU Superchip 在提取、转换、加载(ETL)工作负载领域树立了新标准,在数据中心和云环境中实现了无与伦比的性能和能源效率。据 NVIDIA 称,Grace CPU 配备了高性能的 Arm Neoverse V2 内核、快速的可扩展一致性架构和低功耗高带宽的 LPDDR5X 内存,是处理复杂数据任务的理想选择。

单节点上的 Polars

Polars 是一个开源的数据处理库,利用 NVIDIA 的 Grace CPU 显著增强了单节点工作负载。通过其 Python API 和优化的 LazyFrame 操作,Polars 实现了高效的数据分析,在 PDS 基准测试中得到了验证。值得注意的是,Grace CPU 比最快的 x86 CPU,AMD Turin 提升了 25% 的速度,这一性能提升归因于其 64K 的默认页面大小,而 x86 的页面大小较小。

PDS 基准测试涉及 22 个分析查询,突显了 Grace CPU 的优越性能和能源效率。与 x86 服务器相比,能源消耗减少了 65%,这意味着每瓦特性能提高了 2.7 倍,每美元性能提高了 1.6 倍。

多节点上的 Apache Spark

在多节点设置中,Apache Spark 也受益于 Grace CPU 的功能。NVIDIA 的开源 NDS 基准工具集显示,使用 Grace CPU 的八节点集群几乎与 AMD Genoa 集群的性能相当,但能源消耗显著减少。这个效率使 Grace CPU 集群在相同功率水平下提供约 40% 的性能提升。

行业影响

Grace CPU 的推出意味着向更加节能和成本效益更高的数据处理解决方案的重大转变。通过优化 ETL 工作负载,组织可以在降低运营成本的同时获取更深入的见解。Grace 架构的高性能内核、快速的架构和大内存带宽对数据密集型操作特别有利。

向基于 Arm 的架构如 NVIDIA Grace 的转变,还为集成的 CPU 和 GPU 解决方案铺平了道路,增强了 AI 和机器学习应用的能力。Grace CPU 对 Arm 生态系统的兼容性进一步简化了数据中心的标准化。

总体而言,NVIDIA Grace CPU 不仅承诺提高 ETL 工作负载的性能,还作为未来数据中心运营的可持续选择,提供了可观的成本节约和环境效益。



Read More