NVIDIA推出开放物理AI数据集以推动机器人和自动驾驶领域创新
realtime news Mar 18, 2025 22:37
NVIDIA推出大型开源数据集,以加速机器人和自动驾驶车辆(AV)的开发,为研究人员提供了丰富的数据资源用于模型训练和测试。

NVIDIA宣布发布一套全面的开源数据集,旨在推进机器人与自动驾驶车辆(AV)的开发。这一举措在加利福尼亚州圣何塞举办的NVIDIA GTC全球AI会议上揭晓,预计将成为世界上最大的开放物理AI数据集,为开发者提供所需的资源,用于构建尖端的AI模型。
数据集功能与可用性
该数据集现已在Hugging Face上开放获取,包含15TB的数据,包括用于机器人训练的超过32万条轨迹和多达1000个通用场景描述(OpenUSD)资产。这一庞大的数据集旨在支持模型的预训练、测试和验证,未来更新计划包括为全球1000多个城市中各种交通场景的端到端AV开发提供数据。
应用与早期采用者
NVIDIA的物理AI数据集有望支持能够在复杂环境中导航的AI模型开发。早期采用者如伯克利深度驾驶中心、卡内基梅隆大学安全AI实验室和加利福尼亚大学圣地亚哥分校的情境机器人研究所,已经在探索其潜力。这些机构旨在利用数据集用于从改善AV安全到开发语义AI模型以更好理解情境环境的项目。
解决AI开发中的数据挑战
收集和标注多样化数据场景是AI开发中的一大难题。NVIDIA的数据集旨在通过提供一个坚实的基础来克服这一难题,以构建准确且商用级的模型。该数据集包含真实世界和合成数据,是训练像NVIDIA Isaac GR00T和NVIDIA DRIVE AV等模型必不可少的,它们需要大量数据进行开发。
对安全与研究的影响
开放数据集将通过允许开发者识别异常值和评估模型泛化性能来促进安全研究的进步。借助NVIDIA NeMo Curator等工具,开发者可以高效地处理庞大的数据集,大幅减少模型训练和定制所需的时间。
访问这个庞大的数据集预计将推动机器人和自动驾驶领域的创新,为研究人员和开发者提供突破AI技术边界所需的工具。
欲了解更多关于NVIDIA物理AI数据集及其应用的信息,请访问NVIDIA博客。
Image source: Shutterstock