在增强机器人能力方面取得重大进展,NVIDIA推出了一个名为AutoMate的新框架,旨在针对不同几何结构训练机器人进行装配任务。在最近一篇NVIDIA技术博客文章中详细介绍了这一创新框架,展示了其弥合仿真与现实应用之间差距的潜力。
什么是AutoMate?
AutoMate是第一个基于仿真的框架,设计用于训练专业和通用的机器人装配技能。该框架是与南加州大学和NVIDIA西雅图机器人实验室合作开发的,展示了技能的零样本仿真到现实转移,这意味着在仿真中学习的能力可以直接应用于现实环境,而无需额外调整。
AutoMate的主要贡献包括:
- 一个包含100个装配和现成使用的仿真环境的数据集。
- 有效训练机器人处理各种装配任务的算法。
- 结合多种学习方法,将多种专业技能的知识提炼成一种通用技能,并通过强化学习(RL)进一步优化。
- 一个能够在实际系统中部署这些仿真训练技能的感知初始化工作流程。
数据集和仿真环境
AutoMate的数据集包括100个既兼容仿真又能3D打印的装配。这些装配基于来自Autodesk的大型数据集,允许在实际环境中进行实际应用。仿真环境设计用于并行化任务,提高训练过程的效率。
在多样几何结构上学习专业技能
尽管先前的NVIDIA项目如IndustReal在使用RL方面取得了进展,AutoMate结合了RL和示范学习,从而更有效地训练机器人。这种方法解决了三个主要挑战:生成装配演示,将示范学习集成到RL中,以及在学习过程中选择正确的演示。
通过拆卸生成装配演示
受装配拆卸概念的启发,流程涉及收集拆卸演示并将其反转用于装配。这种方法简化了演示收集,如果手动进行,这可能是昂贵且复杂的。
包含模仿目标的RL
在RL奖励函数中加入模仿项,鼓励机器人模仿演示,从而改进学习过程。这种方法与以前的角色动画工作一致,并提供了一个强大的训练框架。
使用动态时间规整选择演示
动态时间规整(DTW)用于衡量机器人的路径与演示路径之间的相似性,确保机器人在每一步都遵循最有效的演示。此方法提升了机器人从最佳示范中学习的能力。
学习通用装配技能
为了开发能够处理多种装配任务的通用技能,AutoMate采用了三阶段方法:行为克隆、数据集聚合(DAgger)和RL微调。这种方法使通用技能从积累的专业技能知识中受益,从而改进整体性能。
现实环境设置与感知初始化工作流程
现实环境设置包括一个Franka Panda机器人手臂、一个腕部安装的Intel RealSense D435相机和一个Schunk EGK40夹爪。工作流程涉及捕获RGB-D图像、估计部件的6D姿态并部署仿真训练的装配技能。此设置确保训练的技能能够在现实条件下有效应用。
摘要
AutoMate通过利用仿真和学习方法解决广泛的装配问题,代表了机器人装配方面的重大进展。未来的步骤将侧重于多部件装配及进一步优化技能以达到行业标准。
更多信息,请访问AutoMate项目页面,并探索相关的NVIDIA环境和工具。
Image source: Shutterstock