英伟达、Meta 同日发布重磅机器人训练工具

0
2266

英伟达(Nvidia)、Meta 各自发布了重磅机器人训练工具。

首先,英伟达研究院主导开发了 Eureka。该 AI 系统可令开发者配合英伟达自家物理模拟软件 Isaac Gym 进行强化学习(reference learning)。

Eureka 可以教会机器人复杂的运动控制技能,比如转笔、打开抽屉和柜子、抛球和接球、操作剪刀。图来自英伟达官网

Eureka 的全称是 Evolution-driven Universal Reward Kit for Agent,本质是一种由大模型驱动的算法生成工具。借助 GPT-4 写代码的能力,Eureka 拥有了出色的奖励函数设计能力,可以自主编写奖励算法来训练机器人。

据英伟达表示, Eureka 可以教会机器人复杂的运动控制技能,比如转笔、打开抽屉和柜子、抛球和接球、操作剪刀。英伟达称这一突破将重新定义机器学习。Eureka 可以实现灵巧的机器人控制,并为动画作者提供生成逼真实体动作的新方法。

英伟达称,在 29 种不同的开源强化学习(RL)环境中,Eureka 奖励设计的性能达到了人类水平,这些环境包括 10 种不同的机器人形态(四足机器人、四旋翼机器人、双足机器人、机械手以及几种灵巧手)。在没有任何特定任务提示或奖励模板的情况下,Eureka 生成的奖励程序在超过80%的任务上优于专家编写的奖励程序。这使得机器人的平均性能提高了 50% 以上。

Meta 则推出了 Habitat 3.0 模拟器,Meta 将其称为 “社交智能机器人研发路上的里程碑” 。

Meta 的 Habitat 3.0 是第一个支持在多样化、逼真的室内环境中,就人机交互任务进行大规模训练的模拟器。图来自 Meta 官网

据介绍,Habitat 3.0 是第一个支持在多样化、逼真的室内环境中,就人机交互任务进行大规模训练的模拟器。

具体来看,Habitat 3.0 可以利用红外捕捉系统精心构建一个虚拟环境,如办公空间、住宅和仓库等,其中物体的形状和大小完全复制现实世界,该工具还可在外貌和姿势上对人类进行真实的模拟,支持从简单(如行走和挥手)到复杂(如与物体交互)等各种类型的动作,还可模拟多种真实的社交场景。

机器人和人形化身同处一个空间,且虚拟环境中的人形化身既可由算法控制,也可由真人通过键盘、鼠标以及VR头显等进行控制。

Meta的AI研究部门(FAIR)表示,Habitat 3.0 将把机器人 AI 代理的学习时间从几个月甚至几年缩短到几天。它还能在安全的模拟环境中更快速地测试新模型,不会有任何风险。

Previous article领跑可持续工厂标准,艺康案例荣获第一财经“绿点中国●绿贝奖”
Next article铁姆肯公司携全线产品亮相第27届亚洲国际动力传动与控制技术展

LEAVE A REPLY

Please enter your comment!
Please enter your name here