您现在的位置是:首页 >人工智能 > 2022-04-01 15:08:43 来源:

训练机器人操纵柔软和可变形的物体

导读 机器人可以解决魔方并在火星崎岖的地形中航行,但它们在做一些简单的任务时会遇到困难,比如擀一块面团或处理一双筷子。即使拥有大量数据、

机器人可以解决魔方并在火星崎岖的地形中航行,但它们在做一些简单的任务时会遇到困难,比如擀一块面团或处理一双筷子。即使拥有大量数据、清晰的指示和广泛的培训,他们也很难完成孩子轻松完成的任务。

新的模拟环境PlasticineLab旨在让机器人学习更加直观。通过将物理世界的知识构建到模拟器中,研究人员希望能够更容易地训练机器人来操纵现实世界中经常弯曲和变形而不会恢复其原始形状的物体和材料。该模拟器由麻省理工学院、麻省理工学院-IBM沃森人工智能实验室和加州大学圣地亚哥分校的研究人员开发,于5月在国际学习代表大会上发布。

在PlasticineLab中,机器人代理学习如何通过在模拟中操纵各种软物体来完成一系列给定的任务。在RollingPin中,目标是通过按压或用大头针将面团压平;在绳索中,将绳索缠绕在柱子上;在筷子中,拿起一根绳子并将其移动到目标位置。

他们说,研究人员通过将世界的物理知识嵌入到模拟器中,训练他们的代理以比在强化学习算法下训练的代理更快地完成这些和其他任务,这使他们能够利用基于梯度下降的优化技术来找到最好的解决方案。

“将物理基础知识编程到模拟器中可以提高学习过程的效率,”该研究的主要作者黄志奥说,他曾是麻省理工学院-IBM沃森人工智能实验室的实习生,现在是一名博士。加州大学圣地亚哥分校的学生。“这让机器人对现实世界有更直观的感觉,这个世界充满了生物和可变形的物体。”

“机器人可能需要数千次迭代才能通过强化学习的试错技术来掌握一项任务,这种技术通常用于在模拟中训练机器人,”该工作的资深作者、IBM研究员ChuangGan说.“我们表明,通过学习一些物理知识可以更快地完成它,这允许机器人使用基于梯度的规划算法来学习。”

PlasticineLab通过一种名为Taichi的图形编程语言将基本物理方程烘焙到其中。太极拳和PlasticineLab所基于的早期模拟器ChainQueen都是由研究合著者胡元明开发的。通过使用基于梯度的规划算法,PlasticineLab中的代理能够不断地将其目标与它在该点所做的动作进行比较,从而更快地进行路线修正。

“我们可以通过反向传播找到最佳解决方案,这与用于训练神经网络的技术相同,”该研究的共同作者、博士陶杜说。麻省理工学院的学生。“反向传播为代理提供了更新其操作以更快地达到其目标所需的反馈。”

这项工作是赋予机器人更多常识的持续努力的一部分,以便它们有朝一日能够在现实世界中烹饪、清洁、折叠衣物以及执行其他平凡的任务。