您现在的位置是:首页 >互联网 > 2020-10-20 11:35:22 来源:

OpenAI使用新的模拟技术来教机器人如何解决魔方

导读 自动化Rubik的多维数据集求解器在机器人竞赛中非常常见,因此吉尼斯世界纪录为此专门设置了一个类别。但是OpenAI Inc 在该领域的新进入却

自动化Rubik的多维数据集求解器在机器人竞赛中非常常见,因此吉尼斯世界纪录为此专门设置了一个类别。但是OpenAI Inc.在该领域的新进入却引人注目。

今天,人工智能研究实验室推出了一只机器人手(如图所示),弄清楚了如何在没有人工指导的情况下解开魔方的瓷砖。它使用OpenAI开发的突破性培训技术来实现这一目标,该技术可以帮助自己构建新一代更灵活,更适应性强的自主机器。

如今,大多数现存的机器人仅限于执行极其狭窄的任务。这不仅是硬件限制的结果,而且在某些情况下甚至不是主要的原因。相反,它与以下事实有关:训练AI在现实世界中移动和操作充满了障碍。

工程师大多依靠仿真为其机器人构建机器学习模型。基本思想是创建一个虚拟设置,该虚拟设置模仿系统将在其中运行的环境,将AI设置在内部松散并使其通过反复试验来学习。经过数百万次尝试,神经网络甚至可以掌握复杂的任务,例如 两条腿走路。

问题是在需要将AI安装在主机机器人上时开始的。模拟无法完全解决现实世界中存在的无数变量,这意味着机器学习模型通常最终会面临无法教给他们的意外挑战。

输入OpenAI的新培训方法。通过为训练仿真注入不确定性,实验室为AI配备了驱动其机器人手的AI,以应对意外情况。在一个学习环节中,虚拟房间的重力可能类似于地球表面上的重力,而在下一课程中,虚拟房间的重力可能更强,甚至来自不同的角度。

“我们随机化的参数之一是魔方的大小,” OpenAI的研究人员在博客文章中详细阐述。“ ADR从固定大小的魔方开始,然后随着训练的进行逐渐增加随机范围。我们将相同的技术应用于所有其他参数,例如立方体的质量,机器人手指的摩擦力和手的视觉表面材料。”

该过程由第二个机器学习模型执行,随着机器人手的AI的提高,仿真变得越来越困难。研究人员解释说:“随着神经网络在任务中变得更好并达到性能阈值,域随机化的数量会自动增加。”

该项目取得了一些令人鼓舞的初步结果。当模型在现实环境中释放时,它驾驶的机器人手戴着橡胶手套,用几根手指绑在一起,设法解决了魔方,甚至当研究人员试图用各种物体将立方体撞到地面上时。

OpenAI相信培训技术也可能会在更严重的项目中得到应用。当遇到不可预见的障碍或障碍时,该方法可能使工业机器人,无人机和其他自主机器能够动态修改其行为。这种多功能性将是实现AI的圣杯的重要一步,这是自学人工智能的通用智能。

自从7月份与微软公司建立了10亿美元的合作伙伴关系以来,Rubik的Cube求解器是OpenAI详述的首批重大项目之一 。根据协议,微软将为实验室提供资本和云基础设施,以支持研究,以换取知识产权。