当他们学习时帮助引导机器人

2021-04-29 03:15:37 来源：用户：

像幼儿一样，机器人可以在学习在物理世界中发挥作用时使用一些帮助。这就是莱斯大学计划的目的，该计划温和地引导机器人走向最有帮助的，类似人类的方式来协作完成任务。

水稻工程师Marcia O'Malley和研究生Dylan Losey通过在执行任务时对机器施加温和的物理反馈来改进他们训练机器人的方法。目标是简化预期与人类并肩工作的机器人的培训。

他们的研究论文出现在IEEE Explore中。

“从历史上看，机器人的作用是接管我们不想做的平凡任务：制造，装配线，焊接，涂装，”机械工程，电气和计算机工程与计算机科学教授奥马利说。。“随着我们越来越愿意通过技术分享个人信息，就像我的手表记录我采取的步骤一样，该技术也会转变为具体的硬件。

“机器人已经在我们家中吸尘或控制我们的恒温器或修剪草坪，”她说。“技术渗透到我们的生活中有各种各样的方式。我已经在厨房里和Alexa谈过了，为什么不能拥有我们可以与之合作的机器呢?我们的很多工作都是为了让人机交互安全。”

根据研究人员的说法，适应物理人机交互(pHRI)的机器人传统上将此类交互视为干扰，并在交互结束时恢复其原始行为。莱斯研究人员通过一种允许人类实时物理调整机器人轨迹的方法增强了pHRI。

该计划的核心是阻抗控制的概念，实际上是一种管理推动时发生的事情的方法。允许通过物理输入进行阻抗控制的机器人调整其编程轨迹以响应，但在输入结束时返回其初始轨迹。

Rice算法建立在该概念的基础上，因为它允许机器人调整其超出输入的路径并计算到达其目标的新路线，类似于GPS系统，当驾驶员错过转弯时重新计算到达目的地的路线。

去年夏天，洛西在加州大学伯克利分校电子工程和计算机科学助理教授Anca Dragan的实验室里大部分时间都在测试这个理论。他和其他学生训练了一个机器人手臂和一只手，在桌面上放一个咖啡杯，然后使用增强的pHRI使其远离电脑键盘并保持足够低，以便杯子在掉落时不会破裂。(关于实验的另一篇论文出现在机器学习研究论文集中。)

目标是通过物理交互使机器人的编程轨迹变形。“在这里，机器人有一个计划或所需的轨迹，它描述了机器人认为它应该如何执行任务，”洛西在一篇关于伯克利实验的文章中写道。“我们引入了一种实时算法，可以修改或变形机器人未来的预期轨迹。”

在阻抗模式下，机器人在交互后始终恢复到其原始轨迹。在学习模式中，反馈不仅改变了机器人在交互时的状态，而且改变了它如何进入目标，洛西说。例如，如果用户指示它使杯子不能越过键盘，将来会继续这样做。“通过我们在每次新观察后重新计算机器人所需的轨迹，机器人能够产生符合人类偏好的行为，”他说。

进一步的测试使用了10名赖斯学生，他们使用O'Malley实验室的康复力反馈机器人OpenWrist来操纵光标在计算机屏幕上的障碍物上并落在蓝点上。测试首先使用标准阻抗控制，然后使用物理交互式轨迹变形进行阻抗控制，这是pHRI的模拟，允许学生训练设备学习新的轨迹。

结果显示，轨迹变形的试验在物理上更容易，并且需要显着减少的相互作用才能实现目标。实验证明，相互作用可以编程具有多个自由度的自动机器人，在这种情况下弯曲手臂并旋转手腕。

目前的一个限制是pHRI还不能改变机器人执行任务所需的时间，但这是Rice团队的议程。

“这项工作的范式转变是，机器人不应将人类视为随机干扰，而应将人类视为理性存在，有理由互动，并试图传达重要的东西，”洛西说。“机器人不应该只是试图摆脱困境。它应该了解正在发生的事情并更好地完成工作。”

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

当他们学习时 帮助引导机器人

当他们学习时帮助引导机器人