您现在的位置是:首页 >要闻 > 2020-12-03 09:10:34 来源:
从错误和可转移的技能中学习工人机器人的属性
实践是完美的-它是一句格言,已帮助人类变得高度灵巧,现在,它已被应用于机器人。利兹大学的计算机科学家正在使用自动计划和强化学习的人工智能(AI)技术来“训练”机器人,以在杂乱的空间(例如仓库架子或冰箱)中找到物体并进行移动。
目的是发展机器人自主性,以便机器可以评估任务中出现的独特情况并找到解决方案,类似于机器人将技能和知识转移到新问题上。
利兹大学的研究人员今天(11月4日,星期一)在中国澳门举行的智能机器人与系统国际会议上介绍他们的发现。
最大的挑战是,在狭窄的区域中,机械臂可能无法从上方抓取物体。取而代之的是,它可能必须计划一系列移动以到达目标对象,这可能是通过操纵其他项目来实现的。计划此类任务所需的计算机功能非常强大,机器人通常会暂停几分钟。当它执行移动时,通常会失败。
不断发展实践的想法非常完美,利兹的计算机科学家们将AI的两个想法融合在一起。
一种是自动化计划。机器人能够通过视觉系统“看到”问题,实际上是图像。机器人操作系统中的软件可模拟其可能到达目标物体的一系列动作。
但是,机器人“预演”的模拟无法捕获现实世界的复杂性,并且在实施模拟时,机器人无法执行任务。例如,它可以将物品从架子上敲下来。
因此,利兹团队已将计划与另一种称为强化学习的AI技术相结合。
强化学习需要计算机尝试一系列尝试和错误尝试(总共约10,000次)才能到达并移动对象。通过这些尝试和错误尝试,机器人可以“学习”其计划好的动作更有可能成功结束。
计算机自行进行学习,首先随机选择可能有效的计划动作。但是随着机器人从反复试验中学到东西,它变得更加善于选择那些更有可能成功的计划动作。
计算学院的Matteo Leonetti博士说:“人工智能擅长使机器人进行推理-例如,我们已经看到与大师级棋子有关的机器人。
“但是机器人不能很好地发挥人类的才能:高度机动和灵巧。那些物理技能已经硬连接到人脑,这是进化的结果以及我们实践和实践的方式。
“这就是我们将其应用于下一代机器人的想法。”
据Wissam Bejjani博士说。撰写研究论文的学生,该机器人发展了概括能力,可以将其计划应用到独特的环境中。
他说:“我们的工作意义重大,因为它将计划与强化学习相结合。许多尝试开发该技术的研究都只是其中一种方法。
“我们的方法已经在大学的机器人实验室中看到的结果得到验证。
“有一个问题,在机器人必须移动一个大苹果的情况下,它首先要移到苹果的左侧以移开杂物,然后再操纵苹果。
“这样做的目的是使杂物不会落在架子的边界之外。”
计算学院副教授Mehmet Dogar博士也参与了这项研究。他说,这种方法将机器人的“思考”时间加快了十倍,而决定要花50秒,现在要花5秒。