您现在的位置是:首页 >人工智能 > 2021-04-26 10:48:52 来源:
新算法可以使家用机器人更好地识别杂乱环境中的对象
对于实用的家用机器人,他们需要能够识别他们应该操纵的物体。虽然物体识别是人工智能中研究最广泛的 主题之一,但即使最好的物体探测器在很多时候仍然会失效。
麻省理工学院计算机科学与人工智能实验室的研究人员认为,家庭机器人应该利用其移动性和相对静态的环境,通过在对身份做出判断之前从多个角度对物体进行成像,使对象识别更容易。然而,匹配不同图像中描绘的对象会带来其自身的计算挑战。
在即将出版的国际机器人研究期刊上发表的一篇论文中,麻省理工学院的研究人员表明,使用现成算法聚合不同视角的系统可以识别出使用单一视角的对象的四倍,同时减少错误识别的数量。
然后,他们提出了一种新算法,该算法同样准确,但在某些情况下,速度提高了10倍,这使得它更适用于家用机器人的实时部署。
“如果你只是从一个角度观察它的输出,就会有很多东西可能会丢失,或者它可能是照明角度或阻挡物体的东西导致探测器出现系统误差,”劳森说。 Wong,电气工程和计算机科学专业的研究生,也是新论文的第一作者。“解决这个问题的方法就是四处走动,走向另一个观点。”
第一次刺伤
Wong和他的论文顾问 - 松下计算机科学与工程教授Leslie Kaelbling和卓越教学工程学院教授TomásLozano-Pérez认为他们有20到30个不同的家庭对象图像聚集在一起一张桌子。在几个场景中,聚类包括相同对象的多个实例,紧密堆积在一起,这使得匹配不同视角的任务更加困难。
他们尝试的第一种算法是为雷达等跟踪系统开发的,它还必须确定在不同时间成像的物体是否实际上是相同的。“这已经存在了几十年,”Wong说。“这有一个很好的理由,那就是它真的很好用。这是大多数人想到的第一件事。“
对于每对连续图像,该算法产生多个假设,其中一个对象中的哪个对象与另一个中的哪些对象相对应。问题在于增加了假设的数量作为新的观点。为了保持计算的可管理性,算法会在每个步骤中丢弃除其顶部假设之外的所有假设。即便如此,在生成最后一个假设之后对它们进行排序是一项耗时的任务。
代表性抽样
为了获得更有效的算法,麻省理工学院的研究人员采用了不同的方法。他们的算法不会丢弃它在连续图像中产生的任何假设,但它也不会尝试将它们全部拉出来。相反,它随机抽样。由于不同假设之间存在显着重叠,因此足够数量的样本通常会对任何两个连续图像中的对象之间的对应关系产生共识。
为了保持所需的样本数量较少,研究人员采用了一种简化的技术来评估假设。假设算法从一个视角识别出三个对象,从另一个视角识别出四个对象。比较假设的数学上最精确的方法是考虑两组对象之间的每个可能的匹配集:第一个视图中的对象1,2和3与第二个对象中的对象1,2和3匹配的集合; 第一个中的对象1,2和3与第二个中的对象1,2和4匹配的集合; 将第一个视图中的对象1,2和3与第二个视图中的对象1,3和4匹配的集合,依此类推。在这种情况下,如果您包含检测器发生错误的可能性以及某些对象从某些视图中被遮挡,则该方法将产生304个不同的匹配集。
相反,研究人员的算法分别考虑第一组中的每个对象,并评估其映射到第二组中的对象的可能性。因此,第一组中的对象1可以映射到第二组中的对象1,2,3或4,对象2也是如此,依此类推。同样,考虑到错误和遮挡的可能性,这种方法仅需要20次比较。
然而,它确实打开了无意义结果的大门。该算法可以得出结论,第二组中对象3的最可能匹配是第一组中的对象3 - 并且还可以得出结论,第二组中对象4的最可能匹配是第一组中的对象3。因此研究人员的算法也会寻找这样的双重映射并重新评估它们。这需要额外的时间,但不会像考虑聚合映射那样多。在这种情况下,算法将执行32次比较 - 超过20次,但明显少于304次。