您现在的位置是:首页 >市场 > 2020-11-30 09:41:39 来源:
提出实现更好的机器人自学的新方法
导读 在日常生活中处理复杂任务时,人类表现出惊人的适应性。这种适应性是个人学习能力的直接体现,它使人类能够独立,逐步地提高自己的行为能力
在日常生活中处理复杂任务时,人类表现出惊人的适应性。这种适应性是个人学习能力的直接体现,它使人类能够独立,逐步地提高自己的行为能力。
因此,如果机器人可以具有此功能,则它们可以根据数据和案例的实时获取自动生成新的行为模式。这种能力显示出明显的智力,这被称为行为智力。
最近,中国科学院沉阳自动化研究所的研究人员开发了一种新方法,该新方法开发了一种提高机器人行为智能的新方法,相关结果发表在IEEE认知与发展系统交易上。
该研究人员提出了一种基于Q学习和自适应核线性(AKL)模型增量学习方法的新框架。该框架允许机器人学习新行为而不会忘记以前的行为。在这种新方法下,可以通过自主学习和模仿学习来评估机器人的行为,并可以使用新颖的L2-范数核递归最小二乘(L2-KRLS)算法实时更改模型结构和参数。
此外,他们进行了两个实验以验证新方法的性能。结果表明,提出的框架可以渐进地学习不同环境中的行为。基于局部贪婪策略的Q学习比现有的Q学习算法要快。目前,该成果已应用于机器人自主导航中。