您现在的位置是:首页 >要闻 > 2020-11-30 16:22:50 来源:
自然语言生成的认知状态统计模型
为了使机器人能够使用各种各样的设置,它们需要能够与人类进行无缝通信。因此,近年来,研究人员一直在开发越来越先进的计算模型,该模型可以使机器人处理人类语言并制定适当的响应。
机器应掌握的人类语言的一个重要方面是在句子中使用代词。根据一种被称为“ Givenness Hierarchy”(GH)的语言理论,人类根据对对象在听众心中的“认知状态”的隐含假设,选择要使用的代词。例如,如果讲话者假设他们的目标对象在当前对话中处于“焦点对准”(这是一种认知状态),则他们可以选择使用代词“它”。
科罗拉多矿业大学MIRRORLab的研究人员最近在arXiv上预先发表的一篇论文中提出了两种认知状态模型。第一个模型是直接从GH文献中得知的基于理论规则的有限状态机模型,而第二个模型是预测不确定性下对象的认知状态的统计概率模型(认知状态过滤器)。
“我的顾问Tom Williams博士和他的同伴已经开始使用认知状态的概念来帮助机器人自然语言理解(NLU),在这种情况下,听众必须根据目标的认知状态/引用形式信息来识别目标对象”,进行这项研究的研究人员之一Poulomi Pal告诉TechXplore。“我们最近论文的主要思想/目的是基于纪律层次结构(GH)的语言理论创建用于认知状态过滤的计算模型,以达到自然语言生成(NLG)的目的,更具体地说,是提高机器的使用率代词(例如,它,这个,那个等)。”
Pal和她的同事们提出的第一个模型是有限状态机(FSM)模型,该模型根据GH文献列出的规则生成物体的认知状态。本文介绍的第二个模型是认知状态过滤器(CSF),它可以从文本数据中自动学习这些规则。然后,研究人员根据通过在线Amazon Mechanical Turk平台收集的数据训练和评估了他们的CSF模型。
在他们的CSF模型的实验设计过程中,研究人员使用了OFAI多模式任务描述语料库的银标准英语翻译的子集,该库是人与人,人与机器人多模式交互作用的集合。他们发现CSF处理不确定性要比FSM模型更好,因为CSF不遵循预先建立的规则,而是直接从所分析的数据中获取规则。
帕尔说:“我们的结果表明,脑脊液模型在预测物体认知状态方面的准确性比理论上的FSM模型稍好。” “与基于规则的理论模型相比,CSF模型在尝试评估对象的认知状态时(尤其是在数据较大时)可能是更可取的,因为它可以自动从数据中学习规则。”
帕尔和她的同事设计的CSF模型最终可以通过提高人与机器人在对话中使用代词的能力来最终帮助增强人与机器人之间的自然语言互动。将来,这些发现可能会激发其他团队开发类似的机器人应用模型,以及基于其他研究领域的类似技术,例如计算语言学或认知心理学。
帕尔说:“我们相信,开发像CSF这样的计算模型将有助于促进认知知识的方法对自然语言的产生和理解的发展。” “我的进一步研究计划包括开发和实施GH信息回指生成模型,该模型考虑了在选择NLG的不同引用形式时利用CSF模型对物体的认知状态。”