您现在的位置是:首页 >要闻 > 2020-12-09 08:41:41 来源:
自动化系统可以重写Wikipedia文章中的过时句子
麻省理工学院研究人员创建的系统可用于自动更新Wikipedia文章中的事实不一致之处,从而减少了人工编辑人员的工作时间和精力。
Wikipedia包含数百万条文章,需要不断进行编辑以反映新信息。这可能涉及文章扩展,重大重写或更多例行修改,例如更新编号,日期,名称和位置。目前,全球各地的人们都自愿花时间进行这些编辑。
在AAAI人工智能大会上发表的一篇论文中,研究人员描述了一种文本生成系统,该系统可精确定位和替换相关Wikipedia句子中的特定信息,同时保持类似于人类书写和编辑方式的语言。
这样的想法是,人们可以在界面中输入具有更新信息的非结构化句子,而无需担心样式或语法。然后,系统将搜索Wikipedia,找到适当的页面和过时的句子,然后以类似于人的方式将其重写。研究人员说,将来有可能构建一个完全自动化的系统,该系统可以识别和使用来自网络的最新信息,从而在相应的Wikipedia文章中生成重写的句子,以反映更新的信息。
“维基百科的文章经常需要进行大量更新。自动修改文章的确切部分将是有益的,几乎不需要人工干预,”博士Darsh Shah说。是计算机科学和人工智能实验室(CSAIL)的学生,也是主要作者之一。“您无需再花费数百人来修改每篇Wikipedia文章,因为该模型是自动帮助或自动完成的,因此您只需要几个。这大大提高了效率。”
存在许多其他可以自动进行Wikipedia编辑的机器人。Shah说,通常,这些工具可以减轻恶意破坏或将一些狭窄定义的信息放入预定义的模板中。他说,研究人员的模型解决了一个更棘手的人工智能问题:给定了一条新的非结构化信息,该模型会以人性化的方式自动修改句子。他说:“其他[机器人]任务更多地是基于规则的,而这是一项需要对两个句子中相互矛盾的部分进行推理并生成连贯的文本的任务。”
共同主要作者和CSAIL研究生Tal Schuster说,该系统也可以用于其他文本生成应用程序。在他们的论文中,研究人员还使用它来自动合成流行的事实检查数据集中的句子,这有助于减少偏见,而无需手动收集其他数据。Schuster说:“通过这种方式,针对数据集进行训练的自动事实验证模型的性能得到了提高,例如假新闻检测。”
Shah和Schuster与他们的学术顾问Regina Barzilay,三角洲电子工程学和计算机科学教授以及CSAIL教授一起研究了这篇论文。