您现在的位置是:首页 >要闻 > 2020-11-25 08:42:42 来源:
AI工具在句子中总结冗长的论文
学者们有一种巧妙的方法来提醒同事注意冗长的论文,因为他们发现这些论文根本不值得花时间阅读。他们将此类文档标记为“ tl; dr”,时间太长,没有阅读。这是一种具有420年历史的莎士比亚的《波洛纽斯(Palonius)》在21世纪的转折,在《哈姆雷特》(Hamlet)中传达给国王和王后:他建议,“简洁是机智的灵魂”。
西雅图的艾伦人工智能研究所对此深有感触,本周推出了一种系统,该系统可以将冗长的计算机科学报告进行极端汇总,以节省审查此类文献的时间。
语义学者是一种研究工具,搭载AI和用于科学研究。利用其新的摘要功能,它可以对大量科学研究论文进行调查,并将其简化为一句话摘要。每月有超过700万用户访问语义学者。
目前,语义学者数据库中有1000万篇计算机科学论文。根据监督数据库的Dan Weld的说法,其他学科的论文将逐渐添加。
该系统为研究人员提供了巨大的优势,这些研究人员迄今不得不依靠扫描大量的书名和通常冗长的摘要,这是在移动设备上特别需要尝试的任务。经过早期测试,反应一直是积极的。韦尔德说:“人们似乎很喜欢它。”
这些年来,已经开发了各种自然语言处理程序来汇总文档。他们通常使用以下两种方法之一:提取方法着重于选择代表性文本并在摘要中逐字使用。例如,2018年开发的Paper Digest似乎是在提取关键句子,而不是用自己的话来重写发现。
另一种方法是抽象的。它使用自然语言生成算法来创建具有原始措辞的摘要。近年来,人工智能自然语言生成的改进使这种方法成为程序员中的首选。
语义学者以在所有汇总工具中获得最大压缩率而著称。科学论文平均5,000字,语义学者的摘要约为21字。这平均为报告大小的1/238。最接近语义学者的竞争对手将文档压缩到报告大小的1/36。
西雅图华盛顿大学的信息科学家Jevin West对该新程序进行了测试,他说:“我预计,这种工具将在不久的将来成为学术搜索的标准功能。实际上,鉴于需要,惊讶地花了这么长时间才能在实践中看到它。”
他指出,这还不是完美的,“但这绝对是朝正确方向迈出的一步,”他说。
艾伦研究所的团队正在免费提供其代码。他们还建立了一个向所有人开放的示范站点。scitldr.apps.allenai.org/
目前,仅接受以英文撰写的论文。但是该程序的作者希望最终能包含其他语言的文档。