您现在的位置是:首页 >生活 > 2021-04-14 09:55:42 来源:
谷歌将通过开源Parsey McParseface永久改变AI
Google已开源其语言解析模型SyntaxNet,调用英文版Parsey McParseface。该系统以令人难以置信的精确度理解人类语言,但注意力集中在其名称的选择上,这是在人们投票命名科学研究船Boaty McBoatface之后 - 事实上它是以David Attenborough爵士的名字命名的。
谷歌解析模型的开源意味着更广泛的社区可以使用该工具来开展人工智能(AI)游戏。这意味着机器可以理解英语新闻标准数据库中的句子,这是他们接管世界的第一步。“在谷歌,我们花了很多时间思考计算机系统如何阅读和理解人类语言,以便以智能方式处理它,” 谷歌高级职员研究科学家斯拉夫彼得罗夫解释道。
“今天,我们很高兴通过发布SyntaxNet,与TensorFlow实施的开源神经网络框架,为自然语言理解系统提供基础,与更广泛的社区分享我们的研究成果。”SyntaxNet建立在强大的机器学习算法之上,学习分析语言的语言结构,并且可以解释每个单词在给定句子中的功能作用。
但它是如何工作的?系统基本上识别句子的主语和宾语,并通过确定句子中单词之间的句法关系来理解它们的含义,在依赖句法树中表示。为了直观地解释这一点,这里是单词组的简单树形图:“Alice看到Bob”。
该结构编码Alice和Bob是名词,而saw是动词。主要动词'saw'是句子的根,Alice是saw的主语(nsubj),而Bob是它的直接对象(dobj)。这个图结构帮助Parsey McParseface基本上理解了句子的含义,正确地分析了它。
“我们的发布包括在您自己的数据上训练新的SyntaxNet模型所需的所有代码,以及Parsey McParseface,”Petrov补充道。“SyntaxNet将神经网络应用于模糊问题。从左到右处理输入句子,当句子中的每个单词被考虑时,逐渐增加单词之间的依赖关系。“
根据谷歌的说法,Parsey McParseface在新闻文本上获得了94%%的准确率,相比之下,人类语言学家的准确度达到了96%%或97%%,但是对于网络上的随机句子来说,它的表现并不是很好。准确率为90%%。