您现在的位置是:首页 >互联网 > 2020-10-15 14:03:06 来源:
Google开源Tapas这是一种用于分析关系数据的自然语言AI
Google LLC已经发布了Tapas的代码,Tapas是一种内部开发的人工智能,可以处理诸如“最新iPhone的名称是什么?”之类的自然语言问题。并从关系数据库或电子表格中获取答案。
这家搜索巨头的研究人员在周四详细介绍了人工智能。Tapas基于BERT,这是Google在其搜索引擎中使用的自然语言处理技术。
世界信息的很大一部分是关系性的,也就是说组织成行和列。从历史上看,从这些行和列进行导航需要手动筛选电子表格或编写SQL查询。自然语言处理使用户的工作变得相当轻松,这就是为什么该技术已被Google和分析市场中的其他参与者广泛采用的原因。
这家搜索巨头表示,Tapas击败或匹配了三种用于解析关系数据的顶级开源算法。Google用Wikipedia的英语版在620万张桌子上训练了AI,然后将其设置为可用于三组学术数据集。基准测试表明,在所有三个数据集中,神经网络提供的答案都比竞争对手的算法准确或可比。
在后台,Tapas采用了Google搜索中使用的BERT自然语言处理技术的变体。BERT提供了比传统方法更高的准确性,因为它使AI不仅可以像通常那样从左到右或从右到左评估文本序列,而且可以同时执行。Google为Tapas实现的版本使AI不仅可以考虑用户提出的问题和他们希望查询的数据,还可以考虑存储数据的关系表的结构。
提高的准确性只是Google吹捧的优势之一。“与创建仅适用于单一样式表的模型不同,这种方法所产生的模型可以应用于来自广泛领域的表,”研究了Tapas的Google Research软件工程师ThomasMüller说道,在博客文章中有详细介绍。
此外,Tapas不仅可以获取数据,还可以执行基本计算。例如,如果评估销售数据的业务用户要求获得公司三种最受欢迎产品的平均收入,则AI可以计算出答案。
Tapas可能会在Google的某些产品中找到用途。例如,搜索巨头可能会使用该模型来增强其表格电子表格编辑器,该表格已经通过其“浏览”功能提供了有限的自然语言查询选项。Tapas从大型数据存储库中提取特定项目的能力也可能有助于改进Google Assistant的问答功能。