您现在的位置是:首页 >互联网 > 2020-10-20 11:35:20 来源:

Facebook在AI推理和机器翻译方面取得了长足进步

导读 Facebook Inc 今天使用其@Scale会议来提供其人工智能研究进展的最新信息。这家社交媒体公司正在开源新的 AI推理平台,并提供有关机器翻

Facebook Inc. 今天使用其@Scale会议来提供其人工智能研究进展的最新信息。

这家社交媒体公司正在开源新的“ AI推理”平台,并提供有关机器翻译研究的一些最新信息。

Facebook应用人工智能研究负责人Srinivas Narayanan(如图)今天上午在圣何塞会议上说,这是大规模扩展人工智能工作量的一部分,鉴于训练人工智能模型需要大量数据,这是一项艰巨的任务。 ,加利福尼亚。

纳拉亚南说:“没有人工智能,今天的Facebook就不会存在。” “它与我们所做的一切紧密结合。” 但是,随着每天有超过10,000种AI模型做出数万亿的决策,寻找更有效地完成所有这些工作的方法至关重要。他说:“伴随着如此巨大的增长,随之而来的是巨大的规模挑战。”

AI推理是指能够从大量结构化和非结构化数据中提取关键信息并基于该信息得出逻辑结论的计算机系统。Facebook说,推理模型在许多推荐引擎中使用了AI的“极其重要”的方面,展示了在线购物者可能感兴趣的新产品,或者推荐了用户接下来可能想看的电视节目。

AI推理模型使用强化学习进行训练,强化学习是一种使用奖励和惩罚系统来训练算法的编程方法。强化学习算法或代理通过与环境交互来学习。代理在正确执行时会收到奖励,在错误执行时会受到处罚。通过这种方式,代理可以通过最大化其奖励并最小化其惩罚而在无需人工干预的情况下“学习”。

强化学习的唯一问题是,设置过程非常困难且耗时,几乎没有组织拥有以这种方式训练其AI模型所需的资源。因此,Facebook决定开放其ReAgent平台的源代码,以使其更轻松地构建AI推理模型,以克服这些挑战。

ReAgent现在可以在GitHub上下载,它带有预先构建的模型,这些模型已经可以根据所馈送的数据做出决策,并且还可以提供有关这些决策的反馈。此外,还有一个“离线评估器模块”,可以评估新模型在生产中部署之前的性能,以及一个用于大规模部署模型的服务平台。

Facebook代理

Facebook的AI研究团队在博客中写道:“它是用于创建基于AI的推理系统的最全面,模块化的开源平台,并且是第一个包含策略评估的策略,该策略结合了离线反馈以改进模型。” “通过使构建实时,大规模决策的模型变得更加容易,ReAgent使研究项目以及生产应用中策略的创建和评估民主化。”

Facebook说,Facebook已经在内部使用ReAgent来支持其社交媒体平台做出的许多个性化决定,例如决定向用户显示哪些通知。Facebook表示,它通过新文档使组织更易于使用ReAgent,这些文档解释了如何将ReAgent部署到Microsoft Azure等公共云计算服务。

Facebook研究人员说:“这种扩展的兼容性将使RL在生产中的使用进一步民主化,并扩大AI社区对模型如何提高其制定和评估决策的能力(包括实时)的理解。”

机器翻译的进步

Facebook在机器翻译方面也取得了一些进步。它的研究人员说,他们已经为教学系统提出了一种新技术,该系统如何将口语转换成更晦涩的语言,没有成千上万的示例可以用作培训数据。

机器翻译是自然语言处理的一种应用程序,它以源语言和目标语言的相应翻译来训练大量句子模型。对于涉及大量数据的广泛使用的语言(例如英语到西班牙语的翻译),此类模型非常准确。但是,例如在老挝,哈萨克斯坦,海地语,老挝语,奥罗莫语和缅甸语等“资源匮乏的语言”方面,他们的表现就不太好。

Facebook克服这一问题的新技术涉及将“迭代反向翻译”和“自我训练”与嘈杂的频道解码相结合,尽管研究对象只有有限的数据,但它仍使Facebook的研究人员能够创建新的英语到缅甸机器翻译系统语言。

反向翻译是一种训练方法,它假定目标语言中必须有大量的单语数据,并且源语言(例如英语)和目标语言(例如缅甸语)的句子主题应具有可比性。但是这种方法在资源不足的语言中无效,因为没有足够的单语数据。Facebook的新技术提供了解决该问题的方法。

研究人员写道:“首先,利用可用的有限并行数据,我们训练了反向MT系统,该系统将从目标语言转换为源语言。” “然后,我们使用该系统在目标侧翻译单语数据,从而生成由反向MT系统的反向翻译和相应的目标句子组成的合成数据集。”

下一步涉及基于此新创建的合成数据集运行自训练算法,以将单语数据从源语言转换为目标语言。这将产生第二个综合数据集,该综合数据集由原始单语数据及其相应的机器翻译中的句子组成。

“在使用反向翻译和自我训练分别生成带有反向翻译和正向翻译句子的合成数据集之后,我们将所有这些数据集结合在一起,并重新训练了(可能更大的)正向模型和反向模型,” Facebook的研究人员写道。“由于通过重新训练提高了这些模型的翻译质量,因此我们重复使用它们来重新翻译源和目标单语数据集。”

星座研究公司(Constellation Research Inc.)分析师Holger Mueller告诉SiliconANGLE,这项新研究表明Facebook处于机器翻译研究的最前沿。

Mueller说:“鉴于其在全球社交网络市场的份额,Facebook认为它需要推动基于AI的翻译,而不是任何供应商。” “而Facebook正是这样做的,现在支持非主流语言进行翻译。”