您现在的位置是:首页 >互联网 > 2020-11-03 14:04:15 来源:
Alphabet的DeepMind开源了其AI项目的关键构建块
Alphabet公司的人工智能研究小组DeepMind Technologies Ltd正在与世界分享更多的研究成果。
今天,该部门开源了“关键算法组件”的集合,这些集合源于它所描述的一些最成功的AI计划。该库名为TRFL,发音为“松露”,旨在帮助从事采用强化学习(一种训练神经网络的流行方法)的项目的研究人员。
强化学习本质上是一种通过反复试验来提高算法准确性的方法。每当AI在训练环境中做出正确的决定时,它都会获得一种虚拟奖励,从而使神经网络的发展保持在正确的轨道上。
TRFL包括依靠强化学习的算法通常使用的数学运算的实现。它们与DeepMind所说的可以执行更多“尖端”计算的组件以及各种其他构建模块(包括用于确保AI培训课程顺利进行的工具)配对使用。
整个集合都建立在可运行的流行TensorFlow深度学习引擎上,该引擎由Alphabet的Google LLC创建并开源。根据DeepMind的说法,研究人员可以通过应用程序编程接口与TRFL进行交互,该接口使将内部组件与其他来源的技术和概念结合起来相对简单。
该小组对图书馆的目标远远超出了简化单个强化学习项目的范围。TRFL是DeepMind做出的更广泛工作的一部分,该工作旨在创建可供AI研究人员使用的通用构建基块,多年来,该工作已经使该部门开源了其他内部软件。
基本思想是,如果在各个项目中重复使用相同的组件,则研究人员将可以更轻松地复制同事的工作。更紧密地复制AI项目参数的能力反过来会增加调试工作。根据DeepMind的说法,外部评审人员通常在识别影响神经网络或相关组件的缺陷方面起着重要作用。
该小组表示:“这些部分倾向于以微妙的方式进行交互(通常在文件中没有很好地记录,正如Henderson及其同事所强调的那样),因此很难在如此大的计算图中识别错误。” “ OpenAI最近发表的一篇博客文章通过分析一些最受欢迎的增强学习代理的开源实现,并发现十分之六的漏洞是由社区成员发现并得到作者确认的,从而突出了这个问题。”
TRFL 在GitHub上可用。它为DeepMind和Alphabet近年来发布的一长串开源项目增加了另一项内容。