您现在的位置是:首页 >财经 > 2021-04-30 21:57:23 来源:

人工智能计算的爆炸性增长表明企业必须对战略有所了解

导读 人工智能研究组织OpenAI最近发布的一份报告显示,自2012年以来,最大机器学习系统中训练运行所需的计算能力已增加了300,000倍。由于机器学

人工智能研究组织OpenAI最近发布的一份报告显示,自2012年以来,最大机器学习系统中训练运行所需的计算能力已增加了300,000倍。由于机器学习结果在获得额外计算资源时有所改善,我们可能会看到对硅基础设施提出更高要求以获得更好的结果。

人工智能计算的爆炸性增长表明企业必须对战略有所了解

企业越来越多地使用机器学习来自动化复杂问题和分析任务。但OpenAI的研究表明,未来面临着一个关键挑战:当技术要求不断变化时,企业如何构建他们所需的业务成果所需的基础架构?

首先,企业应该尝试找到解决手头业务问题所必需的最简单的算法。虽然大规模复杂的神经网络现在在机器学习领域风靡一时,但很少涉及的技术很容易解决许多问题。例如,Kaggle上的数据科学竞赛通常是通过梯度提升的决策树而不是深度神经网络来赢得的。

当然,一些公司遇到的问题最好通过更复杂的模型来解决,但关键是尽可能降低复杂性。这提供了几个好处,因为更简单的模型更容易排除故障,更容易理解,并且培训成本更低。

了解物理基础设施

其次,企业应该只购买满足其机器学习工作量要求所需的硬件。这似乎是显而易见的,但在这种情况下尤其重要,因为硅供应商正在迅速改变他们销售的产品以满足这个相对较新的市场的需求。考虑Nvidia的新Volta架构,其中包括机器学习任务的专用加速。

在适用的情况下,公司应利用云平台来简化AI硬件车队的配置,尤其是对于没有固定需求的工作负载。在一个主要云中动态部署大型GPU集群比在私有数据中心采购和设置这样的环境要容易得多。如果不再需要该群集,企业可以将其关闭。

目前,OpenAI预计顶级算法将在购买成本“单位数百万美元”的集群上运行。但是,除非现在或在不久的将来满足业务需求,否则走出去并配置这么大的集群是没有意义的。

基础设施需求是一个不断变化的目标,因为支持这些机器学习系统的算法可能会有所改进。最近由斯坦福大学的数据分析下一步(DAWN)小组举办的一次竞赛展示了软件和硬件优化如何以低成本创建高度精确的模型。

使用既定的基础

在考虑提供大量芯片之前,公司应该对一两个流行的开源框架进行标准化,这些框架有助于机器学习模型的开发和部署。谷歌的TensorFlow似乎是一个安全的选择,因为它在开源领域很受欢迎,但还有其他一些选项,包括微软的Cognitive Toolkit(CNTK),PyTorch(Facebook使用)和Apache MXNet(亚马逊的首选框架)。

当像Nvidia和Intel这样的公司尝试为在其硬件上运行的机器学习算法提供优化的执行环境时,他们通常会将精力集中在少数几个框架上,如上面列出的那样。这些类型的软件优化可以帮助提高性能,而无需公司采购额外的硬件。此外,这些框架使创建机器学习系统变得更加容易,公司可以利用这种敏捷性来利用现场出现的新技术或只是改进处理已知问题的方法。

最重要的是,机器学习是一个快速变化的领域,需要企业批判性地思考他们在基础设施方面的投资,并建立一个能够适应可能需要大量计算能力的现有技术变化的敏捷环境。

Blair Hanley Frank是ISG的技术分析师,负责云计算,应用程序开发现代化,人工智能和现代工作场所。他以前是VentureBeat的一名职员作家。