您现在的位置是:首页 >互联网 > 2021-01-15 11:24:40 来源:
Databricks的MLflow机器学习工具包增加了对R语言的支持
大数据公司Databricks Inc. 今天更新了其MLflow机器学习工具包,以支持R编程语言和旨在提高其实用性的其他新功能。
Databricks 仅在6月才发布MLflow,以帮助标准化开发流程并将机器学习应用程序投入生产。该公司认为,训练机器学习算法的过程在很大程度上是不一致的,并且几乎没有可用的工具来再现结果,跟踪实验和管理模型。
MLflow旨在帮助公司更好地打包他们的机器学习代码,执行,测试它并将其部署到生产中。通过标准化跨通用部署方法的现有ML工具包和框架,它使开发人员可以完全控制端到端管理机器学习培训生命周期。
“ MLflow是一个统一的工具包,用于以可重复的方式开发机器学习应用程序,同时具有在多个云环境中可靠地在生产环境中进行可靠部署的灵活性,” MLflow启动时,Databricks首席技术专家Matei Zaharia说。
通过今天的更新,Databricks与RStudio Inc.合作,后者为R提供了开源和集成开发环境,以帮助集成编程语言。现在,使用RStudio和R来构建新应用程序的大型数据科学家社区都可以使用MLflow。
RStudio首席执行官JJ Allaire在一份声明中说:“ R与MLflow的集成将允许更广泛的社区使用并为MLflow做出贡献,从而大大拓宽该项目的范围。”
除R外,MLflow还获得对编程语言(包括Python,Java和Scale)的支持,以及一个REST服务器接口,使其可以与其他语言一起使用。
MLflow还与流行的机器学习库和框架集成在一起,例如SciKit-Learn,TensorFlow,Keras,PyTorch,H2O和Apache Spark Mllib,Databricks说。
最后,Databricks添加了对MLflow工具包的跨云支持,这意味着使用它构建的模型可以部署在云服务上,例如Microsoft Corp.的Azure ML平台,Amazon Web Services Inc.的SageMaker和Databricks自己的Unified数据分析平台。
公司官员说:“ MLflow利用了AWS S3,Google Cloud Storage和Azure Blob Storage,使团队可以轻松地跟踪和共享其代码中的工件。”
“使用MLflow,数据科学团队可以跨框架系统地打包和重用模型,在本地或云中跟踪和共享实验,并在几乎任何地方部署模型,” Zaharia在一份新声明中补充说。“我们从数据科学界看到的一连串的兴趣和贡献证实了对开放源代码框架以简化机器学习生命周期的需求。”