Kubeflow学习指南:生产级机器学习系统实现
上QQ阅读APP看书,第一时间看更新

1.6.2 MLflow

MLflow是由Databricks开发的一个开源的机器学习开发平台。MLflow的架构利用了很多与Clipper相同的架构范式,包括其框架无关性,同时专注于三个主要组件,称之为跟踪(Tracking)、项目(Project)和模型(Model)。

MLflow Tracking作为一个API,还有一个辅助的用户界面(UI),用于记录参数、代码版本、指标和输出文件。这在机器学习中是相当强大的,因为跟踪参数、指标和制品是最重要的。

MLflow Project提供了一种用于包装可重用数据科学代码的标准格式,该格式由YAML文件定义。YAML文件可以使用Anaconda来利用源代码控制代码和依赖项管理。项目格式使共享可重复的数据科学代码变得容易,因为可重现性对于机器学习从业人员至关重要。

MLflow Model是一种将机器学习模型以多种格式打包的约定。每个MLflow模型都被保存为包含任意文件和MLmodel描述文件的目录。MLflow还提供了模型的注册表,显示已部署的模型及其创建元数据之间的沿袭信息。

与Kubeflow一样,MLflow也还在积极开发中,并且有一个活跃的社区。