Kubeflow学习指南:生产级机器学习系统实现
上QQ阅读APP看书,第一时间看更新

1.5.1 使用notebook进行数据探索

MDLC总是从数据探索开始——绘制、分割和处理数据,以了解可能存在的洞察力。Jupyter是一个强大的工具,它为数据探索提供了工具和环境。Jupyter是一个开源的Web应用程序,允许用户创建和共享数据、代码片段和实验,并因其简单性和可移植性受到机器学习从业者的欢迎。

在Kubeflow中,你可以启动Jupyter实例,直接与集群及其他组件交互,如图1-2所示。例如,你可以在笔记本上编写TensorFlow分布式训练代码的片段,只需单击几下就能创建一个训练集群。

图1-2:在Kubeflow中运行的Jupyter notebook