译者序
“一桥飞架南北,天堑变通途”,用这句话来描述Kubeflow再恰当不过了。Kubeflow将云计算与机器学习这两列高速列车紧密地联系在一起,使得两者相互补充,协同发展。Kubeflow并不仅仅是Kubernetes和TensorFlow的组合,各种机器学习主流框架(TensorFlow、PyTorch、Apache MXNet等)都可以在Kubeflow中大展身手。
Kubeflow是为数据科学家和数据工程师构建生产级机器学习实现而设计的,在数据探索、特征准备、模型训练/调优、模型服务、模型测试、模型监控和模型版本管理等方面都提供内置组件的支持。与此同时,Kubeflow的Pipeline(流水线)系统允许用户建立集成的端到端Pipeline,用于连接模型开发生命周期(MDLC)中的所有组件。Kubeflow可以在本地的开发环境或生产集群中运行。通常情况下,Pipeline会在本地开发,在测试完成后迁移至其他环境。Kubeflow提供了一个统一的系统——利用Kubernetes进行容器化和扩展,以实现其Pipeline的可移植性和可重复性。
Kubeflow并不寻求重新发明轮子,也不提供“一刀切”的解决方案。相反,Kubeflow允许机器学习从业者根据特定需求组合和定制技术栈,简化了大规模构建和部署机器学习系统的过程。这使得数据科学家可以将精力集中在模型开发而不是基础设施上。
本书采用循序渐进的方式,从Kubeflow的安装、使用和设计开篇,随后从模型训练的整个生命周期展开,既有相关的理论知识,又包括真实的案例,让读者在学习Kubeflow知识的同时能够全面了解机器学习的相关知识,是入门和深入学习机器学习的良好书籍,希望读者在阅读本书以后能够在机器学习工程的实践之路上更加自信。
本书的翻译比预想的要困难很多,从逐词推敲到逐句整理,从逐段梳理到逐章组织,无论是学习技术还是翻译整理,都是一件非常有挑战的事情,但这也绝对是我所做过的最有意义的事情之一,希望本书能让更多的机器学习工作者从中受益。
在此,要感谢爱人的大力支持和理解(经常占用周末时间来翻译);感谢活泼可爱而又调皮的儿子给我生命中带来了如此多的快乐并给予我不断成长的机会。
感谢李忠明编辑的信任和翻译过程中的耐心指导,这又是一次非常愉快的合作。
感谢马达和高策百忙之中提供的帮助。
由于时间和译者水平有限,译稿中难免有不足之处,敬请批评勘正。
狄卫华
2021年8月