前言
写书的目的:破圈之道
从运维的范畴讲,我认为,在一个开发团队内,除了业务需求实现层面的事情,其他都属于运维的范畴,这个范畴内的事情本质上就是为软件生命周期内的运行维护阶段服务。
——来自赵成的运维体系管理课
以上是蘑菇街运维总监赵成的运维体系管理课中的一段经典语句,如果正在看本书的你是运维人员,可以认真地理解一下这段话,然后与自己的工作职责进行一下对比。
运维人员长期以来的工作职责都是围绕成本、安全、效率、稳定来开展的,这和SRE工程师的工作职责有很多相同点。但现在仍然有不少运维人员将掌握各项基础设施的维护、配置和监控当作工作职责,这样合适吗?如果你所在的公司对运维人员的要求就是支撑和辅助,而你本人也完全接受,那么无可厚非;但如果你在一家产品不断迭代、不断创新的公司做运维工作,笔者相信这些能力是远远不够的,除非你就打算“躺平”。
通过本书,笔者希望可以让更多的运维人员改变以往的工作模式,摒弃常年仅做后方保障工作的习惯,运维人员需要站在团队的最前面,统筹所有与运维架构有关的问题,在保障承诺的稳定性指标的前提下,尽最大的努力完成业务迭代、成本优化、性能优化、容量规划等工作。
本书以SRE的视角解读运维架构,运维架构并非指传统意义上的配置、安装、维护等,而是除了业务开发,其他都属于运维架构范畴,这些最终都是为了在合理的效率和成本前提下,让用户可以享用稳定的服务。
本书会通过一系列实践和案例突出以下3个基础思想。
(1)绝大部分用户体验不顺畅,从运维视角都能看出端倪,通过对性能、容量、响应速度等维度的分析,可以推进代码规范、质量等方面的改进,最终提升用户体验。
(2)在保障稳定性建设正常开展的前提下,最大化地降低用于应对技术风险的运营成本。
(3)除了业务开发,其他都属于运维架构范畴,但只有了解了业务和业务开发,才能更准确地完善运维架构。
这些基础思想可以支撑运维工作的整个生命周期,同样为其他技术岗位人员更好地实现跨部门共建提供解决思路。
读者对象
本书内容是通过大量工作经验总结得到的知识和技术方案,读者需要一定的积累才能更深刻地理解其中的价值。对于刚入行的运维人员,建议先熟悉运维架构工作或SRE方法论,再进行学习。
本书适合互联网行业内的运维人员、SRE和DevOps工程师、架构师、技术团队负责人及关注用户体验的相关开发者阅读,也适合掌握了一定的SRE方法论但在实践中无从下手的读者阅读。
本书内容
本书的大部分内容是以笔者9年电商行业运维和开发经验为基础进行的讲解,其中将电商行业与SRE中的Mikey金字塔相结合进行了创新,很多内容都可以直接用于日常工作(本书不会过多地介绍SRE基础知识,若读者想要学习相关知识,可以自行上网搜索谷歌SRE的相关文章)。
本书分为7篇。
开端篇,主要讲解SRE和运维架构之间的关联性和SRE的工作范畴,解读了岗位职责和一些日常非核心场景中容易被忽略的点,以及应该重视测试环境和预发布环境。
监控篇,主要讲解监控落地时容易被忽略的地方,并且提供了可持续维护监控对象的一些方法,提出了监控新思路——监测和控制,而不是以往运维视角下的以触发报警为核心的监控逻辑,监控应该发挥控制的效果,比如在监测到技术风险时,执行一系列动作来控制风险。
故障篇,主要讲解在故障的整个生命周期内,运维人员和SRE工程师应该担当的职责,并将故障分为事前治理、事中应急、事后改进三大板块,基于每个板块给出什么时间节点做什么事情的指导建议。
容量篇,主要介绍业务和容量的关系,并且讲解在容量规划中通过什么样的方式能够更好地实现成本、性能的平衡,而且在该篇章中,增加了对编程能力的介绍。编程能力能让我们更理解资源消耗是如何产生的,为我们更好地与业务开发人员探讨资源配置的合理性做好准备。
全局视角篇,主要介绍如何从各个技术岗位的视角看待运维架构中的各项事务,同时以用户视角讲解SRE的价值,为运维破圈做准备。
性能篇,主要通过介绍各性能优化技术方案,提供可实战的落地任务,给出工作中常见的技术难题和解题思路。
扩展篇,主要介绍在共建稳定性的过程中如何更好地应用整个技术体系,给出如何将技术思想和技术方案进行跨部门分享和推广的实践。
勘误
本书以实践为主,绝大部分内容是电商行业的技术实践,可能存在考虑不周全的地方,再加上运维架构相关内容烦琐复杂,在体系化的打造过程中难免存在疏漏和错误,请读者朋友多多见谅。如果你发现本书中存在的任何问题或者希望提出建议,请联系笔者,笔者的QQ邮箱是515947130@qq.com。
致谢
本书中有部分内容来自其他作者的共同努力。在他们的帮助下,笔者才得以将整套实践体系打造完善。笔者要特别感谢以下成员。微拍堂运维团队:田红阳、柴振华、刘占彬、张博、刘帅、李秋阳、陆游、姜伯洋、章远强、涂永春、陈建华、李启龙等。Kindling开源团队。技术专家周云龙、索碧桐。网易SRE工程师陆游。
特别感谢微拍堂创始人徐烽、金明亮,在他们的大力支持下,笔者才有充足的时间将本书打磨完善。
感谢电子工业出版社博文视点的编辑付睿,她在本书的出版过程中提供了很多宝贵的建议。
读者服务
微信扫码回复:45458
· 加入本书读者群,与作者互动交流
· 获取【百场业界大咖直播合集】(持续更新),仅需1元