SLO与SLI:软件可靠性实践指南
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5 总结

今天的许多服务都是复杂的、分布式的和深层次的。这会使它们更难理解,反过来也会使用户更难弄清楚服务是否在做它们应该做的事情。但是,退一步,站在用户的立场上,你就可以开发系统,采用让你从他们的角度关注事情的方法。同时,你可以确保你不会过度劳累自己,也不会把资源花在那些对你的用户并不重要的事情上。

基于SLO的服务管理方法为你提供了一个巨大的好处:能够为服务选择一个合理的目标,以一种相对容易使用的方式记录下来,并朝着这个目标运行服务。这听起来可能并没有多好,但如果你尝试过任何其他方法,你将知道在服务、组织和基于用户的术语中支持极简的令人难以置信的优点。这些都是基于SLO的可靠性方法可以为你提供的东西。

使用SLI从用户的角度来度量事物,合理地确定使用SLO的可靠性,并使用这些度量结果来帮助你确定如何以及何时使用错误预算来变得更可靠。这些是可靠性栈的基本原则。


[1] https://www.oreilly.com/library/view/site-reliability-engineering/9781491929117/