更新时间:2024-04-25 19:34:19
封面
版权信息
O'Reilly Media Inc.介绍
本书赞誉
序
前言
第一部分 SLO开发
第1章 可靠性栈
1.1 服务的真理
1.2 可靠性栈概述
1.3 什么是服务
1.4 要记住的事情
1.5 总结
第2章 如何看待可靠性
2.1 可靠性工程
2.2 过去的性能和你的用户
2.3 服务应该有多可靠
2.4 总结
第3章 制定有意义的SLI
3.1 有意义的SLI能提供什么
3.2 很多事情需要关心
3.3 更复杂的东西
3.4 总结
第4章 选择好的SLO
4.1 可靠性目标
4.2 服务依赖项和组件
4.3 你依赖的服务的可靠性
4.4 选择目标
4.5 总结
第5章 如何使用错误预算
5.1 错误预算实践
5.2 错误预算的度量
5.3 总结
第二部分 SLO实现
第6章 获得认同
6.1 工程不只是代码
6.2 主要利益相关者
6.3 行动起来
6.4 惨痛的教训
6.5 总结
第7章 度量SLI和SLO
7.1 设计目标
7.2 通用结构
7.3 常见案例
7.4 一般案例
7.5 其他注意事项
7.6 总结
第8章 SLO监控和告警
8.1 动机:SLO告警是什么,为什么要这样做
8.2 如何进行SLO告警
8.3 剥离建议
8.4 总结
第9章 用于SLI和SLO的概率论与统计学
9.1 概率论
9.2 统计学
9.3 SLI示例:持久性
9.4 延伸阅读
9.5 总结
第10章 可靠性架构
10.1 示例系统:图像服务
10.2 架构考虑:重新审视硬件
10.3 SLO作为系统SLI的结果
10.4 识别和理解依赖项的重要性
10.5 总结
第11章 数据可靠性
11.1 数据服务
11.2 数据服务的用户
11.3 设定可度量的数据目标
11.4 系统设计关注点
11.5 数据沿袭
11.6 总结
第12章 有效案例
12.1 给小狗穿衣服
12.2 将SLI和SLO作为用户旅程
12.3 总结
第三部分 SLO文化
第13章 打造SLO文化
13.1 没有SLO的文化
13.2 文化转变策略
13.3 通往SLO文化的路径
13.4 总结
第14章 SLO演进
14.1 SLO起始
14.2 使用方式的变化
14.3 依赖项的变化
14.4 故障引起的变化
14.5 用户期望和需求的变化
14.6 工具的变化
14.7 基于直觉的变化
14.8 制定理想的SLO
14.9 识别不正确的SLO
14.10 如何改变SLO
14.11 总结
第15章 可发现和可理解的SLO
15.1 可理解性
15.2 可发现性
15.3 总结
第16章 SLO倡导
16.1 起步阶段
16.2 推广阶段