97 Things Every SRE Should Know-61
Table of Contents
Fewer Spreadsheets, More Napkins
更少的电子表格,更多的餐巾纸
餐巾纸数学(napkin math)【1】是一个执行计算的过程,当你无法(或不需要)收集准确的具体细节,而是依靠使用简化的假设,提供一个在一定程度上准确的答案。这对于确认一个选项的可行性或缩小可能性的范围是很有用的,而无需花费数小时或数天的时间进行更复杂的计算。
适合这种做法的估算问题在形式上被称为费米问题【2】。一个著名的例子是估计某个城市的钢琴调音师的数量。
假设芝加哥有300万人口,每个家庭平均有两个人。假设每20户人家中就有一户有钢琴,而且只需要每年调音。猜想钢琴调音师每天工作8小时,每周工作5天,每年工作50周(因此,250天),每架钢琴需要调音2小时。
从这里,我们可以快速划出以下内容。
- 假设芝加哥的人口为 ~3,000,000
- 芝加哥每户有~2人
- (1,500,000个家庭)/(20个有钢琴的家庭)=75,000台钢琴在芝加哥
- (每天8小时)/(调音需要2小时)x(每年250天)=每年调音1000架钢琴
- (芝加哥有75,000架钢琴)/(每年有1000架钢琴调音)=芝加哥有75名钢琴调音师
当然,在芝加哥很可能没有75个钢琴调音师;然而,我们现在也知道,可能不会有1000甚至10000个钢琴调音师在风城【3】闲逛。
让我们把这个应用到钢琴调音师之外。
例如,你想知道将数据从美国东海岸的一个数据中心转移到另一个位于西海岸的中心需要多长时间。在这里,我们可以使用一个简化的表示:
60毫秒(每G字节[GiB])的网络行程(60 ms (per gibibyte [GiB]) for the network trip)
200毫秒(每GiB)用于磁盘读取(发送)(200 ms (per GiB) for the disk read (to send))
1秒(每GiB)用于磁盘写入(接收)(1 second (per GiB) for the disk write (to receive))
以每GiB 1.5秒作为综合简化的时间跨度,你可以将其乘以你的数据存储的大小,你就得到了答案! 现在,这个结果不会是精确的,但它给出了一个与实际结果相差一个数量级的估计,足以确定这种方法的可行性。
因此,请随时开始储备餐巾纸。
我们如何构建本书的结构
SRE虽然涉及复杂的技术系统,但归根结底是一种文化实践。文化是人的产物,这启发我们根据你在组织中的SRE数量来组织本书的各个部分–你具体处理什么,你的一天是怎样的,取决于有多少个SRE工程师。我们将本书的文章分为 “SRE新手” 、0-1个SRE、1-10个SRE、10-100个SRE和 “SRE的未来 ”。
读者如果想找寻先从哪里开始的指导,可以直接跳到最适用于自己的部分;但是,你仍然会发现阅读那些目前并不适用于你日常的部分的文章的价值。
在0到1个SRE时,还没有人被指定为SRE,或者你已经找到了你的第一个SRE,这个角色看起来几乎是孤独的。
在1到10名SRE时,你正在组建一个团队,有知识共享和分工的能力。
在10到100个SRE时,你已经成为一个组织,你需要思考的不仅仅是你所从事的系统,还需要思考如何组织这么多SRE。
“SRE新手” 涵盖了基础性的话题(尽管并不详尽!),对于那些刚刚开始SRE之旅的人来说是很有帮助的,即使是最有经验的SRE,也是一种复习。 “SRE的未来” 包含了一些文章,这些文章探讨了SRE潜在的发展方向,或者是(目前)坐拥时代潮流。
没有必要按照任何特定的顺序阅读本书。你可以从头到尾读一遍。或者,如果你对某个特定的主题感到好奇,可以翻到索引,在那里你可以找到关于该主题的所有文章。把它作为参考指南,或者是灵感的来源–可以在需要的时候提供一个震撼。或者,也许可以建立一个阅读俱乐部,每周一次挑选一篇文章与同事讨论。这就是散文集的魅力所在。我们希望你和我们一样喜欢阅读它们。
结语
SRE系列的文章,有时间我就会翻译一些,希望大家能学到对自己有用的东西。谢谢
翻译不易,转载时请注明原文链接,谢谢
延伸阅读
1.napkin math
2.费米问题
3.风城 芝加哥
因为芝加哥的纬度与纽约差不多,由于芝加哥城区紧靠密歇根湖的曲线型湖岸,10月以后由密歇根湖北部所产生的大量冷空气回从北部森林中升起,并扫过密歇根湖湖面直接吹向城区,城区内街道和河道的尺度宽敞,冷风会顺着这些河道吹到城区的大部分地区,芝加哥由此就被称为“风城”。