Table of Contents

Important but Not Urgent: Roadmaps for SREs

重要但不紧急:SRE的路线图

美国前总统德怀特-艾森豪威尔根据重要性和紧迫性来安排他的工作。重要和紧急的任务被立即完成,而不重要的任务则被委托或忽略。艾森豪威尔的矩阵中最具挑战性的象限是重要和不紧急的事情的交叉点——这些事情有影响,但也最容易被无限期地推迟。艾森豪威尔处理这类工作的方法是什么?计划。

艾森豪威尔的困境也适用于 SRE 团队。 您是否曾经使用过不断产生麻烦或停机但从未重新设计的问题系统? 有没有注意到一个团队在长期技术方向上存在分歧,其中只有一个人推动战略,或者最糟糕的是,其中似乎没有人制定超过本季度末的计划?这些都是一个需要路线图的团队的组织气味。

路线图是对一个团队在未来几年内想要完成的战略工作的高层次描述。所有的SRE团队都应该有一个路线图,因为它可以帮助团队超越眼前的思考,而反思什么工作是重要的。我们是有运维责任的工程团队,这导致了紧急的、被动的工作:救火或对其他团队的请求采取行动。我们的一些工作处理眼前的需要是正常的(也很好),但只在艾森豪威尔矩阵的紧急方面运作的团队,他们能取得的成果是有限的。路线图是避免这种陷阱的最好方法。

我们所面临的许多问题不能被逐步解决,因为它们需要多个季度的工程投资。处于永久救火模式的团队可能会陷入局部的最大限度,使用短期的修复方法来保持事情的运行,但从来没有做出更大的改变来消除根本问题。

例如,一个团队可能会花数年时间为一个单一的托管服务制定更好的恢复和重启流程。相反,它可以投资于重新设计该系统,使其作为一种多主机服务运行,并能在失去一个数据中心的情况下生存下来。第二种方法消除了工作压力、数据丢失的风险和永久的停机时间,但该项目可能需要一年时间才能完成。这种项目只有使用路线图才有可能。

路线图规定了一个团队在长期内应该做什么,为什么这些目标很重要,以及这些目标的相对优先级。路线图不是未来几个季度的OKRs(目标和关键结果)的详细清单,也不是一系列的外部承诺。(没有一个路线图能在与敌人的接触中幸存下来)相反,它表明了意图。在向利益相关者解释为什么紧急但不太重要的工作有时必须被取消优先级时,路线图是非常宝贵的。

如果你准备尝试制定路线图,要知道每个从事战略工程工作的团队都有一个路线图,但它往往是在某人的头脑中。最好是把它写下来。写下并同意路线图文件的行为会产生更好的一致性。一个领导可以起草文件,但整个团队应该有机会在通过前提供意见。

路线图是活的文件,每一年左右就需要更新一次。如果不经常更新,你的战略目标可能就不会取得进展。比起每年一次的更新,你的路线图可能过于关注短期。

正如艾森豪威尔所说,“重要的事情很少是紧急的,紧急的事情也很少是重要的”。不要被所有SRE面临的日常干扰所困扰,以至于忽略了规划和执行将对你的组织产生最大影响的长期项目。

我们如何构建本书的结构

SRE虽然涉及复杂的技术系统,但归根结底是一种文化实践。文化是人的产物,这启发我们根据你在组织中的SRE数量来组织本书的各个部分–你具体处理什么,你的一天是怎样的,取决于有多少个SRE工程师。我们将本书的文章分为 “SRE新手” 、0-1个SRE、1-10个SRE、10-100个SRE和 “SRE的未来 ”。

读者如果想找寻先从哪里开始的指导,可以直接跳到最适用于自己的部分;但是,你仍然会发现阅读那些目前并不适用于你日常的部分的文章的价值。

在0到1个SRE时,还没有人被指定为SRE,或者你已经找到了你的第一个SRE,这个角色看起来几乎是孤独的。

在1到10名SRE时,你正在组建一个团队,有知识共享和分工的能力。

在10到100个SRE时,你已经成为一个组织,你需要思考的不仅仅是你所从事的系统,还需要思考如何组织这么多SRE。

“SRE新手” 涵盖了基础性的话题(尽管并不详尽!),对于那些刚刚开始SRE之旅的人来说是很有帮助的,即使是最有经验的SRE,也是一种复习。 “SRE的未来” 包含了一些文章,这些文章探讨了SRE潜在的发展方向,或者是(目前)坐拥时代潮流。

没有必要按照任何特定的顺序阅读本书。你可以从头到尾读一遍。或者,如果你对某个特定的主题感到好奇,可以翻到索引,在那里你可以找到关于该主题的所有文章。把它作为参考指南,或者是灵感的来源–可以在需要的时候提供一个震撼。或者,也许可以建立一个阅读俱乐部,每周一次挑选一篇文章与同事讨论。这就是散文集的魅力所在。我们希望你和我们一样喜欢阅读它们。

结语

SRE系列的文章,有时间我就会翻译一些,希望大家能学到对自己有用的东西。谢谢

翻译不易,转载时请注明原文链接,谢谢

延伸阅读

1.Site Reliability Engineering-中文
   Site Reliability Engineering-english