Table of Contents

The Forward-Deployed SRE

前向部署的 SRE

SRE【1】团队通常独立于任何其他团队,并在更广泛的工程组织中以自己的目标和任务运作。然而,嵌入式模式是另一种不常被谈论的方法,但在寻求SRE的采用或投资于持续的卓越运营时,它可以是有效的。在第76章中,我讨论了fdSRE【2】(向前部署的SRE)的必要性,作为嵌入式模式的一种表现。在这里,我们将讨论使一个伟大的 fdSRE 的属性。

与SRE一样,fdSRE是一个有能力但有操作意识的软件工程师。当他们设计软件时,他们会考虑它在生产中如何运行,在负载下如何表现,配置会是什么样子,安全和/或合规性会是什么样子,在重新启动时如何恢复一致的状态,以及如何观察。

fdSRE承担了更多的所有权。作为另一个团队的嵌入式工程师,他们关心所在团队的健康状况,但也关心与他们有点线报告关系的SRE组织的更广泛的任务。在总体所有权模式中,团队拥有整个堆栈,解决影响每个人的高阶问题的动力可能是缺乏的。fdSRE必须学会建立关系并产生信任,以确定他们可以带回上游的可解决的问题。当 fdSREs 互相分享他们共同的痛苦时,他们就可以建立最有影响力的解决方案,并作为整个组织的渠道。

fdSRE具有同情心。如同任何加入一个新团队的人一样,fdSRE和其所在团队可能需要时间来磨合。团队可能不知道fdSRE是否与他们保持一致,但随着时间的推移,当他们一起解决问题时,这种信任差距就有机会缩小。fdSRE必须理解这一点,并给其所在团队成员空间和时间来适应他们的存在。

FdSRE是变革的催化剂,但要知道不是每个人都准备好了。他们激发变革的欲望,给人们空间、时间和数据,让他们想成为解决方案的一部分。为此,他们满足团队和个人在提高运营成熟度的旅程中的需求。

FdSRE是一个老师和导师。很有可能主办团队中没有人拥有和 fdSRE 一样的运营专业知识水平。有一个可以传授知识的SRE在团队中是非常有价值的,可以让其所在团队成员感到兴奋,帮助他们发展运营思维。fdSRE的职责包括对其他工程师的教育和成长。

FdSRE是一位外交官。这个角色有其人性化的一面,这是非常宝贵的。他们明白,每个团队最终都希望对组织产生积极的影响,有时必须通过委婉的谈判,而不是授权来达成权衡和妥协。这可以采取的形式是提供数据,询问痛点,以及了解和运作帮助决策的渠道。

如果你采用了fdSRE的方法,你要准备好为跨团队的工程师之间的合作以及与工程领导层的合作做出刻意的努力,以推动所有各方安全地创建和维护可扩展和可靠的软件系统,并且知道这种努力是值得的。

(这篇文章中所分享的经验也是通过与以下同事和业界同行的交流而获得的,在此我要感谢他们。Sarah Sherbondy, Paul Lathrop, Will Barnette, Steve Conklin, Kimberly Lowe-Williams, and Christian Funkhouser。)

我们如何构建本书的结构

SRE虽然涉及复杂的技术系统,但归根结底是一种文化实践。文化是人的产物,这启发我们根据你在组织中的SRE数量来组织本书的各个部分–你具体处理什么,你的一天是怎样的,取决于有多少个SRE工程师。我们将本书的文章分为 “SRE新手” 、0-1个SRE、1-10个SRE、10-100个SRE和 “SRE的未来 ”。

读者如果想找寻先从哪里开始的指导,可以直接跳到最适用于自己的部分;但是,你仍然会发现阅读那些目前并不适用于你日常的部分的文章的价值。

在0到1个SRE时,还没有人被指定为SRE,或者你已经找到了你的第一个SRE,这个角色看起来几乎是孤独的。

在1到10名SRE时,你正在组建一个团队,有知识共享和分工的能力。

在10到100个SRE时,你已经成为一个组织,你需要思考的不仅仅是你所从事的系统,还需要思考如何组织这么多SRE。

“SRE新手” 涵盖了基础性的话题(尽管并不详尽!),对于那些刚刚开始SRE之旅的人来说是很有帮助的,即使是最有经验的SRE,也是一种复习。 “SRE的未来” 包含了一些文章,这些文章探讨了SRE潜在的发展方向,或者是(目前)坐拥时代潮流。

没有必要按照任何特定的顺序阅读本书。你可以从头到尾读一遍。或者,如果你对某个特定的主题感到好奇,可以翻到索引,在那里你可以找到关于该主题的所有文章。把它作为参考指南,或者是灵感的来源–可以在需要的时候提供一个震撼。或者,也许可以建立一个阅读俱乐部,每周一次挑选一篇文章与同事讨论。这就是散文集的魅力所在。我们希望你和我们一样喜欢阅读它们。

结语

SRE系列的文章,有时间我就会翻译一些,希望大家能学到对自己有用的东西。谢谢

翻译不易,转载时请注明原文链接,谢谢

延伸阅读

1.Site Reliability Engineering-中文
   Site Reliability Engineering-english

2.Forward Deployed Software Engineers (FDSEs)
前向部署软件工程师 (FDSE) 负责我们部署的技术成功。 我们技术精湛,好奇心极强,当我们遇到难题时,我们会茁壮成长。 我们直接与该领域的用户合作,了解他们的工作流程、原型工具和功能,并不断改进我们的产品。 从高级系统设计到企业级数据集成再到应用程序开发,我们的工作每天都在变化。 简而言之,我们将技术专长用于解决最重要的问题。