97 Things Every SRE Should Know-48 May 27, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, Sometimes the Fix Is the Problem 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-47 May 27, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, You Don’t Know for Sure Until It Runs in Production 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-46 May 24, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, Move Fast to Unbreak Things 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-45 May 21, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, Using ChatOps to Implement Empathy 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-44 May 20, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, Integrating Empathy into SRE Tools 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-43 May 20, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, What Machines Do Well 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-42 May 18, 2021 in SRE, 97 Things Every SRE Should Know, Part III. One to Ten, Why I Hate Our Playbooks 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading