97 Things Every SRE Should Know-29 April 22, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, How to Change Things 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-28 April 21, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, I Have an Error Budget—Now What? 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-27 April 21, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, Design Goals for SLO Measurement 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-26 April 19, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, Solo SRE:Effecting Large-Scale Change as a Single Individual 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-25 April 14, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, With Incident Response, Start Small 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-24 April 14, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, Auditing Your Environment for Improvements 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading
97 Things Every SRE Should Know-23 April 13, 2021 in SRE, 97 Things Every SRE Should Know, Part II. Zero to One, Everyone Is an SRE in a Small Organization 网站可靠性工程师(SRE)比以往任何时候都更加重要。了解如何保持系统的可靠性已经成为一项关键技能。通过这本实用的书,新手和老手都将探索SRE中发生的广泛对话。您将获得关于几个主题的可操作建议,包括如何采用SRE、为什么SLO很重要、何时需要升级事件响应以及监控和可观察性之间的区别。 Continue reading