互联网
组织
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

如何度量系统可靠性:SLO与黄金指标

资深运维专家,畅销书《sre原理与实践》作者

曾任虎牙资深运维专家和架构师,拥有20年软件开发、架构、运维、SRE经验。历任项目研发负责人、SRE负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。
为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定性保障体系,在混合多云架构、可观测性、预案、变更管控、AIOps等SRE领域有深入研究和丰富经验。多次担任虎牙“英雄联盟全球总决赛直播”稳定性保障负责人。
同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与GOPS、MSUP/EE、GDevops、Takintalks技术大会分享。

曾任虎牙资深运维专家和架构师,拥有20年软件开发、架构、运维、SRE经验。历任项目研发负责人、SRE负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。 为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定性保障体系,在混合多云架构、可观测性、预案、变更管控、AIOps等SRE领域有深入研究和丰富经验。多次担任虎牙“英雄联盟全球总决赛直播”稳定性保障负责人。 同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与GOPS、MSUP/EE、GDevops、Takintalks技术大会分享。

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

成为教练

课程简介

话题概述:
系统稳定性越来越高,我们应该从过去的定性度量演进到度量系统可靠性,SLO与黄金指标就是其中一种度量方法。
我们将以虎牙直播的案例出发,回顾技术方案落地的过程,在组织内推行的过程。

演讲题纲:
1、为什么要评估和度量系统可靠性
2、常见的几种度量方法
3、SLO建设落地和黄金指标的度量方法
4、如何用户度量结果驱动工程团队工作的经验

话题亮点:
用案例讲解SLO与黄金指标的落地实践
推行SLO过程中把SRE影响力扩大到整个工程团队

目标收益

学习如何建立度量系统稳定性的方法
如何落地的SLO的思路和过程

培训对象

运维、SRE、架构师、技术管理者等

课程内容

案例方向


稳定性与可观测性

话题概述


系统稳定性越来越高,我们应该从过去的定性度量演进到度量系统可靠性,SLO与黄金指标就是其中一种度量方法。
我们将以虎牙直播的案例出发,回顾技术方案落地的过程,在组织内推行的过程。

收益


学习如何建立度量系统稳定性的方法
如何落地的SLO的思路和过程

演讲题纲


用案例讲解SLO与黄金指标的落地实践
推行SLO过程中把SRE影响力扩大到整个工程团队

话题亮点


用案例讲解SLO与黄金指标的落地实践
推行SLO过程中把SRE影响力扩大到整个工程团队

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

提交需求