デジタルサービスの品質向上のために、SRE(Site Reliability Engineering)を導入している組織は多い。その際に必要となるのが、SLO(Service Level Objective:サービスレベル目標)やエラーバジェットなどの定量的な仕組みだ。
ただ、SLO設定は一足飛びに行うことはできない。まずユーザー体験を数値化できる指標を特定し、それを正確に測定できる状態を整えることから始めたい。この計測の仕組み(オブザーバビリティ)がなければ、続く活動の全てを勘や推測に頼ることになってしまうからだ。では、オブザーバビリティの仕組みをどのように整備すればよいのだろうか。
本資料では、ECサイトの具体例を交えながら、オブザーバビリティ整備の効果や注意点を解説している。運用・開発の各チームは目的が異なるため、対立的な構図になりがちだが、SREは組織全体で取り組み、両者の対立を解消へと導くものでもある。信頼性の高いサービスの確立、そして迅速なリリースを両立させるための筋道を本資料で確認してほしい。