Service Level Indicator
- 응답 시간 (Request latency) : 시스템의 응답시간
- 에러율 (Error rate%) : 전체 요청에서 실패한 요청의 비율
- 처리량(Throughput) : 일반적으로 초당 처리량으로 측정하고 TPS (Thoughput per second) 또는 QPS (Query per second)라는 단위를 사용한다.
- 가용성(availability) : 시스템의 업타임 비율로, 앞에서 예를 들어 설명하였다.
- 내구성(Durability-스토리지 시스템만 해당) : 스토리지 시스템에만 해당하는데, 장애에도 데이타가 유실되지 않을 확률이다.
SRE #4-예제로 보는 SLI/SLO 정의 방법
조대협 (http://bcho.tistory.com) 앞에서 SRE의 주요 지표인 SLO/SLI의 개념에 대해서 설명하였는데, 그러면 실제 서비스에서는 어떻게 SLO/SLI를 정의하는지에 대해서 알아본다. SLI는 사용자 스토리당 3~5개 정도가 적당하다. 사용자 스토리는 로그인, 검색, 상품 상세 정보와 같이 하나의 기능을 의미한다고 보면된다. 아래 그림과 같은 간단한 게임 서비스가 있다고 가정하자.
https://bcho.tistory.com/1329

Seonglae Cho