이 문서에서는 애플리케이션이 실패하거나 애플리케이션 성능이 정의된 기준을 충족하지 못할 때 알림을 받는 방법을 설명합니다.
알림 작동 방식
Cloud Monitoring 알림 프로세스에는 세 가지 부분이 포함됩니다.
알림을 받을 상황과 이슈에 대한 알림을 받는 방법을 설명하는 알림 정책입니다. 알림 정책은 Monitoring에서 저장한 시계열 데이터 또는 Cloud Logging에서 저장한 로그를 모니터링할 수 있습니다. 이 데이터가 알림 정책 조건을 충족하면 Monitoring이 이슈를 만들고 알림을 전송합니다.
각 이슈는 모니터링된 데이터 유형과 조건이 충족된 시점에 대한 기록입니다. 이 정보는 이슈의 원인이 된 문제를 해결하는 데 도움이 될 수 있습니다.
알림 채널은 Monitoring에서 이슈를 만들었을 때 알림을 수신하는 방법을 정의합니다. 예를 들어,
my-support-team@example.com
에 이메일을 보내고#my-support-team
채널에 Slack 메시지를 게시할 알림 채널을 구성할 수 있습니다. 알림 정책에는 하나 이상의 알림 채널이 포함될 수 있습니다.
알림 정책은 다음 세 가지 유형의 데이터를 평가할 수 있습니다.
Monitoring에서 저장하는 측정항목 데이터라고도 하는 시계열 데이터입니다. 이러한 유형의 정책을 측정항목 기준 알림 정책이라고 합니다.
측정항목 기반 알림 정책을 설정하는 방법을 알아보려면 Compute Engine 빠른 시작을 시도하세요.
Cloud Logging에서 저장하는 로그 항목 데이터입니다. 개별 로그 항목을 평가하는 알림 정책을 로그 기반 알림 정책이라고 합니다. 로그 기반 알림 정책은 특정 메시지가 로그에 표시될 때 알림을 보냅니다. 자세한 내용은 로그 모니터링을 참고하세요.
Logging에 저장된 로그 항목 데이터에 대해 로그 애널리틱스에서 실행된 SQL 쿼리의 결과입니다. SQL 쿼리의 결과를 모니터링하는 알림 정책을 SQL 기반 알림 정책이라고 합니다. 자세한 내용은 알림 정책으로 SQL 쿼리 결과 모니터링을 참고하세요.
SQL 기반 알림 정책은 공개 미리보기 버전입니다.
알림 프로세스는 애플리케이션 성능이 허용 가능한 값을 충족하지 못할 때 문제에 대응하는 데 도움이 됩니다. 예를 들어 Compute Engine 가상 머신(VM) 인스턴스에 웹 애플리케이션을 배포합니다. HTTP 응답 지연 시간이 크게 변동될 것으로 예상되는 경우에는 상당 시간 동안 애플리케이션의 지연 시간이 높을 때 지원팀이 이에 대응하도록 해야 합니다. 애플리케이션의 HTTP 응답 지연 시간 측정항목을 모니터링하는 측정항목 기반 알림 정책을 만들 수 있습니다. 응답 지연 시간이 최소 5분 동안 2초를 초과하면 Monitoring이 이슈를 만들고 지원팀에 이메일 알림을 전송합니다.
알림 정책을 만드는 방법
알림 정책을 만드는 방법에는 여러 가지가 있습니다. 예를 들어 Google Cloud 콘솔의 통합 또는 특정 페이지에서 권장 알림을 사용 설정하여 사전 구성된 알림 정책을 사용할 수 있습니다. 또한 Google Cloud 콘솔, Cloud Monitoring API, Google Cloud CLI 및Terraform을 사용하여 새 알림 정책을 구성할 수 있습니다.
통합 및 권장 알림 정책 사용
Monitoring은 Google Cloud 서비스 및 서드 파티 통합에 대한 알림 정책을 만들 수 있도록 사전 빌드된 패키지를 제공합니다. 패키지에는 서비스에 대한 권장 알림 정책, 샘플 대시보드 및 주요 메트릭이 포함됩니다 이 패키지는 Google Kubernetes Engine, Compute Engine, Cloud SQL과 같은 Google Cloud 서비스와 MongoDB, Kafka, Elasticsearch와 같은 일반적인 서드 파티 통합에 사용할 수 있습니다.
패키지를 설치할 때 패키지의 권장 알림 정책을 사용 설정할 수 있습니다. 권장 알림 정책을 사용 설정하면 알림 채널을 구성하고 원하는 경우 다른 값을 수정합니다. 구성이 완료되면 알림 정책이 목표 모니터링을 즉시 시작합니다. 추가 사용자 입력은 필요하지 않습니다.
권장 알림 정책은 새 서비스를 배포한 후 중요한 측정항목에 대한 알림을 원하는 경우에 유용합니다. 예를 들어 Cloud SQL 통합 패키지에는 실패한 인스턴스 및 느린 트랜잭션에 대한 권장 알림 정책이 제공됩니다.
알림 통합에 관한 자세한 내용은 타사 애플리케이션 모니터링을 참고하세요.
새 알림 정책 만들기
알림 요구사항에 따라 다양한 유형의 데이터를 모니터링하는 알림 정책을 만들 수 있습니다. 다음 섹션에는 알림 정책으로 모니터링할 수 있는 다양한 데이터 유형이 나열되어 있습니다.
시계열 데이터 모니터링
조건 유형 | 설명 | 예 |
---|---|---|
측정항목 임곗값 조건 | 측정항목의 값이 특정 재테스트 기간 동안 기준보다 크거나 작을 때 측정항목 기준 조건이 충족됩니다. 자세한 내용은 측정항목 기준 알림 정책 만들기 및 API를 사용하여 알림 정책 만들기를 참조하세요. |
10분 이상 5회 연속으로 업타임 체크가 발생하는 경우 응답 지연 시간이 500ms 이상일 때 알림을 전송하는 알림 정책이 필요합니다. |
측정항목 부재 조건 | 측정항목 부재 조건은 특정 재테스트 기간 동안 모니터링 시계열에 데이터가 없는 경우에 충족됩니다. 최대 재테스트 기간은 23.5시간입니다. 자세한 내용은 측정항목 부재 알림 정책 만들기 및 API를 사용하여 알림 정책 만들기를 참고하세요. | 5분 동안 리소스가 HTTP 요청에 응답하지 않으면 지원팀에 이슈를 생성하는 알림 정책이 필요합니다. |
예측된 측정항목 값 조건 | 예측된 측정항목 값 조건은 알림 정책이 다가오는 예측 기간 내에 임곗값을 위반할 것이라고 예측할 때 충족됩니다. 예측 기간은 1시간에서 7일 사이입니다. 자세한 내용은 예측된 측정항목 값 알림 정책 만들기 및 API를 사용하여 알림 정책 만들기를 참고하세요. |
리소스가 다음 24시간 내에 80%의 디스크 공간 사용량에 도달할 것으로 예상되면 지원팀에 이슈를 생성하는 알림 정책이 필요합니다. |
로그 항목 데이터 모니터링
개별 로그 항목을 모니터링하려면 로그 기반 알림 정책을 사용하세요.
로그 기반 알림 정책의 조건은 알림 정책에서 로그 항목의 문구가 알림 정책 기준과 일치하는 것을 감지하면 충족됩니다. 예를 들어 로그 항목의 message
에 product_ids=['tier_1_support', 'tier_2_support']
가 포함되면 지원팀에 이슈를 개설하는 알림 정책이 필요합니다.
자세한 내용은 로깅 문서의 로그 기반 알림 정책 구성을 참고하세요.
SQL 쿼리 결과 모니터링
SQL 쿼리 결과를 모니터링하려면 SQL 기반 알림 정책을 사용하세요.
SQL 기반 알림 정책의 조건은 주기적으로 로그 항목 데이터를 분석한 후 쿼리 결과 테이블이 특정 기준을 충족하면 이슈를 만듭니다. 이 유형의 알림 정책은 여러 로그 항목에서 데이터 집계 또는 복잡한 패턴을 모니터링하는 알림 정책이 필요한 경우에 유용합니다. 예를 들어 지난 60분 동안 로그 항목 50개 이상이 심각도가 WARNING
인 경우 알림을 받으려면
자세한 내용은 Logging 문서의 알림 정책으로 SQL 쿼리 결과 모니터링을 참고하세요.
알림 정책 구성요소
각 알림 정책에는 다음 구성요소가 포함됩니다.
리소스 또는 리소스 그룹이 응답이 필요한 상태일 때 이를 설명하는 조건입니다. 조건에는 데이터 소스, 정적 또는 동적 기준 및 필터, 그룹화 등의 데이터 집계 방법이 포함됩니다. 단일 측정항목, 여러 측정항목 또는 측정항목의 비율을 모니터링하는 조건을 만들 수 있습니다. Prometheus Query Language(PromQL)를 사용하여 동적 기준 및 조건부 논리와 같은 복잡한 표현식을 포함할 수도 있습니다.
통합을 사용하여 추천 알림 정책을 사용 설정하면 알림 정책 조건이 자동으로 입력됩니다.
조치가 필요할 때 알림을 받을 사람을 설명하는 알림 채널 목록 자세한 내용은 알림 채널 만들기 및 관리를 참고하세요.
알림 및 이슈 페이지에 표시되는 문서 알림 제목을 구성하고 알림 본문에 유용한 정보를 추가할 수 있습니다. 예를 들어 내부 플레이북 또는 커스텀 대시보드 같은 Google Cloud 페이지의 링크를 표시하도록 알림을 구성할 수 있습니다. 예를 포함하여 문서에 대한 자세한 내용은 사용자 정의 문서로 이슈에 주석 추가를 참조하세요.
쿼리 언어
알림 정책에서 쿼리 언어와 필터를 사용하여 측정항목 평가를 더 세부적으로 관리하세요. 모니터링에서 지원하는 쿼리 유형은 다음과 같습니다.
Prometheus Query Language(PromQL)는 시계열 데이터를 실시간으로 평가하는 데 사용되는 기능적 쿼리 언어입니다. 알림 정책 조건에 PromQL 쿼리가 포함되도록 구성할 수 있습니다. PromQL 쿼리는 측정항목 조합, 비율, 확장 기준과 같은 유효한 표현식을 사용할 수 있습니다. Google Cloud에서 PromQL 기반 조건을 사용해 알림 정책을 구성하여 외부 알림 인프라에 대한 의존도를 줄일 수 있습니다. 자세한 내용은 Cloud Monitoring의 PromQL 및 PromQL을 사용한 알림 정책을 참조하세요.
모니터링 필터를 사용하면 필터 기반 측정항목 비율을 사용하도록 알림 정책을 구성할 수 있습니다. 필터 기반 알림 정책은 Google Cloud 콘솔에서 보거나 수정할 수 없습니다. Monitoring 필터를 사용하는 정책 예시는 측정항목 비율을 참조하세요.
모니터링 쿼리 언어(MQL)는 시계열 데이터를 검색, 필터링, 조작할 수 있는 표현적인 텍스트 기반 인터페이스입니다. 모니터링 쿼리 언어 알림 작업이 포함된 조건으로 알림 정책을 만들 수 있습니다. 자세한 내용은 모니터링 쿼리 언어 개요 및 MQL을 사용한 알림 정책을 참조하세요.
알림 정책 및 이슈 관리
알림 정책이 사용 설정된 후 Monitoring은 해당 정책의 조건을 지속적으로 모니터링합니다. 특정 기간에 대한 조건만 모니터링하도록 알림 정책을 구성할 수 없습니다. 특정 기간 동안 알림 정책을 사용 중지하려면 일시중지를 만듭니다.
이슈가 미해결이고 Monitoring에서 측정항목 기반 정책 조건이 더 이상 충족되지 않는다고 판단되면 Monitoring은 이슈를 자동으로 종료하고 종료에 대한 알림을 보냅니다.
가격 책정
일반적으로 Cloud Monitoring 시스템 측정항목은 무료이고 외부 시스템, 에이전트, 애플리케이션의 측정항목은 무료가 아닙니다. 청구 가능한 측정항목은 수집된 바이트 수 또는 샘플 수에 따라 청구됩니다.
Cloud Monitoring 가격 책정에 대한 자세한 내용은 다음 문서를 참조하세요.
수집되는 trace 스팬 또는 로그 수를 모니터링하는 방법 또는 특정 콘텐츠가 로그 항목에 포함되었을 때 알림을 받는 방법은 다음 문서를 참조하세요.
다음 단계
알림 지연 시간에 대한 정보와 선택한 알림 정책 매개변수가 알림 전송 시기에 미치는 영향은 측정항목 기반 알림 정책 동작을 참조하세요.
측정항목 기반 정책 예시 목록은 예시 알림 정책 요약을 참조하세요.