측정항목 기반 알림 정책 이슈

이슈는 알림 정책의 조건이 충족된 경우에 대한 기록입니다. 일반적으로 조건이 충족되면 Cloud Monitoring은 이슈를 열고 알림을 전송합니다. 하지만 정책이 일시중지되거나 사용 중지된 경우 해당 정책에 대해 미해결된 이슈가 너무 많거나, 기본 리소스가 사용 중지된 것으로 알려진 경우에는 이슈가 생성되지 않습니다. 또한 알림 정책에 여러 조건이 포함된 경우 알림 정책은 어느 한 조건을 충족하는 것만으로도 이슈가 생성되는지 여부를 지정합니다. 이슈는 알림 정책의 조건이 충족된 경우에 대한 기록입니다. 일반적으로 조건이 충족되면 Cloud Monitoring은 알림 정책의 조건과 일치하는 로그가 수신되었을 때 이슈를 열고 알림을 전송합니다. 하지만 다음과 같은 경우에는 이슈가 생성되지 않습니다.

  • 정책이 일시중지되었거나 사용 중지되었습니다.
  • 최대 알림 비율이 각 로그 기반 알림 정책에 대해 5분당 알림 한도인 1개를 초과합니다.
  • 일일 총 알림 수가 각 로그 기반 알림 정책에 대해 일일 알림 한도인 20개를 초과합니다.

Monitoring은 각 이슈에 대해 이슈를 관리하고 오류 문제 해결에 도움이 되는 이슈 정보를 보고할 수 있는 이슈 세부정보 페이지를 만듭니다. 예를 들어 이슈 세부정보 페이지에는 이슈 타임라인과 모니터링 중인 측정항목 데이터를 보여주는 차트가 표시됩니다. 관련 이슈 및 로그 항목 링크도 확인할 수 있습니다.

이 문서에서는 이슈를 찾는 방법을 설명합니다. 또한 이슈 세부정보 페이지를 사용하여 Cloud Monitoring에 저장된 시계열 데이터를 평가하는 측정항목 기반 알림 정책의 이슈를 관리하는 방법도 설명합니다.

시작하기 전에

필요한 권한이 있는지 확인합니다.

Google Cloud 콘솔을 사용하여 이슈를 보고 관리하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

Cloud Monitoring 역할에 대한 자세한 내용은 Identity and Access Management로 액세스 제어를 참조하세요.

이슈 찾기

Google Cloud 프로젝트에서 이슈 목록을 보려면 다음을 수행합니다.

  1. Google Cloud 콘솔에서  알림 페이지로 이동합니다.

    알림으로 이동

    검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.

    • 요약 창에는 미해결 이슈 수가 나열됩니다.
    • 이슈 창에는 가장 최근 이슈가 표시됩니다. 종료된 이슈를 포함하여 테이블에 가장 최근 이슈를 나열하려면 종료된 이슈 표시를 클릭합니다.
  2. 특정 이슈의 세부정보를 보려면 목록에서 이슈를 선택합니다.

    이슈 세부정보 페이지가 열립니다. 이슈 세부정보 페이지에 관한 자세한 내용은 이 페이지의 이슈 조사 섹션을 참조하세요.

이전 이슈 찾기

알림 페이지의 이슈 창에는 가장 최근의 미해결 이슈가 표시됩니다. 이전 이슈를 찾으려면 다음 중 한 가지 방법을 사용합니다.

  • 이슈 표의 항목에서 페이지를 이동하려면  최신 또는 이전을 클릭합니다.

  • 이슈 페이지로 이동하려면 모든 이슈 보기를 클릭합니다. 이슈 페이지에서 다음 작업을 모두 수행할 수 있습니다.

    • 종료된 이슈 표시: 테이블에 있는 모든 이슈를 나열하려면 종료된 이슈 표시를 클릭합니다.
    • 이슈 필터링: 필터 추가에 대한 자세한 내용은 이슈 필터링을 참조하세요.
    • 이슈를 확인하거나 종료하거나 알림 정책을 일시중지합니다. 이러한 옵션에 액세스하려면 이슈 행에서  옵션 더보기를 클릭하고 메뉴에서 항목을 선택합니다. 자세한 내용은 이슈 관리를 참조하세요.

이슈 필터링

필터 표시줄에 값을 입력하면 필터와 일치하는 이슈만 이슈 표에 나열됩니다. 여러 필터를 추가할 경우 모든 필터를 충족하는 이슈만 표시됩니다.

이슈 표를 필터링하려면 다음 안내를 따르세요.

  1. 이슈 페이지에서  표 필터링을 클릭한 다음 필터 속성을 선택합니다. 필터 속성에는 다음 항목이 모두 포함됩니다.

    • 이슈 상태
    • 알림 정책 이름
    • 이슈가 개설되거나 종료된 때
    • 측정항목 유형
    • 리소스 유형
  2. 보조 메뉴에서 값을 선택하거나 필터 표시줄에 값을 입력합니다.

    예를 들어 측정항목 유형을 선택하고 usage_time을 입력하면 보조 메뉴에 다음 옵션만 표시할 수 있습니다.

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time
    

이슈 조사

이슈 세부정보 페이지에는 이슈의 원인을 파악하는 데 도움이 되는 정보가 포함되어 있습니다.

측정항목 데이터 살펴보기

이슈 발생 전후의 측정항목 상태를 분석하려면 알림 측정항목 차트를 사용하세요. 이 차트에는 알림 정책의 조건이 충족된 타임라인과 시계열이 표시됩니다.

타임라인의 범위를 조정하여 이슈와 관련된 측정항목 데이터의 추세와 패턴을 찾을 수 있습니다.

  • 조건이 충족된 시계열만 표시하거나 조건이 평가되는 모든 시계열을 표시하도록 전환하려면 모든 시계열 표시를 클릭합니다.

  • 차트에 표시되는 시간 범위를 변경하려면 툴바의 시간 범위 선택기를 사용하거나 포인터로 차트에서 시간 범위를 강조 표시합니다.

측정항목 탐색기에서 측정항목 데이터를 확인하여 더 자세히 분석할 수도 있습니다. 이렇게 하려면 알림 측정항목 차트로 이동한 다음 데이터 탐색을 클릭합니다. 기본적으로 측정항목 탐색기는 측정항목 차트가 알림 측정항목 타임라인에 표시된 시계열과 일치하도록 측정항목 데이터를 집계하고 필터링합니다.

로그 항목 살펴보기

이슈 세부정보 페이지의 로그 창에는 측정항목에서 모니터링되는 리소스의 리소스 유형 및 라벨과 일치하는 로그 항목이 표시됩니다. 이러한 로그 항목을 분석하여 이슈를 해결하는 데 도움이 될 수 있는 추가 정보를 찾을 수 있습니다.

  • 로그 탐색기에서 로그 항목을 보려면 로그 탐색기에서 보기를 클릭한 다음 범위 설정 프로젝트를 선택합니다. 로그 탐색기는 관련 로그 항목이 생성된 타임라인과 같은 로그 항목 데이터를 분석할 수 있는 추가 도구를 제공합니다.
  • 측정항목 탐색기에서 로그 항목을 필터링하는 데 사용된 쿼리를 보고 수정하려면 데이터 탐색을 클릭합니다.

보충 정보 보기

라벨 섹션에는 이슈의 원인이 된 시계열의 모니터링 리소스와 측정항목의 라벨 및 값과 알림 정책에 정의된 사용자 라벨이 표시됩니다. 이 정보는 이슈의 원인이 된 특정 모니터링 리소스를 식별하는 데 도움이 될 수 있습니다. 자세한 내용은 라벨로 이슈에 주석 추가를 참조하세요.

문서 섹션에는 알림 정책을 만들 때 제공한 알림에 대한 문서 템플릿이 표시됩니다. 이 정보에는 알림 정책에서 모니터링하는 항목에 대한 설명과 완화 방법이 포함되어 있습니다. 자세한 내용은 사용자 정의 문서로 알림에 주석 추가를 참조하세요.

알림 정책에 문서를 구성하지 않은 경우 문서 창에 '구성된 문서 없음'이 표시됩니다.

애플리케이션 전반에서 근본적인 문제를 찾으려면 다른 알림 정책 조건과 관련된 이슈를 살펴봅니다.

관련 이슈 섹션에는 다음 중 하나와 일치하는 이슈 목록이 표시됩니다.

  • 동일한 알림 정책의 조건이 충족되면 이슈가 생성됩니다.
  • 이슈는 이슈 세부정보 페이지에 표시된 이슈와 라벨을 공유합니다.

이슈 관리

이슈 상태는 다음 중 하나입니다.

  • 열기: 알림 정책의 조건 집합이 충족되거나 조건이 더 이상 충족되지 않음을 나타내는 데이터가 없습니다. 알림 정책에 여러 조건이 포함된 경우 조건의 조합 방식에 따라 이슈가 개설됩니다. 자세한 내용은 여러 조건이 포함된 정책을 참조하세요.

  •  확인됨: 이슈가 개설되었으며 수동으로 확인됨으로 표시되었습니다. 일반적으로 이 상태는 이슈가 조사 중임을 나타냅니다.

  •  종료됨: 시스템에서 조건 충족이 중단되었다고 관측되었거나, 사용자가 이슈를 닫았거나, 조건이 지속적으로 충족되는지에 대한 관찰 없이 7일이 경과했습니다.

참고: 알림 정책을 구성하는 경우 모든 상태가 정상일 때 안정적인 상태에서 신호를 제공하는지 확인하세요. 오류가 없는 상태를 식별하고 이슈가 열린 경우 해당 이슈를 닫을 수 있어야 합니다. 이슈가 열린 후 오류 조건이 중지되었음을 나타내는 신호가 없는 경우 알림 정책 실행 후 7일 동안 열린 상태로 유지됩니다.

예를 들어 오류 수가 0보다 많을 때 알림을 전송하는 알림 정책을 만드는 경우 오류가 없을 때 오류 수가 0개인지 확인해야 합니다. 알림 정책이 오류 없음 상태에서 null을 반환하거나 비어 있으면 오류가 중지된 시기를 나타내는 신호가 없습니다. 상황에 따라 Monitoring Query Language(MQL)는 측정된 값을 사용할 수 없을 때 사용할 기본값을 지정하는 기능을 지원합니다. 예시를 보려면 비율 사용을 참조하세요.

이슈 확인

이슈의 원인을 조사하기 시작하면 이슈를 확인됨으로 표시하는 것이 좋습니다.

이슈를 확인됨으로 표시하려면 다음 단계를 따르세요.

  1. 알림 페이지의 이슈 창에서 모든 이슈 보기를 클릭합니다.
  2. 이슈 페이지에서 확인할 이슈를 찾은 후 다음 중 한 가지 방법을 사용합니다.

    •  옵션 더보기를 클릭한 다음 확인을 선택합니다.
    • 이슈의 세부정보 페이지를 열고 이슈 확인을 클릭합니다.

알림 정책이 반복 알림을 전송하도록 구성된 경우 이슈를 확인해도 알림이 중지되지 않습니다. 이를 중지하려면 다음 중 하나를 실행하세요.

  • 알림 정책에 대한 일시중지를 만듭니다.
  • 알림 정책을 사용 중지합니다.

알림 정책 일시중지

Monitoring이 특정 기간 동안 이슈를 만들고 알림을 전송하지 못하도록 방지하려면 관련 알림 정책을 일시중지하세요. 알림 정책을 일시중지하면 Monitoring은 알림 정책과 관련된 모든 이슈도 닫습니다.

보고 있는 이슈에 대한 일시중지를 만들려면 다음을 수행하세요.

  1. 이슈 세부정보 페이지에서 정책 일시중지를 클릭합니다.

  2. 일시중지 기간을 선택합니다. 일시중지 기간을 선택하면 일시중지가 즉시 시작됩니다.

또한 이슈 페이지에서 알림 정책을 일시중지할 수 있는데, 일시중지할 이슈를 찾아서  옵션 더보기를 클릭한 다음 일시중지를 선택하면 됩니다. 문제 해결 프로세스 중에 추가 알림을 방지하기 위해 서비스 중단 중 알림 정책을 일시중지할 수 있습니다.

이슈 종료

Monitoring이 이슈를 닫도록 하거나 관찰 수신이 중지되면 이슈를 닫을 수 있습니다. 이슈를 닫고 조건이 충족되었음을 나타내는 데이터가 수신되면 새 이슈가 생성됩니다. 이슈를 닫아도 해당 동작은 동일한 조건에 대해 열려 있는 다른 모든 이슈를 닫지 않습니다. 알림 정책을 일시중지하면 일시중지가 시작될 때 미해결 이슈가 종료됩니다.

다음 중 하나라도 발생하면 Monitoring이 자동으로 이슈를 종료합니다.

  • 측정항목 기준점 조건:

    • 기준점이 위반되지 않았음을 나타내는 관찰이 수신됩니다.
    • 관찰이 수신되지 않고 관찰 수신이 중지되고 기본 리소스 상태가 알 수 없음이거나 사용 중지됨이면 이슈를 닫도록 조건이 구성됩니다.

    • 알림 정책의 자동 종료 기간 동안 관찰이 수신되지 않고 관찰 수신이 중지되면 이슈를 자동으로 닫도록 조건이 구성되지 않습니다. 자동 종료 기간을 구성하려면 Google Cloud 콘솔이나 Cloud Monitoring API를 사용하면 됩니다. 기본적으로 자동 종료 기간은 7일입니다. 최소 자동 종료 기간은 30분입니다.

  • 측정항목 부재 조건:

    • 관찰이 발생합니다.
    • 알림 정책의 자동 종료 기간이 만료된 후 24시간 동안 관찰이 수신되지 않습니다. 자동 종료 기간을 구성하려면 Google Cloud 콘솔이나 Cloud Monitoring API를 사용하면 됩니다. 기본적으로 자동 종료 기간은 7일입니다.
  • 예측 조건:

    • 예측이 생성되고 시계열이 예측 기간 내 기준점을 위반하지 않을 것이라고 예측합니다.
    • 10분 동안 관찰이 수신되지 않고 관찰 수신이 중지되고 기본 리소스 상태가 알 수 없음이거나 사용 중지됨이면 이슈를 닫도록 조건이 구성됩니다.

    • 알림 정책의 자동 종료 기간 동안 관찰이 수신되지 않고 관찰 수신이 중지되면 이슈를 자동으로 닫도록 조건이 구성되지 않습니다.

예를 들어 HTTP 응답 지연 시간이 10분 연속으로 2초를 초과했기 때문에 알림 정책에서 이슈를 생성했습니다. HTTP 응답 지연 시간의 다음 측정값이 2초 이하인 경우 이슈가 종료됩니다. 마찬가지로 7일 동안 데이터가 전혀 수신되지 않으면 이슈가 종료됩니다.

이슈를 닫으려면 다음을 수행합니다.

  1. 알림 페이지의 이슈 창에서 모든 이슈 보기를 클릭합니다.
  2. 이슈 페이지에서 종료할 이슈를 찾은 후 다음 중 한 가지 방법을 사용합니다.

    •  더 보기를 클릭한 후 이슈 닫기를 선택합니다.
    • 해당 이슈의 이슈 세부정보 페이지를 열고 이슈 닫기를 클릭합니다.
Unable to close incident with active conditions 메시지가 표시되면 최근 알림 기간 내에 데이터가 수신되었기 때문에 이슈를 종료할 수 없는 것입니다.

Unable to close incident. Please try again in a few minutes. 메시지가 표시되면 내부 오류로 인해 이슈를 종료할 수 없습니다.

데이터 보관 및 한도

한도 및 이슈 보관 기간에 대한 자세한 내용은 알림 한도를 참조하세요.

다음 단계