一般的なアラート ポリシーの設定

アラート ポリシーを作成するには、モニタリング対象、アラート ポリシーの条件が満たされるタイミング、通知方法を定義する必要があります。このページでは、アラート ポリシーの作成に使用できる設定について説明します。このページのほとんどのセクションは、次のような構成になっています。

  • タイトル: 関連するプロダクト名とアラート ポリシーの簡単な説明。
  • 概要: アラート ポリシーの簡単な説明。詳細については、プロダクトのドキュメントをご覧ください。
  • アラート ポリシーの作成手順: アラート ポリシーの作成手順の概要。詳しい手順については、アラート ポリシーの作成をご覧ください。
  • 新しい条件: モニタリング対象とデータの集計方法を指定するフィールド。

  • 条件アラート トリガー: アラート ポリシーが適用される条件。再テスト ウィンドウを変更することで、条件を満たす頻度を下げることができます。
割り当てデータを表示するグラフのみを構成する場合は、「新しい条件」表の設定を使用できます。アラートの条件では、グラフ作成ツールと異なる表記を使用します。グラフ作成ツールのカスタム ダッシュボードには、Metrics Explorer のグラフや構成グラフが含まれています。
[新しい条件] ダイアログの
フィールド名
グラフ
ローリング ウィンドウ関数

選択した指標と集計設定に基づいて最適に構成されます。

アライメント関数を指定するには、次の操作を行います。

  1. [集計] 要素で最初のメニューを開いて、[整列指定子を構成] を選択します。[アライメント関数] と [グループ化] 要素が追加されます。
  2. [アライメント関数] 要素を開いて、選択を行います。

ローリング ウィンドウ 最小間隔
(アクセスするには、[ クエリ要素を追加] をクリックします)
時系列のグループ化の基準
(「時系列全体」セクション)
[集計] 要素の 2 番目のメニュー
時系列集計
(「時系列全体」セクション)
[集計] 要素の最初のメニュー

課金

請求額または予測料金が予算を超えた場合に通知を受け取るには、 Google Cloud コンソールの [予算とアラート] ページでアラートを作成します。

  1. Google Cloud コンソール [お支払い] ページに移動します。

    [お支払い] に移動

    このページは、検索バーを使用して見つけることもできます。

    複数の Cloud 請求先アカウントがある場合は、次のいずれかを行います。

    • 現在のプロジェクトの Cloud Billing を管理するには、[リンクされた請求先アカウントに移動] を選択します。
    • 別の Cloud 請求先アカウントを確認するには、[請求先アカウントを管理] を選択し、予算を設定する対象のアカウントを選択します。
  2. [お支払い] ナビゲーション メニューから [予算とアラート] を選択します。
  3. [予算を作成] をクリックします。
  4. 予算ダイアログに入力します。このダイアログでは、 Google Cloud のプロジェクトとサービスを選択し、その組み合わせに対する予算を作成します。デフォルトでは、予算の 50%、90%、100% に達すると通知が送られます。詳細については、予算と予算アラートの設定をご覧ください。

BigQuery の実行時間

BigQuery クエリの実行時間の 99 パーセンタイルが、ユーザーによって定義された上限値を超過すると起動するアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで [BigQuery プロジェクト] を選択します。
[Metric categories] メニューで [Query] を選択します。
[指標] メニューで [Query execution times] を選択します。
フィルタ
時系列全体
時系列のグループ化の基準
priority
Across time series
Time series aggregation
99th percentile
ローリング ウィンドウ 5 m
ローリング ウィンドウ関数 sum
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 この値を決定します。ただし、しきい値を 60 秒にすることをおすすめします。
再テスト ウィンドウ most recent value

BigQuery の使用

取り込まれた BigQuery 指標がユーザー定義レベルを超えた場合にトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで [BigQuery データセット] を選択します。
[指標カテゴリ] メニューで、[ストレージ] を選択します。
[指標] メニューから指標を選択します。Stored bytesUploaded bytesUploaded bytes billed など、使用に固有の指標。利用可能な指標の完全なリストについては、BigQuery 指標をご覧ください。
フィルタ project_id: 実際の Google Cloud プロジェクト ID。
dataset_id: データセット ID。
時系列全体
時系列のグループ化の基準
dataset_id: データセット ID。
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 mean
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 許容値を決定します。
再テスト ウィンドウ 1 minute

Bigtable ストレージの使用率

Bigtable クラスタのストレージ使用率が推奨しきい値(70% など)を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Cloud Bigtable Cluster] を選択します。
[指標カテゴリ] メニューで、[クラスタ] を選択します。
[指標] メニューで [ストレージ使用率] を選択します。

(指標タイプは bigtable.googleapis.com/cluster/storage_utilization です)
フィルタ cluster = YOUR_CLUSTER_ID
[Configure alert trigger]
フィールド

条件タイプ Threshold
次の場合、条件トリガー: Any time series violates
しきい値の位置 Above threshold
しきい値 70
再テスト ウィンドウ 10 minutes

Compute Engine アーリーブート検証

[Early Boot Validation] には、最後のブート シーケンスの初期ブート部分の合格 / 失敗のステータスが示されます。アーリーブートは、UEFI ファームウェアが起動されるところから、UEFI ファームウェアからブートローダーに制御が渡されるまでのブート シーケンスです。

Compute Engine VM インスタンスのアーリーブート シーケンスが失敗したときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[VM インスタンス] を選択します。
[指標カテゴリ] メニューで、[インスタンス] を選択します。
[指標] メニューで [Early boot validation] を選択します。
フィルタ status = failed
時系列全体
時系列のグループ化の基準
status
Across time series
Time series aggregation
sum
ローリング ウィンドウ デフォルトを使用。
ローリング ウィンドウ関数 デフォルトを使用
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

Compute Engine レイトブート検証

[Late Boot Validation] には、最後のブート シーケンスの後期ブート部分の合格 / 失敗のステータスが示されます。後期ブートは、ブートローダーに制御が渡されてから起動が完了するまでのブート シーケンスです。これには、オペレーティング システム カーネルの読み込みが含まれます。

Compute Engine VM インスタンスのレイトブート シーケンスが失敗するとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[VM インスタンス] を選択します。
[指標カテゴリ] メニューで、[インスタンス] を選択します。
[指標] メニューで、[Late boot validation] を選択します。
フィルタ status = failed
時系列全体
時系列のグループ化の基準
status
Across time series
Time series aggregation
sum
ローリング ウィンドウ デフォルトを使用。
ローリング ウィンドウ関数 デフォルトを使用
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

取り込まれた毎月のログバイト数をロギングする

ログバケットに書き込まれたログバイト数が Cloud Logging のユーザー定義の上限を超えたときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[グローバル] を選択します。
[指標カテゴリ] メニューで、[ログベースの指標] を選択します。
[指標] メニューで、[取り込みログバイト数の月間合計] を選択します。
フィルタ なし
時系列全体
時系列集計
sum
ローリング ウィンドウ 60 m
ローリング ウィンドウ関数 max
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 許容値を決定します。
再テスト ウィンドウ 最小許容値は 30 分です。

推奨事項の予測

推奨事項予測アラートを設定するには、アラート ポリシーで次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[消費した API] を選択します。
[指標カテゴリ] メニューで、[API] を選択します。
[指標] メニューで [リクエスト数] を選択します。
フィルタ service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.Predict
response_code != 200
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 sum
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 5 minutes

推奨事項のユーザー イベント記録の削減

推奨事項イベント記録の削減アラートを設定するには、アラート ポリシーで次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[消費した API] を選択します。
[指標カテゴリ] メニューで、[API] を選択します。
[指標] メニューで [リクエスト数] を選択します。
フィルタ service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.CollectUserEvent
response_code != 200
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 sum
[Configure alert trigger]
フィールド

条件タイプ Metric absence
Alert trigger Any time series violates
トリガーとなる不在時間 10 minutes

Spanner の優先度の高い CPU 使用率

Spanner の優先度の高い CPU 使用率が推奨しきい値を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Spanner インスタンス] を選択します。
[指標カテゴリ] メニューで、[インスタンス] を選択します。
[指標] メニューで、[CPU 使用率(優先度別)] を選択します。

(指標タイプは spanner.googleapis.com/instance/cpu/utilization_by_priority です)
フィルタ instance_id = YOUR_INSTANCE_ID
priority = high
時系列全体
時系列のグループ化の基準
マルチリージョン インスタンスの場合: location
リージョン インスタンスの場合は空白のままにします。
時系列全体
時系列集計
sum
ローリング ウィンドウ 10 m
ローリング ウィンドウ関数 mean
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 マルチリージョン インスタンスの場合: 45%
リージョン インスタンスの場合: 65%
再テスト ウィンドウ 10 minutes

Spanner の 24 時間移動使用量

Spanner の CPU 使用率の 24 時間の移動平均が推奨しきい値を上回った場合にトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Spanner インスタンス] を選択します。
[指標カテゴリ] メニューで、[インスタンス] を選択します。
[指標] メニューで、[Smoothed CPU utilization] を選択します。

(指標タイプは spanner.googleapis.com/instance/cpu/smoothed_utilization です)
フィルタ instance_id = YOUR_INSTANCE_ID
時系列全体
時系列集計
sum
ローリング ウィンドウ 10 m
ローリング ウィンドウ関数 mean
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 90%
再テスト ウィンドウ 10 minutes

Spanner ストレージ

Spanner インスタンスのストレージが推奨しきい値を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Spanner インスタンス] を選択します。
[指標カテゴリ] メニューで、[インスタンス] を選択します。
[指標] メニューで [ストレージの使用量] を選択します。

(指標タイプは spanner.googleapis.com/instance/storage/utilization です)
フィルタ instance_id = YOUR_INSTANCE_ID
時系列全体
時系列集計
sum
ローリング ウィンドウ 10 m
ローリング ウィンドウ関数 max
[Configure alert trigger]
フィールド

条件タイプ Threshold
次の場合、条件トリガー: Any time series violates
しきい値の位置 Above threshold
しきい値 ノードあたりの最大ストレージに特定のしきい値を設定する必要はありません。ただし、ストレージの上限に近づいた際のアラートを設定することをおすすめします。詳細については、ストレージ使用量の指標をご覧ください。
再テスト ウィンドウ 10 minutes

API 使用量の割り当てのトレース

取り込まれた Cloud Trace スパンの月間合計が、割り当て量を超えるとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[消費した API] を選択します。
[指標カテゴリ] メニューで、[API] を選択します。
[指標] メニューで [リクエスト数] を選択します。

(指標タイプは serviceruntime.googleapis.com/api/request_count です)
フィルタ service = cloudtrace.googleapis.com
response_code = 429
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 sum
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

Trace モニタリングの月間スパン使用量

取り込まれた Cloud Trace スパンの月間合計が、ユーザー定義の上限を超えたときに起動するアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[グローバル] を選択します。
[指標カテゴリ] メニューで、[お支払い] を選択します。
[指標] メニューで、[Monthly trace spans ingested] を選択します。
フィルタ
時系列全体
時系列集計
sum
ローリング ウィンドウ 60 m
ローリング ウィンドウ関数 max
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
Threshold value 許容値を決定します。
再テスト ウィンドウ 最小許容値は 30 分です。

トレース エクスポート エラー

BigQuery に Cloud Trace データをエクスポートする際にエラーが発生するとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Cloud Trace] を選択します。
[指標カテゴリ] メニューで、[Bigquery_export] を選択します。
[指標] メニューで、[Spans Exported to BigQuert] を選択します。
フィルタ status != ok
時系列全体
時系列のグループ化の基準
status
Across time series
Time series aggregation
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 rate
[Configure alert trigger]
フィールド

条件タイプ Threshold
Alert trigger Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

稼働時間チェックのモニタリング

稼働時間チェックのアラート ポリシーを作成したり、稼働時間チェックの成功またはレイテンシ ステータスを示すグラフを作成するには、稼働時間チェックに関するアラートをご覧ください。