アラート ポリシーを作成するには、モニタリング対象、アラート ポリシーの条件が満たされるタイミング、通知方法を定義する必要があります。このページでは、アラート ポリシーの作成に使用できる設定について説明します。このページのほとんどのセクションは、次のような構成になっています。
- タイトル: 関連するプロダクト名とアラート ポリシーの簡単な説明。
- 概要: アラート ポリシーの簡単な説明。詳細については、プロダクトのドキュメントをご覧ください。
- アラート ポリシーの作成手順: アラート ポリシーの作成手順の概要。詳しい手順については、アラート ポリシーの作成をご覧ください。
新しい条件: モニタリング対象とデータの集計方法を指定するフィールド。
- 条件アラート トリガー: アラート ポリシーが適用される条件。再テスト ウィンドウを変更することで、条件を満たす頻度を下げることができます。
[新しい条件] ダイアログの フィールド名 |
グラフ |
---|---|
ローリング ウィンドウ関数 | 選択した指標と集計設定に基づいて最適に構成されます。 アライメント関数を指定するには、次の操作を行います。
|
ローリング ウィンドウ | 最小間隔 (アクセスするには、[add クエリ要素を追加] をクリックします) |
時系列のグループ化の基準 (「時系列全体」セクション) |
[集計] 要素の 2 番目のメニュー |
時系列集計 (「時系列全体」セクション) |
[集計] 要素の最初のメニュー |
課金
請求額または予測料金が予算を超えた場合に通知を受け取るには、 Google Cloud コンソールの [予算とアラート] ページでアラートを作成します。
-
Google Cloud コンソール [お支払い] ページに移動します。
このページは、検索バーを使用して見つけることもできます。
複数の Cloud 請求先アカウントがある場合は、次のいずれかを行います。
- 現在のプロジェクトの Cloud Billing を管理するには、[リンクされた請求先アカウントに移動] を選択します。
- 別の Cloud 請求先アカウントを確認するには、[請求先アカウントを管理] を選択し、予算を設定する対象のアカウントを選択します。
- [お支払い] ナビゲーション メニューから [予算とアラート] を選択します。
- [予算を作成] をクリックします。
- 予算ダイアログに入力します。このダイアログでは、 Google Cloud のプロジェクトとサービスを選択し、その組み合わせに対する予算を作成します。デフォルトでは、予算の 50%、90%、100% に達すると通知が送られます。詳細については、予算と予算アラートの設定をご覧ください。
BigQuery の実行時間
BigQuery クエリの実行時間の 99 パーセンタイルが、ユーザーによって定義された上限値を超過すると起動するアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで [BigQuery プロジェクト] を選択します。 [Metric categories] メニューで [Query] を選択します。 [指標] メニューで [Query execution times] を選択します。 |
フィルタ | |
時系列全体 時系列のグループ化の基準 |
priority |
Across time series Time series aggregation |
99th percentile |
ローリング ウィンドウ | 5 m |
ローリング ウィンドウ関数 | sum |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | この値を決定します。ただし、しきい値を 60 秒にすることをおすすめします。 |
再テスト ウィンドウ | most recent value |
BigQuery の使用
取り込まれた BigQuery 指標がユーザー定義レベルを超えた場合にトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで [BigQuery データセット] を選択します。 [指標カテゴリ] メニューで、[ストレージ] を選択します。 [指標] メニューから指標を選択します。 Stored bytes 、Uploaded bytes 、Uploaded bytes billed など、使用に固有の指標。利用可能な指標の完全なリストについては、BigQuery 指標をご覧ください。 |
フィルタ | project_id: 実際の Google Cloud プロジェクト ID。 dataset_id: データセット ID。 |
時系列全体 時系列のグループ化の基準 |
dataset_id: データセット ID。 |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 1 m |
ローリング ウィンドウ関数 | mean |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 許容値を決定します。 |
再テスト ウィンドウ | 1 minute |
Bigtable ストレージの使用率
Bigtable クラスタのストレージ使用率が推奨しきい値(70% など)を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[Cloud Bigtable Cluster] を選択します。 [指標カテゴリ] メニューで、[クラスタ] を選択します。 [指標] メニューで [ストレージ使用率] を選択します。 (指標タイプは bigtable.googleapis.com/cluster/storage_utilization です) |
フィルタ | cluster = YOUR_CLUSTER_ID |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
次の場合、条件トリガー: | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 70 |
再テスト ウィンドウ | 10 minutes |
Compute Engine アーリーブート検証
[Early Boot Validation] には、最後のブート シーケンスの初期ブート部分の合格 / 失敗のステータスが示されます。アーリーブートは、UEFI ファームウェアが起動されるところから、UEFI ファームウェアからブートローダーに制御が渡されるまでのブート シーケンスです。
Compute Engine VM インスタンスのアーリーブート シーケンスが失敗したときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[VM インスタンス] を選択します。 [指標カテゴリ] メニューで、[インスタンス] を選択します。 [指標] メニューで [Early boot validation] を選択します。 |
フィルタ | status = failed |
時系列全体 時系列のグループ化の基準 |
status |
Across time series Time series aggregation |
sum |
ローリング ウィンドウ | デフォルトを使用。 |
ローリング ウィンドウ関数 | デフォルトを使用 |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 0 |
再テスト ウィンドウ | 1 minute |
Compute Engine レイトブート検証
[Late Boot Validation] には、最後のブート シーケンスの後期ブート部分の合格 / 失敗のステータスが示されます。後期ブートは、ブートローダーに制御が渡されてから起動が完了するまでのブート シーケンスです。これには、オペレーティング システム カーネルの読み込みが含まれます。
Compute Engine VM インスタンスのレイトブート シーケンスが失敗するとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[VM インスタンス] を選択します。 [指標カテゴリ] メニューで、[インスタンス] を選択します。 [指標] メニューで、[Late boot validation] を選択します。 |
フィルタ | status = failed |
時系列全体 時系列のグループ化の基準 |
status |
Across time series Time series aggregation |
sum |
ローリング ウィンドウ | デフォルトを使用。 |
ローリング ウィンドウ関数 | デフォルトを使用 |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 0 |
再テスト ウィンドウ | 1 minute |
取り込まれた毎月のログバイト数をロギングする
ログバケットに書き込まれたログバイト数が Cloud Logging のユーザー定義の上限を超えたときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[グローバル] を選択します。 [指標カテゴリ] メニューで、[ログベースの指標] を選択します。 [指標] メニューで、[取り込みログバイト数の月間合計] を選択します。 |
フィルタ | なし |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 60 m |
ローリング ウィンドウ関数 | max |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 許容値を決定します。 |
再テスト ウィンドウ | 最小許容値は 30 分です。 |
推奨事項の予測
推奨事項予測アラートを設定するには、アラート ポリシーで次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[消費した API] を選択します。 [指標カテゴリ] メニューで、[API] を選択します。 [指標] メニューで [リクエスト数] を選択します。 |
フィルタ | service = recommendationengine.googleapis.com |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 1 m |
ローリング ウィンドウ関数 | sum |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 0 |
再テスト ウィンドウ | 5 minutes |
推奨事項のユーザー イベント記録の削減
推奨事項イベント記録の削減アラートを設定するには、アラート ポリシーで次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[消費した API] を選択します。 [指標カテゴリ] メニューで、[API] を選択します。 [指標] メニューで [リクエスト数] を選択します。 |
フィルタ | service = recommendationengine.googleapis.com |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 1 m |
ローリング ウィンドウ関数 | sum |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Metric absence |
Alert trigger | Any time series violates |
トリガーとなる不在時間 | 10 minutes |
Spanner の優先度の高い CPU 使用率
Spanner の優先度の高い CPU 使用率が推奨しきい値を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[Spanner インスタンス] を選択します。 [指標カテゴリ] メニューで、[インスタンス] を選択します。 [指標] メニューで、[CPU 使用率(優先度別)] を選択します。 (指標タイプは spanner.googleapis.com/instance/cpu/utilization_by_priority です) |
フィルタ | instance_id = YOUR_INSTANCE_ID priority = high
|
時系列全体 時系列のグループ化の基準 |
マルチリージョン インスタンスの場合: location リージョン インスタンスの場合は空白のままにします。 |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 10 m |
ローリング ウィンドウ関数 | mean |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | マルチリージョン インスタンスの場合: 45% 。リージョン インスタンスの場合: 65% 。 |
再テスト ウィンドウ | 10 minutes |
Spanner の 24 時間移動使用量
Spanner の CPU 使用率の 24 時間の移動平均が推奨しきい値を上回った場合にトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[Spanner インスタンス] を選択します。 [指標カテゴリ] メニューで、[インスタンス] を選択します。 [指標] メニューで、[Smoothed CPU utilization] を選択します。 (指標タイプは spanner.googleapis.com/instance/cpu/smoothed_utilization です) |
フィルタ | instance_id = YOUR_INSTANCE_ID |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 10 m |
ローリング ウィンドウ関数 | mean |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 90%
|
再テスト ウィンドウ | 10 minutes |
Spanner ストレージ
Spanner インスタンスのストレージが推奨しきい値を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[Spanner インスタンス] を選択します。 [指標カテゴリ] メニューで、[インスタンス] を選択します。 [指標] メニューで [ストレージの使用量] を選択します。 (指標タイプは spanner.googleapis.com/instance/storage/utilization です) |
フィルタ | instance_id = YOUR_INSTANCE_ID |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 10 m |
ローリング ウィンドウ関数 | max |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
次の場合、条件トリガー: | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | ノードあたりの最大ストレージに特定のしきい値を設定する必要はありません。ただし、ストレージの上限に近づいた際のアラートを設定することをおすすめします。詳細については、ストレージ使用量の指標をご覧ください。 |
再テスト ウィンドウ | 10 minutes |
API 使用量の割り当てのトレース
取り込まれた Cloud Trace スパンの月間合計が、割り当て量を超えるとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[消費した API] を選択します。 [指標カテゴリ] メニューで、[API] を選択します。 [指標] メニューで [リクエスト数] を選択します。 (指標タイプは serviceruntime.googleapis.com/api/request_count です) |
フィルタ | service = cloudtrace.googleapis.com |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 1 m |
ローリング ウィンドウ関数 | sum |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 0 |
再テスト ウィンドウ | 1 minute |
Trace モニタリングの月間スパン使用量
取り込まれた Cloud Trace スパンの月間合計が、ユーザー定義の上限を超えたときに起動するアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[グローバル] を選択します。 [指標カテゴリ] メニューで、[お支払い] を選択します。 [指標] メニューで、[Monthly trace spans ingested] を選択します。 |
フィルタ | |
時系列全体 時系列集計 |
sum |
ローリング ウィンドウ | 60 m |
ローリング ウィンドウ関数 | max |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
Threshold value |
許容値を決定します。 |
再テスト ウィンドウ | 最小許容値は 30 分です。 |
トレース エクスポート エラー
BigQuery に Cloud Trace データをエクスポートする際にエラーが発生するとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。
[New condition] フィールド |
値 |
---|---|
リソースと指標 | [リソース] メニューで、[Cloud Trace] を選択します。 [指標カテゴリ] メニューで、[Bigquery_export] を選択します。 [指標] メニューで、[Spans Exported to BigQuert] を選択します。 |
フィルタ | status != ok |
時系列全体 時系列のグループ化の基準 |
status |
Across time series Time series aggregation |
sum |
ローリング ウィンドウ | 1 m |
ローリング ウィンドウ関数 | rate |
[Configure alert trigger] フィールド |
値 |
---|---|
条件タイプ | Threshold |
Alert trigger | Any time series violates |
しきい値の位置 | Above threshold |
しきい値 | 0 |
再テスト ウィンドウ | 1 minute |
稼働時間チェックのモニタリング
稼働時間チェックのアラート ポリシーを作成したり、稼働時間チェックの成功またはレイテンシ ステータスを示すグラフを作成するには、稼働時間チェックに関するアラートをご覧ください。