このページでは、Spanner インスタンスの停止の原因になる可能性があり、Spanner サービスレベル契約(SLA)から除外されるユーザー制御構成の一部について説明します。Spanner サービスレベル契約(SLA)では、「Google の合理的な制御が及ばない要因によって発生する」停止は除外されています。また、これらの構成を回避する方法に関するガイドラインも提供します。
Spanner は、データの分割と再調整、レプリケーション、フェイルオーバー、すべてのハードウェアとソフトウェアの更新など、データベース オペレーションの多くの側面を管理します。これらの動作の多くは、組み込みの設定と管理 API で構成できます。ワークロードは、Spanner だけでなく、アプリケーションやネットワークなどの他のコンポーネントにも依存します。これらのお客様が管理する構成は、データベースの負荷やその他の構成パラメータに応じて、インスタンスのダウンタイムのリスクを高める可能性があります。
インスタンスが異常になり、Google が、このページで説明されているオペレーション制限に準拠していないと判断した場合、発生したダウンタイムは Spanner SLA の対象外になることがあります(または SLA の対象としてカウントされません)。
Spanner SLA から除外される構成
次の構成は Spanner SLA の対象外です。
- インスタンスが構成され、ワークロードでインスタンスが過負荷状態になるような方法で使用されている場合、SLA の対象となりません。
- ユーザーの自発的な操作または不作為によって発生したインスタンスのダウンタイムは SLA の対象外です
- Spanner API または Spanner の作成と接続に必要なその他の Google Cloud API を無効にすると、SLA の対象外となります。
- プロキシやファイアウォール ルールなどのネットワーク構成が原因で Spanner API が利用できなくなった場合、SLA の対象外となります。
- クライアントが古くなっているか、構成が誤っているためにアプリケーションが利用できない場合、SLA の対象外となります。特に、サポートされている依存関係を含む最新のクライアント バージョンを使用していることを確認します。たとえば、Java アプリケーションでは、Gradle や Maven などのパッケージ管理システムで Google の BOM(部品構成表)を使用する必要があります。
Cloud Monitoring を使用してアラートとモニタリングを設定することをおすすめします。
避けるべき構成
Spanner SLA の対象範囲を維持するには、次の構成を避ける必要があります。
- CPU の過負荷: CPU 使用率が常に高い場合、インスタンスはワークロードに適切なサイズではなく、SLA の対象外となる可能性があります。Spanner の CPU 使用率の推奨事項は、フェイルオーバー イベントのオーバーヘッドを提供します。残りのコンピューティング リソースは、インスタンスの利用できない部分からのトラフィックの対応に役立ちます。Spanner の CPU 使用率の指標を使用して、CPU 使用率をモニタリングできます。
- ストレージのフル使用: Spanner では、使用したストレージに対してのみ課金されます。ただし、各ノード(コンピューティングの単位)には、管理できるストレージ容量の上限があります。インスタンスがノードあたりのアドレス指定可能なストレージに適切なサイズでない場合、インスタンスは SLA の対象外となる可能性があります。Spanner のストレージ使用率指標を使用して、ストレージ使用率をモニタリングできます。
- 割り当て上限: ノードリソースは、ユーザーごとの割り当てによって制限されます。割り当ての増加を事前にリクエストしないと、コンピューティング リソースが過負荷になり、SLA の対象外となる可能性があります。Google の承認が必要な割り当て増加リクエストは、通常 1 日以内に処理が終わります。
- プロビジョニング不足のセッション: Spanner クライアントは、gRPC チャネルを使用して、クエリと管理用の Google Cloud エンドポイントと通信します。クライアント環境でワークロードのリクエスト量をサポートするのに十分なチャネルが提供されていない場合、アプリケーションでレイテンシが高くなり、リクエスト スループットが低下する可能性があります。これは SLA の対象外となる可能性があります。
- 接続の過負荷: 多くの Spanner API は、クエリのトランザクション デッドロック、ネットワークの問題、管理 API のレート制限など、一時的な障害が発生した場合に安全に再試行できます。再試行が過度に積極的であると、既存の接続が過負荷になり、リソースの枯渇や追加のスロットリングが発生する可能性があります。レイテンシの増加やスループットの低下は、SLA の対象外となる場合があります。詳細については、クライアントのタイムアウトと再試行の管理をご覧ください。
- ハードディスク ドライブ(HDD)の過負荷: 階層型ストレージを使用すると、Spanner データを SSD(ソリッド ステート ドライブ)と HDD(ハードディスク ドライブ)の組み合わせで保存できます。HDD ストレージのディスク負荷が 100% に達すると、Spanner インスタンスのレイテンシが大幅に増加し、SLA の対象外となる可能性があります。Spanner の階層型ストレージ指標を使用して、ディスク負荷をモニタリングできます。