このページは Cloud Translation API によって翻訳されました。

高可用性の Kubernetes ワークロード

このページでは、Google Distributed Cloud（GDC）のエアギャップマルチゾーンユニバースでアプリケーションのフォールトトレランスを高める Kubernetes コンテナワークロード戦略について説明します。GDC は、Google Kubernetes Engine（GKE）上で広く使用され、サポートされている Kubernetes ネイティブのコンテナアプリケーションをサポートしています。

このページは、組織のアプリケーションワークロードの作成を担当するアプリケーションオペレーターグループ内のデベロッパーを対象としています。詳細については、GDC エアギャップの対象読者に関するドキュメントをご覧ください。

HA アプリの Kubernetes に関する考慮事項

Kubernetes で高可用性（HA）を実現するには、コントロールプレーンだけでは不十分です。また、Google Distributed Cloud（GDC）のエアギャップ環境でコンテナワークロードを復元力のある方法で設計してデプロイする必要があります。Kubernetes には、インフラストラクチャの問題が発生した場合や定期メンテナンス中であっても、ダウンタイムを最小限に抑え、高可用性サービスを提供するための強力なメカニズムがいくつか用意されています。次のトピックは、HA を検討するうえで重要な戦略です。

レプリカと自動スケーリングで可用性を維持する: HA を提供するには、アプリケーションの実行中のインスタンスが十分に必要です。
- ReplicaSet: ReplicaSet リソースは、特定の時点で実行される同一の Pod レプリカの安定したセットを維持します。Pod で障害が発生したり、Pod が終了したりすると、ReplicaSet コントローラが自動的に新しい Pod を作成して置き換えます。詳細については、ReplicaSet Kubernetes のドキュメントをご覧ください。
- Horizontal Pod Autoscaler（HPA）: ReplicaSet はレプリカの数を固定しますが、HPA は CPU 使用率やメモリ使用量などのモニタリングされた指標に基づいて、この数を自動的に調整します。これにより、アプリケーションで負荷の急増を処理できます。詳細については、Kubernetes ドキュメントの水平 Pod 自動スケーリングをご覧ください。
PodDisruptionBudget（PDB）でダウンタイムを最小限に抑える: 詳細については、Kubernetes ドキュメントのアプリケーションの停止予算の指定をご覧ください。
アンチアフィニティルールでリスクを分散する: 詳細については、アフィニティとアンチアフィニティに関する Kubernetes のドキュメントをご覧ください。
liveness プローブ、readiness プローブ、startup プローブを使用したヘルスチェック: 詳細については、Kubernetes ドキュメントの livenessProbe、readinessProbe、startupProbe の構成をご覧ください。
安定したエンドポイントとサービスによるロードバランシング: 詳細については、サービスに関する Kubernetes のドキュメントをご覧ください。
デプロイによる正常な更新とロールバック: 詳細については、Kubernetes ドキュメントのデプロイのロールバックをご覧ください。
リソースのリクエストと上限を設定する: 詳細については、Kubernetes ドキュメントの Pod とコンテナのリソース管理をご覧ください。

高可用性の Kubernetes ワークロード コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

HA アプリの Kubernetes に関する考慮事項

次のステップ

高可用性の Kubernetes ワークロード