このページは Cloud Translation API によって翻訳されました。

メンテナンスイベント中のライブマイグレーションプロセス

仮想マシン（VM）インスタンスまたはベアメタルインスタンスの基盤となるハードウェアの計画的なメンテナンスイベント中は、ホストサーバーを使用できません。Compute Engine は、ホストイベント中にインスタンスを実行し続けるために、同じゾーン内の別のホストサーバーへのインスタンスのライブマイグレーションを実行します。ホストイベントの詳細については、ホストイベントについてをご覧ください。

ライブマイグレーションを行うと、 Google Cloud でワークロードの中断、インスタンスの再起動、インスタンスのプロパティ（IP アドレス、メタデータ、ブロックストレージデータ、アプリケーションのステータス、ネットワーク設定など）の変更を行わずにメンテナンスを実施できます。

ライブマイグレーションにより、次の場合でもインスタンスの実行を継続できます。

インフラストラクチャのメンテナンス。インフラストラクチャのメンテナンスには、ホストハードウェア、データセンターのネットワークと電力網、ホストオペレーティングシステム（OS）と BIOS が含まれます。
セキュリティ関連の更新とシステム構成の変更。セキュリティパッチのインストール、ホスト OS イメージとパッケージのストレージ用のホストルートパーティションのサイズ変更などのイベントが含まれます。
ハードウェアの障害。メモリ、CPU、ネットワークインターフェースカード、ディスクの障害が含まれます。サーバーが完全に停止する前に障害が検出されると、Compute Engine はインスタンスを新しいホストサーバーに予防的にライブマイグレーションします。ハードウェアが完全に故障した場合やライブマイグレーションができない場合、インスタンスは停止して自動的に再起動されます。

Compute Engine は、ホストメンテナンスポリシーがマイグレーションに設定されている VM のライブマイグレーションのみを実行します。ホストメンテナンスポリシーを変更する方法については、VM ホストメンテナンスポリシーを設定するをご覧ください。

ライブマイグレーションプロセスとローカル SSD ディスク

Compute Engine は、ローカル SSD ディスクがアタッチされているインスタンスのライブマイグレーションができます（アタッチされている Titanium SSD が 18 TiB を超える Z3 インスタンスを除く）。Compute Engine は、計画的なメンテナンスの前に、VM インスタンスとそれに対応するローカル SSD データを新しいマシンに移行します。

制限事項

次の VM タイプでは、ライブマイグレーションはサポートされていません。

ベアメタルインスタンス。ベアメタルマシンタイプで作成されたインスタンスは、ライブマイグレーションをサポートしていません。これらのインスタンスのメンテナンス動作は、それぞれ TERMINATE と RESTART に設定されています。
ほとんどの Confidential VMs インスタンス。Confidential VM インスタンスのライブマイグレーションは、AMD SEV を実行する AMD EPYC Milan CPU プラットフォームの N2D マシンタイプでのみサポートされます。他のすべての Confidential VM インスタンスはライブマイグレーションをサポートしていないため、ホストメンテナンスイベント中に停止し、必要に応じて再起動するように設定する必要があります。詳しくは、ライブマイグレーションをご覧ください。
GPU がアタッチされている VM。GPU がアタッチされた VM インスタンスは、停止して、必要に応じて再起動するように設定する必要があります。Compute Engine は、GPU のタイプに応じて、GPU がアタッチされている VM インスタンスが停止する前に通知を行います。
- ほとんどの GPU の場合、Compute Engine は 60 分前に通知します。
- A4X、A4、A3 Ultra インスタンスの場合、Compute Engine は 10 分前に通知します。
メンテナンスイベントの通知の詳細については、メタデータサーバーにクエリを実行してメンテナンスイベント通知を取得するをご覧ください。

GPU を使用するホストのメンテナンス方法については、GPU のドキュメントのホストメンテナンスの処理をご覧ください。
Cloud TPU。Cloud TPU はライブマイグレーションをサポートしていません。
ストレージ最適化 VM。18 TiB を超える Titanium SSD がアタッチされている Z3 VM は、ライブマイグレーションをサポートしていません。これらの VM のメンテナンス動作は TERMINATE と RESTART に設定されています。Compute Engine は、インスタンス終了後のディスクの永続性で説明されているように、メンテナンスイベント中に Titanium SSD 上のデータを保持します。

ライブマイグレーションのプロセス

VM がライブマイグレーションするようスケジュール設定されている場合、Compute Engine は通知を行います。これにより、このライブマイグレーションによる停止に備えてワークロードとアプリケーションを準備できます。ライブマイグレーション中、 Google Cloud は最小の停止時間（通常は 1 秒未満）を順守します。VM がライブマイグレーションできるよう設定されていない場合、Compute Engine はホストメンテナンス中に VM を停止します。ホストイベント中に停止するよう設定されている VM は停止し、必要に応じて再起動します。

Google Cloud は実行中の VM をあるホストから別のホストに移行する場合、VM のすべての状態を、ゲスト OS やそれらと通信する対象にとって透過的な方法で移行元から移行先に移します。作業をシームレスに行うため、この移行には多くのコンポーネントが関係しますが、その概要を以下で説明します。

ゲストオペレーティングシステムを再起動せずに、VM とその各リソースを新しいホストシステムに移行する。 — ライブマイグレーションのコンポーネント

このプロセスでは、まず、現在のホストマシンから VM を強制的に移動することを通知します。BIOS の新しいバージョンのリリースを示すファイル変更、ハードウェアの定期メンテナンス、予知されるハードウェア障害による自動信号などにより通知が開始されます。

Google Cloudのクラスタ管理ソフトウェアは、これらのイベントを継続的に監視し、ストレージの使用率、1 つの顧客が同時に移行可能な VM の数などのデータセンターの制御ポリシーに基づいてプロセスのスケジュールを設定します。

VM が移行対象に選択されると、 Google Cloud はゲストに移行が近いことを通知します。待ち時間が経過すると、ターゲットホストが選択され、移行するソース VM を受け取るための、新しい、空のターゲット VM をセットアップするように求められます。ソースとターゲットの間の接続を確立するために、認証が使用されます。

VM の移行は次の 3 段階で行われます。

ソースブラウンアウト。大半の状態が移行元から移行先に送信されていますが、VM はまだ移行元で実行されています。たとえば、Google Cloud はゲストメモリをすべて移行先にコピーすると同時に、移行元で変更されたページの追跡を行っています。ソースブラウンアウトの時間は、ゲストメモリのサイズやページの変更率に比例します。
ブラックアウト。非常に短い時間ですが、VM の実行が停止します。ソース VM は一時停止状態になり、移行先での VM の再開に必要な残りの状態がすべて送信されます。ソースブラウンアウト段階で状態変更の送信が収穫逓減ポイントに達すると、VM はブラックアウト段階に入ります。ゲスト VM が変更を行う速度に応じて送信するメモリのバイト数を決定するアルゴリズムが利用されます。

注: ブラックアウトイベント中は、システムクロックが最大 5 秒先に進んでいるように見えます。ブラックアウトイベントが 5 秒を超えると、 Google Cloud は VM ゲストパッケージの一部として含まれるデーモンを使用して、クロックを停止して同期します。
ターゲットブラウンアウト。VM が移行先の VM で実行されます。この段階では移行元の VM も存在し、移行先の VM にサポートを提供します。たとえば、ネットワークファブリックが移行先の VM の最新のロケーションを取得できるまで、移行元の VM が移行先の VM にパケット転送サービスを提供します。

最後に、移行が完了し、システムによって移行元の VM が削除されます。VM の Cloud Logging ログで移行が行われたことを確認できます。

単一テナント VM のライブマイグレーション

ワークロードを実行中に、VM を別の単一テナントノードまたはノードグループに移動する必要が生じることがあります。VM をノードのグループに移動する場合、そのノードを配置するノードは Compute Engine が決定します。単一テナンシーについては、単一テナンシーの概要をご覧ください。

単一テナント VM を別のノードまたはノードグループに移動するには、ライブマイグレーションを手動で開始します。ライブマイグレーションを手動で開始して、マルチテナントホスト上の VM を単一テナントノードに移動させることもできます。詳しくは、VM を手動でライブマイグレーションするをご覧ください。

次のステップ

VM ホストメンテナンスポリシーオプションを設定して、インスタンスにライブマイグレーションを構成する。
ライブマイグレーションの通知を取得する方法を学習して、メンテナンスイベントの前に実行するタスクをトリガーできるようにします。
サービスの中断にも対応できる堅牢なシステムを設計するためのヒントを確認する。

メンテナンス イベント中のライブ マイグレーション プロセス

ライブ マイグレーション プロセスとローカル SSD ディスク