コンピューティングでの Arm VM


Google Cloud では、Compute Engine でさまざまな Arm 搭載サーバーを用意しています。Arm アーキテクチャは電力効率を重視して最適化されているため、C4A マシンシリーズは優れたコスト パフォーマンスを発揮します。

Arm プロセッサは、x86 サーバーに比べて電力効率が優れているため、標準サーバーで一般的です。スマートフォンとノートパソコンは、Arm プロセッサ上で動作するデバイスの例です。Arm CPU の命令セットが削減されることで、指示件数が少なくなり、バッテリーと消費電力を抑えながらパフォーマンスが向上します。

Google のカスタム Arm プロセッサである Axion は、Arm Neoverse V2 プロセッサをベースにしています。Neoverse V2 は、Armv9 のパフォーマンス、電力、セキュリティが強化された最初の V シリーズ CPU です。ハイ パフォーマンス コンピューティング、機械学習、汎用クラウド コンピューティング向けに設計されています。

次のいずれかの目的で、C4A 汎用 Arm 仮想マシン(VM)の使用を検討してください。

  • 必要に応じて使用量を迅速にスケーリングする必要があるコンピューティング負荷の高いワークロードを実行する場合。
  • ARM 互換のワークロードでコスト パフォーマンスを最適化する場合。
  • 最新のオープンソース ソフトウェア スタック上に構築します。
  • ARM CPU を使用するモバイル システムまたは組み込みシステムを開発してテストする場合。
  • ワークロードが ARM CPU に適しているかどうかを評価する場合。

C4A マシンシリーズ

C4A は、Google の Axion Arm64 ベースの CPU 上に構築された最初の Arm ベースの VM です。C4A には、最大 72 個の vCPU と 576 GB の DDR5-5600 メモリを備えたマシンタイプがあります。C4A は、standardhighmemhighcpu の各マシンタイプで使用できます。

C4A は Titanium 上に構築されており、ネットワーク オフロードを使用し、gVNIC ネットワーク インターフェースで VM あたり最大 100 Gbps の Tier_1 ネットワーキング パフォーマンスを実現します。C4A は、Hyperdisk Balanced ディスクと Hyperdisk Extreme ディスクを使用する NVMe ディスク インターフェースもサポートしています。

同時マルチスレッディング

C4A マシンシリーズでは、各 vCPU が、同時マルチスレッディング(SMT)が有効でない単一のコアを基盤としています。したがって、C4A VM は SMT を有効にした VM と比較して、vCPU あたりのパフォーマンスが高くなります。SMT は特定のワークロードにメリットがありますが、コンピューティング負荷の高いワークロードにはシングルスレッド コアが適しています。なぜなら、プロセスの間でコアが共有されることなく、プロセスがコア全体にアクセスできるためです。

OS イメージ

C4A VM は、Arm ベースの公開 OS イメージをサポートしています。一般公開されている Arm ベースのイメージを使用してカスタム イメージを作成することもできます。

Tau T2A マシンシリーズ

Tau T2A Arm マシンシリーズは、64 コア Ampere Altra Arm プロセッサで動作し、全コア周波数は 3.0 GHz です。Tau T2A により、Arm で最適に実行されるワークロードや、Arm で排他的に実行されるワークロードを実行できます。

Tau T2A マシンシリーズには、最大 48 個の物理コアと vCPU あたり 4 GB のメモリを備えた事前定義済みマシンタイプがあります。Tau T2A マシンタイプは、単一の NUMA ノード内で実行されます。

Tau T2A マシンタイプは、ストレージには NVMe インターフェースのみをサポートし、ネットワーキングには Google Virtual NIC(gVNIC)のみをサポートします。Virtio-Net インターフェースと SCSI インターフェースはサポートされていません。一般公開されているすべての Arm OS イメージは、NVMe インターフェースと gVNIC インターフェースを使用するように構成されています。gVNIC は、Compute Engine 専用に設計されたネットワーク インターフェースです。パフォーマンスを向させ、より高いネットワーク帯域幅とスループットをサポートします。

このマシンシリーズでは、各 vCPU が、同時マルチスレッディング(SMT)が有効でない単一のコアを基盤としています。

ワークロードの最適化案

C4A マシンシリーズは、特に費用対効果が重要な懸念事項である場合、さまざまなスケールアウト ワークロードやコンピューティング負荷の高いワークロードに最適です。次のようなワークロードをデプロイする場合は、C4A を検討してください。

  • ML データ処理
  • ML 推論とモデルのサービング
  • アプリ配信、ウェブ配信、ゲーム配信
  • 組み込みシステムの開発
  • ARM での CI / CD による開発
  • 動画と画像のエンコード、コード変換、処理
  • デジタル広告のエクスチェンジと配信
  • キャッシュ サーバー
  • コンピュータによる創薬
  • Android 開発情報
  • 自律型自動車と従来型自動車のソフトウェア開発

次のステップ