Compute Engine を使用して仮想マシン(VM)またはベアメタル インスタンスを作成する場合は、インスタンスのマシンシリーズとマシンタイプを指定します。各マシンシリーズは 1 つ以上の CPU プラットフォームに関連付けられています。マシンシリーズで使用可能な CPU プラットフォームが複数ある場合は、コンピューティング インスタンスに最小 CPU プラットフォームを選択できます。
CPU プラットフォームは複数の物理プロセッサを備えており、これらのプロセッサのそれぞれをコアと呼びます。Compute Engine で利用可能なプロセッサでは、同時マルチスレッド化(SMT)を通じて、1 つの CPU コアを複数のハードウェア スレッドとして実行できます。これはインテル プロセッサではインテル ハイパー スレッディング テクノロジーとして知られています。Compute Engine では、各ハードウェア スレッドは仮想 CPU(vCPU)と呼ばれます。C4A、T2D、H3 などの一部のマシンシリーズは SMT を使用しないため、各 vCPU はコアを表します。vCPU が異なる仮想コアを占有しているとして VM に報告されると、Compute Engine はこれらの vCPU が同じ物理コアを共有しないようにします。
コンピューティング インスタンスのマシンタイプでは、vCPU の数が指定され、そのマシンシリーズのコアレーシオあたりのデフォルトの vCPU を使用する物理 CPU コアの数を推定できます。
- C4A、Tau T2D、Tau T2A、H3 マシンシリーズの場合、VM には常に 1 コアあたり 1 つの vCPU があります。
- 他のすべてのマシンシリーズでは、コンピューティング インスタンスにはデフォルトで 1 コアあたり 2 つの vCPU があります。
必要に応じて、コアあたりのスレッド数をデフォルト以外の値に設定できます。これにより、一部のワークロードにメリットがある場合があります。重要なこととして、この操作を行うと、コンピューティング インスタンスのマシンタイプに正しい数の vCPU が反映されません。代わりに、料金と物理 CPU コアの数は、コアあたりのデフォルトの 2 つの vCPU と同じままで、vCPU の数は、マシンタイプで示される値の半分です。
Arm プロセッサ
Arm プロセッサの場合、Compute Engine は 1 コアあたり 1 つのスレッドを使用します。各 vCPU は、SMT のない物理コアにマッピングされます。
次の表に、Compute Engine インスタンスで使用できる Arm プロセッサを示します。
CPU プロセッサと SKU | サポートされているマシンシリーズとマシンタイプ |
---|---|
Google Axion™ プロセッサ | C4A |
Ampere Altra Q64-30 | Tau T2A |
x86 プロセッサ
ほとんどの x86 プロセッサでは、各 vCPU は単一のハードウェア スレッドとして実装されます。H3 マシンシリーズは例外で、1 つの vCPU が 1 つの物理コアを表します。
Intel プロセッサ
インテル Xeon プロセッサでは、インテル ハイパー スレッディング テクノロジーにより、各コアで同時に実行される複数のスレッドがサポートされます。vCPU の数とメモリは、コンピューティング インスタンスのマシンタイプによって決まります。
CPU プロセッサ | プロセッサ SKU | サポートされているマシンシリーズとマシンタイプ | 基本周波数(GHz) | 全コアターボ周波数(GHz) | シングルコア最大ターボ周波数(GHz) |
---|---|---|---|---|---|
インテル Xeon スケーラブル プロセッサ (Emerald Rapids) 第 5 世代 |
|||||
インテル® Xeon® Platinum 8581C プロセッサ |
2.3 | 3.1 | 4.0 | ||
インテル® Xeon® Platinum 8581C プロセッサ |
2.1 | 2.9 | 3.3 | ||
インテル Xeon スケーラブル プロセッサ (Sapphire Rapids) 第 4 世代 |
インテル® Xeon® プラチナ 8490H プロセッサ | 1.9 | 2.9 | 3.5 | |
インテル® Xeon® プラチナ 8481C プロセッサ | 2.2 | 3.0 | 3.0 | ||
インテル® Xeon® プラチナ 8481C プロセッサ | 2.0 | 3.8 | 2.9 | ||
インテル Xeon スケーラブル プロセッサ(Ice Lake) 第 3 世代 |
インテル® Xeon® プラチナ 8373C プロセッサ |
2.6 | 3.4 | 3.5 | |
Intel Xeon スケーラブル プロセッサ(Cascade Lake) 第 2 世代 |
|||||
インテル® Xeon® ゴールド 6268CL プロセッサ | 2.8 | 3.4 | 3.9 | ||
インテル® Xeon® ゴールド 6253CL プロセッサ | 3.1 | 3.8 | 3.9 | ||
インテル® Xeon® プラチナ 8280L プロセッサ | 2.5 | 3.4 | 4.0 | ||
インテル® Xeon® プラチナ 8273CL プロセッサ | 2.2 | 2.9 | 3.7 | ||
Intel Xeon スケーラブル プロセッサ(Skylake) 第 1 世代 |
インテル® Xeon® スケーラブル プラチナ 8173M プロセッサ | 2.0 | 2.7 | 3.5 | |
インテル Xeon E7(Broadwell E7) | インテル® Xeon® E7-8880V4 プロセッサ | 2.2 | 2.6 | 3.3 | |
インテル Xeon E5 v4(Broadwell E5) | インテル® Xeon® E5-2696V4 プロセッサ | 2.2 | 2.8 | 3.7 | |
インテル Xeon E5 v3(Haswell) | インテル® Xeon® E5-2696V3 プロセッサ | 2.3 | 2.8 | 3.8 | |
インテル Xeon E5 v2(Ivy Bridge) | インテル® Xeon® E5-2696V2 プロセッサ | 2.5 | 3.1 | 3.5 | |
インテル Xeon E5(Sandy Bridge) | インテル® Xeon® E5-2689 プロセッサ | 2.6 | 3.2 | 3.6 |
*96 個以上の vCPU を備えた N2 マシンタイプには Intel Ice Lake CPU が必要です。
AMD プロセッサ
AMD プロセッサは、SMT を使用してパフォーマンスとスケーラビリティを最適化します。ほとんどの場合、Compute Engine はコアあたり 2 つのスレッドを使用し、各 vCPU は 1 スレッドです。Tau T2D は例外で、Compute Engine がコアごとに 1 つのスレッドを使用し、各 vCPU が物理コアにマッピングされます。vCPU の数とメモリは、コンピューティング インスタンスのマシンタイプによって決まります。
CPU プロセッサ | プロセッサ SKU | サポートされているマシンシリーズ | 基本周波数(GHz) | 有効周波数(GHz) | 最大ブースト周波数(GHz) |
---|---|---|---|---|---|
AMD EPYC Genoa 第 4 世代 |
AMD EPYC™ 9B14 | 2.6 | 3.3 | 3.7 | |
AMD EPYC Milan 第 3 世代 |
AMD EPYC™ 7B13 | 2.45 | 2.8 | 3.5 | |
AMD EPYC Rome 第 2 世代 |
AMD EPYC™ 7B12 | 2.25 | 2.7 | 3.3 |
周波数特性
上記の表では、Compute Engine で使用可能な CPU のハードウェア仕様について説明していますが、次の点に注意してください。
周波数: PC の周波数(クロック速度)は、CPU が 1 秒間に実行するサイクル数を GHz(ギガヘルツ)で測定したものです。一般に、周波数が高いほどパフォーマンスが高いことを示します。ただし、CPU の設計によって命令の処理方法が異なるため、クロック速度が低い新しい CPU のほうが新しいアーキテクチャで命令が効率的に処理され、クロック速度が高い古い CPU よりもパフォーマンスが高くなることがあります。
基本周波数: システムがアイドル状態または負荷が小さいときの CPU の動作周波数。基本周波数で実行すると、CPU では、電力消費は減少し、発熱が抑えられます。
コンピューティング インスタンスのゲスト環境では、CPU の実際の動作周波数に関係なく、基本周波数が反映されています。
全コアターボ周波数: ソケット内のすべてのコアが同時にアクティブである場合の、各 CPU の一般的な動作周波数。ワークロードが異なれば、システムの CPU に対する要求も異なります。Boost テクノロジーは、この違いに対応し、CPU の周波数を上げて、プロセスがワークロードの需要に適応できるようにします。
- ゲスト環境には基本周波数しかアドバタイズされない状態でも、ほとんどのコンピューティング インスタンスは全コアターボ時の周波数を取得します。
- Arm プロセッサの周波数は常に全コアターボ周波数であるため、Ampere Altra Arm プロセッサではパフォーマンスが予測しやすくなります。
- C4 VM は、AdvancedMachineFeature フィールドを
ALL_CORE_MAX
に設定することで、全コア最大ターボ周波数で実行できます。このフィールドが設定されていない場合、VM はデフォルトの設定(制限なしの周波数)で実行されます。
最大ターボ周波数: ビデオゲームやデザイン モデリング アプリケーションなど、要求の厳しいアプリケーションによって負荷がかけられる CPU のターゲット周波数。これは、オーバークロックなしで CPU が達成する最大シングルコア周波数です。
プロセッサの電力管理技術: インテルのプロセッサは、複数のテクノロジーをサポートして、電力消費を最適化します。これらのテクノロジーは 2 つのカテゴリまたは状態に分類されます。
- C-State は、CPU が選択された機能を削減または無効にしたときの状態です。
- P-State では、CPU の電力消費を低減するために、プロセッサが動作する周波数と電圧をスケーリングする方法が提供されます。
すべての C4 マシンタイプと、特定の C2(30、60 vCPU)、C2D(56、112 vCPU)、M2(208、416 vCPU)マシンタイプは、
MWAIT
命令によりインスタンスが提供する C-State のヒントをサポートしています。Compute Engine インスタンスには、お客様が P-State を制御するための機能はありません。
CPU 機能
半導体メーカーは、製造する CPU に計算、グラフィック、仮想化、メモリ管理のための高度なテクノロジーを追加します。 Google Cloudでは、これらの高度な機能のいくつかを Compute Engine で使用できます。
Advanced Vector Extensions
Advanced Vector Extensions(AVX)は、Intel と Advanced Micro Devices(AMD)のマイクロプロセッサ向けの x86 命令セット アーキテクチャに対する単一命令、複数データ(SIMD)拡張機能です。AVX は、新しい命令と新しいコーディング スキームを提供します。
詳細については、Advanced Vector Extensions をご覧ください。
AVX は、Compute Engine で使用されるすべての x86 プロセッサで使用できます。
Advanced Vector Extensions(AVX2)
AVX2(Haswell 新命令とも呼ばれます)では、AVX に次の追加機能が導入されています。
- ほとんどのベクトル整数 SSE 命令と AVX 命令を 256 ビットに拡張
- Gather のサポートを追加し、非連続のメモリ位置からのベクトル要素の読み込みが可能に
- DWORD と QWORD の粒度で任意の値同士を並べ替える
- ベクトルシフト
AVX2 は、次の CPU プラットフォームで使用できます。
- Intel Xeon E5 v3(Haswell)以降のプロセッサ
- すべての AMD プロセッサ
Advanced Vector Extensions(AVX512)
AVX-512 は、EVEX プレフィックス エンコードを使用して AVX を 512 ビットサポートに拡張します。AVX-512 は、負荷の高いベクトルベースの処理を伴う要求の厳しいワークロードに、組み込みのアクセラレーションを提供します。AVX-512 アクセラレータの大規模レジスタは、8 個の 64 ビット整数と 16 個の 32 ビット整数に加えて、32 個の倍精度浮動小数点数と 64 個の単精度浮動小数点数をサポートしています。
AVX-512 の詳細については、Intel AVX-512 とは何ですか?をご覧ください。
AVX-512 は、次の CPU プラットフォームで使用できます。
- Intel Xeon スケーラブル プロセッサ(Skylake)第 1 世代以降のプロセッサ
- AMD EPYC Genoa 第 4 世代プロセッサ
Advanced Matrix Extensions
Intel Advanced Matrix Extensions(AMX)は、人工知能(AI)ワークロードと ML ワークロードを高速化するように設計された新しい命令セット アーキテクチャ(ISA)です。AMX では、AI と ML で最もよく使用される 2 つの行列乗算と畳み込み演算に使用できる新しい命令が導入されています。
AMX では、アクセラレータがオペレーションを実行できるように、タイルと呼ばれる 2 次元のレジスタが導入されています。AMX は拡張可能なアーキテクチャを前提としています。最初に実装されるアクセラレータは、タイル マトリックス乗算ユニット(TMUL)と呼ばれます。Sapphire Rapids プロセッサの各 CPU コアには、独立した AMX TMUL ユニットがあります。
Intel AMX の技術的な詳細については、5.16 の Intel AMX サポートをご覧ください。Intel では、コードサンプル: Intel® Advanced Matrix Extensions(Intel® AMX)- Intrinsics Functions で AMX に関するチュートリアルを提供しています。
AMX は、第 4 世代 Intel Xeon(Sapphire Rapids)以降のプロセッサで使用できます。AMX は AMD プロセッサまたは Arm プロセッサでは使用できません。
AMX を使用するための要件
インテル AMX 命令には、次のような最小ソフトウェア要件があります。
- カスタム イメージの場合、AMX は Linux カーネル バージョン 5.16 以降でサポートされています。
- Compute Engine では、次の公開イメージで AMX をサポートしています。
- CentOS Stream 8 以降
- Container-Optimized OS 109 LTS(またはそれ以降)
- RHEL 8(最新ビルド)以降
- Rocky Linux 8(最新ビルド)以降
- Ubuntu 22.04 以降
- Windows Server 2022 以降
- Tensorflow 2.9.1 以降
- PyTorch のインテル® 最適化用のインテル拡張機能
C4 VM と C3 VM を利用できるリージョンについては、使用可能なリージョンとゾーンを参照し、C4 または C3 マシンタイプのみが表示されるようにテーブルをフィルタします。
ベアメタル インスタンスで利用可能な CPU 機能
第 4 世代 Intel Xeon スケーラブル プロセッサで実行されるベアメタル インスタンスは、サーバーのすべての未加工コンピューティング リソースを提供できるだけでなく、機能固有の複数のオンボード アクセラレータとオフロードを使用できます。
- Intel-QAT: Intel QuickAssist Technology(Intel QAT)は、圧縮、暗号化、復号を高速化します。
- Intel-DLB: Intel Dynamic Load Balancer(Intel DLB)は、データキューの高速化に役立ちます。
- Intel IAA: Intel In-Memory Analytics Accelerator(Intel IAA)は、クエリ処理のパフォーマンスを向上させます。
- Intel DSA: Intel Data Streaming Accelerator(Intel DSA)は、データをより高速にコピーおよび移動するのに役立ちます。
Confidential Computing
使用中のデータを保護するため、Confidential Computing テクノロジーをサポートする CPU プラットフォームを使用して、Confidential VM インスタンスを作成できます。
Confidential VM インスタンスの作成要件の詳細については、サポートされている構成をご覧ください。
次のステップ
- マシン ファミリーの詳細を確認する。
- 仮想マシン インスタンスの詳細を確認する。
- イメージの詳細を確認する。
- 最小 CPU プラットフォームの指定方法を確認する。
使ってみる
Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
Compute Engine の無料トライアル