このページは Cloud Translation API によって翻訳されました。

CPU プラットフォーム

Compute Engine を使用して仮想マシン（VM）またはベアメタルインスタンスを作成する場合は、インスタンスのマシンシリーズとマシンタイプを指定します。各マシンシリーズは 1 つ以上の CPU プラットフォームに関連付けられています。マシンシリーズで使用可能な CPU プラットフォームが複数ある場合は、コンピューティングインスタンスに最小 CPU プラットフォームを選択できます。

CPU プラットフォームは複数の物理プロセッサを備えており、これらのプロセッサのそれぞれをコアと呼びます。Compute Engine で利用可能なプロセッサでは、同時マルチスレッド化（SMT）を通じて、1 つの CPU コアを複数のハードウェアスレッドとして実行できます。これはインテルプロセッサではインテルハイパースレッディングテクノロジーとして知られています。Compute Engine では、各ハードウェアスレッドは仮想 CPU（vCPU）と呼ばれます。C4A、T2D、H4D、H3 などの一部のマシンシリーズは SMT を使用しないため、各 vCPU はコアを表します。vCPU が異なる仮想コアを占有しているとしてインスタンスに報告されると、Compute Engine はこれらの vCPU が同じ物理コアを共有していないことを検証します。

コンピューティングインスタンスのマシンタイプでは、vCPU の数が指定され、そのマシンシリーズのコアレーシオあたりのデフォルトの vCPU を使用する物理 CPU コアの数を推定できます。

C4A、T2D、T2A、H4D（プレビュー）、H3、A4X マシンシリーズの場合、Compute Engine インスタンスには常に 1 コアあたり 1 つの vCPU があります。
他のすべてのマシンシリーズでは、コンピューティングインスタンスにはデフォルトで 1 コアあたり 2 つの vCPU があります。

必要に応じて、コアあたりのスレッド数をデフォルト以外の値に設定できます。これにより、一部のワークロードにメリットがある場合があります。重要なこととして、この操作を行うと、コンピューティングインスタンスのマシンタイプに正しい数の vCPU が反映されません。代わりに、料金と物理 CPU コアの数は、コアあたりのデフォルトの 2 つの vCPU と同じままで、vCPU の数は、マシンタイプで示される値の半分です。

Arm プロセッサ

Arm プロセッサの場合、Compute Engine は 1 コアあたり 1 つのスレッドを使用します。各 vCPU は、SMT のない物理コアにマッピングされます。

次の表に、Compute Engine インスタンスで使用できる Arm プロセッサを示します。

CPU プロセッサ	プロセッサ SKU	サポートされているマシンシリーズとマシンタイプ
Arm Neoverse V2 コア搭載の NVIDIA Grace プロセッサ	スーパーチップ	A4X
Google Axion プロセッサ		C4A
Ampere Altra	Q64-30	Tau T2A

x86 プロセッサ

ほとんどの x86 プロセッサでは、各 vCPU は単一のハードウェアスレッドとして実装されます。H3 マシンシリーズは例外で、1 つの vCPU が 1 つの物理コアを表します。

Intel プロセッサ

インテル Xeon プロセッサでは、インテルハイパースレッディングテクノロジーにより、各コアで同時に実行される複数のスレッドがサポートされます。vCPU の数とメモリは、コンピューティングインスタンスのマシンタイプによって決まります。

CPU プロセッサ	プロセッサ SKU	サポートされているマシンシリーズとマシンタイプ	基本周波数（GHz）	全コアターボ周波数（GHz）	シングルコア最大ターボ周波数（GHz）
Intel Xeon スケーラブルプロセッサ（Granite Rapids）第 6 世代
Intel Xeon スケーラブルプロセッサ（Granite Rapids）第 6 世代	インテル Xeon プラチナ 6985P-C プロセッサ	C4	2.8¹	3.9	4.2
インテル Xeon スケーラブルプロセッサ（Emerald Rapids）第 5 世代
	インテル Xeon プラチナ 8581C プロセッサ	A4 A3 Ultra M4	2.1	2.9	4.0
		C4	2.3	3.1	4.0
		N4	2.1	2.9	3.3
インテル Xeon スケーラブルプロセッサ（Sapphire Rapids）第 4 世代	インテル Xeon プラチナ 8490H プロセッサ	X4	1.9	2.9	3.5
	インテル Xeon プラチナ 8481C プロセッサ	C3 Z3 H3	2.2	3.0	3.0
		Z3 ベアメタル	2.2	3.0	3.8
		A3 Mega A3 High A3 Edge	2.0	3.8	2.9
インテル Xeon スケーラブルプロセッサ（Ice Lake）第 3 世代	インテル Xeon プラチナ 8373C プロセッサ	N2² M3	2.6	3.4	3.5
Intel Xeon スケーラブルプロセッサ（Cascade Lake）第 2 世代
	インテル Xeon ゴールド 6268CL プロセッサ	N2²	2.8	3.4	3.9
	インテル Xeon ゴールド 6253CL プロセッサ	C2	3.1	3.8	3.9
	インテル Xeon プラチナ 8280L プロセッサ	M2	2.5	3.4	4.0
	インテル Xeon プラチナ 8273CL プロセッサ	A2 G2	2.2	2.9	3.7
Intel Xeon スケーラブルプロセッサ（Skylake）第 1 世代	インテル Xeon スケーラブルプラチナ 8173M プロセッサ	E2 `m1-megamem` メモリ最適化マシンタイプ N1	2.0	2.7	3.5
インテル Xeon E7（Broadwell E7）	インテル Xeon E7-8880V4 プロセッサ	`m1-ultramem` メモリ最適化マシンタイプ	2.2	2.6	3.3
インテル Xeon E5 v4（Broadwell E5）	インテル Xeon E5-2696V4 プロセッサ	E2 N1	2.2	2.8	3.7
インテル Xeon E5 v3（Haswell）	インテル Xeon E5-2696V3 プロセッサ	N1	2.3	2.8	3.8
インテル Xeon E5 v2（Ivy Bridge）	インテル Xeon E5-2696V2 プロセッサ	N1	2.5	3.1	3.5
インテル Xeon E5（Sandy Bridge）	インテル Xeon E5-2689 プロセッサ	N1	2.6	3.2	3.6

¹Intel Granite Rapids CPU を使用する C4 マシンタイプの基本周波数は 2.8 ですが、vPMU は互換性のために 2.3 を提示します。

^*96 個以上の vCPU を備えた N2 マシンタイプには Intel Ice Lake CPU が必要です。

AMD プロセッサ

AMD プロセッサは、SMT を使用してパフォーマンスとスケーラビリティを最適化します。ほとんどの場合、Compute Engine はコアあたり 2 つのスレッドを使用し、各 vCPU は 1 スレッドです。H4D と Tau T2D は例外で、Compute Engine がコアごとに 1 つのスレッドを使用し、各 vCPU が物理コアにマッピングされます。コンピューティングインスタンスのマシンタイプによって、インスタンスに割り当てられる vCPU の数とメモリ量が決まります。

CPU プロセッサ	プロセッサ SKU	サポートされているマシンシリーズ	基本周波数（GHz）	有効周波数（GHz）	最大ブースト周波数（GHz）
AMD EPYC Turin 第 5 世代	AMD EPYC 9B45	C4D G4 H4D（プレビュー）	2.7	3.5	4.1
AMD EPYC Genoa 第 4 世代	AMD EPYC 9B14	C3D	2.6	3.3	3.7
AMD EPYC Milan 第 3 世代	AMD EPYC 7B13	E2 Tau T2D N2D C2D	2.45	2.8	3.5
AMD EPYC Rome 第 2 世代	AMD EPYC 7B12	E2 N2D	2.25	2.7	3.3

周波数特性

上記の表では、Compute Engine で使用可能な CPU のハードウェア仕様について説明していますが、次の点に注意してください。

周波数: PC の周波数（クロック速度）は、CPU が 1 秒間に実行するサイクル数を GHz（ギガヘルツ）で測定したものです。一般に、周波数が高いほどパフォーマンスが高いことを示します。ただし、CPU の設計によって命令の処理方法が異なるため、クロック速度が低い新しい CPU のほうが新しいアーキテクチャで命令が効率的に処理され、クロック速度が高い古い CPU よりもパフォーマンスが高くなることがあります。
基本周波数: システムがアイドル状態または負荷が小さいときの CPU の動作周波数。基本周波数で実行すると、CPU では、電力消費は減少し、発熱が抑えられます。

コンピューティングインスタンスのゲスト環境では、CPU の実際の動作周波数に関係なく、基本周波数が反映されています。
全コアターボ周波数: ソケット内のすべてのコアが同時にアクティブである場合の、各 CPU の一般的な動作周波数。ワークロードが異なれば、システムの CPU に対する要求も異なります。Boost テクノロジーは、この違いに対応し、CPU の周波数を上げて、プロセスがワークロードの需要に適応できるようにします。
- ゲスト環境には基本周波数しかアドバタイズされない状態でも、ほとんどのコンピューティングインスタンスは全コアターボ時の周波数を取得します。
- Arm プロセッサの周波数は常に全コアターボ周波数であるため、Ampere Altra Arm プロセッサではパフォーマンスが予測しやすくなります。
- C4 インスタンスは、AdvancedMachineFeature フィールドを ALL_CORE_MAX に設定することで、全コア最大ターボ周波数で実行できます。このフィールドが設定されていない場合、インスタンスはデフォルトの設定（制限なしの周波数）で実行されます。
  
  ALL_CORE_MAX 設定は、C4D コンピューティングインスタンスまたは C4A コンピューティングインスタンスでは使用できません。
最大ターボ周波数: ビデオゲームやデザインモデリングアプリケーションなど、要求の厳しいアプリケーションによって負荷がかけられる CPU のターゲット周波数。これは、オーバークロックなしで CPU が達成する最大シングルコア周波数です。
プロセッサの電力管理技術: インテルのプロセッサは、複数のテクノロジーをサポートして、電力消費を最適化します。これらのテクノロジーは 2 つのカテゴリまたは状態に分類されます。
- C-State は、CPU が選択された機能を削減または無効にしたときの状態です。
- P-State では、CPU の電力消費を低減するために、プロセッサが動作する周波数と電圧をスケーリングする方法が提供されます。
すべての C4 マシンタイプと、特定の C2（30、60 vCPU）、C2D（56、112 vCPU）、M2（208、416 vCPU）マシンタイプは、MWAIT 命令によりインスタンスが提供する C-State のヒントをサポートしています。

Compute Engine インスタンスには、お客様が P-State を制御するための機能はありません。

CPU 機能

半導体メーカーは、製造する CPU に計算、グラフィック、仮想化、メモリ管理のための高度なテクノロジーを追加します。 Google Cloudでは、これらの高度な機能のいくつかを Compute Engine で使用できます。

Advanced Vector Extensions

Advanced Vector Extensions（AVX）は、Intel と Advanced Micro Devices（AMD）のマイクロプロセッサ向けの x86 命令セットアーキテクチャに対する単一命令、複数データ（SIMD）拡張機能です。AVX は、新しい命令と新しいコーディングスキームを提供します。

詳細については、Advanced Vector Extensions をご覧ください。

AVX は、Compute Engine で使用されるすべての x86 プロセッサで使用できます。

Advanced Vector Extensions（AVX2）

AVX2（Haswell 新命令とも呼ばれます）では、AVX に次の追加機能が導入されています。

ほとんどのベクトル整数 SSE 命令と AVX 命令を 256 ビットに拡張
Gather のサポートを追加し、非連続のメモリ位置からのベクトル要素の読み込みが可能に
DWORD と QWORD の粒度で任意の値同士を並べ替える
ベクトルシフト

AVX2 は、次の CPU プラットフォームで使用できます。

Intel Xeon E5 v3（Haswell）以降のプロセッサ
すべての AMD プロセッサ

Advanced Vector Extensions（AVX512）

AVX-512 は、EVEX プレフィックスエンコードを使用して AVX を 512 ビットサポートに拡張します。AVX-512 は、負荷の高いベクトルベースの処理を伴う要求の厳しいワークロードに、組み込みのアクセラレーションを提供します。AVX-512 アクセラレータの大規模レジスタは、8 個の 64 ビット整数と 16 個の 32 ビット整数に加えて、32 個の倍精度浮動小数点数と 64 個の単精度浮動小数点数をサポートしています。

AVX-512 の詳細については、Intel AVX-512 とは何ですか？をご覧ください。

AVX-512 は、次の CPU プラットフォームで使用できます。

Intel Xeon スケーラブルプロセッサ（Skylake）第 1 世代以降のプロセッサ
AMD EPYC Genoa 第 4 世代以降のプロセッサ

Advanced Matrix Extensions

Intel Advanced Matrix Extensions（AMX）は、人工知能（AI）ワークロードと ML ワークロードを高速化するように設計された新しい命令セットアーキテクチャ（ISA）です。AMX では、AI と ML で最もよく使用される 2 つの行列乗算と畳み込み演算に使用できる新しい命令が導入されています。

AMX では、アクセラレータがオペレーションを実行できるように、タイルと呼ばれる 2 次元のレジスタが導入されています。AMX は拡張可能なアーキテクチャを前提としています。最初に実装されるアクセラレータは、タイルマトリックス乗算ユニット（TMUL）と呼ばれます。Sapphire Rapids プロセッサの各 CPU コアには、独立した AMX TMUL ユニットがあります。

Intel AMX の技術的な詳細については、5.16 の Intel AMX サポートをご覧ください。Intel では、コードサンプル: Intel Advanced Matrix Extensions（Intel AMX）- Intrinsics Functions で AMX に関するチュートリアルを提供しています。

AMX は、第 4 世代 Intel Xeon（Sapphire Rapids）以降のプロセッサで使用できます。AMX は AMD プロセッサまたは Arm プロセッサでは使用できません。

AMX を使用するための要件

インテル AMX 命令には、次のような最小ソフトウェア要件があります。

カスタムイメージの場合、AMX は Linux カーネルバージョン 5.16 以降でサポートされています。
Compute Engine では、次の公開イメージで AMX をサポートしています。
- CentOS Stream 9
- Container-Optimized OS 109 LTS（またはそれ以降）
- RHEL 8（最新ビルド）以降
- Rocky Linux 8（最新ビルド）以降
- Ubuntu 22.04 以降
- Windows Server 2022 以降
Tensorflow 2.9.1 以降
PyTorch のインテル最適化用のインテル拡張機能

ベアメタルインスタンスで利用可能な CPU 機能

第 4 世代以降の Intel Xeon スケーラブルプロセッサで実行されるベアメタルインスタンスは、サーバーのすべての未加工コンピューティングリソースを提供できるだけでなく、機能固有の複数のオンボードアクセラレータとオフロードを使用できます。

Intel-QAT: Intel QuickAssist Technology（Intel QAT）は、圧縮、暗号化、復号を高速化します。
Intel-DLB: Intel Dynamic Load Balancer（Intel DLB）は、データキューの高速化に役立ちます。
Intel IAA: Intel In-Memory Analytics Accelerator（Intel IAA）は、クエリ処理のパフォーマンスを向上させます。
Intel DSA: Intel Data Streaming Accelerator（Intel DSA）は、データをより高速にコピーおよび移動するのに役立ちます。

Confidential Computing

使用中のデータを保護するため、Confidential Computing テクノロジーをサポートする CPU プラットフォームを使用して、Confidential VM インスタンスを作成できます。

Confidential VM インスタンスの作成要件の詳細については、サポートされている構成をご覧ください。

次のステップ

マシンファミリーの詳細を確認する。
Compute Engine インスタンスの詳細を確認する。
イメージの詳細を確認する。
最小 CPU プラットフォームの指定方法を確認する。

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル