CPU プラットフォーム


Compute Engine を使用して仮想マシン(VM)またはベアメタル インスタンスを作成する場合は、インスタンスのマシンシリーズとマシンタイプを指定します。各マシンシリーズは 1 つ以上の CPU プラットフォームに関連付けられています。マシンシリーズで使用可能な CPU プラットフォームが複数ある場合は、コンピューティング インスタンスに最小 CPU プラットフォームを選択できます。

CPU プラットフォームは複数の物理プロセッサを備えており、これらのプロセッサのそれぞれをコアと呼びます。Compute Engine で利用可能なプロセッサでは、同時マルチスレッド化(SMT)を通じて、1 つの CPU コアを複数のハードウェア スレッドとして実行できます。これはインテル プロセッサではインテル ハイパー スレッディング テクノロジーとして知られています。Compute Engine では、各ハードウェア スレッドは仮想 CPU(vCPU)と呼ばれます。C4A、T2D、H3 などの一部のマシンシリーズは SMT を使用しないため、各 vCPU はコアを表します。vCPU が異なる仮想コアを占有しているとして VM に報告されると、Compute Engine はこれらの vCPU が同じ物理コアを共有しないようにします。

コンピューティング インスタンスのマシンタイプでは、vCPU の数が指定され、そのマシンシリーズのコアレーシオあたりのデフォルトの vCPU を使用する物理 CPU コアの数を推定できます。

  • C4A、Tau T2D、Tau T2A、H3 マシンシリーズの場合、VM には常にコアあたり 1 つの vCPU があります。
  • 他のすべてのマシンシリーズでは、コンピューティング インスタンスにはデフォルトで 1 コアあたり 2 つの vCPU があります。

必要に応じて、コアあたりのスレッド数をデフォルト以外の値に設定できます。これにより、一部のワークロードにメリットがある場合があります。重要なこととして、この操作を行うと、コンピューティング インスタンスのマシンタイプに正しい数の vCPU が反映されません。代わりに、料金と物理 CPU コアの数は、コアあたりのデフォルトの 2 つの vCPU と同じままで、vCPU の数は、マシンタイプで示される値の半分です。

Arm プロセッサ

Arm プロセッサの場合、Compute Engine は 1 コアあたり 1 つのスレッドを使用します。各 vCPU は、SMT のない物理コアにマッピングされます。

次の表に、Compute Engine インスタンスで使用できる Arm プロセッサを示します。

CPU プロセッサと SKU サポートされているマシンシリーズとマシンタイプ
Google Axion™ プロセッサ C4A
Ampere Altra Q64-30 Tau T2A

x86 プロセッサ

ほとんどの x86 プロセッサでは、各 vCPU は単一のハードウェア スレッドとして実装されます。H3 マシンシリーズは例外で、1 つの vCPU が 1 つの物理コアを表します。

Intel プロセッサ

インテル Xeon プロセッサでは、インテル ハイパー スレッディング テクノロジーにより、各コアで同時に実行される複数のスレッドがサポートされます。vCPU の数とメモリは、コンピューティング インスタンスのマシンタイプによって決まります。

CPU プロセッサ プロセッサ SKU サポートされているマシンシリーズとマシンタイプ 基本周波数(GHz) 全コアターボ周波数(GHz) シングルコア最大ターボ周波数(GHz)
インテル Xeon スケーラブル プロセッサ
(Emerald Rapids)
第 5 世代
インテル® Xeon® Platinum 8581C プロセッサ
2.3 3.1 4.0
インテル® Xeon® Platinum 8581C プロセッサ
2.1 2.9 3.3
インテル Xeon スケーラブル プロセッサ
(Sapphire Rapids)
第 4 世代
インテル® Xeon® プラチナ 8490H プロセッサ 1.9 2.9 3.5
インテル® Xeon® プラチナ 8481C プロセッサ 2.2 3.0 3.0
インテル® Xeon® プラチナ 8481C プロセッサ 2.0 3.8 2.9
インテル Xeon スケーラブル プロセッサ(Ice Lake)
第 3 世代
インテル® Xeon®
プラチナ 8373C プロセッサ
2.6 3.4 3.5
Intel Xeon スケーラブル プロセッサ(Cascade Lake)
第 2 世代
インテル® Xeon® ゴールド 6268CL プロセッサ 2.8 3.4 3.9
インテル® Xeon® ゴールド 6253CL プロセッサ 3.1 3.8 3.9
インテル® Xeon® プラチナ 8280L プロセッサ 2.5 3.4 4.0
インテル® Xeon® プラチナ 8273CL プロセッサ 2.2 2.9 3.7
Intel Xeon スケーラブル プロセッサ(Skylake)
第 1 世代
インテル® Xeon® スケーラブル プラチナ 8173M プロセッサ 2.0 2.7 3.5
インテル Xeon E7(Broadwell E7) インテル® Xeon® E7-8880V4 プロセッサ 2.2 2.6 3.3
インテル Xeon E5 v4(Broadwell E5) インテル® Xeon® E5-2696V4 プロセッサ 2.2 2.8 3.7
インテル Xeon E5 v3(Haswell) インテル® Xeon® E5-2696V3 プロセッサ 2.3 2.8 3.8
インテル Xeon E5 v2(Ivy Bridge) インテル® Xeon® E5-2696V2 プロセッサ 2.5 3.1 3.5
インテル Xeon E5(Sandy Bridge) インテル® Xeon® E5-2689 プロセッサ 2.6 3.2 3.6

*96 個以上の vCPU を備えた N2 マシンタイプには Intel Ice Lake CPU が必要です。

AMD プロセッサ

AMD プロセッサは、SMT を使用してパフォーマンスとスケーラビリティを最適化します。ほとんどの場合、Compute Engine はコアあたり 2 つのスレッドを使用し、各 vCPU は 1 スレッドです。Tau T2D は例外で、Compute Engine がコアごとに 1 つのスレッドを使用し、各 vCPU が物理コアにマッピングされます。vCPU の数とメモリは、コンピューティング インスタンスのマシンタイプによって決まります。

CPU プロセッサ プロセッサ SKU サポートされているマシンシリーズ 基本周波数(GHz) 有効周波数(GHz) 最大ブースト周波数(GHz)
AMD EPYC Genoa
第 4 世代
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milan
第 3 世代
AMD EPYC™ 7B13 2.45 2.8 3.5
AMD EPYC Rome
第 2 世代
AMD EPYC™ 7B12 2.25 2.7 3.3

周波数特性

上記の表では、Compute Engine で使用可能な CPU のハードウェア仕様について説明していますが、次の点に注意してください。

  • 周波数: PC の周波数(クロック速度)は、CPU が 1 秒間に実行するサイクル数を GHz(ギガヘルツ)で測定したものです。一般に、周波数が高いほどパフォーマンスが高いことを示します。ただし、CPU の設計によって命令の処理が異なるため、新しいアーキテクチャでは命令が効率的に処理されるため、クロック速度が高い古い CPU のほうが新しいクロック速度で処理できることがあります。

  • 基本周波数: システムがアイドル状態または負荷が小さい場合に CPU が実行している周波数。基本周波数で実行すると、CPU では、電力消費は減少し、発熱が抑えられます。

    コンピューティング インスタンスのゲスト環境では、CPU の実際の動作周波数に関係なく、基本周波数が反映されています。

  • 全コアターボ周波数: ソケット内のすべてのコアが同時にアクティブである場合の、各 CPU の一般的な動作周波数。ワークロードが異なれば、システムの CPU に対する要求も異なります。Boost テクノロジーは、この違いに対応し、CPU の周波数を上げて、プロセスがワークロードの需要に適応できるようにします。

    • ゲスト環境には基本周波数しかアドバタイズされない状態でも、ほとんどのコンピューティング インスタンスは全コアターボ時の周波数を取得します。
    • Arm プロセッサの周波数は常に全コアターボ周波数であるため、Ampere Altra Arm プロセッサではパフォーマンスが予測しやすくなります。
    • C4 VM は、AdvancedMachineFeature フィールドを ALL_CORE_MAX に設定することで、全コア最大ターボ周波数で実行できます。このフィールドが設定されていない場合、VM はデフォルトの設定(制限なしの周波数)で実行されます。
  • 最大ターボ周波数: ビデオゲームやデザイン モデリング アプリケーションなど、要求の厳しいアプリケーションによって負荷がかけられる CPU のターゲット周波数。これは、オーバークロックなしで CPU が達成する最大シングルコア周波数です。

  • プロセッサの電力管理技術: インテルのプロセッサは、複数のテクノロジーをサポートして、電力消費を最適化します。これらのテクノロジーは 2 つのカテゴリまたは状態に分類されます。

    • C-State は、CPU が選択された機能を削減または無効にしたときの状態です。
    • P-State では、CPU の電力消費を低減するために、プロセッサが動作する周波数と電圧をスケーリングする方法が提供されます。

    すべての C4 マシンタイプと、特定の C2(30、60 vCPU)、C2D(56、112 vCPU)、M2(208、416 vCPU)マシンタイプは、MWAIT 命令によりインスタンスが提供する C-State のヒントをサポートしています。

    Compute Engine インスタンスには、お客様が P-State を制御するための機能はありません。

CPU 機能

半導体メーカーは、製造する CPU に計算、グラフィック、仮想化、メモリ管理のための高度なテクノロジーを追加します。Google Cloud では、これらの高度な機能のいくつかを Compute Engine で使用できます。

Advanced Matrix Extensions(AMX)

Intel AMX は、人工知能(AI)ワークロードと機械学習(ML)ワークロードを高速化するように設計された新しい命令セット アーキテクチャ(ISA)です。AMX では、AI と ML で最もよく使用される 2 つの行列乗算と畳み込み演算に使用できる新しい命令が導入されています。

AMX は、C4 汎用 VM シリーズで活用されている第 5 世代インテル Xeon プロセッサ(コード名: Emerald Rapids)、および A3 アクセラレータ最適化 VM と C3 汎用 VM で活用されている第 4 世代インテル Xeon プロセッサ(コード名: Sapphire Rapids)でサポートされています。すべての C4 VM マシンタイプと C3 VM マシンタイプは、AMX 命令セットをサポートしています。

AMX では、アクセラレータがオペレーションを実行できるように、タイルと呼ばれる 2 次元のレジスタが導入されています。AMX は拡張可能なアーキテクチャを前提としています。最初に実装されるアクセラレータは、タイル マトリックス乗算ユニット(TMUL)と呼ばれます。Sapphire Rapids プロセッサの各 CPU コアには、独立した AMX TMUL ユニットがあります。

インテル AMX に関する技術的な詳細については、5.16 のインテル AMX サポートをご覧ください。 インテルでは、コードサンプル: Intel® Advanced Matrix Extensions(Intel® AMX)- Intrinsics Functions で AMX に関するチュートリアルを提供しています。

AMX を使用するための要件

インテル AMX 命令には、次のような最小ソフトウェア要件があります。

  • カスタム イメージの場合、AMX は Linux カーネル バージョン 5.16 以降でサポートされています。
  • Compute Engine では、次の公開イメージで AMX をサポートしています。
    • CentOS Stream 8 以降
    • Container-Optimized OS 109 LTS(またはそれ以降)
    • RHEL 8(最新ビルド)以降
    • Rocky Linux 8(最新ビルド)以降
    • Ubuntu 22.04 以降
    • Windows Server 2022 以降
  • Tensorflow 2.9.1 以降
  • PyTorch のインテル® 最適化用のインテル拡張機能

C4 VM と C3 VM を利用できるリージョンについては、使用可能なリージョンとゾーンを参照し、C4 または C3 マシンタイプのみが表示されるようにテーブルをフィルタします。

ベアメタル インスタンスで利用可能な CPU 機能

第 4 世代 Intel Xeon スケーラブル プロセッサで実行されるベアメタル インスタンスは、サーバーのすべての未加工コンピューティング リソースを提供できるだけでなく、機能固有の複数のオンボード アクセラレータとオフロードを使用できます。

  • Intel-QAT: Intel QuickAssist Technology(Intel QAT)は、圧縮、暗号化、復号を高速化します。
  • Intel-DLB: Intel Dynamic Load Balancer(Intel DLB)は、データキューの高速化に役立ちます。
  • Intel IAA: Intel In-Memory Analytics Accelerator(Intel IAA)は、クエリ処理のパフォーマンスを向上させます。
  • Intel DSA: Intel Data Streaming Accelerator(Intel DSA)は、データをより高速にコピーおよび移動するのに役立ちます。

Confidential Computing

使用中のデータを保護するため、Confidential Computing テクノロジーをサポートする CPU プラットフォームを使用して、Confidential VM インスタンスを作成できます。

Confidential VM インスタンスの作成要件の詳細については、サポートされている構成をご覧ください。

次のステップ

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル