VM Arm sur Compute Engine


Google Cloud propose une gamme de serveurs Arm dans Compute Engine via les séries de machines C4A et A4X. L'architecture Arm est optimisée pour accroître l'efficacité énergétique. Par conséquent, elle peut offrir un meilleur rapport prix-performances.

Les processeurs Arm sont courants sur les serveurs standards en raison de leur efficacité énergétique par rapport aux serveurs x86. Les téléphones mobiles et les ordinateurs portables sont des exemples d'appareils exécutés sur un processeur Arm. Avec l'ensemble d'instructions réduit d'un processeur Arm, vous bénéficiez de meilleures performances avec une batterie et une consommation d'énergie réduites.

Par exemple, C4A utilise le processeur Arm personnalisé de Google, Axion, qui est basé sur le processeur Arm Neoverse V2. Le Neoverse V2 est le premier processeur de la série V à bénéficier d'améliorations des performances, de la puissance et de la sécurité Armv9. Il est conçu pour le calcul hautes performances, le machine learning et le cloud computing à usage général. Envisagez d'utiliser des machines virtuelles (VM) Arm à usage général C4A pour l'une des raisons suivantes:

  • Exécuter des charges de travail nécessitant beaucoup de ressources de calcul qui doivent effectuer un scaling rapide de l'utilisation si nécessaire
  • Optimiser le rapport prix-performances sur les charges de travail compatibles avec Arm
  • Créez des applications sur des piles logicielles Open Source modernes.
  • Développer et tester des systèmes mobiles ou intégrés utilisant un processeur Arm
  • Déterminer si votre charge de travail est adaptée à un processeur Arm

Pour utiliser des GPU avec un processeur basé sur ARM, choisissez la série de machines A4X, qui s'exécute sur la plate-forme NVIDIA GB200 NVL72. Les VM créées à l'aide de cette série de machines sont associées à des superchips NVIDIA GB200 Grace Blackwell. Cette série de machines est optimisée pour les charges de travail de calcul CUDA (Compute Unified Device Architecture) massivement parallélisées, telles que le machine learning (ML) et le calcul hautes performances (HPC).

Série de machines A4X

A4X est la première VM Compute Engine à la fois équipée de processeurs Arm et de GPU associés. A4X propose des types de machines pouvant accueillir jusqu'à 140 processeurs virtuels et 884 Go de mémoire. L'A4X utilise des GPU NVIDIA GB200, qui offrent 180 Go de mémoire par GPU. L'A4X dispose de deux sockets avec des processeurs NVIDIA Grace Arm connectés à quatre GPU B200 avec une communication rapide de puce à puce (NVLink C2C). A4X est disponible dans le type de machine a4x-highgpu-4g.

Options de stockage pour les instances A4X

L'A4X peut être utilisé avec le stockage associé Google Cloud Hyperdisk et est livré avec 12 000 Go de SSD local. Compute Engine associe automatiquement les disques SSD locaux à vos instances A4X lors de leur création.

Images d'OS

Les instances A4X sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image d'OS Arm publique.

Série de machines C4A

C4A est la première VM basée sur l'architecture ARM conçue sur le processeur Axion basé sur Arm64 de Google. C4A propose des types de machines avec jusqu'à 72 processeurs virtuels et 576 Go de mémoire DDR5-5600. C4A est disponible dans les types de machines standard, highmem et highcpu.

C4A est basé sur Titanium, qui utilise des transferts réseau et permet des performances réseau Tier_1 par VM pouvant atteindre 100 Gbit/s avec l'interface réseau gVNIC. C4A est également compatible avec l'interface de disque NVMe avec les disques Hyperdisk Balanced et Hyperdisk Extreme.

Multithreading simultané

Pour la série de machines C4A, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT). Ainsi, les VM C4A offrent de meilleures performances par processeur virtuel qu'une VM avec SMT activé. Bien que SMT offre des avantages pour certaines charges de travail, les cœurs à un seul thread sont parfaits pour les charges de travail nécessitant beaucoup de ressources de calcul, car les processus peuvent accéder à l'intégralité du cœur plutôt que de le partager avec d'autres processus.

Images d'OS

Les VM C4A sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image Arm publique.

Série de machines Tau T2A

La série de machines Tau T2A Arm s'exécute sur le processeur Ampere Altra Arm à 64 cœurs à une fréquence de 3 GHz tout cœur. La série Tau T2A permet d'exécuter des charges de travail qui s'exécutent de façon optimale ou exclusivement sur Arm.

La série de machines Tau T2A propose des types de machines prédéfinis comportant jusqu'à 48 cœurs physiques, avec 4 Go de mémoire par processeur virtuel. Les types de machines Tau T2A s'exécutent dans un seul nœud NUMA.

Les types de machines Tau T2A ne sont compatibles qu'avec l'interface NVMe pour le stockage et la carte d'interface réseau virtuelle Google (gVNIC) pour la mise en réseau. Les interfaces Virtio-Net et SCSI ne sont pas acceptées. Toutes les images de l'OS Arm disponibles publiquement sont configurées pour utiliser les interfaces NVMe et gVNIC. gVNIC est une interface réseau conçue spécifiquement pour Compute Engine. Elle offre de meilleures performances, et une bande passante et un débit réseau plus élevés.

Pour cette série de machines, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT).

Recommandations concernant les charges de travail

La série de machines C4A est un excellent choix pour un large éventail de charges de travail évolutives et intensives, en particulier lorsque le rapport prix-performances est un facteur clé. Envisagez d'utiliser C4A lorsque vous déployez des charges de travail telles que les suivantes:

  • Traitement des données ML
  • Inférence de ML et diffusion de modèles
  • Diffusion d'applications, diffusion Web et diffusion de jeux
  • Développement de systèmes intégrés
  • Développement sur CI/CD sur Arm
  • Encodage, transcodage et traitement des vidéos et images
  • Échanges et diffusion d'annonces numériques
  • Serveurs cache
  • Découverte de médicaments par calcul
  • Développement d'Android
  • Développement de logiciels automobiles classiques ou autonomes

Étape suivante