La famille de machines optimisées pour les accélérateurs est conçue par Google Cloud pour fournir les performances et l'efficacité nécessaires aux charges de travail accélérées par GPU, telles que l'intelligence artificielle (IA), le machine learning (ML) et le calcul hautes performances (HPC).
La famille de machines optimisées pour les accélérateurs est disponible dans les séries de machines A4X, A4, A3, A2 et G2. Chaque type de machine d'une série est associé à un modèle spécifique et à un nombre de GPU NVIDIA. Vous pouvez également associer certains modèles de GPU à des types de machines à usage général N1.
Recommandation de séries de machines par type de charge de travail
La section suivante fournit la série de machines recommandée en fonction de vos charges de travail GPU.
Type de charge de travail | Type de machine recommandé |
---|---|
Modèles de pré-entraînement | A4X, A4, A3 Ultra, A3 Mega, A3 High et A2 Pour identifier la solution la plus adaptée, consultez Recommandations pour les modèles de pré-entraînement dans la documentation AI Hypercomputer. |
Affinage de modèles | A4X, A4, A3 Ultra, A3 Mega, A3 High et A2 Pour identifier la solution la plus adaptée, consultez Recommandations pour l'affinage des modèles dans la documentation AI Hypercomputer. |
Diffuser l'inférence | A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge et A2 Pour identifier la solution la plus adaptée, consultez Recommandations pour le service d'inférence dans la documentation AI Hypercomputer. |
Charges de travail exigeantes en ressources graphiques | G2 et N1+T4 |
Calcul hautes performances | Pour les charges de travail de calcul hautes performances, toutes les séries de machines optimisées pour les accélérateurs fonctionnent bien. La machine la plus adaptée dépend de la quantité de calculs qui doit être déchargée sur le GPU. Pour en savoir plus, consultez Recommandations pour le HPC dans la documentation AI Hypercomputer. |
Options de tarification et de provisionnement
Les types de machines optimisés pour les accélérateurs sont facturés pour les GPU, les processeurs virtuels prédéfinis, la mémoire et le disque SSD local (le cas échéant). Les remises qui peuvent s'appliquer aux instances optimisées pour les accélérateurs varient en fonction de l'option de provisionnement que vous utilisez, comme indiqué dans le tableau suivant. Pour en savoir plus sur les tarifs des instances optimisées pour les accélérateurs, consultez la section Famille de types de machines optimisés pour les accélérateurs sur la page des tarifs des instances de VM.
À la demande (par défaut) | Spot VM | Démarrage Flex (Aperçu) | Réservations | |
---|---|---|---|---|
Séries de machines optimisées pour les accélérateurs compatibles | A3 Mega, A3 High, A3 Edge, A2 et G2 | A4, A3, A2 et G2 | A4, A3, A2 et G2 | L'assistance varie en fonction du type de réservation :
|
Remises | Vous pouvez bénéficier de remises sur engagement d'utilisation pour certaines ressources en souscrivant des engagements basés sur les ressources. Toutefois, les GPU et les disques SSD locaux que vous utilisez avec l'option de provisionnement à la demande ne sont pas éligibles aux remises sur engagement d'utilisation. Si vous souhaitez bénéficier de remises sur engagement d'utilisation, même pour les GPU et les disques SSD locaux, nous vous recommandons d'utiliser plutôt l'option de provisionnement des réservations. |
Les VM Spot bénéficient automatiquement de remises grâce à la tarification des VM Spot. |
Les VM provisionnées à l'aide du modèle de provisionnement Démarrage flexible bénéficient automatiquement de remises grâce à la tarification du Dynamic Workload Scheduler. |
Vous pouvez bénéficier de remises sur engagement d'utilisation pour vos ressources de type de machine optimisé pour les accélérateurs en souscrivant des engagements basés sur les ressources. Notez que les engagements pour les GPU et les disques SSD locaux nécessitent des réservations associées pour ces ressources. |
Série de machines A4X
La série de machines A4X s'exécute sur une plate-forme exascale basée sur l'architecture rack NVIDIA GB200 NVL72. Elle dispose de 140 vCPU et de 884 Go de mémoire. Cette série de machines est optimisée pour les charges de travail de calcul et de mémoire intensives, l'entraînement ML lié au réseau et les charges de travail HPC. La série de machines A4X n'est disponible qu'en un seul type de machine.
Les instances de VM créées à l'aide du type de machine A4X offrent les fonctionnalités suivantes :
Accélération GPU avec les superchips NVIDIA GB200 : les instances A4X sont automatiquement associées aux superchips NVIDIA GB200. Ces superchips sont équipés de GPU NVIDIA B200 et offrent 180 Go de mémoire par GPU. Les VM A4X disposent de deux sockets avec des processeurs NVIDIA Grace™ dotés de cœurs Arm® Neoverse™ V2. Ces processeurs sont connectés à quatre GPU B200 avec une communication rapide de puce à puce (NVLink-C2C).
Plate-forme de processeurs NVIDIA Grace : les instances A4X utilisent la plate-forme de processeurs NVIDIA Grace. Pour en savoir plus sur la plate-forme, consultez Plates-formes de processeur.
Évolutivité NVLink de pointe : NVLink multinœud qui peut évoluer jusqu'à 72 GPU dans un seul domaine. Les GPU NVIDIA B200 offrent une bande passante GPU NVLink de 1 800 Go/s, de manière bidirectionnelle par GPU. Avec une topologie globale NVLink répartie sur quatre GPU dans un même système, la bande passante globale NVLink peut atteindre 130 To/s.
Mise en réseau améliorée avec RoCE : pour les instances A4X, RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant les cartes d'interface réseau (NIC) NVIDIA ConnectX-7 (CX-7) avec le réseau Google à quatre voies alignées sur rail à l'échelle du centre de données. En tirant parti de RDMA over Converged Ethernet (RoCE), les instances A4X atteignent un débit beaucoup plus élevé entre les instances d'un cluster par rapport aux instances A4.
Les cartes d'interface réseau CX-7, physiquement isolées dans une topologie réseau à quatre voies alignées, permettent aux instances A4X d'effectuer un scaling horizontal par groupes de 72 GPU jusqu'à des milliers de GPU dans un seul cluster non bloquant.
Débits réseau améliorés : les débits réseau sont jusqu'à quatre fois plus rapides que ceux des instances créées à l'aide des types de machines A3.
Optimisations de la virtualisation pour les transferts et la récupération de données : la topologie PCIe (Peripheral Component Interconnect Express) des instances A4X fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données.
Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.
Compatibilité avec les disques SSD locaux et Hyperdisk : 12 000 Gio de disque SSD local sont automatiquement ajoutés aux instances A4X. Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.
Pour les applications nécessitant des performances de stockage plus élevées, vous pouvez associer jusqu'à 512 Tio d'Hyperdisk aux instances A4X.
Prise en charge de l'allocation dense et de la planification tenant compte de la topologie : lorsque vous provisionnez des instances A4X via Cluster Director, vous pouvez demander des blocs de capacité à allocation dense. Vos machines hôtes sont allouées physiquement à proximité les unes des autres, provisionnées sous forme de blocs de ressources et interconnectées avec un réseau ML dynamique pour minimiser les sauts de réseau et optimiser la latence la plus faible. De plus, Cluster Director fournit des informations sur la topologie au niveau des nœuds et des clusters, qui peuvent être utilisées pour le placement des jobs.
Type de machine A4X
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3e) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Go/s)‡ |
---|---|---|---|---|---|---|---|
a4x-highgpu-4g |
4 | 720 | 140 | 884 | 12 000 | 6 | 2 000 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines A4X
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A4X.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A4X.
- Vous ne pouvez utiliser un type de machine A4X que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disque persistant (régional ou zonal) sur une VM utilisant un type de machine A4X.
- Le type de machine A4X n'est disponible que sur la plate-forme NVIDIA Grace.
- Vous ne pouvez pas modifier le type de machine d'une VM existante en type de machine A4X. Vous ne pouvez créer que des VM A4X. Une fois que vous avez créé une VM à l'aide d'un type de machine A4X, vous ne pouvez pas modifier le type de machine.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A4X.
- Les VM A4X ne sont pas compatibles avec les éléments suivants :
Types de disques compatibles avec la série A4X
Les VM A4X peuvent utiliser les types de stockage de blocs suivants :
- Hyperdisk avec équilibrage (
hyperdisk-balanced
) : il s'agit du seul type de disque compatible avec le disque de démarrage. - Hyperdisque extrême (
hyperdisk-extreme
) - SSD local : ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A4X
Nombre maximal de disques par VM* | ||||||
---|---|---|---|---|---|---|
Types de machine | Tous les disques† | Volume Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | SSD local associé |
a4x-highgpu-4g |
128 | 128 | N/A | N/A | 8 | 32 |
* L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.
† Cette limite s'applique à Hyperdisk, mais n'inclut pas les disques SSD locaux.
Limites de disque et de capacité
Vous pouvez utiliser une combinaison de différents types d'Hyperdisk avec une VM, mais la capacité totale maximale de disque (en Tio) pour tous les types de disques ne peut pas dépasser :
Pour les types de machines comportant moins de 32 processeurs virtuels : 257 Tio pour tous les volumes Hyperdisk
Pour les types de machines comportant 32 processeurs virtuels ou plus : 512 Tio pour tous les volumes Hyperdisk
Pour en savoir plus sur les limites de capacité, consultez Limites de taille et de rattachement des disques Hyperdisk.
Série de machines A4
La série de machines A4 propose des types de machines avec jusqu'à 224 processeurs virtuels et 3 968 Go de mémoire. Les instances A4 offrent des performances jusqu'à trois fois supérieures à celles des types d'instances GPU précédents pour la plupart des charges de travail accélérées par GPU. La famille A4 est recommandée pour les charges de travail d'entraînement de ML, en particulier à grande échelle (par exemple, des centaines ou des milliers de GPU). La série de machines A4 n'est disponible que dans un seul type de machine.
Les instances de VM créées à l'aide du type de machine A4 offrent les fonctionnalités suivantes :
Accélération GPU avec les GPU NVIDIA B200 : les GPU NVIDIA B200 sont automatiquement associés aux instances A4, qui offrent 180 Go de mémoire GPU par GPU.
Processeur évolutif Intel Xeon de 5e génération (Emerald Rapids) : offre une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 4,0 GHz. Pour en savoir plus sur ce processeur, consultez Plate-forme de processeur.
Évolutivité NVLink de pointe : les GPU NVIDIA B200 fournissent une bande passante GPU NVLink de 1 800 Go/s, de manière bidirectionnelle par GPU.
Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 14,4 To/s.
Mise en réseau améliorée avec RoCE : RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant les cartes d'interface réseau (NIC) NVIDIA ConnectX-7 avec le réseau Google à quatre voies alignées sur les rails à l'échelle du centre de données. En tirant parti de RDMA over Converged Ethernet (RoCE), les instances A4 atteignent un débit beaucoup plus élevé entre les instances d'un cluster par rapport à la plupart des instances A3, à l'exception de celles exécutées sur le type de machine A3-Ultra.
Vitesse réseau accrue : jusqu'à quatre fois plus rapide que les instances A2 de la génération précédente.
Pour en savoir plus sur la mise en réseau, consultez Bandes passantes réseau et GPU.
Optimisations de la virtualisation pour les transferts et la récupération de données : la topologie PCIe (Peripheral Component Interconnect Express) des instances A4 fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données.
Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.
Compatibilité avec les disques SSD locaux et Hyperdisk : 12 000 Gio de disque SSD local sont automatiquement ajoutés aux instances A4. Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.
Pour les applications nécessitant des performances de stockage plus élevées, vous pouvez également associer jusqu'à 512 Tio d'Hyperdisk aux instances A4.
Prise en charge de l'allocation dense et de la planification tenant compte de la topologie : lorsque vous provisionnez des instances A4 qui utilisent les fonctionnalités et les services disponibles dans Cluster Director, vous pouvez demander des blocs de capacité à allocation dense. Vos machines hôtes sont allouées à proximité les unes des autres, provisionnées sous forme de blocs de ressources et interconnectées avec un réseau ML dynamique pour minimiser les sauts de réseau et optimiser la latence la plus faible. De plus, vous pouvez obtenir des informations sur la topologie au niveau des nœuds et des clusters, qui peuvent être utilisées pour le placement des jobs.
Type de machine A4
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3e) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
a4-highgpu-8g |
8 | 1 440 | 224 | 3 968 | 12 000 | 10 | 3 600 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines A4
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A4.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A4.
- Vous ne pouvez utiliser un type de machine A4 que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disque persistant (régional ou zonal) sur une VM utilisant un type de machine A4.
- Le type de machine A4 n'est disponible que sur la plate-forme de processeur Emerald Rapids.
- Vous ne pouvez pas modifier le type de machine d'une VM existante en type de machine A4. Vous ne pouvez créer que des VM A4. Une fois que vous avez créé une VM à l'aide d'un type de machine A4, vous ne pouvez plus modifier le type de machine.
- Les types de machines A4 ne sont pas compatibles avec la location unique.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A4.
Types de disques compatibles avec la série A4
Les VM A4 peuvent utiliser les types de stockage de blocs suivants :
- Hyperdisk avec équilibrage (
hyperdisk-balanced
) : il s'agit du seul type de disque compatible avec le disque de démarrage. - Hyperdisque extrême (
hyperdisk-extreme
) - SSD local : ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A4
Nombre maximal de disques par VM* | ||||||
---|---|---|---|---|---|---|
Types de machine | Tous les disques† | Volume Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | SSD local associé |
a4-highgpu-8g |
128 | 128 | N/A | N/A | 8 | 32 |
* L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.
† Cette limite s'applique à Hyperdisk, mais n'inclut pas les disques SSD locaux.
Limites de disque et de capacité
Si le type de machine le permet, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU:
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus:
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.
Série de machines A3
La série de machines A3 dispose de jusqu'à 224 processeurs virtuels et de 2 944 Go de mémoire. Cette série de machines est optimisée pour les charges de travail de calcul et de mémoire intensives, d'entraînement au ML lié au réseau et de HPC. La série de machines A3 est disponible dans les types de machines A3 Ultra, A3 Mega, A3 High et A3 Edge.
Les instances de VM créées à l'aide des types de machines A3 offrent les fonctionnalités suivantes :
Fonctionnalité | A3 Ultra | A3 Mega, High, Edge |
---|---|---|
Accélération GPU | GPU NVIDIA H200 SXM : ils offrent 141 Go de mémoire GPU par GPU et fournissent une mémoire plus grande et plus rapide pour prendre en charge les grands modèles de langage et les charges de travail HPC. |
GPU NVIDIA H100 SXM : chaque type de machine A3 est associé à des GPU NVIDIA H100 SXM, qui offrent 80 Go de mémoire par GPU et sont idéaux pour les modèles de langage volumineux basés sur les transformateurs, les bases de données et le HPC. |
Processeurs Intel Xeon Scalable | Processeur Intel Xeon Scalable de 5e génération (Emerald Rapids) offrant une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 4,0 GHz. Pour en savoir plus sur ce processeur, consultez Plate-forme de processeur. |
Processeur évolutif Intel Xeon de 4e génération (Sapphire Rapids) offrant une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 3,3 GHz. Pour en savoir plus sur ce processeur, consultez Plate-forme de processeur. |
Évolutivité NVLink de pointe | Les GPU NVIDIA H200 fournissent une bande passante GPU NVLink maximale de 900 Go/s, de manière unidirectionnelle. Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s. |
Les GPU NVIDIA H100 fournissent une bande passante GPU NVLink maximale de 450 Go/s, de manière unidirectionnelle. Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s. |
Mise en réseau améliorée | Pour ce type de machine, RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant des cartes d'interface réseau (NIC) NVIDIA ConnectX-7 avec notre réseau à quatre voies alignées à l'échelle du centre de données. En tirant parti de RDMA over Converged Ethernet (RoCE), le type de machine a3-ultragpu-8g atteint un débit beaucoup plus élevé entre les instances d'un cluster par rapport aux autres types de machines A3.
|
|
Amélioration de la vitesse du réseau | Offre des vitesses réseau jusqu'à quatre fois supérieures à celles de la série de machines A2 de la génération précédente. Pour en savoir plus sur la mise en réseau, consultez Bandes passantes réseau et GPU. |
Offre des vitesses de mise en réseau jusqu'à 2,5 fois supérieures à celles de la série de machines A2 de la génération précédente. Pour en savoir plus sur la mise en réseau, consultez Bandes passantes réseau et GPU. |
Optimisations de la virtualisation | La topologie PCIe (Peripheral Component Interconnect Express) des instances A3 fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données. Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios. |
|
Compatibilité avec les disques SSD locaux, les disques persistants et les hyperdisques |
Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S. Le disque SSD local est associé comme suit :
Vous pouvez également associer jusqu'à 512 Tio de stockage Persistent Disk et Hyperdisk aux types de machines de ces séries pour les applications nécessitant des performances de stockage plus élevées. Pour certains types de machines, jusqu'à 257 Tio de disque persistant sont également acceptés. |
|
Prise en charge des stratégies d'emplacement compact | Vous permet de mieux contrôler l'emplacement physique de vos instances dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour les instances situées dans une seule zone de disponibilité. Pour en savoir plus, consultez À propos des stratégies d'emplacement compact. |
Type de machine A3 Ultra
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3e) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
a3-ultragpu-8g |
8 | 1128 | 224 | 2 952 | 12 000 | 10 | 3 600 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines A3 Ultra
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A3 Ultra.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A3 Ultra.
- Vous ne pouvez utiliser un type de machine A3 Ultra que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de Persistent Disk (régional ou zonal) sur une VM utilisant un type de machine A3 Ultra.
- Le type de machine A3 Ultra n'est disponible que sur la plate-forme de processeur Emerald Rapids.
- Vous ne pouvez pas modifier le type de machine d'une VM existante en type de machine A3 Ultra. Vous ne pouvez créer que des VM A3-ultra. Une fois que vous avez créé une VM à l'aide d'un type de machine A3 Ultra, vous ne pouvez pas modifier le type de machine.
- Les types de machines A3 Ultra ne sont pas compatibles avec la location unique.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Ultra.
Type de machine A3 Mega
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
a3-megagpu-8g |
8 | 640 | 208 | 1 872 | 6 000 | 9 | 1 800 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines A3 Mega
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A3 Mega.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A3 Mega.
- Vous ne pouvez utiliser un type de machine A3 Mega que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de Persistent Disk régional sur une VM utilisant un type de machine A3 Mega.
- Le type de machine A3 Mega n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
- Vous ne pouvez pas modifier le type de machine d'une VM existante en type de machine A3 Mega. Vous ne pouvez créer que des VM A3-mega. Une fois que vous avez créé une VM à l'aide d'un type de machine A3 Mega, vous ne pouvez pas modifier le type de machine.
- Les types de machines A3 Mega ne sont pas compatibles avec la location unique.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Mega.
Type de machine A3 High
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
a3-highgpu-1g |
1 | 80 | 26 | 234 | 750 | 1 | 25 |
a3-highgpu-2g |
2 | 160 | 52 | 468 | 1 500 | 1 | 50 |
a3-highgpu-4g |
4 | 320 | 104 | 936 | 3 000 | 1 | 100 |
a3-highgpu-8g |
8 | 640 | 208 | 1 872 | 6 000 | 5 | 1 000 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines A3 High
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A3 High.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A3 High.
- Vous ne pouvez utiliser un type de machine A3 High que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de Persistent Disk régional sur une VM utilisant un type de machine A3 High.
- Le type de machine A3 High n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
- Vous ne pouvez pas modifier le type de machine d'une VM existante en type de machine A3 High. Vous ne pouvez créer que des VM A3-high. Une fois que vous avez créé une VM à l'aide d'un type de machine A3 High, vous ne pouvez pas modifier le type de machine.
- Les types de machines A3 High ne sont pas compatibles avec la location unique.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 High.
- Les limites suivantes s'appliquent aux types de machines
a3-highgpu-1g
,a3-highgpu-2g
eta3-highgpu-4g
:-
Pour ces types de machines, vous devez créer des VM à l'aide de VM Spot ou d'une fonctionnalité qui utilise le programmeur de charge de travail dynamique (DWS), comme les requêtes de redimensionnement dans un MIG. Pour obtenir des instructions détaillées sur ces deux options, consultez les ressources suivantes :
- Pour créer des VM Spot, définissez le modèle de provisionnement sur
SPOT
lorsque vous créez une VM optimisée pour les accélérateurs. - Pour créer une demande de redimensionnement dans un MIG qui utilise DWS, consultez Créer un MIG comprenant des VM avec GPU.
- Pour créer des VM Spot, définissez le modèle de provisionnement sur
- Vous ne pouvez pas utiliser Hyperdisk équilibré avec ces types de machines.
- Vous ne pouvez pas créer de réservations.
-
Pour ces types de machines, vous devez créer des VM à l'aide de VM Spot ou d'une fonctionnalité qui utilise le programmeur de charge de travail dynamique (DWS), comme les requêtes de redimensionnement dans un MIG. Pour obtenir des instructions détaillées sur ces deux options, consultez les ressources suivantes :
Type de machine A3 Edge
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
a3-edgegpu-8g |
8 | 640 | 208 | 1 872 | 6 000 | 5 |
|
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines A3 Edge
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A3 Edge.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A3 Edge.
- Vous ne pouvez utiliser un type de machine A3 Edge que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disque persistant régional sur une VM utilisant un type de machine A3 Edge.
- Le type de machine A3 Edge n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
- Vous ne pouvez pas modifier le type de machine d'une VM existante en type de machine A3 Edge. Vous ne pouvez créer que des VM A3-edge. Une fois que vous avez créé une VM à l'aide d'un type de machine A3 Edge, vous ne pouvez pas modifier le type de machine.
- Les types de machines A3 Edge ne sont pas compatibles avec la location unique.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Edge.
Types de disques compatibles avec la série A3
A3 Ultra
Les VM A3 Ultra peuvent utiliser les types de stockage de blocs suivants :
- Hyperdisk avec équilibrage (
hyperdisk-balanced
) : il s'agit du seul type de disque compatible avec le disque de démarrage. - Volume Hyperdisk équilibré à haute disponibilité (
hyperdisk-balanced-high-availability
) - Hyperdisque extrême (
hyperdisk-extreme
) - SSD local : ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM* | |||||||
---|---|---|---|---|---|---|---|
Types de machines |
Tous les disques† | Volume Hyperdisk équilibré | Haute disponibilité sur Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | Disques SSD locaux associés |
a3-ultragpu-8g |
128 | 128 | 128 | N/A | N/A | 8 | 32 |
* L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.
† Cette limite s'applique à Hyperdisk, mais n'inclut pas les disques SSD locaux.
A3 Mega
Les VM A3 Mega peuvent utiliser les types de stockage de blocs suivants :
- Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Volume Hyperdisk équilibré (
hyperdisk-balanced
) - Volume Hyperdisk équilibré à haute disponibilité (
hyperdisk-balanced-high-availability
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisque extrême (
hyperdisk-extreme
) - Débit hyperdisque (
hyperdisk-throughput
) - SSD local : ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM* | |||||||
---|---|---|---|---|---|---|---|
Types de machines |
Tous les disques† | Volume Hyperdisk équilibré | Haute disponibilité sur Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | Disques SSD locaux associés |
a3-megagpu-8g |
128 | 32 | 32 | 64 | 64 | 8 | 16 |
* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques persistants et Hyperdisk.
† Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.
A3 High
Les VM A3 High peuvent utiliser les types de stockage de blocs suivants :
- Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Hyperdisk avec équilibrage (
hyperdisk-balanced
) : uniquement compatible aveca3-highgpu-8g
- Volume Hyperdisk équilibré à haute disponibilité (
hyperdisk-balanced-high-availability
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisque extrême (
hyperdisk-extreme
) - Débit hyperdisque (
hyperdisk-throughput
) - SSD local : ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM* | |||||||
---|---|---|---|---|---|---|---|
Types de machines |
Tous les disques† | Volume Hyperdisk équilibré | Haute disponibilité sur Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | Disques SSD locaux associés |
a3-highgpu-1g |
128 | N/A | 32 | 64 | 64 | N/A | 2 |
a3-highgpu-2g |
128 | N/A | 32 | 64 | 64 | N/A | 4 |
a3-highgpu-4g |
128 | N/A | 32 | 64 | 64 | 8 | 8 |
a3-highgpu-8g |
128 | 32 | 32 | 64 | 64 | 8 | 16 |
* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques persistants et Hyperdisk.
† Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.
A3 Edge
Les VM A3 Edge peuvent utiliser les types de stockage de blocs suivants :
- Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Volume Hyperdisk équilibré (
hyperdisk-balanced
) - Volume Hyperdisk équilibré à haute disponibilité (
hyperdisk-balanced-high-availability
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisque extrême (
hyperdisk-extreme
) - Débit hyperdisque (
hyperdisk-throughput
) - SSD local : ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM* | |||||||
---|---|---|---|---|---|---|---|
Types de machine | Tous les disques† | Volume Hyperdisk équilibré | Haute disponibilité sur Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | SSD local associé |
a3-edgegpu-8g |
128 | 32 | 32 | 64 | 64 | 8 | 16 |
* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques persistants et Hyperdisk.
† Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.
Limites de disque et de capacité
Si le type de machine le permet, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU:
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus:
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.
Série de machines A2
La série de machines A2 est disponible dans les types de machines A2 standard et A2 ultra. Ces types de machines disposent de 12 à 96 processeurs virtuels et de 1 360 Go de mémoire.
Les instances de VM créées à l'aide des types de machines A2 offrent les fonctionnalités suivantes :
Accélération GPU : chaque instance A2 dispose de GPU NVIDIA A100. Elles sont disponibles dans les options A100 40 Go et A100 80 Go.
Évolutivité NVLink de pointe qui fournit un pic de bande passante GPU à GPU NVLink de 600 Gbit/s. Par exemple, les systèmes avec 16 GPU disposent d'une bande passante globale NVLink pouvant atteindre 9,6 To. Ces 16 GPU peuvent être utilisés comme accélérateur hautes performances unique équipé d'un espace de mémoire unifié pour fournir jusqu'à 10 pétaflops de puissance de calcul et jusqu'à 20 pétaflops de puissance de calcul d'inférence pouvant servir pour l'intelligence artificielle, ainsi que les charges de travail de deep learning et de machine learning.
Vitesse de calcul améliorée : les GPU NVIDIA A100 associées offrent une vitesse de calcul jusqu'à 10 fois supérieure à celle des GPU NVIDIA V100 de la génération précédente.
Avec la série de machines A2, vous pouvez obtenir jusqu'à 100 Gbit/s de bande passante réseau.
Compatibilité avec les disques SSD locaux, les disques persistants et les hyperdisques : pour les espaces de travail rapides ou pour alimenter les GPU en données, tout en évitant les goulots d'étranglement d'E/S, les types de machines A2 sont compatibles avec les disques SSD locaux comme suit :
- Pour les types de machines A2 standards, vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local lorsque vous créez une instance.
- Pour les types de machines ultra A2, le disque SSD local est automatiquement associé lorsque vous créez une instance.
Pour les applications nécessitant des performances de stockage plus élevées, vous pouvez également associer jusqu'à 257 Tio de volumes Persistent Disk et 512 Tio de volumes Hyperdisk aux instances A2.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos instances dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour les instances situées dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.
Les types de machines suivants sont disponibles pour la série de machines A2.
Types de machines ultra A2
Ces types de machines ont un nombre fixe de GPU A100 80 Go. Le disque SSD local est automatiquement associé aux instances créées à l'aide des types de machines ultra A2.
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g |
1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g |
2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g |
4 | 320 | 48 | 680 | 1 500 | 50 |
a2-ultragpu-8g |
8 | 640 | 96 | 1 360 | 3 000 | 100 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de l'instance et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines ultra A2
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A2 Ultra.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A2 Ultra.
- Vous ne pouvez utiliser un type de machine A2 Ultra que dans certaines régions et zones.
- Les types de machines A2 Ultra ne sont disponibles que sur la plate-forme Cascade Lake.
- Si votre VM utilise un type de machine A2 Ultra, vous ne pouvez pas modifier le type de machine. Si vous devez utiliser un autre type de machine A2 Ultra ou toute autre famille de machines, vous devez créer une VM.
- Vous ne pouvez pas remplacer un autre type de machine par un type de machine A2 Ultra. Si vous avez besoin d'une VM utilisant un type de machine A2 Ultra, vous devez créer une nouvelle VM.
- Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des VM Windows qui utilisent des types de machines A2 Ultra. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant
format fs=ntfs label=tmpfs
.
Types de machines A2 standards
Ces types de machines ont un nombre fixe de GPU A100 40 Go.
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g |
1 | 40 | 12 | 85 | Oui | 24 |
a2-highgpu-2g |
2 | 80 | 24 | 170 | Oui | 32 |
a2-highgpu-4g |
4 | 160 | 48 | 340 | Oui | 50 |
a2-highgpu-8g |
8 | 320 | 96 | 680 | Oui | 100 |
a2-megagpu-16g |
16 | 640 | 96 | 1 360 | Oui | 100 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de l'instance et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des types de machines A2 standards
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine A2 Standard.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine A2 Standard.
- Vous ne pouvez utiliser un type de machine A2 Standard que dans certaines régions et zones.
- Les types de machines A2 Standard ne sont disponibles que sur la plate-forme Cascade Lake.
- Si votre VM utilise un type de machine A2 Standard, vous ne pouvez passer d'un type de machine A2 Standard qu'à un autre type de machine A2 Standard. Vous ne pouvez pas passer à un autre type de machine. Pour en savoir plus, consultez la page Modifier des VM optimisées pour les accélérateurs.
- Vous ne pouvez pas utiliser le système d'exploitation Windows avec les types de machines A2 Standard <codea2-megagpu-16g< code="" dir="ltr" translate="no">. Lorsque vous utilisez des systèmes d'exploitation Windows, choisissez un autre type de machine A2 Standard.</codea2-megagpu-16g<>
- Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des VM Windows qui utilisent des types de machines A2 Standard. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant
format fs=ntfs label=tmpfs
. - Les types de machines A2 Standard ne sont pas compatibles avec la location unique.
Types de disques compatibles avec la série A2
Les instances A2 peuvent utiliser les types de stockage de blocs suivants :
- Hyperdisk ML (
hyperdisk-ml
) - Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Disque persistant standard (
pd-standard
) - SSD local : il est automatiquement associé aux instances créées à l'aide des types de machines ultra A2.
Si le type de machine le permet, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU:
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus:
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.
Série de machines G2
La série de machines G2 est disponible dans les types de machines standards comportant entre 4 et 96 processeurs virtuels et jusqu'à 432 Go de mémoire. Cette série de machines est optimisée pour les charges de travail d'inférence et graphiques. La série de machines G2 est disponible dans un seul type de machine standard avec plusieurs configurations.
Les instances de VM créées à l'aide des types de machines G2 offrent les fonctionnalités suivantes :
Accélération GPU : chaque type de machine G2 dispose de GPU NVIDIA L4.
Amélioration des taux d'inférence : le type de machine G2 accepte le type de données FP8 (virgule flottante de 8 bits), ce qui accélère les taux d'inférence de ML et réduit les besoins en mémoire.
Performances graphiques de nouvelle génération : les GPU NVIDIA L4 offrent des performances graphiques jusqu'à trois fois supérieures en utilisant des cœurs RT de troisième génération et la technologie NVIDIA DLSS 3 (Deep Learning Super Sampling).
Bande passante réseau hautes performances : avec les types de machines G2, vous pouvez atteindre jusqu'à 100 Gbit/s de bande passante réseau.
Compatibilité avec les disques SSD locaux, les disques persistants et les hyperdisques : vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local aux instances G2. Cela peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.
Vous pouvez également associer des volumes Hyperdisk et Persistent Disk aux instances G2, pour les applications nécessitant un stockage plus persistant. La capacité de stockage maximale dépend du nombre de processeurs virtuels disponibles sur la VM. Pour plus d'informations, consultez la page Types de disques compatibles.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos instances dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour les instances situées dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.
Types de machines G2
Chaque type de machine G2 est associé à un nombre fixe de GPU NVIDIA L4 et de processeurs virtuels. Chaque type de machine G2 dispose également d'une mémoire par défaut et d'une plage de mémoire personnalisée. La plage de mémoire personnalisée définit la quantité de mémoire que vous pouvez allouer à votre VM pour chaque type de machine. Vous pouvez spécifier votre mémoire personnalisée lors de la création de la VM.
Type de machine | Nombre de GPU | Mémoire GPU* (Go GDDR6) | Nombre de vCPU† | Mémoire VM par défaut (Go) | Plage de mémoire personnalisée VM (Go) | Disque SSD local maximal compatible (Gio) | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 |
1 | 24 | 4 | 16 | Entre 16 et 32 | 375 | 10 |
g2-standard-8 |
1 | 24 | 8 | 32 | Entre 32 et 54 | 375 | 16 |
g2-standard-12 |
1 | 24 | 12 | 48 | Entre 48 et 54 | 375 | 16 |
g2-standard-16 |
1 | 24 | 16 | 64 | Entre 54 et 64 | 375 | 32 |
g2-standard-24 |
2 | 48 | 24 | 96 | Entre 96 et 108 | 750 | 32 |
g2-standard-32 |
1 | 24 | 32 | 128 | Entre 96 et 128 | 375 | 32 |
g2-standard-48 |
4 | 96 | 48 | 192 | Entre 192 et 216 | 1 500 | 50 |
g2-standard-96 |
8 | 192 | 96 | 384 | Entre 384 et 432 | 3 000 | 100 |
*La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines G2
- Vous ne pouvez demander de la capacité qu'en utilisant les options de provisionnement compatibles pour un type de machine G2.
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent un type de machine G2.
- Vous ne pouvez utiliser un type de machine G2 que dans certaines régions et zones.
- Le type de machine G2 n'est disponible que sur la plate-forme Cascade Lake.
- Les disques persistants standards (
pd-standard
) ne sont pas compatibles avec les VM qui utilisent des types de machines standards G2. Pour connaître les types de disques compatibles, consultez la section Types de disques compatibles pour G2. - Vous ne pouvez pas créer de GPU multi-instances sur des types de machines G2.
- Si vous devez modifier le type de machine d'une VM G2, consultez la page Modifier des VM optimisées pour les accélérateurs.
- Vous ne pouvez pas utiliser de Deep Learning VM Image en tant que disque de démarrage pour vos VM utilisant des types de machines G2.
- Le pilote par défaut actuel de Container-Optimized OS n'est pas compatible avec les GPU L4 s'exécutant sur des types de machines G2. Container-Optimized OS n'accepte également qu'un ensemble sélectionné de pilotes.
Si vous souhaitez utiliser Container-Optimized OS sur des types de machines G2, consultez les notes suivantes :
- Utilisez une version de Container-Optimized OS compatible avec le pilote NVIDIA version
525.60.13
recommandée (minimum) ou ultérieure. Pour en savoir plus, consultez les Notes de version de Container-Optimized OS. - Lorsque vous installez le pilote, spécifiez la dernière version disponible compatible avec les GPU L4.
Par exemple,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Utilisez une version de Container-Optimized OS compatible avec le pilote NVIDIA version
- Vous devez utiliser Google Cloud CLI ou REST pour créer des VM G2 dans les scénarios suivants :
- Vous souhaitez spécifier des valeurs personnalisées de la mémoire.
- Vous souhaitez personnaliser le nombre de cœurs de processeur visibles.
Types de disques compatibles avec la série G2
Les instances G2 peuvent utiliser les types de stockage de blocs suivants :
- Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Débit hyperdisque (
hyperdisk-throughput
) - SSD local
Si le type de machine le permet, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU:
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus:
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.