Esta página foi traduzida pela API Cloud Translation.

Instale controladores da GPU

Linux Windows

Depois de criar uma instância de máquina virtual (VM) com uma ou mais GPUs, o seu sistema requer controladores de dispositivos NVIDIA para que as suas aplicações possam aceder ao dispositivo. Certifique-se de que as instâncias de máquinas virtuais (VMs) têm espaço em disco livre suficiente. Deve escolher, pelo menos, 40 GB para o disco de arranque quando criar a nova VM.

Para instalar os controladores, tem duas opções à sua escolha:

Se precisar de GPUs para gráficos 3D acelerados por hardware, como jogos ou um ambiente de trabalho remoto, consulte o artigo Instale controladores para estações de trabalho virtuais (vWS) NVIDIA RTX.
Para outras cargas de trabalho, siga as instruções neste documento para instalar o controlador da NVIDIA.

Sugestão profissional: em alternativa, pode ignorar esta configuração criando VMs que usam imagens com controladores instalados. Consulte o artigo Escolher um sistema operativo para mais informações.

Versões do controlador NVIDIA, do kit de ferramentas CUDA e do tempo de execução CUDA

Existem diferentes componentes com versões de controladores e tempo de execução que podem ser necessários no seu ambiente. Estes incluem os seguintes componentes:

Controlador NVIDIA
Toolkit CUDA
Tempo de execução do CUDA

Quando instala estes componentes, tem a possibilidade de configurar o seu ambiente de acordo com as suas necessidades. Por exemplo, se tiver uma versão anterior do TensorFlow que funcione melhor com uma versão anterior do kit de ferramentas CUDA, mas a GPU que quer usar requer uma versão posterior do controlador da NVIDIA, pode instalar uma versão anterior de um kit de ferramentas CUDA juntamente com uma versão posterior do controlador da NVIDIA.

No entanto, tem de se certificar de que as versões do controlador da NVIDIA e do kit de ferramentas CUDA são compatíveis. Para a compatibilidade do controlador da NVIDIA e do kit de ferramentas CUDA, consulte a documentação da NVIDIA sobre a compatibilidade com CUDA.

Compreenda as ramificações dos controladores da NVIDIA

A NVIDIA oferece os seguintes três ramos de controladores:

Ramo de apoio técnico a longo prazo (LTSB): este ramo dá prioridade à estabilidade e minimiza a manutenção, com um ciclo de vida de apoio técnico prolongado de três anos. A LTSB mais recente testada e validada pela Google é a R580, que tem uma data de fim do apoio técnico em agosto de 2028.
Ramo de produção (PB): este ramo oferece melhorias de desempenho e suporte para o hardware mais recente. Suporta totalmente cargas de trabalho de produção, mas tem um ciclo de vida de apoio técnico mais curto, até um ano. A versão mais recente do PB testada e validada pela Google é a R570, que tem um fim do suporte em fevereiro de 2026.
Nova ramificação de funcionalidades (NFB): esta ramificação destina-se aos primeiros utilizadores a testar novas funcionalidades e não é recomendada para ambientes de produção.

Para cargas de trabalho de produção, use o ramo de produção ou o ramo de apoio técnico a longo prazo. Para mais detalhes sobre as ramificações da NVIDIA, consulte a documentação da NVIDIA.

Ramos de controladores NVIDIA recomendados

Use a tabela nesta secção para ajudar a determinar a melhor ramificação do controlador da NVIDIA para o tipo de máquina com GPU.

Na tabela seguinte, EOS indica que a NVIDIA lista essa ramificação como atingindo o fim do suporte. N/A indica que o sistema operativo (SO) especificado não pode ser executado no tipo de máquina.

Tipo de máquina	Modelo da GPU	Ramos suportados	Ramo recomendado (data de FVD)	Driver mínimo para a ramificação recomendada
A4X	NVIDIA Blackwell GB200 Superchip	R570 ou posterior	R580 (agosto de 2028)	Linux: `580.82.07` ou posterior Windows: N/A
A4	NVIDIA Blackwell B200	R570 ou posterior	R580 (agosto de 2028)	Linux: `580.82.07` ou posterior Windows: N/A
A3 Ultra	NVIDIA H200	R570 ou posterior	R580 (agosto de 2028)	Linux: `580.82.07` ou posterior Windows: N/A
A3 Mega, High e Edge	NVIDIA H100	R535 ou posterior	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: N/A
G4	NVIDIA RTX PRO 6000	R580 ou posterior	R580 (agosto de 2028)	Linux: `580.95.05` ou posterior Windows: `581.42` ou posterior
G2	NVIDIA L4	R535 ou posterior	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou posterior
A2 Standard, A2 Ultra	NVIDIA A100	R535 ou posterior	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou posterior
N1	NVIDIA T4	R535 ou posterior	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou posterior
N1	NVIDIA V100, P100 e P4	R35 a R580¹	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou posterior

¹A NVIDIA anunciou que o R580 é o último ramo de controladores a suportar a arquitetura Pascal (P4 e P100) e Volta (V100).

Instale controladores de GPU em VMs através dos guias do CUDA Toolkit

Uma forma de instalar o controlador da NVIDIA na maioria das VMs é instalar o CUDA Toolkit.

Para instalar o CUDA Toolkit, conclua os seguintes passos:

Selecione uma versão do CUDA Toolkit que suporte a versão do controlador de que precisa.

Tipo de máquina	Modelo da GPU	CUDA Toolkit recomendado
A4X	NVIDIA Blackwell GB200 Superchip	CUDA 12.8.1 ou posterior
A4	NVIDIA Blackwell B200	CUDA 12.8.1 ou posterior
A3 Ultra	NVIDIA H200	CUDA 12.4 ou posterior
G4	NVIDIA RTX PRO 6000	CUDA 13.1 ou posterior
G2	NVIDIA L4	CUDA 12.2.2 ou posterior
A3 Mega, High e Edge	NVIDIA H100	CUDA 12.2.2 ou posterior
A2 Standard, A2 Ultra	NVIDIA A100	CUDA 12.2.2 ou posterior
N1	NVIDIA T4	CUDA 12.2.2 ou posterior
N1	NVIDIA V100, P100 e P4	CUDA 12.2.2 para CUDA 12 (versão final)¹

¹ O CUDA Toolkit 12 é o último a suportar a arquitetura Pascal (P4 e P100) e Volta (V100). A NVIDIA anunciou que a compilação offline e o suporte de bibliotecas para estas arquiteturas são removidos a partir do lançamento da versão principal do CUDA Toolkit 13.0. Para mais informações, consulte as notas de lançamento do controlador 13.0 da NVIDIA.

Estabeleça ligação à VM onde quer instalar o controlador.
Na VM, transfira e instale o CUDA Toolkit. Para encontrar o pacote do CUDA Toolkit e as instruções de instalação, consulte o arquivo do CUDA Toolkit na documentação da NVIDIA.

Instale controladores de GPU em VMs através de um script de instalação

Pode usar os seguintes scripts para automatizar o processo de instalação. Para rever estes scripts, consulte o repositório do GitHub.

Linux

Use estas instruções para instalar controladores de GPU numa VM em execução.

Sistemas operativos compatíveis

O script de instalação do Linux foi testado nos seguintes sistemas operativos:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Se usar este guião noutros sistemas operativos, a instalação pode falhar. Este script pode instalar o controlador da NVIDIA, bem como o CUDA Toolkit.

Para instalar os controladores da GPU e o CUDA Toolkit, conclua os seguintes passos:

Se tiver a versão 2.38.0 ou posterior do agente Ops a recolher métricas da GPU na sua VM, tem de parar o agente antes de poder instalar ou atualizar os controladores da GPU através deste script de instalação.

Para parar o agente de operações, execute o seguinte comando:
```
sudo systemctl stop google-cloud-ops-agent
```
Certifique-se de que o Python 3 está instalado no seu sistema operativo.

Transfira o script de instalação.

curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz

Execute o guião de instalação.
```
sudo python3 cuda_installer.pyz install_driver --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
- INSTALLATION_MODE: o método de instalação. Use um dos seguintes valores:
  - repo: (Predefinição) instala o controlador a partir do repositório de pacotes oficial da NVIDIA.
  - binary: instala o controlador através do pacote de instalação binário.
- BRANCH: o ramo do controlador que quer instalar. Use um dos seguintes valores:
  - prod: (predefinição) o ramo de produção. Este ramo está qualificado para utilização em ambientes de produção para GPUs empresariais e de centros de dados.
  - nfb: o novo ramo de funcionalidades. Esta ramificação inclui as atualizações mais recentes para os primeiros utilizadores. Este ramo não é recomendado para ambientes de produção.
  - lts: o ramo de apoio técnico a longo prazo. Esta ramificação é mantida durante um período mais longo do que uma ramificação de produção normal.
A execução do script demora algum tempo. Vai reiniciar a VM. Quando a VM for reiniciada, execute novamente o script para continuar a instalação.
Valide a instalação. Consulte o artigo Valide a instalação do controlador da GPU.
Também pode usar esta ferramenta para instalar o CUDA Toolkit. Para instalar o CUDA Toolkit, execute o seguinte comando:
```
sudo python3 cuda_installer.pyz install_cuda --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
Certifique-se de que usa os mesmos valores para INSTALLATION_MODE e BRANCH que usou durante a instalação do controlador.

A execução do script demora algum tempo. Vai reiniciar a VM. Quando a VM for reiniciada, execute novamente o script para continuar a instalação.
Valide a instalação do conjunto de ferramentas CUDA.
```
python3 cuda_installer.pyz verify_cuda
```
Depois de concluir a instalação, tem de reiniciar a VM.

Linux (script de arranque)

Use estas instruções para instalar controladores de GPU durante o arranque de uma VM.

Sistemas operativos compatíveis

O script de instalação do Linux foi testado nos seguintes sistemas operativos:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Se usar este guião noutros sistemas operativos, a instalação pode falhar. Este script pode instalar o controlador da NVIDIA, bem como o CUDA Toolkit.

Use o seguinte script de arranque para automatizar a instalação do controlador e do CUDA Toolkit:

#!/bin/bash
if test -f /opt/google/cuda-installer
then
  exit
fi

mkdir -p /opt/google/cuda-installer
cd /opt/google/cuda-installer/ || exit

if test -f cuda_installation
then
  exit
fi

curl -fSsL -O https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz
python3 cuda_installer.pyz install_cuda

Pode anexar as flags --installation-mode INSTALLATION_MODE e --installation-branch BRANCH ao comando de instalação para indicar o modo de instalação e a ramificação do controlador que quer instalar.

INSTALLATION_MODE: o método de instalação. Use um dos seguintes valores:
- repo: (Predefinição) instala o controlador a partir do repositório de pacotes oficial da NVIDIA.
- binary: instala o controlador através do pacote de instalação binário.
BRANCH: o ramo do controlador que quer instalar. Use um dos seguintes valores:
- prod: (predefinição) o ramo de produção. Este ramo está qualificado para utilização em ambientes de produção para GPUs empresariais e de centros de dados.
- nfb: o novo ramo de funcionalidades. Esta ramificação inclui as atualizações mais recentes para os primeiros utilizadores. Este ramo não é recomendado para ambientes de produção.
- lts: o ramo de apoio técnico a longo prazo. Esta ramificação é mantida durante um período mais longo do que uma ramificação de produção normal.

Windows

Este script de instalação pode ser usado em VMs com o arranque seguro ativado.

Para VMs do Windows que usam uma série de máquinas G2, este script instala apenas o controlador da NVIDIA.
Para outros tipos de máquinas, o script instala o controlador da NVIDIA e o kit de ferramentas CUDA.

Abra um terminal do PowerShell como administrador e, de seguida, conclua os seguintes passos:

Se estiver a usar o Windows Server 2016, defina a versão do Transport Layer Security (TLS) como 1.2.
```
[Net.ServicePointManager]::SecurityProtocol = 'Tls12'
```

Transfira o script.

Invoke-WebRequest https://github.com/GoogleCloudPlatform/compute-gpu-installation/raw/main/windows/install_gpu_driver.ps1 -OutFile C:\install_gpu_driver.ps1

Execute o script.
```
C:\install_gpu_driver.ps1
```
A execução do script demora algum tempo. Não são apresentadas instruções de comando durante o processo de instalação. Quando o script é terminado, o controlador é instalado.

Este script instala os controladores na seguinte localização predefinida na sua VM: C:\Program Files\NVIDIA Corporation\\.
Valide a instalação. Consulte o artigo Valide a instalação do controlador da GPU.

Instale controladores de GPU (VMs de arranque seguro)

Estas instruções destinam-se à instalação de controladores de GPU em VMs Linux que usam o Arranque seguro.

Suporte de GPU

Os procedimentos nesta secção suportam todos os modelos de GPU disponíveis no Compute Engine.

Não pode usar estes procedimentos para instalar controladores em instâncias de arranque seguro que tenham versões das nossas GPUs NVIDIA RTX Virtual Workstations (vWS) anexadas.

Se estiver a usar uma VM do Windows ou uma VM do Linux que não use o arranque seguro, reveja uma das seguintes instruções:

A instalação do controlador numa VM de arranque seguro é diferente para VMs Linux, porque estas VMs requerem que todos os módulos do kernel tenham uma assinatura de certificado fidedigna.

Instalação

Pode usar uma das seguintes opções para instalar controladores com certificados fidedignos:

Crie um certificado fidedigno para os seus controladores. Para esta opção, escolha uma das seguintes:
- Método automático: use uma ferramenta de criação de imagens para criar imagens de arranque que tenham certificados fidedignos para os seus controladores instalados
- Método manual: gere o seu próprio certificado e use-o para assinar os módulos do kernel do controlador da GPU
Use controladores pré-assinados com um certificado fidedigno existente. Este método só é compatível com o Ubuntu.

Assinatura automática

Sistemas operativos compatíveis:

Este método de assinatura automática foi testado nos seguintes sistemas operativos:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Procedimento

Para criar uma imagem do SO com certificados autoassinados, conclua os seguintes passos:

1. In the Google Cloud console, activate Cloud Shell.
  
  Activate Cloud Shell
  
  At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
2. Transfira a ferramenta cuda_installer. Para transferir a versão mais recente do script, execute o seguinte comando:
```
curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz
```
3. Crie uma imagem com o arranque seguro ativado executando o seguinte comando. O processo de criação de imagens pode demorar até 20 minutos.
```
PROJECT=PROJECT_ID
ZONE=ZONE
BASE_IMAGE=BASE_IMAGE_NAME
SECURE_BOOT_IMAGE=IMAGE_NAME

python3 cuda_installer.pyz build_image \
  --project $PROJECT \
  --vm-zone $ZONE \
  --base-image $BASE_IMAGE $SECURE_BOOT_IMAGE
```
  Substitua o seguinte:
  - PROJECT_ID: ID do projeto no qual criar a imagem
  - ZONE: zona a usar para criar uma VM temporária. Por exemplo, us-west4-a.
  - IMAGE_NAME: nome da imagem que vai ser criada.
  - BASE_IMAGE_NAME: selecione uma das seguintes opções:
    - debian-12
    - rhel-8 ou rhel-9
    - rocky-8 ou rocky-9
    - ubuntu-22 ou ubuntu-24
  Também pode adicionar a flag --family NAME para adicionar a nova imagem a uma família de imagens.
  
  Para ver todas as opções de personalização da execução de imagens python3 cuda_installer.pyz build_image --help. Também pode rever a documentação da cuda_installer no GitHub.
4. Valide a imagem. Siga os passos abaixo para verificar se a imagem tem o arranque seguro ativado e se pode criar instâncias de GPU com os controladores da NVIDIA instalados.
  1. Crie uma instância de VM de teste para verificar se a imagem está corretamente configurada e se os controladores de GPU são carregados com êxito. O exemplo seguinte cria um tipo de máquina N1 com um único acelerador NVIDIA T4 anexado. No entanto, pode usar qualquer tipo de máquina de GPU suportado à sua escolha.
```
TEST_INSTANCE_NAME=TEST_INSTANCE_NAME
ZONE=ZONE

gcloud compute instances create $TEST_INSTANCE_NAME \
 --project=$PROJECT \
 --zone=$ZONE \
 --machine-type=n1-standard-4 \
 --accelerator=count=1,type=nvidia-tesla-t4 \
 --create-disk=auto-delete=yes,boot=yes,device-name=$TEST_INSTANCE_NAME,image=projects/$PROJECT/global/images/$SECURE_BOOT_IMAGE,mode=rw,size=100,type=pd-balanced \
 --shielded-secure-boot \
 --shielded-vtpm \
 --shielded-integrity-monitoring \
 --maintenance-policy=TERMINATE
```
    Substitua o seguinte:
    - TEST_INSTANCE_NAME: um nome para a instância de VM de teste
    - ZONE: uma zona com GPUs T4 ou a GPU da sua escolha. Para mais informações, consulte o artigo Regiões e zonas de GPUs.
  2. Verifique se o arranque seguro está ativado executando o comando mokutil --sb-state na VM de teste através de gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "mokutil --sb-state"
```
  3. Verifique se o controlador está instalado executando o comando nvidia-smi na VM de teste através de gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "nvidia-smi"
```
    Se tiver instalado o CUDA Toolkit, pode usar a cuda_installer ferramenta para validar a instalação da seguinte forma:
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "python3 cuda_installer.pyz verify_cuda"
```
5. Limpar. Depois de validar que a imagem personalizada funciona, não é necessário manter a VM de validação. Para eliminar a VM, execute o seguinte comando:
```
gcloud compute instances delete --zone=$ZONE --project=$PROJECT $TEST_INSTANCE_NAME
```
6. Opcional: para eliminar a imagem do disco que criou, execute o seguinte comando:
```
gcloud compute images delete --project=$PROJECT $SECURE_BOOT_IMAGE
```

Valide a instalação do controlador da GPU

Depois de concluir os passos de instalação do controlador, verifique se o controlador foi instalado e inicializado corretamente.

Linux

Ligue-se à instância do Linux e use o comando nvidia-smi para verificar se o controlador está a ser executado corretamente.

sudo nvidia-smi

O resultado é semelhante ao seguinte:

  +-----------------------------------------------------------------------------------------+
  | NVIDIA-SMI 580.82.07              Driver Version: 580.82.07      CUDA Version: 13.0     |
  +-----------------------------------------+------------------------+----------------------+
  | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
  | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
  |                                         |                        |               MIG M. |
  |=======================================+====================+====================|
  |   0  Tesla T4                       On  |   00000000:00:04.0 Off |                    0 |
  | N/A   53C    P8             17W /   70W |       0MiB /  15360MiB |      0%      Default |
  |                                         |                        |                  N/A |
  +-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
  | Processes:                                                                              |
  |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
  |        ID   ID                                                               Usage      |
  |=========================================================================================|
  |  No running processes found                                                             |
  +-----------------------------------------------------------------------------------------+

Se este comando falhar, verifique se as GPUs estão associadas à VM. Para verificar se existem dispositivos PCI da NVIDIA, execute o seguinte comando:

sudo lspci | grep -i "nvidia"

Windows Server

Ligue-se à instância do Windows Server e abra um terminal do PowerShell. Em seguida, execute o seguinte comando para verificar se o controlador está a ser executado corretamente.

nvidia-smi

O resultado é semelhante ao seguinte:

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 538.67                 Driver Version: 538.67       CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA L4                    WDDM  | 00000000:00:03.0 Off |                    0 |
| N/A   66C    P8              17W /  72W |    128MiB / 23034MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4888    C+G   ...CBS_cw5n1h2txyewy\TextInputHost.exe    N/A      |
|    0   N/A  N/A      5180    C+G   ....Search_cw5n1h2txyewy\SearchApp.exe    N/A      |
+---------------------------------------------------------------------------------------+

O que se segue?

Para monitorizar o desempenho da GPU, consulte o artigo Monitorize o desempenho da GPU.

Para processar a manutenção do anfitrião da GPU, consulte o artigo Processar eventos de manutenção do anfitrião da GPU.
Para melhorar o desempenho da rede, consulte o artigo Use uma largura de banda da rede mais elevada.
Para resolver problemas com VMs de GPU, consulte o artigo Resolva problemas com VMs de GPU.

Instale controladores da GPU

Versões do controlador NVIDIA, do kit de ferramentas CUDA e do tempo de execução CUDA

Compreenda as ramificações dos controladores da NVIDIA

Ramos de controladores NVIDIA recomendados

Instale controladores de GPU em VMs através dos guias do CUDA Toolkit

Instale controladores de GPU em VMs através de um script de instalação

Linux

Linux (script de arranque)

Windows

Instale controladores de GPU (VMs de arranque seguro)

Suporte de GPU

Instalação

Assinatura automática

Autocertificação (manual)

Pré-assinado (apenas para Ubuntu)

Ubuntu PRO e LTS

Ubuntu PRO FIPS

Ubuntu 18.04

Ubuntu 20.04

Ubuntu 22.04

Valide a instalação do controlador da GPU

Linux

Windows Server

O que se segue?