Esta página foi traduzida pela API Cloud Translation.

Configurar a rede para o Gemini

Nesta página, mostramos como configurar o Gemini em um ambiente isolado do Google Distributed Cloud (GDC). Este guia é destinado a operadores de infraestrutura (IOs, na sigla em inglês) que gerenciam implantações de sistemas. Ele aborda detalhes sobre a infraestrutura necessária, a configuração de hardware para pods de GPU e as configurações de rede necessárias para implantar o Gemini.

Antes de começar

Para configurar a rede do Gemini, é necessário ter o cluster de administrador raiz instalado com sucesso nos racks de base. Para mais informações, consulte Bootstrap do cluster de administrador raiz.

Configurar o hardware de GPU para o Gemini

Para executar o Gemini no GDC, é necessário implantar o hardware necessário na forma de um pod de GPU. Um pod de GPU consiste em um a oito servidores de GPU que consomem energia e é a unidade mínima implantável de racks compatíveis com GPU. Cada servidor de GPU fica em um rack próprio e se conecta a um switch de gerenciamento dedicado e a dois switches compartilhados de topo de rack (TOR, na sigla em inglês). O número de servidores por rack depende do orçamento de energia e dos seus requisitos.

O diagrama a seguir mostra duas configurações diferentes de pods de GPU:

Configuração de rack de um pod de GPU

Figura 1. Dois pods de GPU são mostrados. O primeiro pod de GPU consiste em oito servidores de GPU. O segundo pod de GPU consiste em cinco servidores de GPU.

Na Figura 1, o primeiro pod de GPU consiste no seguinte:

Um par de nuvens privadas virtuais (VPCs) dedicadas, que podem oferecer suporte a até oito servidores de GPU. Para mais conexões de servidor, é preciso criar novos pods de GPU.
Cada GPU XE9680 no pod de GPU tem uso exclusivo de um switch TOR. Os TORs no pod da GPU não são compartilhados com outros recursos de computação ou armazenamento.
Dois switches TOR são conectados para oferecer conectividade de alta largura de banda aos servidores de GPU.
Esse pod de GPU consiste em até oito servidores de GPU. Cada servidor fica em um rack próprio.
Cada servidor de GPU se conecta a um switch de gerenciamento dedicado e aos switches TOR de GPU compartilhados que formam um par de VPCs.

Na figura 1, o segundo pod de GPU mostrado compartilha a mesma arquitetura, mas consiste em cinco servidores de GPU em vez de oito.