Antes de pedir o Gemini na API conectada do Google Distributed Cloud, você precisa atender aos requisitos de instalação descritos neste documento. Para mais informações, consulte Como receber suporte.
Hardware certificado
Antes de pedir o Gemini na API conectada do GDC, você precisa adquirir hardware certificado que corresponda à configuração exata descrita nesta seção. Essa configuração é para uma única máquina certificada pelo Google.
Item | SKU da Dell | Quantidade |
---|---|---|
PowerEdge XE9680, DSS RESTRICTED | 210-BHYV | 1 |
Chassi de 2,5 polegadas | 379-BDTF | 1 |
Trusted Platform Module 2.0 V3 | 461-AAIG | 1 |
Chassi XE9680 6U com 8 GPUs 8 x 2,5 NVMe somente | 321-BIEK | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338: CPBP | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338: CPBP | 1 |
Processador adicional selecionado | 379-BDCO | 1 |
Configuração de altura ajustável 2 | 330-BCHH | 1 |
Dissipador de calor para configuração de duas CPUs | 412-BBCN | 1 |
Desempenho otimizado | 370-AAIP | 1 |
RDIMMs de 5.600 MT/s | 370-BBRX | 1 |
C30, sem RAID para chassi NVME | 780-BCDO | 1 |
Sem controle | 405-AACD | 1 |
Configurações de performance da BIOS | 384-BBBL | 1 |
Modo de inicialização do BIOS UEFI com partição GPT | 800-BBDM | 1 |
Ventilador de desempenho muito alto x6 | 750-ADGJ | 1 |
3+3 FTR (freio de energia da GPU ativado), PSU hot-plug, 2.800 W MM HLAC (200-240 VCA) Titanium, conector C22 | 450-AMMN | 1 |
Placa-mãe do sistema XE9680, MX, MLK | 338-CPWL | 1 |
Painel LCD 2U do PowerEdge | 325-BETK | 1 |
Conjunto de GPUs NVIDIA HGX H200 de 8 GPUs SXM 141 GB 700 W | 490-BKHF | 1 |
Placa controladora BOSS-N1 + com 2 FIPS M.2 de 960 GB (RAID 1) | 403-BCVH | 1 |
Cabo BOSS XE9680 | 470-AFNO | 1 |
Nenhuma placa de rede mezzanine OCP 3.0 | 412-AASK | 1 |
Nenhum sistema operacional, nenhuma partição de utilitário | 611-BBBG | 1 |
iDRAC9, Datacenter 16G | 528-CTID | 1 |
Licença do iDRAC Secure Enterprise Key Manager 2.0 | 634-BZIL | 1 |
Verificação de componentes seguros | 528-COYT | 1 |
iDRAC,senha gerada de fábrica | 379-BCSF | 1 |
Módulo de serviço iDRAC (ISM), NÃO instalado | 379-BCQX | 1 |
Gerenciador de grupos do iDRAC, desativado | 379-BCQY | 1 |
Braço organizador de cabos para trilho de rack XE9680 | 770-BEPB | 1 |
Trilho deslizante pronto XE9680 (B28) | 770-BEPC | 1 |
PowerEdge XE9680, envio | 340-DDBX | 1 |
Marcação CE do PowerEdge XE9680, sem marcação CCC | 389-EFKE | 1 |
Material de envio XE9680 | 343-BBXC | 1 |
Suporte ao gerenciamento de programas empresariais | 973-3700 | 1 |
Basic Next Business Day 36 Months | 709-BFTF | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Ext, 24 Month(s) | 199-BTKS | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Init, 36 Month(s) | 199-BTKT | 1 |
Keep Your Hard Drive For Enterprise, 60 Month(s) | 711-BCXN | 1 |
ProDeploy Plus PowerEdge XE Series 5U6U | 683-BDSB | 1 |
Implantação de infraestrutura selecionada | 701-6538 | 1 |
RDIMM de 128 GB, 5.600 MT/s, Quad Rank | 370-BBQY | 16 |
Unidade AG de uso misto NVMe de data center de 800 G U2 Gen4 com suporte | 400-BRPJ | 1 |
C20 para C21, estilo PDU, 16 AMP, 2,4 metros, cabo de alimentação | 450-AGXK | 6 |
Broadcom 5720 Dual Port 1GbE LOM | 540-BDKD | 1 |
Adaptador de rede Mellanox ConnectX-6 DX de porta dupla 100GbE QSFP56, altura total | 540-BCXO | 2 |
Tamanho e peso
Cada máquina certificada pelo Google tem 6U de altura e as seguintes dimensões:
- Altura: 263,2 mm (10,36")
- Largura: 482 mm (18,97")
- Profundidade: 1008,77 mm (39,71") incluindo o painel frontal
Cada máquina certificada pelo Google pesa 113,3 kg.
Alimentação e resfriamento
Cada máquina certificada pelo Google tem as seguintes especificações elétricas:
- Tensão:100 V a 240 V CA, 50/60 Hz
- Energia:11.000 W no máximo
Sua instalação precisa ter resfriamento adequado para oferecer suporte a uma (1) máquina certificada pelo Google para cada implantação do Gemini na API conectada ao GDC.
Rede
Nesta seção, descrevemos os requisitos de rede para implantar o Gemini na API conectada do GDC.
Conectividade de rede
A Figura 1 ilustra a rede de APIs conectadas do Gemini no GDC.
Você precisa atender aos seguintes requisitos de conectividade de rede para implantar o Gemini na API conectada do GDC:
Prepare um switch de topo de rack (ToR) que ofereça suporte à conectividade óptica de 100 gigabits com plug-in de formato pequeno quádruplo (QSFP).
Alocar um mínimo de uma porta óptica QFSP de 100 gigabits no switch ToR por máquina certificada pelo Google. No entanto, o Google recomenda alocar duas portas ópticas QFSP de 100G por máquina para alta disponibilidade. Cada uma dessas portas requer cabeamento QSFP-100G-SR4-S.
Se você estiver alocando duas portas por máquina, conecte as duas portas do switch ToR ao mesmo adaptador de rede Mellanox CX-6 em cada máquina.
Uma conexão de Internet com largura de banda mínima de 1 Gbps downstream e 100 Mbps upstream.
Faça as seguintes conexões de rede para cada máquina certificada pelo Google:
Conecte uma ou as duas portas de 100 gigabits QFSP no adaptador de rede Mellanox CX-6 na máquina ao switch ToR. Essas portas processam o tráfego de alta velocidade da API conectada do Gemini no GDC e do software conectado do Distributed Cloud.
Conecte a porta do Integrated Dell Remote Access Controller (iDRAC) na máquina a um switch de camada 2 separado. Isso é necessário para o gerenciamento de máquinas.
Conecte o switch de gerenciamento e o switch ToR na camada 2.
Configuração de rede
Configure sua rede local da seguinte maneira para implantar o Gemini na API conectada ao GDC:
- Alocar uma VLAN dedicada sem tag configurada com uma unidade de transmissão máxima (MTU) de 1.500 bytes.
- Aloque um bloco de endereços CIDR IPv4 /26 particular para conectividade de carga de trabalho.
- Configure a conectividade de saída para a VLAN usando o peering do BGP e divulgue o bloco CIDR /26 atribuído para a rede upstream.
- Provisione a VLAN com uma rota padrão para a rede upstream e a Internet.
- Um servidor de protocolo de configuração de host dinâmico (DHCP) que pode atribuir endereços IPv4 às máquinas certificadas pelo Google para inicialização. Os endereços nesse bloco DHCP precisam ser a última seção /29 do bloco de endereços CIDR IPv4 de conectividade da carga de trabalho.
Configuração do switch ToR
Configure o switch ToR da seguinte maneira:
- Ative o suporte a DHCPv4 e DNS nas portas alocadas ao Gemini em máquinas de API conectadas ao GDC.
- Configure um bloco CIDR IPv4 /26 particular na VLAN dedicada e sem tag com uma MTU de 1.500 bytes.
- Alocar o primeiro endereço IPv4 no bloco CIDR como o gateway de rede.
- Verifique se o restante dos endereços IPv4 no bloco CIDR está livre. O Gemini na API conectada ao GDC os aloca automaticamente para funções, serviços e endpoints de modelos locais do sistema.
Configuração do servidor DHCP
Configure o servidor DHCP para o Gemini em máquinas de API conectadas ao GDC da seguinte maneira:
- O servidor DHCP precisa ser acessível de todas as portas do switch ToR conectadas ao Gemini em máquinas de API conectadas ao GDC.
- Reserve o último segmento /29 do bloco CIDR IPv4 /26 alocado ao Gemini em máquinas de API conectadas ao GDC para atribuições de DHCP e configure o servidor DHCP para usar esse segmento /29 como um pool de endereços DHCP.
Configuração do firewall
Configure seu firewall local para permitir o tráfego da API conectada do Gemini no GDC da seguinte maneira:
Nome | Endereço IP de origem | Endereço IP anycast de destino | Protocolo | Porta |
---|---|---|---|---|
Gerenciamento conectado do GDC (TCP), serviço de comprovação, serviço de verificação de recitação, downloads de modelos | CIDR da zona do GDCc (/26) | Intervalos de IP do Google | TCP | 443 |
Gerenciamento do GDC conectado (UDP) | CIDR da zona do GDCc (/26) | Intervalos de IP do Google | UDP | 443 |
Serviço de nomes de domínio (DNS) | CIDR da zona do GDCc (/26) | DNS do Google: 8.8.8.8 , 8.8.4.4 |
UDP | 53 |
Network Time Protocol (NTP) | CIDR da zona do GDCc (/26) | NTP do Google: 216.239.35.{0,4,8,12} |
UDP | 123 |
Declaração remota do Intel TDX | CIDR da zona do GDCc (/26) | 4.255.75.174/32 |
TCP | 443 |
Chave de API de comprovação remota do Intel TDX
Para ativar o atestado das máquinas virtuais confidenciais que atendem aos endpoints de API conectados do Gemini no GDC, é necessário obter uma chave de API de atestado remoto do Intel TDX e fornecê-la ao Google. Para conseguir a chave de API, siga as etapas desta seção.
Acesse a página Intel® Provisioning Certification Service for ECDSA Attestation (em inglês).
Na seção Receber certificados PCK, clique em Inscrever-se.
Siga as instruções exibidas para criar uma conta e estabelecer uma assinatura do serviço de certificação de provisionamento do Intel® SGX.
Na seção Suas assinaturas da sua conta, encontre e anote a chave de API principal da sua assinatura do Intel® SGX Provisioning Certification Service.
Informações a serem fornecidas ao Google
Forneça as seguintes informações ao Google:
Dados de contato de uma pessoa responsável por adquirir e implantar as máquinas certificadas pelo Google.
O bloco CIDR IPv4 /26 alocado para suas máquinas certificadas pelo Google.
As chaves de API principal e secundária da sua assinatura do serviço de certificação de provisionamento do Intel® SGX.
As tags de serviço para suas máquinas de API conectadas ao Gemini no GDC. Para instruções, consulte Como localizar o código e a tag de serviço do Express.
Os identificadores de segurança física (PSIDs, na sigla em inglês) de unidades de disco não inicializáveis em máquinas certificadas pelo Google.
O ID do projeto do Google Cloud que hospeda sua zona conectada do Distributed Cloud para o Gemini na API conectada do GDC.
Validar o hardware certificado
Antes de agendar uma visita de um técnico do Google, valide seu hardware certificado da seguinte forma:
Receba o script de validação de hardware do seu representante do Google.
Instale ou inicialize o Ubuntu Linux na máquina certificada.
Execute o script de validação de hardware na máquina certificada.
Forneça a saída do script ao seu representante do Google.
A seguir
Para colocar sua implantação de API conectada do Gemini no GDC on-line, faça o seguinte:
Receba e instale o hardware certificado pela API Gemini no GDC conectado no local de destino.
Configure seu ambiente de API conectada do Gemini no GDC conforme descrito anteriormente neste documento.
Valide o hardware certificado conforme descrito anteriormente neste documento.
Coordene com seu representante do Google para agendar uma visita de um técnico do Google.
Conclua a visita do técnico do Google para instalar e configurar o software da API conectada do Gemini no GDC.
Conclua as etapas em Criar e gerenciar endpoints.