Requisitos de instalação

Antes de pedir o Gemini na API conectada do Google Distributed Cloud, você precisa atender aos requisitos de instalação descritos neste documento. Para mais informações, consulte Como receber suporte.

Hardware certificado

Antes de pedir o Gemini na API conectada do GDC, você precisa adquirir hardware certificado que corresponda à configuração exata descrita nesta seção. Essa configuração é para uma única máquina certificada pelo Google.

Item SKU da Dell Quantidade
PowerEdge XE9680, DSS RESTRICTED 210-BHYV 1
Chassi de 2,5 polegadas 379-BDTF 1
Trusted Platform Module 2.0 V3 461-AAIG 1
Chassi XE9680 6U com 8 GPUs 8 x 2,5 NVMe somente 321-BIEK 1
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 338: CPBP 1
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 338: CPBP 1
Processador adicional selecionado 379-BDCO 1
Configuração de altura ajustável 2 330-BCHH 1
Dissipador de calor para configuração de duas CPUs 412-BBCN 1
Desempenho otimizado 370-AAIP 1
RDIMMs de 5.600 MT/s 370-BBRX 1
C30, sem RAID para chassi NVME 780-BCDO 1
Sem controle 405-AACD 1
Configurações de performance da BIOS 384-BBBL 1
Modo de inicialização do BIOS UEFI com partição GPT 800-BBDM 1
Ventilador de desempenho muito alto x6 750-ADGJ 1
3+3 FTR (freio de energia da GPU ativado), PSU hot-plug, 2.800 W MM HLAC (200-240 VCA) Titanium, conector C22 450-AMMN 1
Placa-mãe do sistema XE9680, MX, MLK 338-CPWL 1
Painel LCD 2U do PowerEdge 325-BETK 1
Conjunto de GPUs NVIDIA HGX H200 de 8 GPUs SXM 141 GB 700 W 490-BKHF 1
Placa controladora BOSS-N1 + com 2 FIPS M.2 de 960 GB (RAID 1) 403-BCVH 1
Cabo BOSS XE9680 470-AFNO 1
Nenhuma placa de rede mezzanine OCP 3.0 412-AASK 1
Nenhum sistema operacional, nenhuma partição de utilitário 611-BBBG 1
iDRAC9, Datacenter 16G 528-CTID 1
Licença do iDRAC Secure Enterprise Key Manager 2.0 634-BZIL 1
Verificação de componentes seguros 528-COYT 1
iDRAC,senha gerada de fábrica 379-BCSF 1
Módulo de serviço iDRAC (ISM), NÃO instalado 379-BCQX 1
Gerenciador de grupos do iDRAC, desativado 379-BCQY 1
Braço organizador de cabos para trilho de rack XE9680 770-BEPB 1
Trilho deslizante pronto XE9680 (B28) 770-BEPC 1
PowerEdge XE9680, envio 340-DDBX 1
Marcação CE do PowerEdge XE9680, sem marcação CCC 389-EFKE 1
Material de envio XE9680 343-BBXC 1
Suporte ao gerenciamento de programas empresariais 973-3700 1
Basic Next Business Day 36 Months 709-BFTF 1
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Ext, 24 Month(s) 199-BTKS 1
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Init, 36 Month(s) 199-BTKT 1
Keep Your Hard Drive For Enterprise, 60 Month(s) 711-BCXN 1
ProDeploy Plus PowerEdge XE Series 5U6U 683-BDSB 1
Implantação de infraestrutura selecionada 701-6538 1
RDIMM de 128 GB, 5.600 MT/s, Quad Rank 370-BBQY 16
Unidade AG de uso misto NVMe de data center de 800 G U2 Gen4 com suporte 400-BRPJ 1
C20 para C21, estilo PDU, 16 AMP, 2,4 metros, cabo de alimentação 450-AGXK 6
Broadcom 5720 Dual Port 1GbE LOM 540-BDKD 1
Adaptador de rede Mellanox ConnectX-6 DX de porta dupla 100GbE QSFP56, altura total 540-BCXO 2

Tamanho e peso

Cada máquina certificada pelo Google tem 6U de altura e as seguintes dimensões:

  • Altura: 263,2 mm (10,36")
  • Largura: 482 mm (18,97")
  • Profundidade: 1008,77 mm (39,71") incluindo o painel frontal

Cada máquina certificada pelo Google pesa 113,3 kg.

Alimentação e resfriamento

Cada máquina certificada pelo Google tem as seguintes especificações elétricas:

  • Tensão:100 V a 240 V CA, 50/60 Hz
  • Energia:11.000 W no máximo

Sua instalação precisa ter resfriamento adequado para oferecer suporte a uma (1) máquina certificada pelo Google para cada implantação do Gemini na API conectada ao GDC.

Rede

Nesta seção, descrevemos os requisitos de rede para implantar o Gemini na API conectada do GDC.

Conectividade de rede

A Figura 1 ilustra a rede de APIs conectadas do Gemini no GDC.

Figura 1. Gemini na API GDC connected em rede conectada do Distributed Cloud.
Figura 1. Gemini na API GDC connected em rede conectada do Distributed Cloud.

Você precisa atender aos seguintes requisitos de conectividade de rede para implantar o Gemini na API conectada do GDC:

  • Prepare um switch de topo de rack (ToR) que ofereça suporte à conectividade óptica de 100 gigabits com plug-in de formato pequeno quádruplo (QSFP).

  • Alocar um mínimo de uma porta óptica QFSP de 100 gigabits no switch ToR por máquina certificada pelo Google. No entanto, o Google recomenda alocar duas portas ópticas QFSP de 100G por máquina para alta disponibilidade. Cada uma dessas portas requer cabeamento QSFP-100G-SR4-S.

  • Se você estiver alocando duas portas por máquina, conecte as duas portas do switch ToR ao mesmo adaptador de rede Mellanox CX-6 em cada máquina.

  • Uma conexão de Internet com largura de banda mínima de 1 Gbps downstream e 100 Mbps upstream.

Faça as seguintes conexões de rede para cada máquina certificada pelo Google:

  • Conecte uma ou as duas portas de 100 gigabits QFSP no adaptador de rede Mellanox CX-6 na máquina ao switch ToR. Essas portas processam o tráfego de alta velocidade da API conectada do Gemini no GDC e do software conectado do Distributed Cloud.

  • Conecte a porta do Integrated Dell Remote Access Controller (iDRAC) na máquina a um switch de camada 2 separado. Isso é necessário para o gerenciamento de máquinas.

  • Conecte o switch de gerenciamento e o switch ToR na camada 2.

Configuração de rede

Configure sua rede local da seguinte maneira para implantar o Gemini na API conectada ao GDC:

  • Alocar uma VLAN dedicada sem tag configurada com uma unidade de transmissão máxima (MTU) de 1.500 bytes.
  • Aloque um bloco de endereços CIDR IPv4 /26 particular para conectividade de carga de trabalho.
  • Configure a conectividade de saída para a VLAN usando o peering do BGP e divulgue o bloco CIDR /26 atribuído para a rede upstream.
  • Provisione a VLAN com uma rota padrão para a rede upstream e a Internet.
  • Um servidor de protocolo de configuração de host dinâmico (DHCP) que pode atribuir endereços IPv4 às máquinas certificadas pelo Google para inicialização. Os endereços nesse bloco DHCP precisam ser a última seção /29 do bloco de endereços CIDR IPv4 de conectividade da carga de trabalho.

Configuração do switch ToR

Configure o switch ToR da seguinte maneira:

  • Ative o suporte a DHCPv4 e DNS nas portas alocadas ao Gemini em máquinas de API conectadas ao GDC.
  • Configure um bloco CIDR IPv4 /26 particular na VLAN dedicada e sem tag com uma MTU de 1.500 bytes.
  • Alocar o primeiro endereço IPv4 no bloco CIDR como o gateway de rede.
  • Verifique se o restante dos endereços IPv4 no bloco CIDR está livre. O Gemini na API conectada ao GDC os aloca automaticamente para funções, serviços e endpoints de modelos locais do sistema.

Configuração do servidor DHCP

Configure o servidor DHCP para o Gemini em máquinas de API conectadas ao GDC da seguinte maneira:

  • O servidor DHCP precisa ser acessível de todas as portas do switch ToR conectadas ao Gemini em máquinas de API conectadas ao GDC.
  • Reserve o último segmento /29 do bloco CIDR IPv4 /26 alocado ao Gemini em máquinas de API conectadas ao GDC para atribuições de DHCP e configure o servidor DHCP para usar esse segmento /29 como um pool de endereços DHCP.

Configuração do firewall

Configure seu firewall local para permitir o tráfego da API conectada do Gemini no GDC da seguinte maneira:

Nome Endereço IP de origem Endereço IP anycast de destino Protocolo Porta
Gerenciamento conectado do GDC (TCP), serviço de comprovação, serviço de verificação de recitação, downloads de modelos CIDR da zona do GDCc (/26) Intervalos de IP do Google TCP 443
Gerenciamento do GDC conectado (UDP) CIDR da zona do GDCc (/26) Intervalos de IP do Google UDP 443
Serviço de nomes de domínio (DNS) CIDR da zona do GDCc (/26) DNS do Google: 8.8.8.8, 8.8.4.4 UDP 53
Network Time Protocol (NTP) CIDR da zona do GDCc (/26) NTP do Google: 216.239.35.{0,4,8,12} UDP 123
Declaração remota do Intel TDX CIDR da zona do GDCc (/26) 4.255.75.174/32 TCP 443

Chave de API de comprovação remota do Intel TDX

Para ativar o atestado das máquinas virtuais confidenciais que atendem aos endpoints de API conectados do Gemini no GDC, é necessário obter uma chave de API de atestado remoto do Intel TDX e fornecê-la ao Google. Para conseguir a chave de API, siga as etapas desta seção.

  1. Acesse a página Intel® Provisioning Certification Service for ECDSA Attestation (em inglês).

  2. Na seção Receber certificados PCK, clique em Inscrever-se.

  3. Siga as instruções exibidas para criar uma conta e estabelecer uma assinatura do serviço de certificação de provisionamento do Intel® SGX.

  4. Na seção Suas assinaturas da sua conta, encontre e anote a chave de API principal da sua assinatura do Intel® SGX Provisioning Certification Service.

Informações a serem fornecidas ao Google

Forneça as seguintes informações ao Google:

  1. Dados de contato de uma pessoa responsável por adquirir e implantar as máquinas certificadas pelo Google.

  2. O bloco CIDR IPv4 /26 alocado para suas máquinas certificadas pelo Google.

  3. As chaves de API principal e secundária da sua assinatura do serviço de certificação de provisionamento do Intel® SGX.

  4. As tags de serviço para suas máquinas de API conectadas ao Gemini no GDC. Para instruções, consulte Como localizar o código e a tag de serviço do Express.

  5. Os identificadores de segurança física (PSIDs, na sigla em inglês) de unidades de disco não inicializáveis em máquinas certificadas pelo Google.

  6. O ID do projeto do Google Cloud que hospeda sua zona conectada do Distributed Cloud para o Gemini na API conectada do GDC.

Validar o hardware certificado

Antes de agendar uma visita de um técnico do Google, valide seu hardware certificado da seguinte forma:

  1. Receba o script de validação de hardware do seu representante do Google.

  2. Instale ou inicialize o Ubuntu Linux na máquina certificada.

  3. Execute o script de validação de hardware na máquina certificada.

  4. Forneça a saída do script ao seu representante do Google.

A seguir

Para colocar sua implantação de API conectada do Gemini no GDC on-line, faça o seguinte:

  1. Receba e instale o hardware certificado pela API Gemini no GDC conectado no local de destino.

  2. Configure seu ambiente de API conectada do Gemini no GDC conforme descrito anteriormente neste documento.

  3. Valide o hardware certificado conforme descrito anteriormente neste documento.

  4. Coordene com seu representante do Google para agendar uma visita de um técnico do Google.

  5. Conclua a visita do técnico do Google para instalar e configurar o software da API conectada do Gemini no GDC.

  6. Conclua as etapas em Criar e gerenciar endpoints.