Antes de pedir Gemini en la API conectada de Google Distributed Cloud, debes cumplir los requisitos de instalación que se describen en este documento. Para obtener más información, consulta Obtener asistencia.
Hardware certificado
Antes de pedir Gemini en la API conectada de GDC, debes adquirir hardware certificado que coincida con la configuración exacta descrita en esta sección. Esta configuración es para una sola máquina certificada por Google.
Elemento | SKU de Dell | Cantidad |
---|---|---|
PowerEdge XE9680, DSS RESTRICTED | 210-BHYV | 1 |
Chasis 2.5 | 379-BDTF | 1 |
Trusted Platform Module 2.0 V3 | 461-AAIG | 1 |
Chasis XE9680 6U con 8 GPUs y 8 NVMe de 2,5" | 321-BIEK | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338-CPBP | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338-CPBP | 1 |
Se ha seleccionado un procesador adicional | 379-BDCO | 1 |
Riser Config 2 | 330-BCHH | 1 |
Disipador de calor para configuración de 2 CPUs | 412-BBCN | 1 |
Rendimiento optimizado | 370-AAIP | 1 |
RDIMMs de 5600 MT/s | 370-BBRX | 1 |
C30, sin RAID para chasis NVME | 780-BCDO | 1 |
Sin mando | 405-AACD | 1 |
Configuración de la BIOS de rendimiento | 384-BBBL | 1 |
Modo de inicio de BIOS UEFI con partición GPT | 800-BBDM | 1 |
Ventilador de muy alto rendimiento x6 | 750-ADGJ | 1 |
3+3 FTR (GPU Power Brake Enabled), Hot-Plug PSU, 2800W MM HLAC (200-240Vac) Titanium, C22 Connector | 450-AMMN | 1 |
XE9680 System Motherboard, MX, MLK | 338-CPWL | 1 |
Pantalla LCD 2U de PowerEdge | 325-BETK | 1 |
Ensamblaje de GPUs NVIDIA HGX H200 8-GPU SXM 141 GB 700 W | 490-BKHF | 1 |
Tarjeta controladora BOSS-N1 con 2 unidades M.2 FIPS de 960 GB (RAID 1) | 403-BCVH | 1 |
Cable XE9680 BOSS | 470-AFNO | 1 |
No hay tarjeta NIC mezzanine OCP 3.0 | 412-AASK | 1 |
Sin sistema operativo, sin partición de utilidad | 611-BBBG | 1 |
iDRAC9, Datacenter 16G | 528-CTID | 1 |
Licencia de iDRAC Secure Enterprise Key Manager 2.0 | 634-BZIL | 1 |
Verificación de componentes seguros | 528-COYT | 1 |
iDRAC,contraseña generada de fábrica | 379-BCSF | 1 |
Módulo de servicio iDRAC (ISM), NO instalado | 379-BCQX | 1 |
Administrador de grupos de iDRAC, inhabilitado | 379-BCQY | 1 |
Brazo de gestión de cables para riel de rack XE9680 | 770-BEPB | 1 |
XE9680 Sliding Ready Rail (B28) | 770-BEPC | 1 |
PowerEdge XE9680, envío | 340-DDBX | 1 |
PowerEdge XE9680 con marcado CE, sin marcado CCC | 389-EFKE | 1 |
XE9680 Shipping Material | 343-BBXC | 1 |
Asistencia para la gestión de programas Enterprise | 973-3700 | 1 |
Básico al siguiente día hábil (36 meses) | 709-BFTF | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Ext, 24 Month(s) | 199-BTKS | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Init, 36 Month(s) | 199-BTKT | 1 |
Keep Your Hard Drive For Enterprise, 60 Month(s) | 711-BCXN | 1 |
ProDeploy Plus PowerEdge XE Series 5U6U | 683-BDSB | 1 |
Infraestructura de despliegue seleccionada | 701-6538 | 1 |
RDIMM de 128 GB, 5600 MT/s, Quad Rank | 370-BBQY | 16 |
Unidad AG de uso mixto NVMe de centro de datos de 800 GB U2 Gen4 con operador | 400-BRPJ | 1 |
C20 a C21, estilo PDU, 16 A, 2,4 m, cable de alimentación | 450-AGXK | 6 |
Broadcom 5720 Dual Port 1GbE LOM | 540-BDKD | 1 |
Adaptador de red Mellanox ConnectX-6 DX de doble puerto 100GbE QSFP56, altura completa | 540-BCXO | 2 |
Tamaño y peso
Cada máquina certificada por Google tiene una altura de 6 U y las siguientes dimensiones:
- Altura: 263,2 mm (10,36")
- Anchura: 482,0 mm (18,97")
- Profundidad: 1008,77 mm (39,71") con el marco frontal incluido
Cada máquina certificada por Google pesa 113,3 kg.
Energía y refrigeración
Cada máquina certificada por Google tiene las siguientes especificaciones eléctricas:
- Voltaje: de 100 a 240 V CA, 50/60 Hz
- Potencia: 11.000 W como máximo
Tu centro de datos debe tener una refrigeración adecuada para admitir una (1) máquina certificada por Google por cada implementación de la API conectada de Gemini en GDC.
Redes
En esta sección se describen los requisitos de red para implementar Gemini en la API conectada de GDC.
Conectividad de red
En la figura 1 se muestra Gemini en la red de APIs conectada a GDC.
Para implementar Gemini en la API conectada de GDC, debes cumplir los siguientes requisitos de conectividad de red:
Prepara un switch Top-of-Rack (ToR) que admita conectividad óptica de 100 gigabits con factor de forma pequeño enchufable cuádruple (QSFP).
Asigna un mínimo de un puerto óptico QFSP de 100 gigabits en el switch ToR por máquina certificada por Google. Sin embargo, Google recomienda asignar dos puertos ópticos QFSP de 100 G por máquina para garantizar la alta disponibilidad. Cada uno de estos puertos requiere cableado QSFP-100G-SR4-S.
Si asignas dos puertos por máquina, conecta ambos puertos del switch ToR al mismo adaptador de red Mellanox CX-6 en cada máquina.
Una conexión a Internet con un ancho de banda mínimo de 1 Gbps de descarga y 100 Mbps de subida.
Establece las siguientes conexiones de red para cada máquina certificada por Google:
Conecta uno o ambos puertos QFSP de 100 gigabits del adaptador de red Mellanox CX-6 de la máquina al switch ToR. Estos puertos gestionan el tráfico de alta velocidad de la API de Gemini en GDC connected y el software de Distributed Cloud connected.
Conecta el puerto del controlador de acceso remoto de Dell (iDRAC) integrado de la máquina a un conmutador de capa 2 independiente. Es necesario para la gestión de máquinas.
Conecta el conmutador de gestión y el conmutador ToR en la capa 2.
Configuración de red
Configura tu red local de la siguiente manera para implementar Gemini en la API conectada de GDC:
- Asigna una VLAN sin etiquetar dedicada configurada con un tamaño de unidad máxima de transmisión (MTU) de 1500 bytes.
- Asigna un bloque de direcciones CIDR IPv4 /26 privadas para la conectividad de las cargas de trabajo.
- Configura la conectividad de salida de la VLAN mediante el emparejamiento BGP y anuncia el bloque CIDR /26 asignado a la red upstream.
- Aprovisiona la VLAN con una ruta predeterminada a la red de nivel superior e Internet.
- Un servidor de protocolo de configuración dinámica de host (DHCP) que pueda asignar direcciones IPv4 a las máquinas certificadas por Google para el arranque. Las direcciones de este bloque DHCP deben ser la última sección /29 del bloque de direcciones CIDR IPv4 de conectividad de la carga de trabajo.
Configuración del interruptor ToR
Configura tu interruptor ToR de la siguiente manera:
- Habilita la compatibilidad con DHCPv4 y DNS en los puertos asignados a Gemini en las máquinas de API conectadas a GDC.
- Configura un bloque CIDR IPv4 privado /26 en la VLAN dedicada sin etiquetar con una MTU de 1500 bytes.
- Asigna la primera dirección IPv4 del bloque CIDR como puerta de enlace de la red.
- Asegúrate de que el resto de las direcciones IPv4 del bloque CIDR estén libres. Gemini en la API conectada de GDC las asigna automáticamente para funciones, servicios y endpoints de modelos locales del sistema.
Configuración del servidor DHCP
Configura el servidor DHCP para Gemini en las máquinas de la API conectadas a GDC de la siguiente manera:
- Se debe poder acceder al servidor DHCP desde todos los puertos del conmutador ToR conectados a Gemini en las máquinas de la API conectadas a GDC.
- Reserva el último segmento /29 del bloque CIDR IPv4 /26 que has asignado a Gemini en las máquinas de la API conectadas a GDC para las asignaciones de DHCP y configura el servidor DHCP para que use este segmento /29 como grupo de direcciones DHCP.
Configuración del cortafuegos
Configura tu cortafuegos local para permitir el tráfico de la API conectada de Gemini en GDC de la siguiente manera:
Nombre | Dirección IP de origen | Dirección IP de Anycast de destino | Protocolo | Puerto |
---|---|---|---|---|
Gestión conectada de GDC (TCP), servicio de certificación, servicio de comprobación de recitación y descargas de modelos | CIDR de zona de GDCc (/26) | Intervalos de IPs de Google | TCP | 443 |
Gestión de GDC conectado (UDP) | CIDR de zona de GDCc (/26) | Intervalos de IPs de Google | UDP | 443 |
Servicio de nombres de dominio (DNS) | CIDR de zona de GDCc (/26) | DNS de Google: 8.8.8.8 , 8.8.4.4 |
UDP | 53 |
Protocolo de hora de red (NTP) | CIDR de zona de GDCc (/26) | NTP de Google: 216.239.35.{0,4,8,12} |
UDP | 123 |
Confirmación remota de Intel TDX | CIDR de zona de GDCc (/26) | 4.255.75.174/32 |
TCP | 443 |
Clave de API de confirmación remota de Intel TDX
Para habilitar la certificación de las máquinas virtuales confidenciales que sirven a tus endpoints de API conectados de Gemini en GDC, debes obtener una clave de API de certificación remota de Intel TDX y proporcionársela a Google. Para obtener la clave de API, sigue los pasos que se indican en esta sección.
Ve a la página del servicio de certificación de aprovisionamiento de Intel® para la certificación ECDSA.
En la sección Get PCK Certificates (Obtener certificados PCK), haga clic en Subscribe (Suscribirse).
Sigue las instrucciones que aparecen en pantalla para crear una cuenta y establecer una suscripción al servicio de certificación de aprovisionamiento de Intel® SGX.
En la sección Tus suscripciones de tu cuenta, busca y anota la clave de API principal de tu suscripción al servicio de certificación de aprovisionamiento de Intel® SGX.
Información que debe proporcionar a Google
Proporciona la siguiente información a Google:
Información de contacto de la persona responsable de adquirir e implementar las máquinas certificadas por Google.
El bloque CIDR IPv4 /26 que has asignado a tus máquinas certificadas por Google.
Las claves de API principal y secundaria de tu suscripción al servicio de certificación de aprovisionamiento de Intel® SGX.
Las etiquetas de servicio de tus máquinas de API conectadas de Gemini on GDC. Para ver instrucciones, consulta el artículo Localizar el código de servicio exprés y la etiqueta de servicio.
Los identificadores de seguridad física (PSIDs) de las unidades de disco que no son de arranque en las máquinas certificadas por Google.
El ID del proyecto que aloja tu zona conectada de Distributed Cloud para Gemini en la API conectada de GDC. Google Cloud
Validar el hardware certificado
Antes de concertar una visita de un técnico de Google, debes validar tu hardware certificado de la siguiente manera:
Obtén la secuencia de comandos de validación de hardware de tu representante de Google.
Instala o inicia Ubuntu Linux en la máquina certificada.
Ejecuta la secuencia de comandos de validación de hardware en el equipo certificado.
Proporciona el resultado de la secuencia de comandos a tu representante de Google.
Siguientes pasos
Para poner en línea tu implementación de la API conectada de Gemini en GDC, haz lo siguiente:
Recibe e instala el hardware certificado de la API conectada de Gemini on GDC en la ubicación de destino.
Configura tu entorno de API conectada de Gemini en GDC como se ha descrito anteriormente en este documento.
Valida el hardware certificado tal como se ha descrito anteriormente en este documento.
Coordina con tu representante de Google la visita de un técnico de Google.
Completa la visita del técnico de Google para instalar y configurar el software de la API de Gemini en GDC conectado.
Completa los pasos que se indican en el artículo Crear y gestionar endpoints.