Prima di ordinare Gemini sull'API Google Distributed Cloud connessa, devi soddisfare i requisiti di installazione descritti in questo documento. Per ulteriori informazioni, consulta la pagina Richiedere assistenza.
Hardware certificato
Prima di ordinare Gemini sull'API connessa GDC, devi procurarti hardware certificato che corrisponda esattamente alla configurazione descritta in questa sezione. Questa configurazione è per una singola macchina certificata da Google.
Elemento | SKU Dell | Quantità |
---|---|---|
PowerEdge XE9680, DSS RESTRICTED | 210-BHYV | 1 |
2.5 Chassis | 379-BDTF | 1 |
Trusted Platform Module 2.0 V3 | 461-AAIG | 1 |
XE9680 6U Chassis with 8 GPU 8 x 2.5 NVMe Only | 321-BIEK | 1 |
Intel Xeon Platinum 8592+ 1,9 G, 64C/128T, 20 GT/s, 320 M di cache, Turbo, HT (350 W) DDR5-5600 | 338-CPBP | 1 |
Intel Xeon Platinum 8592+ 1,9 G, 64C/128T, 20 GT/s, 320 M di cache, Turbo, HT (350 W) DDR5-5600 | 338-CPBP | 1 |
Processore aggiuntivo selezionato | 379-BDCO | 1 |
Configurazione riser 2 | 330-BCHH | 1 |
Dissipatore per configurazione a 2 CPU | 412-BBCN | 1 |
Prestazioni ottimizzate | 370-AAIP | 1 |
RDIMM da 5600 MT/s | 370-BBRX | 1 |
C30, nessun RAID per lo chassis NVME | 780-BCDO | 1 |
Nessun controller | 405-AACD | 1 |
Impostazioni del BIOS per le prestazioni | 384-BBBL | 1 |
Modalità di avvio del BIOS UEFI con partizione GPT | 800-BBDM | 1 |
Ventola ad altissime prestazioni x6 | 750-ADGJ | 1 |
3+3 FTR (GPU Power Brake Enabled), alimentatore hot-plug, 2800 W MM HLAC (200-240 V CA) in titanio, connettore C22 | 450-AMMN | 1 |
XE9680 System Motherboard, MX, MLK | 338-CPWL | 1 |
Cornice LCD 2U PowerEdge | 325-BETK | 1 |
NVIDIA HGX H200 8-GPU SXM 141GB 700W GPUs Assembly | 490-BKHF | 1 |
Scheda controller BOSS-N1 + con 2 FIPS M.2 960 GB (RAID 1) | 403-BCVH | 1 |
XE9680 BOSS Cable | 470-AFNO | 1 |
Nessuna scheda NIC mezzanine OCP 3.0 | 412-AASK | 1 |
Nessun sistema operativo, nessuna partizione di utilità | 611-BBBG | 1 |
iDRAC9, Datacenter 16G | 528-CTID | 1 |
Licenza iDRAC Secure Enterprise Key Manager 2.0 | 634-BZIL | 1 |
Verifica dei componenti protetti | 528-COYT | 1 |
iDRAC,Factory Generated Password | 379-BCSF | 1 |
Modulo di servizio iDRAC (ISM), NON installato | 379-BCQX | 1 |
iDRAC Group Manager, disabilitato | 379-BCQY | 1 |
Braccio per la gestione dei cavi della guida rack XE9680 | 770-BEPB | 1 |
XE9680 Sliding Ready Rail (B28) | 770-BEPC | 1 |
PowerEdge XE9680, spedizione | 340-DDBX | 1 |
PowerEdge XE9680 Marchio CE, nessun marchio CCC | 389-EFKE | 1 |
XE9680 Shipping Material | 343-BBXC | 1 |
Supporto per la gestione del programma aziendale | 973-3700 | 1 |
Basic Next Business Day 36 Months | 709-BFTF | 1 |
CON LIMITAZIONI:ProSupport One Data Center e servizio on-site il giorno lavorativo successivo Vol Low Ext, 24 mesi | 199-BTKS | 1 |
CON RISERVE:ProSupport One Data Center e servizio in loco il giorno lavorativo successivo Vol Low Init, 36 mesi | 199-BTKT | 1 |
Keep Your Hard Drive For Enterprise, 60 Month(s) | 711-BCXN | 1 |
ProDeploy Plus PowerEdge XE Series 5U6U | 683-BDSB | 1 |
Deployment dell'infrastruttura selezionato | 701-6538 | 1 |
128 GB RDIMM, 5600 MT/s, quad rank | 370-BBQY | 16 |
Unità NVMe per data center 800G a uso misto AG Drive U2 Gen4 con supporto | 400-BRPJ | 1 |
Cavo di alimentazione da C20 a C21, stile PDU, 16 A, 2, 4 m | 450-AGXK | 6 |
Broadcom 5720 Dual Port 1GbE LOM | 540-BDKD | 1 |
Scheda di rete Mellanox ConnectX-6 DX Dual Port 100GbE QSFP56, altezza completa | 540-BCXO | 2 |
Dimensioni e peso
Ogni macchina certificata da Google ha un'altezza di 6 U e le seguenti dimensioni:
- Altezza: 263,2 mm (10,36")
- Larghezza: 482 mm (18,97")
- Profondità: 1008,77 mm (39,71") incluso il pannello frontale
Ogni macchina certificata da Google pesa 113,3 kg.
Alimentazione e raffreddamento
Ogni macchina certificata da Google ha le seguenti specifiche elettriche:
- Tensione: da 100 V a 240 V CA, 50/60 Hz
- Potenza: 11.000 W massimo
La tua struttura deve disporre di un raffreddamento adeguato per supportare una (1) macchina certificata da Google per ogni deployment di Gemini sull'API connessa GDC.
Networking
Questa sezione descrive i requisiti di rete per il deployment di Gemini sull'API GDC connected.
Connettività di rete
La Figura 1 illustra Gemini su GDC Connected API Networking.
Per eseguire il deployment di Gemini sull'API GDC connected, devi soddisfare i seguenti requisiti di connettività di rete:
Prepara uno switch Top-of-Rack (ToR) che supporti la connettività ottica Quad Small Form-factor Pluggable (QFSP) da 100 gigabit.
Alloca almeno una porta ottica QFSP da 100 gigabit sullo switch ToR per ogni macchina certificata da Google. Tuttavia, Google consiglia di allocare due porte ottiche QFSP da 100 G per macchina per garantire l'alta affidabilità. Ciascuna di queste porte richiede un cablaggio QSFP-100G-SR4-S.
Se allochi due porte per macchina, collega entrambe le porte dello switch ToR allo stesso adattatore di rete Mellanox CX-6 su ogni macchina.
Una connessione a internet con una larghezza di banda minima di 1 Gbps in downstream e 100 Mbps in upstream.
Effettua le seguenti connessioni di rete per ogni macchina certificata da Google:
Collega una o entrambe le porte QFSP da 100 gigabit dell'adattatore di rete Mellanox CX-6 sulla macchina allo switch ToR. Queste porte gestiscono il traffico ad alta velocità per l'API Gemini on GDC connected e il software Distributed Cloud connesso.
Collega la porta Dell Remote Access Controller (iDRAC) integrata sulla macchina a uno switch di livello 2 separato. Questo è necessario per la gestione delle macchine.
Collega lo switch di gestione e lo switch ToR al livello 2.
Configurazione di rete
Configura la rete locale come segue per eseguire il deployment di Gemini sull'API connessa a GDC:
- Alloca una VLAN non taggata dedicata configurata con una dimensione dell'unità massima di trasmissione (MTU) di 1500 byte.
- Alloca un blocco di indirizzi CIDR IPv4 privato /26 per la connettività dei carichi di lavoro.
- Configura la connettività in uscita per la VLAN utilizzando il peering BGP; annuncia il blocco CIDR /26 assegnato alla rete upstream.
- Esegui il provisioning della VLAN con una route predefinita alla rete upstream e a internet.
- Un server DHCP (Dynamic Host Configuration Protocol) in grado di assegnare indirizzi IPv4 alle macchine certificate da Google per il bootstrapping. Gli indirizzi in questo blocco DHCP devono essere l'ultima sezione /29 del blocco di indirizzi CIDR IPv4 di connettività del workload.
Configurazione dello switch ToR
Configura lo switch ToR nel seguente modo:
- Attiva il supporto DHCPv4 e DNS sulle porte allocate a Gemini sulle macchine API connesse a GDC.
- Configura un blocco CIDR IPv4 privato /26 sulla VLAN dedicata e senza tag con una MTU di 1500 byte.
- Alloca il primo indirizzo IPv4 nel blocco CIDR come gateway di rete.
- Assicurati che il resto degli indirizzi IPv4 nel blocco CIDR sia libero. L'API Gemini on GDC connessa li alloca automaticamente per funzioni, servizi ed endpoint di modelli locali.
Configurazione del server DHCP
Configura il server DHCP per Gemini sulle macchine API connesse a GDC nel seguente modo:
- Il server DHCP deve essere raggiungibile da tutte le porte dello switch ToR collegate a Gemini sulle macchine API connesse a GDC.
- Riserva l'ultimo segmento /29 del blocco CIDR IPv4 /26 che hai allocato a Gemini sulle macchine API connesse a GDC per le assegnazioni DHCP e configura il server DHCP in modo che utilizzi questo segmento /29 come pool di indirizzi DHCP.
Configurazione del firewall
Configura il firewall locale per consentire il traffico API connesso a Gemini in GDC nel seguente modo:
Nome | Indirizzo IP di origine | Indirizzo IP anycast di destinazione | Protocollo | Porta |
---|---|---|---|---|
Gestione GDC Connected (TCP), servizio di attestazione, servizio di controllo della recitazione, download dei modelli | CIDR zona GDCc (/26) | Intervalli di indirizzi IP di Google | TCP | 443 |
Gestione di GDC Connected (UDP) | CIDR zona GDCc (/26) | Intervalli di indirizzi IP di Google | UDP | 443 |
Domain Name Service (DNS) | CIDR zona GDCc (/26) | Google DNS: 8.8.8.8 , 8.8.4.4 |
UDP | 53 |
Network Time Protocol (NTP) | CIDR zona GDCc (/26) | NTP di Google: 216.239.35.{0,4,8,12} |
UDP | 123 |
Attestazione remota Intel TDX | CIDR zona GDCc (/26) | 4.255.75.174/32 |
TCP | 443 |
Chiave API di attestazione remota Intel TDX
Per abilitare l'attestazione delle macchine virtuali confidenziali che gestiscono gli endpoint API Gemini on GDC connessi, devi ottenere una chiave API di attestazione remota Intel TDX e fornirla a Google. Per ottenere la chiave API, completa i passaggi descritti in questa sezione.
Vai alla pagina del servizio di certificazione del provisioning Intel® per l'attestazione ECDSA.
Nella sezione Get PCK Certificates (Ottieni certificati PCK), fai clic su Subscribe (Iscriviti).
Segui le istruzioni visualizzate per creare un account e stabilire un abbonamento al servizio di certificazione del provisioning Intel® SGX.
Nella sezione I tuoi abbonamenti del tuo account, trova e annota la chiave API principale per il tuo abbonamento al servizio di certificazione del provisioning Intel® SGX.
Informazioni da fornire a Google
Fornisci a Google le seguenti informazioni:
Dati di contatto di una persona responsabile dell'approvvigionamento e dell'implementazione delle macchine certificate da Google.
Il blocco CIDR IPv4 /26 che hai allocato per le tue macchine certificate da Google.
Le chiavi API primaria e secondaria per l'abbonamento al servizio di certificazione del provisioning Intel® SGX.
I service tag per le tue macchine API connesse a Gemini su GDC. Per le istruzioni, vedi Individuare il codice di servizio rapido e il service tag.
Gli identificatori di sicurezza fisica (PSID) delle unità disco non di avvio nelle macchine certificate da Google.
L'ID progetto del progetto Google Cloud che ospita la zona connessa Distributed Cloud per Gemini sull'API GDC connected.
Convalidare l'hardware certificato
Prima di programmare una visita di un tecnico Google, devi convalidare l'hardware certificato nel seguente modo:
Ottieni lo script di convalida dell'hardware dal tuo rappresentante di Google.
Installa o avvia Ubuntu Linux in modalità live sulla macchina certificata.
Esegui lo script di convalida hardware sulla macchina certificata.
Fornisci l'output dello script al tuo rappresentante di Google.
Passaggi successivi
Per portare online il deployment dell'API connessa di Gemini su GDC:
Ricevi e installa l'hardware certificato per l'API Gemini on GDC connected nella tua località di destinazione.
Configura l'ambiente API connesso di Gemini su GDC come descritto in precedenza in questo documento.
Convalida l'hardware certificato come descritto in precedenza in questo documento.
Coordina con il tuo rappresentante di Google la programmazione di una visita di un tecnico di Google.
Completa la visita del tecnico Google per installare e configurare il software dell'API Gemini on GDC connected.
Completa i passaggi descritti in Creare e gestire endpoint.