Diese Seite wurde von der Cloud Translation API übersetzt.

Netzwerk für Gemini einrichten

Auf dieser Seite wird beschrieben, wie Sie Gemini in einer Air-Gap-Umgebung von Google Distributed Cloud (GDC) einrichten. Dieser Leitfaden richtet sich an Infrastrukturadministratoren, die Systembereitstellungen verwalten. Er enthält Details zur erforderlichen Infrastruktur, zur Hardwareeinrichtung für GPU-Pods und zu den Netzwerkkonfigurationen, die für die Bereitstellung von Gemini erforderlich sind.

Hinweise

Damit Sie die Netzwerkkonfiguration für Gemini einrichten können, muss der Root-Administratorcluster erfolgreich in den Basis-Racks installiert sein. Weitere Informationen finden Sie unter Root-Administratorcluster-Bootstrap.

GPU-Hardware für Gemini konfigurieren

Wenn Sie Gemini in GDC ausführen möchten, müssen Sie die erforderliche Hardware in Form eines GPU-Pods bereitstellen. Ein GPU-Pod besteht aus einem bis acht stromverbrauchenden GPU-Servern und ist die kleinste bereitstellbare Einheit von GPU-fähigen Racks. Jeder GPU-Server befindet sich in einem eigenen Rack und ist sowohl mit einem dedizierten Management-Switch als auch mit zwei gemeinsam genutzten TOR-Switches (Top of Rack) verbunden. Die Anzahl der Server pro Rack hängt vom Strombudget und Ihren Anforderungen ab.

Im folgenden Diagramm sind zwei verschiedene GPU-Pod-Konfigurationen dargestellt:

Rack-Konfiguration eines GPU-Pods

Abbildung 1. Es werden zwei GPU-Pods angezeigt. Der erste GPU-Pod besteht aus acht GPU-Servern. Der zweite GPU-Pod besteht aus fünf GPU-Servern.

In Abbildung 1 besteht der erste GPU-Pod aus Folgendem:

Ein dediziertes VPC-Paar (Virtual Private Cloud), das bis zu acht GPU-Server unterstützt. Für zusätzliche Serververbindungen müssen neue GPU-Pods erstellt werden.
Jede XE9680-GPU im GPU-Pod hat exklusiven Zugriff auf einen TOR-Switch. TORs im GPU-Pod werden nicht mit anderen Rechen- oder Speicherressourcen geteilt.
Zwei TOR-Switches sind verbunden, um eine Verbindung mit hoher Bandbreite für die GPU-Server bereitzustellen.
Dieser GPU-Pod besteht aus maximal acht GPU-Servern. Jeder Server befindet sich in einem eigenen Rack.
Jeder GPU-Server ist sowohl mit einem dedizierten Management-Switch als auch mit den gemeinsam genutzten GPU-TOR-Switches verbunden, die ein VPC-Paar bilden.

In Abbildung 1 hat der zweite GPU-Pod dieselbe Architektur, besteht aber aus fünf statt acht GPU-Servern.