Endpunkttyp auswählen

Wenn Sie ein Modell für Onlinevorhersagen bereitstellen möchten, benötigen Sie einen Endpunkt. Endpunkte können in die folgenden Typen unterteilt werden:

  • Auf öffentliche Endpunkte kann über das öffentliche Internet zugegriffen werden. Sie sind einfacher zu verwenden, da keine private Netzwerkinfrastruktur erforderlich ist. Es gibt zwei Arten von öffentlichen Endpunkten: dedizierte und freigegebene. Ein dedizierter öffentlicher Endpunkt ist ein schnellerer Endpunkt, der Produktionsisolierung, Unterstützung für größere Nutzlasten und längere Zeitüberschreitungen für Anfragen bietet als ein freigegebener öffentlicher Endpunkt. Wenn Sie eine Vorhersageanfrage an einen speziellen öffentlichen Endpunkt senden, wird sie vom Traffic anderer Nutzer getrennt. Aus diesen Gründen werden spezielle öffentliche Endpunkte als Best Practice empfohlen.

  • Private Service Connect-Endpunkte bieten eine sichere Verbindung für die private Kommunikation zwischen lokalen Umgebungen und Google Cloud. Sie können damit den Google API-Traffic über Private Service Connect APIs steuern. Sie werden als Best Practice empfohlen.

  • Private Endpunkte bieten auch eine sichere Verbindung zu Ihrem Modell und können für die private Kommunikation zwischen On-Premise- undGoogle Cloud-Umgebungen verwendet werden. Sie verwenden den Zugriff auf private Dienste über eine VPC-Netzwerk-Peering-Verbindung.

Weitere Informationen zum Bereitstellen eines Modells auf einem Endpunkt finden Sie unter Modell auf einem Endpunkt bereitstellen.

In der folgenden Tabelle werden die unterstützten Endpunkttypen für die Bereitstellung von Vertex AI-Onlinevorhersagen verglichen.

Dedizierter öffentlicher Endpunkt (empfohlen) Gemeinsamer öffentlicher Endpunkt Private Service Connect-Endpunkt (empfohlen) Privater Endpunkt
Zweck Standardnetzwerkeinstellungen Ermöglicht das Senden von Anfragen aus dem öffentlichen Internet, wenn VPC Service Controls nicht aktiviert ist. Standardnetzwerkeinstellungen Ermöglicht das Senden von Anfragen aus dem öffentlichen Internet, wenn VPC Service Controls nicht aktiviert ist. Empfohlen für Produktionsanwendungen in Unternehmen. Verbessert die Netzwerklatenz und -sicherheit, da Anfragen und Antworten privat weitergeleitet werden. Empfohlen für Produktionsanwendungen in Unternehmen. Verbessert die Netzwerklatenz und -sicherheit, da Anfragen und Antworten privat weitergeleitet werden.
Eingehende Netzwerke Öffentliches Internet mit dedizierter Netzwerkebene Öffentliches Internet mit gemeinsam genutzter Netzwerkebene Privates Netzwerk mit Private Service Connect-Endpunkt Privates Netzwerk mit Zugriff auf private Dienste (VPC-Netzwerk-Peering)
Ausgehende Daten Öffentliches Internet Öffentliches Internet Nicht unterstützt Privates Netzwerk mit Zugriff auf private Dienste (VPC-Netzwerk-Peering)
VPC Service Controls Nicht unterstützt. Verwenden Sie stattdessen einen Private Service Connect-Endpunkt. Unterstützt Unterstützt Unterstützt
Kosten Vertex-AI-Prediction Vertex-AI-Prediction Vertex AI Prediction + Privater Service Connect-Endpunkt Vertex AI Prediction + Zugriff auf private Dienste (siehe „Private Service Connect-Endpunkt (Weiterleitungsregel) für den Zugriff auf einen veröffentlichten Dienst verwenden“)
Netzwerklatenz Optimiert Nicht optimiert Optimiert Optimiert
Verschlüsselung während der Übertragung TLS mit von einer Zertifizierungsstelle signiertem Zertifikat TLS mit von einer Zertifizierungsstelle signiertem Zertifikat Optionale TLS-Verschlüsselung mit selbstsigniertem Zertifikat Keine
Zeitlimit für Inferenz Bis zu 1 Stunde konfigurierbar 60 Sekunden Bis zu 1 Stunde konfigurierbar 60 Sekunden
Nutzlastgrößenlimit 10 MB 1,5 MB 10 MB 10 MB
QPM-Kontingent Unbegrenzt 30.000 Unbegrenzt Unbegrenzt
Protokollunterstützung HTTP oder gRPC HTTP HTTP oder gRPC HTTP
Streamingunterstützung Ja (SSE) Nein Ja (SSE) Nein
Trafficaufteilung Ja Ja Ja Nein
Anfrage- und Antwort-Logging Ja Ja Ja Nein
Zugriffs-Logging Ja Ja Ja Nein
AutoML-Modelle und Erklärbarkeit Nein Ja Nein Nein
Unterstützte Clientbibliotheken Vertex AI SDK für Python Vertex AI-Clientbibliotheken, Vertex AI SDK für Python Vertex AI SDK für Python Vertex AI SDK für Python

Nächste Schritte