Die Vertex AI Agent Engine (früher LangChain in Vertex AI oder Vertex AI Reasoning Engine) ist ein vollständig verwalteter Google Cloud Dienst, mit dem Entwickler KI-Agents in der Produktion bereitstellen, verwalten und skalieren können. Agent Engine kümmert sich um die Infrastruktur, um Agenten in der Produktion zu skalieren, damit Sie sich auf die Entwicklung intelligenter und wirkungsvoller Anwendungen konzentrieren können. Die Vertex AI-Kundenservice-Engine bietet:
Vollständig verwaltet: Sie können Agenten mit einer verwalteten Laufzeit bereitstellen und skalieren, die robuste Sicherheitsfunktionen bietet, einschließlich VPC-SC-Compliance und umfassender End-to-End-Verwaltungsfunktionen. Sie erhalten CRUD-Zugriff auf Multi-Agent-Anwendungen, die Google Cloud Trace (mit OpenTelemetry-Unterstützung) für die Leistungsüberwachung und Trekking verwenden. Weitere Informationen finden Sie unter Agent bereitstellen.
Qualität und Bewertung: Mit dem integrierten Gen AI Evaluation Service können Sie die Qualität Ihrer Kundenservicemitarbeiter überprüfen.
Vereinfachte Entwicklung: Die Vertex AI Agent Engine abstrahiert Low-Level-Aufgaben wie die Entwicklung von Anwendungsservern und die Konfiguration der Authentifizierung und IAM. So können Sie sich auf die einzigartigen Funktionen Ihres Agents konzentrieren, z. B. auf sein Verhalten, seine Tools und seine Modellparameter. Außerdem können Ihre Kundenservicemitarbeiter alle Modelle und Tools in Vertex AI verwenden, z. B. Funktionsaufrufe.
Framework-unabhängig: Sie können Agenten, die Sie mit verschiedenen Python-Frameworks wie LangGraph, Langchain, AG2 und CrewAI erstellen, flexibel bereitstellen. Wenn Sie bereits einen Agenten haben, können Sie ihn mithilfe der benutzerdefinierten Vorlage in unserem SDK für die Ausführung auf der Vertex AI Agent Engine anpassen. Andernfalls können Sie einen Agenten mit einer unserer frameworkspezifischen Vorlagen von Grund auf neu entwickeln.
In der Vertex AI-Agent Engine erstellen und bereitstellen
Hinweis:Für eine optimierte, IDE-basierte Entwicklung und Bereitstellung mit der Vertex AI Agent Engine können Sie das Agent-Starterpaket verwenden. Sie bietet vorgefertigte Vorlagen, eine integrierte Benutzeroberfläche für Experimente und vereinfacht die Bereitstellung, den Betrieb, die Bewertung, die Anpassung und die Beobachtbarkeit.
So erstellen Sie einen Agenten in der Vertex AI Agent Engine:
Schritte | Beschreibung |
---|---|
1. Umgebung einrichten | Richten Sie Ihr Google-Projekt ein und installieren Sie die neueste Version des Vertex AI SDK für Python. |
2. Agent entwickeln | Einen Agenten entwickeln, der in der Vertex AI-Agent Engine bereitgestellt werden kann |
3. Agent bereitstellen | Stellen Sie den Agenten in der verwalteten Laufzeit der Vertex AI-Agent Engine bereit. |
4. Kundenservicemitarbeiter verwenden | Rufen Sie den Agenten durch Senden einer API-Anfrage ab. |
5. Bereitgestellten Agent verwalten | Sie können Agenten verwalten und löschen, die Sie in der Vertex AI Agent Engine bereitgestellt haben. |
Die Schritte werden im folgenden Diagramm veranschaulicht:
Anwendungsfälle
In den folgenden Ressourcen erfahren Sie mehr über die Vertex AI Agent Engine mit End-to-End-Beispielen:
Anwendungsfall | Beschreibung | Links |
---|---|---|
Bots erstellen, indem eine Verbindung zu öffentlichen APIs hergestellt wird | Währungen umrechnen. Erstellen Sie eine Funktion, die eine Verbindung zu einer Währungsaustauschanwendung herstellt, damit das Modell korrekte Antworten auf Anfragen wie „Wie hoch ist der Wechselkurs von Euro zu Dollar heute?“ liefert. |
Vertex AI SDK für Python-Notebook – Einführung in das Erstellen und Bereitstellen eines Agents mit der Vertex AI Agent Engine |
Design eines Solarprojekts für eine Gemeinde Potenzielle Standorte identifizieren, relevante Behörden und Lieferanten suchen, Satellitenbilder und das Solarpotenzial von Regionen und Gebäuden prüfen, um den optimalen Standort für die Installation von Solarmodulen zu finden. |
Vertex AI SDK für Python-Notebook – Einen Google Maps API-Agenten mit der Vertex AI Agent Engine erstellen und bereitstellen | |
Agents erstellen, indem eine Verbindung zu Datenbanken hergestellt wird | Integration in AlloyDB und Cloud SQL for PostgreSQL | Blogpost – LangChain in Vertex AI für AlloyDB und Cloud SQL for PostgreSQL Vertex AI SDK für Python-Notebook – RAG-Anwendung mit Cloud SQL for PostgreSQL in der Vertex AI Agent Engine bereitstellen Vertex AI SDK für Python-Notebook – RAG-Anwendung mit AlloyDB for PostgreSQL in der Vertex AI Agent Engine bereitstellen |
Strukturierte Datenspeicher mit natürlicher Sprache abfragen und analysieren | Vertex AI SDK für Python-Notebook – Conversational Search Agent mit Vertex AI Agent Engine und RAG in Vertex AI Search erstellen | |
Grafikdatenbanken mit natürlicher Sprache abfragen und analysieren | Blogpost – GenAI GraphRAG und KI-Agenten mit der Vertex AI Agent Engine mit LangChain und Neo4j | |
Vektorspeicher mit natürlicher Sprache abfragen und analysieren | Blogpost – GenAI RAG mit MongoDB Atlas und Vertex AI Agent Engine vereinfachen | |
Bots mit Open-Source-Frameworks erstellen | Mit dem Open-Source-Framework OneTwo können Sie Agenten erstellen und bereitstellen. | Blogpost – OneTwo und Vertex AI Agent Engine: Entwicklung fortschrittlicher KI-Agenten in Google Cloud |
Mit dem Open-Source-Framework LangGraph können Sie Agenten erstellen und bereitstellen. | Vertex AI SDK für Python-Notebook – LangGraph-Anwendung mit der Vertex AI Agent Engine erstellen und bereitstellen | |
Agents debuggen und optimieren | Mit OpenTelemetry und Cloud Trace können Sie Agenten erstellen und für sie Tracing ausführen. | Vertex AI SDK für Python-Notebook – Debugging und Optimieren von Agents: Eine Anleitung zum Tracing in der Vertex AI Agent Engine |
Unternehmenssicherheit
Die Vertex AI-Agent Engine unterstützt VPC Service Controls, um die Datensicherheit zu erhöhen und das Risiko einer Daten-Exfiltration zu minimieren. Wenn VPC Service Controls konfiguriert ist, behält der bereitgestellte Agent sicheren Zugriff auf Google APIs und ‑Dienste wie die BigQuery API, die Cloud SQL Admin API und die Vertex AI API. So wird ein reibungsloser Betrieb innerhalb des definierten Perimeters sichergestellt. VPC Service Controls blockieren effektiv den gesamten Zugriff auf das öffentliche Internet, beschränken die Datenübertragung auf Ihre autorisierten Netzwerkgrenzen und verbessern die Sicherheit Ihres Unternehmens erheblich.
Unterstützte Regionen
Die Vertex AI-Kundenservice-Engine wird in den folgenden Regionen unterstützt:
Region | Standort | Beschreibung | Startphase |
---|---|---|---|
us-central1 |
Iowa | Die Versionen v1 und v1beta1 werden unterstützt. |
GA |
us-west1 |
Oregon | Die Versionen v1 und v1beta1 werden unterstützt. |
GA |
europe-west1 |
Belgien | Die Versionen v1 und v1beta1 werden unterstützt. |
GA |
europe-southwest1 |
Madrid | Die Versionen v1 und v1beta1 werden unterstützt. |
GA |
asia-east1 |
Taiwan | Die Versionen v1 und v1beta1 werden unterstützt. |
GA |
asia-northeast1 |
Tokio | Die Versionen v1 und v1beta1 werden unterstützt. |
GA |
Kontingent
Die folgenden Kontingente und Limits gelten für die Vertex AI Agent Engine für ein bestimmtes Projekt in jeder Region.Kontingent | Wert |
---|---|
Vertex AI-Agent-Engine pro Minute erstellen/löschen/aktualisieren | 10 |
Vertex AI-Agent-Engine für Abfragen/Streamabfragen pro Minute | 60 |
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen | 100 |
Preise
Die Preise basieren auf den Rechenressourcen (vCPU-Stunden) und Speicherressourcen (GiB-Stunden), die von den Agenten verwendet werden, die in der von der Vertex AI Agent Engine verwalteten Laufzeit bereitgestellt werden.
Produkt | SKU-ID | Preis |
---|---|---|
Reasoning Engine-vCPU | 8A55-0B95-B7DC | 0,0994 $/vCPU-Stunde |
ReasoningEngine-Speicher | 0B45-6103-6EC1 | 0,0105 $/GiB-Stunde |
Weitere Informationen finden Sie unter Preise.