Vertex AI Agent Engine (precedentemente noto come LangChain su Vertex AI o Vertex AI Reasoning Engine) è un insieme di servizi che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Engine gestisce l'infrastruttura per scalare gli agenti in produzione, così da potersi concentrare sulla creazione di applicazioni. Vertex AI Agent Engine offre i seguenti servizi che puoi utilizzare singolarmente o in combinazione:
Runtime gestito:
- Esegui il deployment e scala gli agenti con un runtime gestito e funzionalità di gestione end-to-end.
- Personalizza l'immagine container dell'agente con script di installazione in fase di compilazione per le dipendenze di sistema.
- Utilizza le funzionalità di sicurezza, tra cui la conformità a VPC-SC e la configurazione dell'autenticazione e di IAM.
- Accedere a modelli e strumenti come la chiamata di funzione.
- Esegui il deployment di agenti creati utilizzando diversi framework Python:
Gestione del contesto:
Sessioni (anteprima): le sessioni di Agent Engine consentono di archiviare le singole interazioni tra utenti e agenti, fornendo fonti definitive per il contesto della conversazione.
Banca della memoria (anteprima): la banca della memoria di Agent Engine ti consente di archiviare e recuperare informazioni dalle sessioni per personalizzare le interazioni dell'agente.
Example Store (anteprima): Example Store ti consente di archiviare e recuperare in modo dinamico esempi few-shot.
Qualità e valutazione (anteprima):
- Valuta la qualità dell'agente con il servizio di valutazione dell'AI generativa integrato.
- Migliora il rendimento degli agenti con Example Store.
- Ottimizza gli agenti con le sessioni di addestramento del modello Gemini.
Osservabilità:
- Comprendi il comportamento dell'agente con Google Cloud Trace (che supporta OpenTelemetry), Cloud Monitoring e Cloud Logging.
Vertex AI Agent Engine fa parte di Vertex AI Agent Builder, una suite di funzionalità per il rilevamento, la creazione e l'implementazione di agenti AI.
Crea ed esegui il deployment su Vertex AI Agent Engine
Nota:per un'esperienza di sviluppo e deployment basata su IDE semplificata con Vertex AI Agent Engine, valuta la possibilità di utilizzare l'agent-starter-pack. Fornisce modelli pronti all'uso, un'interfaccia utente integrata per la sperimentazione e semplifica il deployment, le operazioni, la valutazione, la personalizzazione e l'osservabilità.
Il flusso di lavoro per la creazione di un agente su Vertex AI Agent Engine è il seguente:
Passaggi | Descrizione |
---|---|
1. Configura l'ambiente | Configura il tuo progetto Google e installa l'ultima versione dell'SDK Vertex AI per Python. |
2. Sviluppare un agente | Sviluppa un agente che può essere implementato su Vertex AI Agent Engine. |
3. Esegui il deployment dell'agente | Esegui il deployment dell'agente nel runtime gestito di Vertex AI Agent Engine. |
4. Utilizzare l'agente | Interroga l'agente inviando una richiesta API. |
5. Gestire l'agente di cui è stato eseguito il deployment | Gestisci ed elimina gli agenti di cui hai eseguito il deployment in Vertex AI Agent Engine. |
I passaggi sono illustrati nel seguente diagramma:
Framework supportati
La tabella seguente descrive il livello di supporto fornito da Vertex AI Agent Engine per vari framework di agenti:
Livello di assistenza | Framework degli agenti |
---|---|
Modello personalizzato: puoi adattare un modello personalizzato per supportare il deployment in Vertex AI Agent Engine dal tuo framework. | CrewAI, framework personalizzati |
Integrazione dell'SDK Vertex AI: Vertex AI Agent Engine fornisce modelli gestiti per framework nell'SDK Vertex AI e nella documentazione. | AG2, LlamaIndex |
Integrazione completa: le funzionalità sono integrate per funzionare nel framework, in Vertex AI Agent Engine e nell'ecosistema Google Cloud più ampio. | Agent Development Kit (ADK), LangChain, LangGraph |
Esegui il deployment in produzione con Agent Starter Pack
L'Agent Starter Pack è una raccolta di modelli di agenti di AI generativa pronti per la produzione creati per Vertex AI Agent Engine. Lo starter pack dell'agente fornisce quanto segue:
- Modelli di agenti predefiniti:ReAct, RAG, multi-agente e altri modelli.
- Playground interattivo: testa il tuo agente e interagisci con lui.
- Infrastruttura automatizzata: utilizza Terraform per una gestione semplificata delle risorse.
- Pipeline CI/CD: workflow di deployment automatizzati che sfruttano Cloud Build.
- Osservabilità: supporto integrato per Cloud Trace e Cloud Logging.
Per iniziare, consulta la guida rapida.
Casi d'uso
Per scoprire di più su Vertex AI Agent Engine con esempi end-to-end, consulta le seguenti risorse:
Caso d'uso | Descrizione | Link |
---|---|---|
Creare agenti connettendosi alle API pubbliche | Convertire tra valute. Crea una funzione che si connette a un'app di cambio valuta, consentendo al modello di fornire risposte accurate a query come "Qual è il tasso di cambio euro-dollaro oggi?" |
Notebook SDK Vertex AI per Python - Introduzione alla creazione e al deployment di un agente con Vertex AI Agent Engine |
Progettazione di un progetto di energia solare di comunità. Identifica potenziali posizioni, cerca uffici governativi e fornitori pertinenti e rivedi immagini satellitari e potenziale solare di regioni ed edifici per trovare la posizione ottimale per installare i pannelli solari. |
Notebook SDK Vertex AI per Python - Creazione e deployment di un agente API Google Maps con Vertex AI Agent Engine | |
Creare agenti connettendosi ai database | Integrazione con AlloyDB e Cloud SQL per PostgreSQL. | Post del blog - Annuncio di LangChain su Vertex AI per AlloyDB e Cloud SQL per PostgreSQL Notebook SDK Vertex AI per Python - Deployment di un'applicazione RAG con Cloud SQL per PostgreSQL in Vertex AI Agent Engine Notebook SDK Vertex AI per Python - Deployment di un'applicazione RAG con AlloyDB per PostgreSQL in Vertex AI Agent Engine |
Crea agenti con strumenti che accedono ai dati nel tuo database. | Blocco note dell'SDK Vertex AI per Python - Deployment di un agente con Vertex AI Agent Engine e MCP Toolbox for Databases | |
Esegui query e comprendi i datastore strutturati utilizzando il linguaggio naturale. | Notebook SDK Vertex AI Python - Building a Conversational Search Agent with Vertex AI Agent Engine and RAG on Vertex AI Search | |
Eseguire query e comprendere i database grafici utilizzando il linguaggio naturale | Post del blog: GenAI GraphRAG e agenti AI che utilizzano Vertex AI Agent Engine con LangChain e Neo4j | |
Esegui query e comprendi gli spazi vettoriali utilizzando il linguaggio naturale | Post del blog - Simplify GenAI RAG with MongoDB Atlas and Vertex AI Agent Engine | |
Creare agenti con Agent Development Kit (anteprima) | Crea ed esegui il deployment di agenti utilizzando Agent Development Kit. | Kit di sviluppo dell'agente: esegui il deployment su Vertex AI Agent Engine |
Gestisci il contesto con le sessioni e la banca di memoria di Vertex AI Agent Engine in modalità express di Vertex AI senza fatturazione. | Agent Development Kit: sessioni e banca della memoria di Vertex AI Agent Engine in modalità express di Vertex AI. | |
Creare agenti con framework OSS | Crea ed esegui il deployment di agenti utilizzando il framework open source OneTwo. | Post del blog - OneTwo e Vertex AI Agent Engine: esplorare lo sviluppo avanzato di agenti AI su Google Cloud |
Crea ed esegui il deployment di agenti utilizzando il framework open source LangGraph. | Blocco note dell'SDK Vertex AI Python - Creazione e deployment di un'applicazione LangGraph con Vertex AI Agent Engine | |
Debug e ottimizzazione degli agenti | Crea e traccia agenti utilizzando OpenTelemetry e Cloud Trace. | Blocco note SDK Vertex AI per Python - Debug e ottimizzazione degli agenti: una guida al tracciamento in Vertex AI Agent Engine |
Sicurezza aziendale
Vertex AI Agent Engine supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API e ai servizi Google, come l'API BigQuery, l'API Cloud SQL Admin e l'API Vertex AI, verificando il funzionamento senza problemi all'interno del perimetro definito. Fondamentalmente, i controlli di servizio VPC bloccano efficacemente tutto l'accesso a internet pubblico, limitando il movimento dei dati ai confini della rete autorizzata e migliorando significativamente la postura di sicurezza della tua azienda.
Aree geografiche supportate
Vertex AI Agent Engine è supportato nelle seguenti regioni:
Regione | Località | Versioni supportate |
---|---|---|
us-central1 |
Iowa | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
us-east4 |
Virginia del Nord | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
us-west1 |
Oregon | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
europe-west1 |
Belgio | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
europe-west2 |
Londra | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
europe-west3 |
Francoforte | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
europe-west4 |
Paesi Bassi | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
europe-southwest1 |
Madrid | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
asia-east1 |
Taiwan | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
asia-northeast1 |
Tokyo | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
asia-south1 |
Mumbai | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
asia-southeast1 |
Singapore | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
australia-southeast2 |
Melbourne | v1 è supportato per le funzionalità GA. v1beta1 è supportato per le funzionalità di anteprima. |
Per Agent Engine Memory Bank (anteprima), sono supportate le seguenti regioni:
Regione | Località | Versioni supportate |
---|---|---|
us-central1 |
Iowa | La versione v1beta1 è supportata. |
Quota
I seguenti limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione:Descrizione | Limite |
---|---|
Crea, elimina o aggiorna Vertex AI Agent Engine al minuto | 10 |
Crea, elimina o aggiorna le sessioni di Vertex AI Agent Engine al minuto | 100 |
Crea, elimina o aggiorna le sessioni di Vertex AI Agent Engine al minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine al minuto |
60 |
Aggiungi evento alle sessioni al minuto di Vertex AI Agent Engine | 100 |
Numero massimo di risorse Vertex AI Agent Engine | 100 |
Crea, elimina o aggiorna le risorse di memoria di Vertex AI Agent Engine al minuto | 100 |
Recupera, elenca o recupera da Vertex AI Agent Engine Memory Bank al minuto | 300 |
Prezzi
I prezzi si basano sulle risorse di calcolo (ore vCPU) e di memoria (ore GiB) utilizzate dagli agenti di cui è stato eseguito il deployment nel runtime gestito di Vertex AI Agent Engine.
Prodotto | ID SKU | Prezzo |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | $0,0994/vCPU-Hr |
ReasoningEngine Memory | 0B45-6103-6EC1 | $0,0105/GiB-Hr |
Per ulteriori informazioni, consulta la sezione Prezzi.