Vertex AI Agent Engine (in precedenza noto come LangChain su Vertex AI o Vertex AI Reasoning Engine) è un Google Cloud servizio completamente gestito che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Engine gestisce l'infrastruttura per scalare gli agenti in produzione, in modo da poterti concentrare sulla creazione di applicazioni intelligenti e di grande impatto. Vertex AI Agent Engine offre:
Completamente gestito: esegui il deployment e scala gli agenti con un runtime gestito che offre funzionalità di sicurezza solide, tra cui la conformità a VPC-SC e funzionalità di gestione end-to-end complete. Ottieni l'accesso CRUD alle applicazioni multi-agente che utilizzano Google Cloud Trace (supporta OpenTelemetry) per il monitoraggio delle prestazioni e il trafilamento. Per scoprire di più, consulta la sezione Eseguire il deployment di un agente.
Qualità e valutazione: assicurati la qualità dell'agente con il servizio di valutazione dell'AI generativa integrato.
Sviluppo semplificato: Vertex AI Agent Engine esegue l'astrazione delle attività di basso livello come lo sviluppo del server di applicazioni e la configurazione dell'autenticazione e dell'IAM, consentendoti di concentrarti sulle funzionalità uniche del tuo agente, come il comportamento, gli strumenti e i parametri del modello. Inoltre, i tuoi agenti possono utilizzare qualsiasi modello e strumento, ad esempio le chiamate di funzione, in Vertex AI.
Indipendentemente dal framework: goditi la flessibilità durante il deployment degli agenti che crei utilizzando diversi framework Python, tra cui LangGraph, Langchain, AG2 e CrewAI. Se hai già un agente, puoi adattarlo per l'esecuzione su Vertex AI Agent Engine utilizzando il modello personalizzato nel nostro SDK. In caso contrario, puoi sviluppare un agente da zero utilizzando uno dei modelli specifici per il framework che forniamo.
Crea ed esegui il deployment su Vertex AI Agent Engine
Nota:per un'esperienza di sviluppo e deployment semplificata e basata su IDE con Vertex AI Agent Engine, valuta la possibilità di utilizzare agent-starter-pack. Fornisce modelli pronti all'uso, un'interfaccia utente integrata per la sperimentazione e semplifica il deployment, le operazioni, la valutazione, la personalizzazione e l'osservabilità.
Il flusso di lavoro per creare un agente su Vertex AI Agent Engine è il seguente:
Passaggi | Descrizione |
---|---|
1. Configura l'ambiente | Configura il tuo progetto Google e installa la versione più recente dell'SDK Vertex AI per Python. |
2. Sviluppare un agente | Sviluppare un agente che può essere implementato in Vertex AI Agent Engine. |
3. Esegui il deployment dell'agente | Esegui il deployment dell'agente nel runtime gestito di Vertex AI Agent Engine. |
4. Utilizzare l'agente | Esegui una query sull'agente inviando una richiesta API. |
5. Gestire l'agente di cui è stato eseguito il deployment | Gestisci ed elimina gli agenti che hai di cui hai eseguito il deployment in Vertex AI Agent Engine. |
I passaggi sono illustrati nel seguente diagramma:
Casi d'uso
Per scoprire di più su Vertex AI Agent Engine con esempi end-to-end, consulta le seguenti risorse:
Sicurezza aziendale
Vertex AI Agent Engine supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API e ai servizi Google, come l'API BigQuery, l'API Cloud SQL Admin e l'API Vertex AI, garantendo un funzionamento senza problemi all'interno del perimetro definito. È fondamentale che Controlli di servizio VPC blocchi efficacemente tutto l'accesso a internet pubblico, confinando il movimento dei dati ai confini della rete autorizzata e migliorando notevolmente la posizione di sicurezza dell'azienda.
Aree geografiche supportate
Vertex AI Agent Engine è supportato nelle seguenti regioni:
Regione | Località | Descrizione | Fase di avvio |
---|---|---|---|
us-central1 |
Iowa | Sono supportate le versioni v1 e v1beta1 . |
GA |
us-west1 |
Oregon | Sono supportate le versioni v1 e v1beta1 . |
GA |
europe-west1 |
Belgio | Sono supportate le versioni v1 e v1beta1 . |
GA |
europe-southwest1 |
Madrid | Sono supportate le versioni v1 e v1beta1 . |
GA |
asia-east1 |
Taiwan | Sono supportate le versioni v1 e v1beta1 . |
GA |
asia-northeast1 |
Tokyo | Sono supportate le versioni v1 e v1beta1 . |
GA |
Quota
Le seguenti quote e limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione.Quota | Valore |
---|---|
Creazione/eliminazione/aggiornamento di Vertex AI Agent Engine al minuto | 10 |
Motore dell'agente Vertex AI Query/StreamQuery al minuto | 60 |
Numero massimo di risorse Vertex AI Agent Engine | 100 |
Prezzi
I prezzi si basano sulle risorse di calcolo (ore vCPU) e di memoria (ore GiB) utilizzate dagli agenti di cui è stato eseguito il deployment nel runtime gestito di Vertex AI Agent Engine.
Prodotto | ID SKU | Prezzo |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | 0,0994 $/vCPU-ora |
Memoria del ReasoningEngine | 0B45-6103-6EC1 | 0,0105 $/GiB-ora |
Per ulteriori informazioni, consulta la sezione Prezzi.