Vertex AI Agent Engine adalah serangkaian layanan yang memungkinkan developer men-deploy, mengelola, dan menskalakan agen AI dalam produksi. Agent Engine menangani infrastruktur untuk menskalakan agen dalam produksi sehingga Anda dapat berfokus pada pembuatan aplikasi. Vertex AI Agent Engine menawarkan layanan berikut yang dapat Anda gunakan secara terpisah atau bersamaan:
Runtime:
- Deploy dan menskalakan agen dengan kemampuan pengelolaan menyeluruh dan runtime terkelola.
- Sesuaikan image container agen dengan skrip penginstalan waktu build untuk dependensi sistem.
- Gunakan fitur keamanan termasuk kepatuhan VPC-SC dan konfigurasi autentikasi dan IAM.
- Akses model dan alat seperti panggilan fungsi.
- Men-deploy agen yang dibangun menggunakan framework Python yang berbeda:
- Pahami perilaku agen dengan Google Cloud Trace (mendukung OpenTelemetry), Cloud Monitoring, dan Cloud Logging.
Kualitas dan evaluasi (Pratinjau): Evaluasi kualitas agen dengan layanan Evaluasi AI Generatif terintegrasi dan optimalkan agen dengan menjalankan pelatihan model Gemini.
Contoh Toko (Pratinjau): Simpan dan ambil contoh few-shot secara dinamis untuk meningkatkan performa agen.
Sesi (Pratinjau): Sesi Agent Engine memungkinkan Anda menyimpan setiap interaksi antara pengguna dan agen, sehingga memberikan sumber pasti untuk konteks percakapan.
Bank Memori (Pratinjau): Bank Memori Agent Engine memungkinkan Anda menyimpan dan mengambil informasi dari sesi untuk mempersonalisasi interaksi agen.
Vertex AI Agent Engine adalah bagian dari Vertex AI Agent Builder, serangkaian fitur untuk menemukan, membangun, dan men-deploy agen AI.
Membuat dan men-deploy di Vertex AI Agent Engine
Catatan: Untuk pengalaman pengembangan dan deployment berbasis IDE yang disederhanakan dengan Vertex AI Agent Engine, pertimbangkan agent-starter-pack. MLOps menyediakan template siap pakai, UI bawaan untuk eksperimen, serta menyederhanakan deployment, operasi, evaluasi, penyesuaian, dan kemampuan pengamatan.
Alur kerja untuk membangun agen di Vertex AI Agent Engine adalah:
Langkah | Deskripsi |
---|---|
1. Menyiapkan lingkungan | Siapkan project Google Anda dan instal Vertex AI SDK untuk Python versi terbaru. |
2. Mengembangkan agen | Mengembangkan agen yang dapat di-deploy di Vertex AI Agent Engine. |
3. Men-deploy agen | Men-deploy agen di runtime terkelola Vertex AI Agent Engine. |
4. Menggunakan agen | Kueri agen dengan mengirim permintaan API. |
5. Mengelola agen yang di-deploy | Mengelola dan menghapus agen yang telah Anda deploy ke Vertex AI Agent Engine. |
Langkah-langkahnya diilustrasikan oleh diagram berikut:
Framework yang didukung
Tabel berikut menjelaskan tingkat dukungan yang diberikan Vertex AI Agent Engine untuk berbagai framework agen:
Level dukungan | Framework agen |
---|---|
Template kustom: Anda dapat menyesuaikan template kustom untuk mendukung deployment ke Vertex AI Agent Engine dari framework Anda. | CrewAI, framework kustom |
Integrasi Vertex AI SDK: Vertex AI Agent Engine menyediakan template terkelola per framework di Vertex AI SDK dan dokumentasi. | AG2, LlamaIndex |
Integrasi penuh: Fitur diintegrasikan untuk berfungsi di seluruh framework, Vertex AI Agent Engine, dan ekosistem Google Cloud yang lebih luas. | Agent Development Kit (ADK), LangChain, LangGraph |
Men-deploy dalam produksi dengan Agent Starter Pack
Agent Starter Pack adalah kumpulan template agen AI generatif siap produksi yang dibuat untuk Vertex AI Agent Engine. Paket Pemula Agen menyediakan hal berikut:
- Template agen siap pakai: ReAct, RAG, multi-agen, dan template lainnya.
- Playground interaktif: Uji dan berinteraksi dengan agen Anda.
- Infrastruktur otomatis: Menggunakan Terraform untuk pengelolaan resource yang disederhanakan.
- Pipeline CI/CD: Alur kerja deployment otomatis yang memanfaatkan Cloud Build.
- Kemampuan observasi: Dukungan bawaan untuk Cloud Trace dan Cloud Logging.
Untuk memulai, lihat Panduan memulai.
Kasus penggunaan
Untuk mempelajari Vertex AI Agent Engine dengan contoh end-to-end, lihat referensi berikut:
Keamanan perusahaan
Vertex AI Agent Engine mendukung Kontrol Layanan VPC untuk memperkuat keamanan data dan mengurangi risiko pemindahan data yang tidak sah. Jika Kontrol Layanan VPC dikonfigurasi, agen yang di-deploy akan mempertahankan akses aman ke API dan layanan Google, seperti BigQuery API, Cloud SQL Admin API, dan Vertex AI API, sehingga memverifikasi operasi yang lancar dalam perimeter yang Anda tentukan. Yang penting, Kontrol Layanan VPC secara efektif memblokir semua akses internet publik, membatasi pergerakan data ke batas jaringan yang diizinkan, dan meningkatkan postur keamanan perusahaan Anda secara signifikan.
Region yang didukung
Vertex AI Agent Engine didukung di region berikut:
Wilayah | Lokasi | Versi yang didukung |
---|---|---|
us-central1 |
Iowa | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
us-east4 |
Northern Virginia | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
us-west1 |
Oregon | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west1 |
Belgia | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west2 |
London | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west3 |
Frankfurt | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west4 |
Belanda | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-southwest1 |
Madrid | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-east1 |
Taiwan | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-northeast1 |
Tokyo | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-south1 |
Mumbai | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-southeast1 |
Singapura | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
australia-southeast2 |
Melbourne | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
Untuk Agent Engine Memory Bank (Pratinjau), region berikut didukung:
Wilayah | Lokasi | Versi yang didukung |
---|---|---|
us-central1 |
Iowa | Versi v1beta1 didukung. |
us-west1 |
Oregon | Versi v1beta1 didukung. |
europe-west1 |
Belgia | Versi v1beta1 didukung. |
europe-west4 |
Belanda | Versi v1beta1 didukung. |
europe-southwest1 |
Madrid | Versi v1beta1 didukung. |
Kuota
Batas berikut berlaku untuk Vertex AI Agent Engine untuk project tertentu di setiap region:Deskripsi | Batas |
---|---|
Membuat, menghapus, atau memperbarui Agent Engine Vertex AI per menit | 10 |
Membuat, menghapus, atau memperbarui sesi Vertex AI Agent Engine per menit | 100 |
Query atau StreamQuery Vertex AI Agent Engine per menit |
60 |
Menambahkan peristiwa ke sesi Vertex AI Agent Engine per menit | 300 |
Jumlah maksimum resource Vertex AI Agent Engine | 100 |
Membuat, menghapus, atau memperbarui resource memori Vertex AI Agent Engine per menit | 100 |
Mendapatkan, mencantumkan, atau mengambil dari Vertex AI Agent Engine Memory Bank per menit | 300 |
Harga
Harga didasarkan pada resource komputasi (jam vCPU) dan memori (jam GiB) yang digunakan oleh agen yang di-deploy ke runtime terkelola Vertex AI Agent Engine.
Produk | ID SKU | Harga |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | $0,0994/vCPU-Jam |
Memori ReasoningEngine | 0B45-6103-6EC1 | $0,0105/GiB-Jam |
Untuk informasi selengkapnya, lihat harga.