Vertex AI Agent Engine (sebelumnya dikenal sebagai LangChain di Vertex AI atau Vertex AI Reasoning Engine) adalah serangkaian layanan yang memungkinkan developer men-deploy, mengelola, dan menskalakan agen AI dalam produksi. Agent Engine menangani infrastruktur untuk menskalakan agen dalam produksi sehingga Anda dapat berfokus pada pembuatan aplikasi. Vertex AI Agent Engine menawarkan layanan berikut yang dapat Anda gunakan secara terpisah atau dalam kombinasi:
Runtime terkelola (GA):
- Deploy dan skalakan agen dengan runtime terkelola dan kemampuan pengelolaan menyeluruh.
- Gunakan fitur keamanan termasuk kepatuhan VPC-SC dan konfigurasi autentikasi serta IAM.
- Mengakses model dan alat seperti panggilan fungsi.
- Men-deploy agen yang dibuat menggunakan framework Python yang berbeda:
Pengelolaan konteks:
Sesi (Pratinjau): Sesi Mesin Agen memungkinkan Anda menyimpan setiap interaksi antara pengguna dan agen, sehingga memberikan sumber yang pasti untuk konteks percakapan.
Example Store (Pratinjau): Example Store memungkinkan Anda menyimpan dan mengambil contoh few-shot secara dinamis.
Kualitas dan evaluasi (Pratinjau):
- Evaluasi kualitas agen dengan layanan Evaluasi AI Generatif yang terintegrasi.
- Tingkatkan performa agen dengan Example Store.
- Optimalkan agen dengan menjalankan pelatihan model Gemini.
Kemampuan observasi (GA):
- Pahami perilaku agen dengan Google Cloud Trace (mendukung OpenTelemetry), Cloud Monitoring, dan Cloud Logging.
Vertex AI Agent Engine adalah bagian dari Vertex AI Agent Builder, serangkaian fitur untuk menemukan, mem-build, dan men-deploy agen AI.
Membuat dan men-deploy di Vertex AI Agent Engine
Catatan: Untuk pengalaman pengembangan dan deployment yang berbasis IDE dan disederhanakan dengan Vertex AI Agent Engine, pertimbangkan agent-starter-pack. Platform ini menyediakan template siap pakai, UI bawaan untuk eksperimen, serta menyederhanakan deployment, operasi, evaluasi, penyesuaian, dan visibilitas.
Alur kerja untuk membuat agen di Vertex AI Agent Engine adalah:
Langkah | Deskripsi |
---|---|
1. Menyiapkan lingkungan | Siapkan project Google Anda dan instal Vertex AI SDK untuk Python versi terbaru. |
2. Mengembangkan agen | Mengembangkan agen yang dapat di-deploy di Vertex AI Agent Engine. |
3. Men-deploy agen | Men-deploy agen di runtime terkelola Vertex AI Agent Engine. |
4. Menggunakan agen | Buat kueri agen dengan mengirimkan permintaan API. |
5. Mengelola agen yang di-deploy | Mengelola dan menghapus agen yang telah Anda deploy ke Vertex AI Agent Engine. |
Langkah-langkahnya diilustrasikan oleh diagram berikut:
Framework yang didukung
Tabel berikut menjelaskan tingkat dukungan yang disediakan Vertex AI Agent Engine untuk berbagai framework agen:
Level dukungan | Framework agen |
---|---|
Template kustom: Anda dapat menyesuaikan template kustom untuk mendukung deployment ke Vertex AI Agent Engine dari framework Anda. | CrewAI, framework kustom |
Integrasi Vertex AI SDK: Vertex AI Agent Engine menyediakan template terkelola per framework dalam dokumentasi dan Vertex AI SDK. | AG2, LlamaIndex |
Integrasi penuh: Fitur diintegrasikan agar dapat berfungsi di seluruh framework, Vertex AI Agent Engine, dan ekosistem Google Cloud yang lebih luas. | Agent Development Kit (ADK), LangChain, LangGraph |
Men-deploy dalam produksi dengan Paket Awal Agen
Paket Awal Agen adalah kumpulan template agen AI generatif siap produksi yang dibuat untuk Vertex AI Agent Engine. Paket Awal Agen menyediakan hal berikut:
- Template agen siap pakai: Template ReAct, RAG, multi-agen, dan lainnya.
- Panggung interaktif: Menguji dan berinteraksi dengan agen Anda.
- Infrastruktur otomatis: Menggunakan Terraform untuk pengelolaan resource yang disederhanakan.
- Pipeline CI/CD: Alur kerja deployment otomatis yang memanfaatkan Cloud Build.
- Kemampuan Observasi: Dukungan bawaan untuk Cloud Trace dan Cloud Logging.
Untuk memulai, lihat Panduan memulai.
Kasus penggunaan
Untuk mempelajari Vertex AI Agent Engine dengan contoh menyeluruh, lihat referensi berikut:
Keamanan perusahaan
Vertex AI Agent Engine mendukung Kontrol Layanan VPC untuk memperkuat keamanan data dan mengurangi risiko pemindahan data yang tidak sah. Saat Kontrol Layanan VPC dikonfigurasi, agen yang di-deploy akan mempertahankan akses aman ke API dan layanan Google, seperti BigQuery API, Cloud SQL Admin API, dan Vertex AI API, sehingga memastikan operasi yang lancar dalam perimeter yang Anda tentukan. Yang terpenting, Kontrol Layanan VPC secara efektif memblokir semua akses internet publik, membatasi pergerakan data ke batas jaringan yang diizinkan, dan secara signifikan meningkatkan postur keamanan perusahaan Anda.
Region yang didukung
Vertex AI Agent Engine didukung di region berikut:
Wilayah | Lokasi | Versi yang didukung |
---|---|---|
us-central1 |
Iowa | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
us-east4 |
Northern Virginia | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
us-west1 |
Oregon | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west1 |
Belgia | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west2 |
London | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west3 |
Frankfurt | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-west4 |
Belanda | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
europe-southwest1 |
Madrid | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-east1 |
Taiwan | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-northeast1 |
Tokyo | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-south1 |
Mumbai | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
asia-southeast1 |
Singapura | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
australia-southeast2 |
Melbourne | v1 didukung untuk fitur GA. v1beta1 didukung untuk fitur Pratinjau. |
Kuota
Kuota dan batas berikut berlaku untuk Vertex AI Agent Engine untuk project tertentu di setiap region.Kuota | Nilai |
---|---|
Membuat/Menghapus/Memperbarui Mesin Agen Vertex AI per menit | 10 |
Mesin Agen Vertex AI Query/StreamQuery per menit | 60 |
Jumlah maksimum resource Vertex AI Agent Engine | 100 |
Harga
Harga didasarkan pada resource komputasi (jam vCPU) dan memori (jam GiB) yang digunakan oleh agen yang di-deploy ke runtime yang dikelola Vertex AI Agent Engine.
Produk | ID SKU | Harga |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | $0,0994/vCPU-Jam |
Memori ReasoningEngine | 0B45-6103-6EC1 | $0,0105/GiB-Jam |
Untuk informasi selengkapnya, lihat harga.