Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Halaman ini memperkenalkan database vektor yang didukung di Vertex AI RAG Engine.
Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG.
Database vektor memainkan peran penting dalam mengaktifkan pengambilan untuk aplikasi RAG.
Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embedding vektor memungkinkan sistem RAG
menemukan informasi yang paling relevan dengan cepat dan akurat dalam pusat informasi yang luas, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model penyematan, database vektor dapat membantu mengatasi batasan LLM, dan memberikan respons yang lebih akurat, relevan, dan komprehensif.
Database vektor yang didukung
Saat membuat korpus RAG, RAG Engine Vertex AI menawarkan RagManagedDb yang siap digunakan perusahaan sebagai database vektor default, yang tidak memerlukan penyediaan atau pengelolaan tambahan.
RagManagedDb menawarkan opsi penelusuran KNN dan ANN serta memungkinkan peralihan ke tingkat dasar untuk beberapa pembuatan prototipe dan eksperimen cepat.
Untuk mempelajari lebih lanjut cara memilih strategi pengambilan di RagManagedDb atau untuk memperbarui tingkat, lihat Menggunakan RagManagedDb dengan RAG. Agar Vertex AI RAG Engine dapat membuat dan mengelola database vektor secara otomatis untuk Anda, lihat Membuat korpus RAG.
Selain RagManagedDb default, Vertex AI RAG Engine
memungkinkan Anda menyediakan dan menggunakan database vektor dalam korpus RAG. Dalam hal ini, Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor Anda.
Membandingkan opsi database vektor
Tabel ini mencantumkan pilihan database vektor yang didukung dalam
Vertex AI RAG Engine dan menyediakan link ke halaman yang menjelaskan cara
menggunakan database vektor dalam korpus RAG Anda.
Database vektor
Manfaat
Ideal untuk
Kekurangan
Metrik jarak yang didukung
Jenis penelusuran
Tahap peluncuran
RagManagedDb (default) adalah layanan database skalabel yang didistribusikan secara regional yang menawarkan konsistensi sangat tinggi dan ketersediaan tinggi serta dapat digunakan untuk penelusuran vektor.
mudah sederhana cepat
Tidak perlu penyiapan.
Cocok untuk kasus penggunaan skala perusahaan dan skala kecil.
Konsistensi sangat tinggi.
Ketersediaan tinggi.
Latensi rendah.
Sangat baik untuk beban kerja transaksional.
CMEK diaktifkan.
Membuat dokumen bervolume tinggi.
Membangun RAG skala perusahaan.
Mengembangkan bukti konsep cepat.
Menyediakan overhead penyediaan dan pemeliharaan yang rendah.
Menggunakan dengan bot chat.
Membangun aplikasi RAG.
Untuk perolehan optimal, fitur ANN mengharuskan indeks
dibangun ulang setelah perubahan besar pada data Anda.
cosine
KNN (default) dan ANN
Pratinjau
Vector Search adalah layanan database vektor dalam Vertex AI yang dioptimalkan untuk tugas machine learning.
Terintegrasi dengan layanan Google Cloud lainnya.
Skalabilitas dan keandalan didukung oleh infrastruktur Google Cloud .
Menggunakan harga bayar sesuai penggunaan.
Membuat dokumen bervolume tinggi.
Membangun RAG skala perusahaan.
Mengelola infrastruktur database vektor.
Pelanggan Google Cloud lama atau siapa pun yang ingin menggunakan beberapa Google Cloud layanan.
Pembaruan tidak langsung ditampilkan.
Keterikatan pada vendor dengan Google Cloud.
Bisa lebih mahal, bergantung pada kasus penggunaan Anda.
cosine
dot-product
ANN
Tersedia secara umum
Vertex AI Feature Store
adalah layanan terkelola untuk mengatur, menyimpan, dan menyalurkan fitur machine learning.
Terintegrasi dengan Vertex AI dan layanan Google Cloud lainnya.
Skalabilitas dan keandalan didukung oleh infrastruktur Google Cloud .
Memanfaatkan infrastruktur BigQuery yang ada.
Membuat dokumen bervolume tinggi.
Membangun RAG skala perusahaan.
Mengelola infrastruktur database vektor.
Pelanggan Google Cloud lama atau pelanggan yang ingin menggunakan beberapa Google Cloud layanan.
Perubahan hanya tersedia di toko online setelah sinkronisasi manual dilakukan.
Keterikatan pada vendor dengan Google Cloud.
cosine
dot-product
L2 squared
ANN
Pratinjau
Weaviate
adalah database vektor open source yang fleksibel dan modular.
Mendukung berbagai jenis data dan menawarkan kemampuan grafik bawaan.
Menyediakan open source dan komunitas yang aktif.
Sangat fleksibel dan dapat disesuaikan.
Mendukung berbagai jenis data dan modul untuk modalitas yang berbeda, seperti teks dan gambar.
Dapat memilih di antara penyedia Cloud, seperti Google Cloud, AWS, dan Azure.
Membuat dokumen bervolume tinggi.
Membangun RAG skala perusahaan.
Mengelola infrastruktur database vektor.
Pelanggan Weaviate lama.
Pembaruan tidak langsung ditampilkan.
Penyiapan dan pengelolaannya bisa lebih rumit.
Performa dapat bervariasi bergantung pada konfigurasi.
cosine
dot-product
L2 squared
hamming
manhattan
Dukungan penelusuran Hybrid + ANN
Pratinjau
Pinecone
adalah database vektor berbasis cloud yang terkelola sepenuhnya dan dirancang untuk penelusuran kesamaan dengan performa tinggi.
Mulai dengan cepat.
Skalabilitas dan performa yang sangat baik.
Berfokus pada penelusuran vektor dengan fitur lanjutan seperti pemfilteran dan penelusuran metadata.
Dapat memilih di antara penyedia Cloud, seperti Google Cloud, AWS, dan Azure.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-29 UTC."],[],[],null,["# Vector database choices in Vertex AI RAG Engine\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces the vector databases supported on Vertex AI RAG Engine.\nYou can also see how to connect a vector database (vector store) to your RAG\ncorpus.\n\nVector databases play a crucial role in enabling retrieval for RAG applications.\nVector databases offer a specialized way to store and query vector embeddings,\nwhich are mathematical representations of text or other data that capture\nsemantic meaning and relationships. Vector embeddings allow RAG systems to\nquickly and accurately find the most relevant information within a vast\nknowledge base, even when dealing with complex or nuanced queries. When combined\nwith an embedding model, vector databases can help overcome the limitations of\nLLMs, and provide more accurate, relevant, and comprehensive responses.\n\nSupported vector databases\n--------------------------\n\nWhen creating a RAG corpus, Vertex AI RAG Engine offers the\nenterprise-ready `RagManagedDb` as the default vector database, which requires\nno additional provisioning or managing.\n`RagManagedDb` offers both KNN and ANN search options and\nallows switching to a basic tier for some quick prototyping and experimentation.\nTo learn more about choosing a retrieval strategy on `RagManagedDb` or for\nupdating the tier, see [Use `RagManagedDb` with\nRAG](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag). For\nVertex AI RAG Engine to automatically create and manage the\nvector database for you, see [Create a RAG\ncorpus](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-params-api).\n\nIn addition to the default `RagManagedDb`, Vertex AI RAG Engine\nlets you provision and use your vector database within your RAG corpus. In this\ncase, you are responsible for the lifecycle and scalability of your vector\ndatabase.\n\nCompare vector database options\n-------------------------------\n\nThis table lists your choices of vector databases that are supported within\nVertex AI RAG Engine and provides links to pages that explain how\nto use the vector databases within your RAG corpus. \n\nWhat's next\n-----------\n\n- To create a RAG corpus, see [Create a RAG corpus\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-example-api).\n- To list all of the RAG corpora, see [List RAG corpora\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#list-rag-corpora-example-api)."]]