Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Halaman ini memperkenalkan Anda pada RagManagedDb, teknologi yang mendasarinya, dan cara
RagManagedDb digunakan di Vertex AI RAG Engine. Selain itu, halaman ini menjelaskan berbagai tingkat yang tersedia untuk menyesuaikan performa, yang dapat memengaruhi biaya Anda, dan memberikan petunjuk untuk menghapus data Vertex AI RAG Engine Anda, yang akan menghentikan penagihan.
Ringkasan
Vertex AI RAG Engine menggunakan RagManagedDb, yaitu instance Google Spanner yang siap digunakan perusahaan dan terkelola sepenuhnya yang digunakan untuk penyimpanan resource oleh Vertex AI RAG Engine dan secara opsional tersedia untuk digunakan sebagai database vektor pilihan untuk korpus RAG Anda.
Melalui Spanner, Vertex AI RAG Engine menawarkan database yang konsisten, memiliki ketersediaan tinggi, dan sangat skalabel untuk mendukung aplikasi Anda. Untuk mempelajari Google Spanner lebih lanjut, lihat
Spanner.
Vertex AI RAG Engine menyimpan metadata resource file RAG dan korpus RAG Anda di RagManagedDb, terlepas dari pilihan database vektor Anda. Database
vektor hanya digunakan untuk penyimpanan dan pengambilan embedding. Selain penyimpanan resource, RagManagedDb juga dapat digunakan untuk menyimpan dan mengelola representasi vektor dokumen Anda. Database vektor kemudian digunakan untuk mengambil
dokumen yang relevan berdasarkan kemiripan semantik dokumen dengan kueri tertentu.
Mengelola tingkat
Vertex AI RAG Engine memungkinkan Anda menskalakan instance RagManagedDb berdasarkan
penggunaan dan persyaratan performa menggunakan pilihan dua tingkat, dan
secara opsional, memungkinkan Anda menghapus data Vertex AI RAG Engine menggunakan
tingkat ketiga.
Tingkatan adalah setelan tingkat project yang tersedia di resource RagEngineConfig yang memengaruhi korpus RAG menggunakan RagManagedDb. Tingkatan berikut
tersedia di RagEngineConfig:
Tingkat yang diskalakan: Tingkat ini menawarkan performa skala produksi beserta fungsi penskalaan otomatis. Layanan ini cocok untuk pelanggan dengan data dalam jumlah besar atau workload yang sensitif terhadap performa. Secara internal, tingkat ini menetapkan instance Spanner ke konfigurasi penskalaan otomatis dengan minimal 1 node (1.000 unit pemrosesan) dan maksimum 10 node (10.000 unit pemrosesan).
Tingkat dasar (default): Tingkat ini menawarkan tingkat komputasi rendah dan hemat biaya, yang mungkin cocok untuk beberapa kasus berikut:
Bereksperimen dengan RagManagedDb.
Ukuran data kecil.
Workload yang tidak sensitif terhadap latensi.
Gunakan Vertex AI RAG Engine hanya dengan database vektor lainnya.
Untuk menawarkan tingkat Dasar, RagManagedDb menetapkan instance Spanner yang mendasarinya ke konfigurasi tetap 100 unit pemrosesan, yang setara dengan 0,1 node.
Paket yang tidak disediakan: Paket ini menghapus RagManagedDb dan instance Spanner yang mendasarinya. Tingkat yang Tidak Disediakan akan menonaktifkan layanan Vertex AI RAG Engine dan menghapus data Anda yang disimpan dalam layanan ini, terlepas dari database vektor yang digunakan untuk RagCorpora Anda. Tindakan ini akan menghentikan penagihan layanan. Untuk mengetahui informasi selengkapnya tentang penagihan, lihat Penagihan Mesin RAG Vertex AI.
Setelah data dihapus, data tidak dapat dipulihkan. Untuk mulai menggunakan Vertex AI RAG Engine lagi, Anda harus memperbarui tingkat dengan
memanggil UpdateRagEngineConfig API.
Mendapatkan konfigurasi project
Contoh kode berikut menunjukkan cara menggunakan API GetRagEngineConfig untuk setiap jenis tingkat:
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-29 UTC."],[],[],null,["# Understanding RagManagedDb\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces you to `RagManagedDb`, its underlying technology, and how\n`RagManagedDb` is used in Vertex AI RAG Engine. In addition, this page\ndescribes the different tiers that are available to tune performance, which\nmight impact your costs, and provides instructions for deleting your\nVertex AI RAG Engine data, which stops billing.\n\nOverview\n--------\n\nVertex AI RAG Engine uses `RagManagedDb`, which is an enterprise-ready,\nfully-managed Google Spanner instance that's used for resource storage\nby Vertex AI RAG Engine and is optionally available to be used as\nthe [vector database of\nchoice](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag) for your RAG corpora.\n\nThrough Spanner, Vertex AI RAG Engine offers a\nconsistent, highly available, and highly scalable database to support your\napplication. To learn more about Google Spanner, see\n[Spanner](/spanner).\n\nVertex AI RAG Engine stores your RAG corpus and RAG file resource\nmetadata in `RagManagedDb`, regardless of your choice of vector database. Vector\ndatabases are only used for storage and retrieval of embeddings. In addition to\nresource storage, `RagManagedDb` can also be used to store and manage vector\nrepresentations of your documents. The vector database is then used to retrieve\nrelevant documents based on the document's semantic similarity to a given query.\n\nManage tiers\n------------\n\nVertex AI RAG Engine lets you scale your `RagManagedDb` instance based\non your usage and performance requirements using a choice of two tiers, and\noptionally, lets you delete your Vertex AI RAG Engine data using\na third tier.\n\nThe tier is a project-level setting that's available in the `RagEngineConfig`\nresource that impacts RAG corpora using `RagManagedDb`. The following tiers\nare available in `RagEngineConfig`:\n\n- **Scaled tier**: This tier offers production-scale performance along with\n autoscaling functionality. It's suitable for customers with large amounts of\n data or performance-sensitive workloads. Internally, this tier sets the\n Spanner instance to autoscaling configuration with a minimum\n of 1 node (1,000 processing units) and a maximum of 10 nodes (10,000\n processing units).\n\n- **Basic tier (default)**: This tier offers a cost-effective and low-compute\n tier, which might be suitable for some of the following cases:\n\n - Experimenting with `RagManagedDb`.\n - Small data size.\n - Latency-insensitive workload.\n - Use Vertex AI RAG Engine with only other vector databases.\n\n To offer the Basic tier, `RagManagedDb` sets the underlying\n Spanner instance to a fixed configuration of 100 processing\n units, which is equivalent to 0.1 nodes.\n- **Unprovisioned tier** : This tier deletes the `RagManagedDb` and its\n underlying Spanner instance. The Unprovisioned tier disables\n the Vertex AI RAG Engine service and deletes your data held\n within this service regardless of the vector database used for your\n `RagCorpora`. This stops the billing of the service. For more information on\n billing, see [Vertex AI RAG Engine\n billing](/vertex-ai/generative-ai/docs/rag-engine/rag_engine_billing).\n\n After the data is deleted, the data can't be recovered. To start usingVertex AI RAG Engine again, you must update the tier by\n calling the `UpdateRagEngineConfig` API.\n\n| **Note:** The Enterprise tier from the `v1beta1` version was renamed to the Scaled tier.\n\nGet the project configuration\n-----------------------------\n\nThe following code samples demonstrate how to use the `GetRagEngineConfig` API\nfor each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#get_project_configuration) API\n code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#get-project-config-for-rag) API\n code samples.\n\nUpdate the project configuration\n--------------------------------\n\nThe following code samples demonstrate how to use the `UpdateRagEngineConfig`\nAPI for each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#update_project_configuration)\n API code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#update-project-config-for-rag)\n API code samples.\n\nWhat's next\n-----------\n\n- To learn how to use the RAG API v1, the default, see [RAG API\n v1](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1).\n- To learn how to use the RAG API v1beta1, see [RAG API\n v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api).\n- To learn more about `RagManagedDb` and how to manage your tier configuration as well as the RAG corpus-level retrieval strategy, see [Use RagManagedDb with\n Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag)."]]