Memahami RagManagedDb

Halaman ini memperkenalkan Anda pada RagManagedDb, teknologi yang mendasarinya, dan cara RagManagedDb digunakan di Vertex AI RAG Engine. Selain itu, halaman ini menjelaskan berbagai tingkat yang tersedia untuk menyesuaikan performa, yang dapat memengaruhi biaya Anda, dan memberikan petunjuk untuk menghapus data Vertex AI RAG Engine Anda, yang akan menghentikan penagihan.

Ringkasan

Vertex AI RAG Engine menggunakan RagManagedDb, yaitu instance Google Spanner yang siap digunakan perusahaan dan terkelola sepenuhnya yang digunakan untuk penyimpanan resource oleh Vertex AI RAG Engine dan secara opsional tersedia untuk digunakan sebagai database vektor pilihan untuk korpus RAG Anda.

Melalui Spanner, Vertex AI RAG Engine menawarkan database yang konsisten, memiliki ketersediaan tinggi, dan sangat skalabel untuk mendukung aplikasi Anda. Untuk mempelajari Google Spanner lebih lanjut, lihat Spanner.

Vertex AI RAG Engine menyimpan metadata resource file RAG dan korpus RAG Anda di RagManagedDb, terlepas dari pilihan database vektor Anda. Database vektor hanya digunakan untuk penyimpanan dan pengambilan embedding. Selain penyimpanan resource, RagManagedDb juga dapat digunakan untuk menyimpan dan mengelola representasi vektor dokumen Anda. Database vektor kemudian digunakan untuk mengambil dokumen yang relevan berdasarkan kemiripan semantik dokumen dengan kueri tertentu.

Mengelola tingkat

Vertex AI RAG Engine memungkinkan Anda menskalakan instance RagManagedDb berdasarkan penggunaan dan persyaratan performa menggunakan pilihan dua tingkat, dan secara opsional, memungkinkan Anda menghapus data Vertex AI RAG Engine menggunakan tingkat ketiga.

Tingkatan adalah setelan tingkat project yang tersedia di resource RagEngineConfig yang memengaruhi korpus RAG menggunakan RagManagedDb. Tingkatan berikut tersedia di RagEngineConfig:

  • Tingkat yang diskalakan: Tingkat ini menawarkan performa skala produksi beserta fungsi penskalaan otomatis. Layanan ini cocok untuk pelanggan dengan data dalam jumlah besar atau workload yang sensitif terhadap performa. Secara internal, tingkat ini menetapkan instance Spanner ke konfigurasi penskalaan otomatis dengan minimal 1 node (1.000 unit pemrosesan) dan maksimum 10 node (10.000 unit pemrosesan).

  • Tingkat dasar (default): Tingkat ini menawarkan tingkat komputasi rendah dan hemat biaya, yang mungkin cocok untuk beberapa kasus berikut:

    • Bereksperimen dengan RagManagedDb.
    • Ukuran data kecil.
    • Workload yang tidak sensitif terhadap latensi.
    • Gunakan Vertex AI RAG Engine hanya dengan database vektor lainnya.

    Untuk menawarkan tingkat Dasar, RagManagedDb menetapkan instance Spanner yang mendasarinya ke konfigurasi tetap 100 unit pemrosesan, yang setara dengan 0,1 node.

  • Paket yang tidak disediakan: Paket ini menghapus RagManagedDb dan instance Spanner yang mendasarinya. Tingkat yang Tidak Disediakan akan menonaktifkan layanan Vertex AI RAG Engine dan menghapus data Anda yang disimpan dalam layanan ini, terlepas dari database vektor yang digunakan untuk RagCorpora Anda. Tindakan ini akan menghentikan penagihan layanan. Untuk mengetahui informasi selengkapnya tentang penagihan, lihat Penagihan Mesin RAG Vertex AI.

    Setelah data dihapus, data tidak dapat dipulihkan. Untuk mulai menggunakan Vertex AI RAG Engine lagi, Anda harus memperbarui tingkat dengan memanggil UpdateRagEngineConfig API.

Mendapatkan konfigurasi project

Contoh kode berikut menunjukkan cara menggunakan API GetRagEngineConfig untuk setiap jenis tingkat:

Memperbarui konfigurasi project

Contoh kode berikut menunjukkan cara menggunakan API UpdateRagEngineConfig untuk setiap jenis tingkat:

Langkah berikutnya