Ringkasan Vertex AI RAG Engine

Halaman ini menjelaskan apa itu Vertex AI RAG Engine dan cara kerjanya.

Deskripsi Konsol
Untuk mempelajari cara menggunakan Vertex AI SDK guna menjalankan tugas Vertex AI RAG Engine, lihat Mulai cepat RAG untuk Python.

Coba Vertex AI RAG Engine

Ringkasan

Vertex AI RAG Engine, komponen Platform Vertex AI, memfasilitasi Retrieval-Augmented Generation (RAG). Vertex AI RAG Engine juga merupakan framework data untuk mengembangkan aplikasi model bahasa besar (LLM) yang dilengkapi konteks. Peningkatan konteks terjadi saat Anda menerapkan LLM ke data Anda. Ini mengimplementasikan retrieval-augmented generation (RAG).

Masalah umum pada LLM adalah bahwa LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan Vertex AI RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, karena model dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.

Dengan menggabungkan sumber pengetahuan tambahan dengan pengetahuan yang sudah dimiliki LLM, konteks yang lebih baik akan diberikan. Konteks yang ditingkatkan bersama dengan kueri meningkatkan kualitas respons LLM.

Gambar berikut mengilustrasikan konsep utama untuk memahami Vertex AI RAG Engine.

Konsep utama RAG Vertex AI

Konsep ini tercantum dalam urutan proses retrieval-augmented generation (RAG).

  1. Penyerapan data: Memasukkan data dari berbagai sumber data. Misalnya, file lokal, Cloud Storage, dan Google Drive.

  2. Transformasi data: Konversi data sebagai persiapan untuk pengindeksan. Misalnya, data dibagi menjadi beberapa bagian.

  3. Embedding: Representasi numerik kata atau potongan teks. Angka ini menangkap makna semantik dan konteks teks. Kata atau teks yang serupa atau terkait cenderung memiliki embedding yang serupa, yang berarti posisinya lebih berdekatan dalam ruang vektor berdimensi tinggi.

  4. Pengindeksan data: Vertex AI RAG Engine membuat indeks yang disebut korpus. Indeks menyusun pusat informasi sehingga dioptimalkan untuk penelusuran. Misalnya, indeks ini seperti daftar isi mendetail untuk buku referensi yang sangat besar.

  5. Pengambilan: Saat pengguna mengajukan pertanyaan atau memberikan perintah, komponen pengambilan di Vertex AI RAG Engine akan menelusuri basis pengetahuannya untuk menemukan informasi yang relevan dengan kueri.

  6. Generasi: Informasi yang diambil menjadi konteks yang ditambahkan ke kueri pengguna asli sebagai panduan bagi model AI generatif untuk menghasilkan respons yang berbasis fakta dan relevan.

Region yang didukung

Mesin RAG Vertex AI didukung di wilayah berikut:

Wilayah Lokasi Deskripsi Tahap peluncuran
us-central1 Iowa Versi v1 dan v1beta1 didukung. Daftar yang diizinkan
us-east4 Virginia Versi v1 dan v1beta1 didukung. GA
europe-west3 Frankfurt, Jerman Versi v1 dan v1beta1 didukung. GA
europe-west4 Eemshaven, Belanda Versi v1 dan v1beta1 didukung. GA
  • us-central1 diubah menjadi Allowlist. Jika Anda ingin bereksperimen dengan Vertex AI RAG Engine, coba region lain. Jika Anda berencana untuk mengaktifkan traffic produksi ke us-central1, hubungi vertex-ai-rag-engine-support@google.com.

Kirim masukan

Untuk memulai percakapan dengan dukungan Google, buka grup dukungan Vertex AI RAG Engine.

Untuk mengirim email, gunakan alamat email vertex-ai-rag-engine-support@google.com.

Langkah berikutnya