Vertex AI API untuk membuat pengalaman penelusuran dan RAG

Vertex AI menawarkan serangkaian API untuk membantu Anda membangun aplikasi Retrieval-Augmented Generation (RAG) Anda sendiri atau membangun mesin penelusuran Anda sendiri. Halaman ini memperkenalkan API tersebut.

Pengambilan dan pembuatan

RAG adalah metodologi yang memungkinkan Model Bahasa Besar (LLM) menghasilkan respons yang didasarkan pada sumber data pilihan Anda. Ada dua tahap dalam RAG:

  1. Pengambilan: Mendapatkan fakta yang paling relevan dengan cepat dapat menjadi masalah penelusuran yang umum. Dengan RAG, Anda dapat dengan cepat mengambil fakta yang penting untuk membuat jawaban.
  2. Pembuatan: Fakta yang diambil digunakan oleh LLM untuk menghasilkan respons yang berisi rujukan.

Vertex AI menawarkan opsi untuk kedua tahap agar sesuai dengan berbagai kebutuhan developer.

Retrieval

Pilih metode pengambilan terbaik untuk kebutuhan Anda:

  • Vertex AI Search: Vertex AI Search adalah mesin pengambilan informasi berkualitas Google Penelusuran yang dapat menjadi komponen dalam aplikasi AI generatif apa pun yang menggunakan data perusahaan Anda. Vertex AI Search berfungsi sebagai mesin telusur semantik & kata kunci siap pakai untuk RAG dengan kemampuan memproses berbagai jenis dokumen dan dengan konektor ke berbagai sistem sumber, termasuk BigQuery dan banyak sistem pihak ketiga.

    Untuk mengetahui informasi selengkapnya, lihat Vertex AI Search.

  • Membangun pengambilan Anda sendiri: Jika ingin membangun penelusuran semantik, Anda dapat mengandalkan API Vertex AI untuk komponen sistem RAG kustom Anda. Serangkaian API ini menyediakan penerapan berkualitas tinggi untuk penguraian dokumen, pembuatan embedding, penelusuran vektor, dan pemeringkatan semantik. Dengan menggunakan API tingkat rendah ini, Anda akan mendapatkan fleksibilitas penuh dalam desain retriever, sekaligus menawarkan waktu pemasaran yang lebih cepat dan kualitas tinggi dengan mengandalkan Vertex AI API tingkat rendah.

    Untuk mengetahui informasi selengkapnya, lihat Membangun Retrieval Augmented Generation Anda sendiri.

  • Membawa pengambilan yang ada: Anda dapat menggunakan penelusuran yang ada sebagai pengambil untuk pembuatan yang memiliki rujukan. Anda juga dapat menggunakan Vertex API untuk RAG guna meningkatkan kualitas penelusuran yang ada. Untuk mengetahui informasi selengkapnya, lihat Ringkasan perujukan.

  • Mesin RAG Vertex AI: Mesin RAG Vertex AI menyediakan runtime yang terkelola sepenuhnya untuk orkestrasi RAG, yang memungkinkan developer membangun RAG untuk digunakan dalam produksi dan konteks yang siap digunakan perusahaan.

    Untuk mengetahui informasi selengkapnya, lihat Ringkasan Mesin RAG Vertex AI dalam dokumentasi AI Generatif di Vertex AI.

  • Google Penelusuran: Jika Anda menggunakan Grounding dengan Google Penelusuran untuk model Gemini, Gemini akan menggunakan Google Penelusuran dan menghasilkan output yang didasarkan pada hasil penelusuran yang relevan. Metode pengambilan ini tidak memerlukan pengelolaan dan Anda mendapatkan pengetahuan dunia yang tersedia untuk Gemini.

    Untuk mengetahui informasi selengkapnya, lihat Perujukan dengan Google Penelusuran di dokumentasi AI Generatif di Vertex AI.

Generation

Pilih metode pembuatan terbaik untuk kebutuhan Anda:

  • Membuat jawaban yang relevan dengan data Anda: Menghasilkan jawaban yang relevan atas kueri pengguna. API pembuatan dengan rujukan menggunakan model Gemini khusus yang telah disesuaikan dan merupakan cara efektif untuk mengurangi halusinasi dan memberikan respons yang didasarkan pada sumber Anda atau sumber pihak ketiga, termasuk referensi ke konten dukungan perujukan.

    Untuk mengetahui informasi selengkapnya, lihat Membuat jawaban yang memiliki rujukan dengan RAG.

    Anda juga dapat men-grounding respons terhadap data Vertex AI Search menggunakan AI Generatif di Vertex AI. Untuk mengetahui informasi selengkapnya, lihat Menyertakan data Anda.

  • Grounding dengan Google Penelusuran: Gemini adalah model tercanggih Google dan menawarkan grounding siap pakai dengan Google Penelusuran. Anda dapat menggunakannya untuk membangun solusi pembuatan dengan perujukan yang sepenuhnya disesuaikan.

    Untuk mengetahui informasi selengkapnya, lihat Perujukan dengan Google Penelusuran dalam dokumentasi AI Generatif di Vertex AI.

  • Model Garden: Jika Anda menginginkan kontrol penuh dan model pilihan Anda, Anda dapat menggunakan model apa pun di Vertex AI Model Garden untuk pembuatan.

Membangun Retrieval-Augmented Generation Anda sendiri

Mengembangkan sistem RAG kustom untuk perujukan menawarkan fleksibilitas dan kontrol di setiap langkah proses. Vertex AI menawarkan serangkaian API untuk membantu Anda membuat solusi penelusuran sendiri. Dengan menggunakan API tersebut, Anda akan mendapatkan fleksibilitas penuh dalam desain aplikasi RAG, sekaligus menawarkan waktu pemasaran yang lebih cepat dan kualitas tinggi dengan mengandalkan Vertex AI API tingkat bawah ini.

  • Document AI Layout Parser. Document AI Layout Parser mengonversi dokumen dalam berbagai format menjadi representasi terstruktur, sehingga konten seperti paragraf, tabel, daftar, dan elemen struktural seperti judul, header halaman, dan footer dapat diakses, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam berbagai aplikasi AI generatif dan penemuan.

    Untuk mengetahui informasi selengkapnya, lihat Document AI Layout Parser dalam dokumentasi Document AI.

  • Embeddings API: Vertex AI Embeddings API memungkinkan Anda membuat embedding untuk input teks atau multimodal. Embedding adalah vektor angka floating point yang dirancang untuk menangkap makna inputnya. Anda dapat menggunakan embedding untuk mendukung penelusuran semantik menggunakan penelusuran Vektor.

    Untuk mengetahui informasi selengkapnya, lihat Penyematan teks dan Penyematan multimodal dalam dokumentasi AI Generatif di Vertex AI.

  • Vector Search. Mesin pengambilan adalah bagian penting dari aplikasi penelusuran atau RAG Anda. Vertex AI Vector Search adalah mesin pengambilan yang dapat menelusuri miliaran item yang memiliki kemiripan atau keterkaitan semantik dalam skala besar, dengan kueri per detik (QPS) tinggi, perolehan tinggi, latensi rendah, dan biaya yang rendah. Fitur ini dapat menelusuri embedding padat, dan mendukung penelusuran kata kunci embedding jarang dan penelusuran hybrid dalam Pratinjau publik.

    Untuk mengetahui informasi selengkapnya, lihat: Ringkasan Penelusuran Vektor Vertex AI di dokumentasi Vertex AI.

  • API peringkat. Ranking API menerima daftar dokumen dan mengurutkan ulang dokumen tersebut berdasarkan seberapa relevan dokumen tersebut dengan kueri tertentu. Dibandingkan dengan embedding yang hanya melihat kemiripan semantik dokumen dan kueri, Ranking API dapat memberikan skor yang lebih akurat tentang seberapa baik dokumen menjawab kueri tertentu.

    Untuk mengetahui informasi selengkapnya, lihat Meningkatkan kualitas penelusuran dan RAG dengan API peringkat.

  • API pembuatan berbasis data. Gunakan API pembuatan yang relevan untuk membuat jawaban yang relevan atas perintah pengguna. Sumber perujukan dapat berupa penyimpanan data Vertex AI Search, data kustom yang Anda berikan, atau Google Penelusuran.

    Untuk mengetahui informasi selengkapnya, lihat Membuat jawaban yang memiliki rujukan.

  • API pembuatan konten. Gunakan API buat konten untuk menghasilkan jawaban yang memiliki rujukan yang baik atas perintah pengguna. Sumber perujukan dapat berupa penyimpanan data Vertex AI Search atau Google Penelusuran.

    Untuk mengetahui informasi selengkapnya, lihat Menghubungkan dengan Google Penelusuran atau Menghubungkan dengan data Anda.

  • API perujukan pemeriksaan. Check grounding API menentukan seberapa kuat suatu teks didasarkan pada sekumpulan teks referensi tertentu. API dapat membuat kutipan pendukung dari teks referensi untuk menunjukkan bagian teks tertentu yang didukung oleh teks referensi. Selain hal lainnya, API ini dapat digunakan untuk menilai perujukan respons dari sistem RAG. Selain itu, sebagai fitur eksperimental, API juga menghasilkan kutipan yang bertentangan yang menunjukkan di mana teks yang diberikan dan teks referensi tidak sesuai.

    Untuk mengetahui informasi selengkapnya, lihat Memeriksa perujukan.

Alur kerja: Membuat respons yang relevan dari data tidak terstruktur

Berikut adalah alur kerja yang menguraikan cara mengintegrasikan Vertex AI RAG API untuk membuat respons yang memiliki rujukan dari data tidak terstruktur.

  1. Impor dokumen tidak terstruktur Anda, seperti file PDF, file HTML, atau gambar dengan teks, ke lokasi Cloud Storage.
  2. Proses dokumen yang diimpor menggunakan parser tata letak. Parser tata letak memecah dokumen tidak terstruktur menjadi beberapa bagian dan mengubah konten tidak terstruktur menjadi representasi terstrukturnya. Parser tata letak juga mengekstrak anotasi dari potongan.
  3. Buat embedding teks untuk potongan menggunakan Vertex AI text embeddings API.
  4. Indeks dan ambil embedding potongan menggunakan Vector Search.
  5. Urutkan potongan menggunakan API peringkat dan tentukan potongan yang memiliki peringkat teratas.
  6. Buat jawaban yang memiliki rujukan berdasarkan potongan yang diberi peringkat teratas menggunakan API pembuatan dengan rujukan atau menggunakan API pembuatan konten.

Jika Anda membuat jawaban menggunakan model pembuatan jawaban selain model Google, Anda dapat memeriksa perujukan jawaban ini menggunakan metode pemeriksaan perujukan.