Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

Menyesuaikan transformasi RAG

Setelah dokumen diserap, Vertex AI RAG Engine menjalankan serangkaian transformasi untuk menyiapkan data untuk pengindeksan. Anda dapat mengontrol kasus penggunaan menggunakan parameter berikut:

Parameter	Deskripsi
`chunk_size`	Saat dokumen dimasukkan ke dalam indeks, dokumen tersebut akan dibagi menjadi beberapa bagian. Parameter `chunk_size` (dalam token) menentukan ukuran potongan. Ukuran potongan default adalah 1.024 token.
`chunk_overlap`	Secara default, dokumen dibagi menjadi beberapa bagian dengan jumlah tumpang-tindih tertentu untuk meningkatkan relevansi dan kualitas pengambilan. Tumpang-tindih potongan default adalah 256 token.

Ukuran potongan yang lebih kecil berarti embedding lebih presisi. Ukuran potongan yang lebih besar berarti sematan mungkin lebih umum, tetapi mungkin melewatkan detail tertentu.

Misalnya, jika Anda mengonversi 1.000 kata menjadi array sematan yang dimaksudkan untuk 200 kata, Anda mungkin akan kehilangan detail. Kapasitas embedding ditetapkan untuk setiap potongan. Sebagian besar teks mungkin tidak sesuai dengan model jendela kecil.

Langkah berikutnya

Gunakan pengurai tata letak Document AI dengan Vertex AI RAG Engine.

Menyesuaikan transformasi RAG Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Langkah berikutnya

Menyesuaikan transformasi RAG