Panduan ini menunjukkan cara membuat embedding teks menggunakan Text embeddings API Vertex AI. Halaman ini membahas beberapa topik berikut: Vertex AI Text Embeddings API menggunakan representasi vektor padat teks. Embedding ini dibuat menggunakan metode deep learning yang serupa dengan yang digunakan oleh model bahasa besar. Tidak seperti vektor renggang, yang cenderung memetakan kata secara langsung ke angka, vektor padat dirancang untuk merepresentasikan makna sebuah teks. Hal ini memungkinkan Anda menelusuri bagian teks yang sesuai dengan makna kueri, meskipun bagian teks tersebut tidak menggunakan kata yang sama. Karakteristik utama embedding ini meliputi: Untuk mempelajari lebih lanjut, lihat referensi berikut: In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
Anda bisa mendapatkan embedding teks dengan menggunakan model berikut: Untuk kualitas embedding yang lebih baik, Hanya gunakan nama model seperti yang tercantum dalam tabel model yang didukung. Jangan tentukan nama model tanpa akhiran Anda bisa mendapatkan embedding teks untuk cuplikan teks dengan menggunakan Vertex AI API atau
Vertex AI SDK untuk Python. Setiap permintaan dibatasi hingga 250 teks input dan total 20.000 token input. Jika permintaan melebihi batas token, error 400 akan ditampilkan. Setiap teks input individu dibatasi hingga 2.048 token, dan token yang berlebih akan dipangkas tanpa pemberitahuan. Untuk menonaktifkan pemangkasan senyap, tetapkan Untuk mengetahui informasi selengkapnya, lihat Batas embedding teks. Secara default, semua model menghasilkan vektor embedding berdurasi penuh. Untuk Contoh berikut menggunakan model
Untuk mempelajari lebih lanjut, lihat
dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
Setelah membuat embedding, Anda dapat menambahkannya ke database vektor, seperti Vector Search. Hal ini memungkinkan pengambilan dengan latensi rendah dan sangat penting seiring bertambahnya ukuran data Anda. Untuk mempelajari Vector Search lebih lanjut, lihat Ringkasan Vector Search.
Sebelum memulai
Model yang didukung
Nama model
Deskripsi
Dimensi Output
Panjang urutan maksimum
Bahasa teks yang didukung
gemini-embedding-001
Performa canggih untuk tugas bahasa Inggris, multibahasa, dan kode. Model ini menyatukan model khusus sebelumnya seperti
text-embedding-005
dan text-multilingual-embedding-002
serta mencapai performa yang lebih baik di domain masing-masing. Baca Laporan Teknis kami untuk mengetahui detail selengkapnya.hingga 3072
2048 token
Bahasa teks yang didukung
text-embedding-005
Khusus dalam tugas bahasa Inggris dan kode.
hingga 768
2048 token
Inggris
text-multilingual-embedding-002
Khusus dalam tugas multibahasa.
hingga 768
2048 token
Bahasa teks yang didukung
gemini-embedding-001
adalah model besar kami yang dirancang untuk memberikan performa tertinggi. Perhatikan bahwa
gemini-embedding-001
mendukung satu instance per permintaan.@version
atau gunakan @latest
, karena format ini tidak valid.Mendapatkan embedding teks untuk cuplikan teks
Batas API
autoTruncate
ke false
.Pilih dimensi penyematan
gemini-embedding-001
, vektor ini memiliki 3.072 dimensi, dan untuk model lainnya, vektor ini memiliki 768 dimensi. Untuk mengontrol ukuran vektor sematan output, Anda dapat menggunakan parameter output_dimensionality
. Dimensi output yang lebih kecil dapat menghemat ruang penyimpanan dan meningkatkan efisiensi komputasi untuk aplikasi hilir, dengan potensi penurunan kualitas.gemini-embedding-001
.Python
Instal
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Menambahkan embedding ke database vektor
Langkah berikutnya
text-embedding-005
dan text-multilingual-embedding-002
dalam makalah penelitian Gecko: Versatile Text Embeddings Distilled from Large Language Models.
Mendapatkan embedding teks
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-08-19 UTC.