Halaman ini diterjemahkan oleh Cloud Translation API.

Mendapatkan embedding teks

Halaman ini menjelaskan cara membuat penyematan teks menggunakan Text Embedding API.

Vertex AI mendukung penyematan teks di lingkungan tertutup Google Distributed Cloud (GDC) melalui Text Embedding API. Text Embedding menggunakan representasi vektor.

Text Embedding mengonversi data tekstual yang ditulis dalam bahasa apa pun yang didukung menjadi vektor numerik. Representasi vektor ini dirancang untuk menangkap makna semantik dan konteks dari kata-kata yang direpresentasikannya. Model penyematan teks dapat menghasilkan penyematan yang dioptimalkan untuk berbagai jenis tugas, seperti pengambilan dokumen, pertanyaan dan jawaban, klasifikasi, dan verifikasi fakta untuk teks.

Untuk mengetahui informasi selengkapnya tentang konsep utama yang digunakan embedding teks, lihat dokumentasi berikut:

Untuk mempelajari lebih lanjut embedding, lihat ringkasan embedding teks.
Untuk mempelajari model embedding teks, lihat Model embedding.
Untuk mempelajari cara jenis tugas menghasilkan embedding yang dioptimalkan, lihat Memilih jenis tugas embedding.
Untuk mengetahui informasi tentang bahasa yang didukung oleh setiap model embedding, lihat Bahasa yang didukung untuk embedding teks.

Sebelum memulai

Sebelum menggunakan Penyematan Teks dalam project GDC, ikuti langkah-langkah berikut:

Siapkan project untuk Vertex AI.
Pilih salah satu model yang tersedia untuk embedding teks, bergantung pada bahasa dan jenis tugas.
Aktifkan Text Embedding API atau Text Embedding Multilingual API, bergantung pada model yang ingin Anda gunakan.
Berikan akses yang sesuai kepada pengguna atau akun layanan ke Text Embedding atau Text Embedding Multilingual. Untuk informasi selengkapnya, lihat dokumentasi berikut:
- Untuk mengetahui informasi tentang peran yang diperlukan, lihat Menyiapkan izin IAM.
- Untuk mengetahui informasi tentang binding peran untuk akun layanan, lihat Menyiapkan akun layanan.
Instal library klien Vertex AI.

Penting: Anda harus menginstal library klien Vertex AI Platform untuk menggunakan Text Embedding dan Text Embedding Multilingual.
Dapatkan token autentikasi.

Anda harus menggunakan project yang sama untuk permintaan model, akun layanan, dan binding peran IAM.

Mendapatkan embedding teks untuk cuplikan teks

Setelah memenuhi prasyarat, Anda dapat menggunakan model Text Embedding atau Text Embedding Multilingual untuk mendapatkan embedding teks untuk cuplikan teks dengan menggunakan API atau SDK untuk Python.

Contoh berikut menggunakan model text-embedding-004.

Buat permintaan REST ke Text Embedding API. Atau, berinteraksi dengan model dari skrip Python untuk mendapatkan embedding teks.

REST

Untuk mendapatkan embedding teks, kirim permintaan POST dengan menentukan endpoint model.

Ikuti langkah-langkah berikut untuk membuat permintaan:

Simpan konten permintaan Anda dalam file JSON bernama request.json. File harus terlihat seperti contoh berikut:

{
  "instances": [
    {
      "content": "What is life?",
      "task_type": "",
      "title": ""
    }
  ]
}

Buat permintaan menggunakan alat curl:
```
curl -X POST \
-H "Authorization: Bearer TOKEN"\
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://ENDPOINT:443/v1/projects/PROJECT/locations/PROJECT/endpoints/MODEL:predict"
```
Ganti kode berikut:
- TOKEN: token autentikasi yang Anda peroleh.
- ENDPOINT: endpoint Text Embedding atau Text Embedding Multilingual yang Anda gunakan untuk organisasi Anda. Untuk mengetahui informasi selengkapnya, lihat status dan endpoint layanan.
- PROJECT: nama project Anda.
- MODEL: model yang ingin Anda gunakan. Berikut adalah nilai yang tersedia:
  - endpoint-text-embedding untuk model Embedding Teks.
  - endpoint-text-embedding-multilingual untuk model Multibahasa Embedding Teks.

Anda harus mendapatkan respons JSON yang mirip dengan berikut ini:

{"predictions":[[-0.00668720435,3.20804138e-05,-0.0281705819,-0.00954890903,-0.0818724185,0.0150693133,-0.00677698106, …. ,0.0167487375,-0.0534791686,0.00208711182,0.032938987,-0.01491543]],"deployedModelId":"text-embedding","model":"models/text-embedding/1","modelDisplayName":"text-embedding","modelVersionId":"1"}

Python

Ikuti langkah-langkah berikut untuk mendapatkan embedding teks dari skrip Python:

Instal library klien Vertex AI Platform.