Mengonfigurasi setelan kolom

Halaman ini menunjukkan cara mengonfigurasi kolom skema untuk menyiapkan aplikasi bagi data terstruktur, bagi data tidak terstruktur dengan metadata, atau bagi data situs dengan atribut terstruktur kustom.

Setelan kolom membantu menentukan cara Vertex AI Search menggunakan kolom dalam hasilnya. Anda dapat menggunakan tab Schema di Google Cloud konsol untuk mengonfigurasi setelan kolom.

Konfigurasi setelan kolom hanya tersedia untuk aplikasi dengan penyimpanan data yang berisi data terstruktur atau data tidak terstruktur dengan metadata.

Setelan kolom

Setelan kolom berikut tersedia untuk banyak jenis kolom dalam data penelusuran atau rekomendasi Anda, tetapi tidak untuk semua jenis data. Skema berisi beberapa setelan kolom untuk masing-masing kolom, dan tabel berikutnya berisi setelan yang dapat diterapkan ke kolom dalam skema. Penggunaan data terstruktur sangat direkomendasikan untuk setelan kolom berikut:

Setelan Definisi Tujuan Contoh kasus penggunaan
Dapat diindeks

Dengan menyetel kolom agar dapat diindeks, operasi seperti pemfilteran, peningkatan, dan faseting pada kolom terstruktur dalam dokumen dapat dilakukan.

Kolom berjenis Object tidak dapat disetel ke Indexable.

Menandai kolom sebagai Indexable memungkinkan pencarian yang lebih cepat.

Perhatikan bahwa menandai kolom sebagai Indexable akan meningkatkan ukuran indeks penelusuran dan dapat memperlambat pengindeksan.

Di penyimpanan data hotel, Anda dapat menetapkan kolom, seperti hotel_chain, sebagai dapat diindeks. Hal ini memungkinkan Anda menerapkan operasi pemberian peringkat, pemfilteran, dan peningkatan pada hotel_chain. Misalnya, Anda dapat menerapkan filter sehingga penelusuran hanya akan menampilkan hasil penelusuran yang berisi jaringan hotel yang difilter.
Dapat ditelusuri

Kolom yang kemungkinan besar terkait dengan penelusuran ditetapkan sebagai Searchable. Kolom dapat ditelusuri tanpa dapat diindeks atau diambil.

Hanya kolom dengan nilai teks yang dapat ditandai sebagai dapat ditelusuri. Dengan demikian, kolom harga numerik dapat diindeks (untuk pemfilteran atau pengelompokan) tetapi tidak dapat ditelusuri sebagai teks lengkap.

Menyetel kolom ke Dapat Ditelusuri meningkatkan ingatan untuk kolom tersebut dalam kueri penelusuran, sehingga pengguna dapat menemukan konten, seperti halaman web, dengan mengirimkan kueri teks dalam kolom ini. Menandai kolom sebagai dapat ditelusuri memungkinkan penerapan peringkat. Akibatnya, menandai terlalu banyak kolom sebagai dapat ditelusuri dapat berdampak negatif pada presisi penelusuran dengan membuat algoritma peringkat menjadi terlalu jenuh dan menampilkan terlalu banyak hasil. Hal ini dapat menyebabkan hasil penelusuran yang tidak relevan.

Sistem tiket dukungan penyedia layanan internet menyimpan setiap tiket sebagai dokumen terstruktur. Jika dokumen ini berisi kolom Teks yang dapat ditelusuri, seperti issue_description atau resolution_notes, agen dukungan dapat menjalankan kueri yang terkait dengan konten di kolom tersebut, seperti cara memperbaiki kecepatan internet yang lambat setelah modem direset. Kemudian, sistem akan menampilkan dokumen yang berisi salah satu istilah penelusuran tersebut, termasuk modem, internet, kecepatan, di salah satu atau kedua kolom issue_description atau resolution_notes.

Facet dinamis Menyediakan filter yang memahami konteks untuk menargetkan pengguna dengan lebih baik dalam penelusuran. Menetapkan kolom sebagai Dynamic Facetable memungkinkan sistem otomatis membuat filter interaktif (facet) berdasarkan nilai unik yang ada di kolom. Menetapkan kolom ke Dynamic facetable memungkinkan pengguna menyaring hasil penelusuran secara dinamis dengan memilih kategori atau atribut yang berasal langsung dari data yang Anda masukkan, tanpa harus menentukan setiap opsi filter yang mungkin secara manual. Hal ini memungkinkan pengguna mempersempit penelusuran mereka ke konten web yang sangat spesifik. Halaman di pusat informasi perusahaan internal, seperti kebijakan SDM, akan diproses dengan data seperti department, document_type, atau last_modified_date. Jika kolom ini diberi tag dynamic facetable, penelusuran karyawan untuk istilah seperti penggantian biaya akan menghasilkan filter interaktif secara dinamis berdasarkan hasil yang relevan yang ditemukan. Dalam kasus tersebut, antarmuka web dapat menampilkan aspek untuk Departemen: Keuangan, Perjalanan, Jenis Dokumen: Kebijakan, FAQ, atau Tanggal Terakhir Diubah: Kuartal Ini, Tahun Lalu.
Dapat diambil Saat kueri penelusuran menemukan konten yang cocok, mesin telusur dapat menarik nilai kolom yang dapat diambil untuk ditampilkan atau digunakan dalam aplikasi, yang berarti informasi dari dokumen asli ditampilkan sebagai bagian dari hasil penelusuran. Kolom kunci (ID unik untuk dokumen) disiapkan agar dapat diambil. Kolom yang dapat diambil memberikan konteks penelusuran dengan membedakan kolom yang nilainya dapat ditampilkan dari kolom yang hanya digunakan dalam logika penelusuran, tetapi nilai mentahnya tidak dimaksudkan untuk ditampilkan kepada pengguna akhir. Untuk penelusuran produk di situs penjual, product_id, name, price, dan image_url adalah kolom umum yang ingin Anda tetapkan sebagai dapat diambil. Di sisi lain, internal_tracking_code dapat diindeks dan dapat difilter hanya untuk tujuan administratif, tetapi tidak dapat diambil di hasil penelusuran publik.
Dapat diselesaikan Mengizinkan konten kolom digunakan untuk saran kueri penelusuran. Untuk informasi selengkapnya, lihat Mengonfigurasi pelengkapan otomatis.

Setelan ini memungkinkan nilai dalam kolom tersebut digunakan untuk memberikan saran kueri real-time saat pengguna mengetik. Fitur ini membantu mengarahkan pengguna ke konten yang relevan dan mempercepat proses penelusuran. Faktor tertentu seperti penggunaan pemfilteran bahasa natural dapat memengaruhi performa ini.

Jika kolom completable disetel untuk product_name, brand, dan category, saat pengguna mengetik Tech, saran pelengkapan otomatis dapat menampilkan:
  • TechCo (dari kolom brand)
  • TechCo UltraBook X1 (dari kolom product_name )
  • Technology GameMaster Pro (produk lain dari kolom category)
Dapat difilter Memungkinkan rekomendasi menggunakan kolom untuk memfilter hasil yang direkomendasikan, menentukan hasil penelusuran yang dilihat pengguna Anda. Untuk mengetahui informasi tentang memfilter rekomendasi, lihat Memfilter rekomendasi. Menetapkan kolom ke Filterable membantu menyesuaikan rekomendasi untuk pengguna. Perhatikan bahwa batas pemfilteran berlaku. Setelan filter menurut bahasa dan drama dapat terlihat seperti: language_code: ANY("en", "fr") OR categories: ANY("drama").

Perbedaan antara setelan yang umum digunakan

Ada perbedaan utama antara setelan kolom yang dapat diindeks, dapat ditelusuri, dan dapat diambil. Tabel ini merangkum perbedaan tersebut.

Fitur Indexable Dapat ditelusuri Dapat diambil
Peran Utama Membuat konten kolom tersedia untuk mesin telusur Memungkinkan kueri teks lengkap terhadap konten kolom Mengizinkan nilai kolom ditampilkan di hasil penelusuran
Analisis Konten diproses dan dimasukkan ke dalam indeks. Biasanya menjalani analisis leksikal yang ekstensif. Nilai disimpan apa adanya untuk ditampilkan.
Mungkinkah...
...Dapat ditelusuri? Ya (sering kali merupakan prasyarat) T/A Tidak harus (dapat diambil tanpa dapat ditelusuri)
...Dapat diambil? Belum tentu Belum tentu T/A
...Dapat Difilter/Diurutkan/Dikelompokkan? Ya (biasanya juga merupakan prasyarat untuk hal ini) Tidak secara langsung; ini adalah atribut terpisah yang sering kali dibuat di kolom yang dapat diindeks. Tidak secara langsung; atribut ini berkaitan dengan cara kolom diindeks dan dikueri, bukan hanya ditampilkan.

Dalam praktiknya, banyak kolom yang penting untuk pengalaman pengguna (seperti judul, deskripsi, dan informasi identifikasi) sering ditetapkan sebagai indexable, searchable, dan retrievable.

Batasan

Setelan kolom memiliki batasan berikut:

  • Anda dapat mengonfigurasi hingga 50 kolom sebagai kolom yang dapat diindeks, dapat ditelusuri, atau dapat difasilitasi secara dinamis.
  • Anda dapat mengonfigurasi hingga 30 kolom sebagai dapat diambil.
  • Untuk mengonfigurasi kolom sebagai aspek dinamis, kolom tersebut harus dikonfigurasi sebagai dapat diindeks terlebih dahulu.
  • Mengubah setelan yang dapat diindeks memerlukan pengindeksan ulang data, yang dapat memakan waktu berjam-jam, terutama untuk penyimpanan data yang besar.

Jika Anda mengonfigurasi kolom untuk aplikasi penelusuran media dan menginginkan informasi mendetail tentang kolom dalam skema, lihat Tentang dokumen media dan penyimpanan data.

Memperbarui setelan kolom

Untuk memperbarui setelan kolom:

  1. Di konsol Google Cloud , buka halaman AI Applications.

    Aplikasi AI

  2. Klik nama aplikasi yang ingin Anda edit.

  3. Klik Data.

  4. Klik tab Schema. Tab ini menampilkan setelan kolom saat ini.

  5. Klik Edit.

  6. Pilih atau hapus setelan kolom yang perlu Anda perbarui. Beberapa setelan kolom tidak didukung. Misalnya, kolom numerik tidak dapat disetel ke Dapat ditelusuri.

  7. Klik Simpan untuk menerapkan perubahan.

Langkah berikutnya