Halaman ini menjelaskan fitur pelengkapan otomatis dasar Vertex AI Search. Pelengkapan otomatis menghasilkan saran kueri berdasarkan beberapa karakter pertama yang dimasukkan untuk kueri.
Saran yang dihasilkan pelengkapan otomatis bervariasi bergantung pada jenis data yang digunakan aplikasi penelusuran:
Data terstruktur dan tidak terstruktur. Secara default, pelengkapan otomatis akan menghasilkan saran berdasarkan konten dokumen di penyimpanan data. Setelah impor dokumen, secara default, pelengkapan otomatis tidak mulai menghasilkan saran hingga ada data berkualitas yang memadai, biasanya beberapa hari. Jika Anda membuat permintaan pelengkapan otomatis melalui API, pelengkapan otomatis dapat membuat saran yang didasarkan pada histori penelusuran atau peristiwa pengguna.
Data situs. Secara default, pelengkapan otomatis menghasilkan saran dari histori penelusuran. Pelengkapan otomatis memerlukan traffic penelusuran yang sebenarnya. Setelah traffic penelusuran dimulai, pelengkapan otomatis memerlukan waktu satu atau dua hari sebelum menghasilkan saran. Saran dapat dihasilkan dari data yang di-crawl web dari situs publik dengan model data dokumen lanjutan eksperimental.
Data perawatan kesehatan. Secara default, sumber data medis kanonis digunakan untuk membuat saran pelengkapan otomatis untuk penyimpanan data layanan kesehatan. Untuk penelusuran layanan kesehatan, pelengkapan otomatis adalah fitur Pratinjau.
Model data pelengkapan otomatis menentukan jenis data yang digunakan pelengkapan otomatis untuk membuat saran. Ada empat model pelengkapan otomatis:
Document. Model dokumen menghasilkan saran dari dokumen yang diimpor pengguna. Model ini tidak tersedia untuk data situs atau data layanan kesehatan.
Kolom yang Dapat Diisi. Model kolom yang dapat diselesaikan menyarankan teks yang diambil langsung dari kolom data terstruktur. Hanya kolom yang dianotasi dengan
completable
yang digunakan untuk saran pelengkapan otomatis. Model ini hanya tersedia untuk data terstruktur.Histori penelusuran. Model histori penelusuran menghasilkan saran dari histori panggilan API
SearchService.search
. Jangan gunakan model ini jika tidak ada traffic yang tersedia untuk metodeservingConfigs.search
. Model ini tidak tersedia untuk data layanan kesehatan.Peristiwa pengguna. Model peristiwa pengguna menghasilkan saran dari peristiwa penelusuran yang diimpor pengguna. Model ini tidak tersedia untuk data layanan kesehatan.
Permintaan Autocomplete dikirim menggunakan
metode dataStores.completeQuery
.
Tabel berikut menunjukkan jenis model pelengkapan otomatis yang tersedia untuk setiap jenis data.
Model data pelengkapan otomatis |
Sumber data |
Data situs |
Data terstruktur |
Data tidak terstruktur |
---|---|---|---|---|
Dokumen | Diimpor oleh pengguna | ✔* (default) | ✔ (default) | |
Kolom yang dapat diselesaikan | Diimpor oleh pengguna | ✔ | ||
Histori penelusuran | Dikumpulkan secara otomatis | ✔ (default) | ✔ | ✔ |
Peristiwa pengguna | Diimpor oleh pengguna atau dikumpulkan secara otomatis oleh widget | ✔ | ✔ | ✔ |
Konten yang di-crawl web | Di-crawl dari konten dari situs publik yang ditentukan oleh pengguna | ✔† |
* : Skema dokumen harus berisi kolom title
atau description
, atau harus
ada kolom yang telah ditentukan sebagai properti kunci
title
atau description
. Lihat artikel Memperbarui skema untuk data terstruktur.
† : Konten yang di-crawl web hanya dapat digunakan sebagai sumber data jika model data dokumen lanjutan eksperimental untuk pelengkapan otomatis diaktifkan. Lihat Model data dokumen lanjutan.
Jika tidak ingin menggunakan model default untuk jenis data, Anda dapat menentukan model lain saat mengirim permintaan pelengkapan otomatis. Permintaan
Autocomplete dikirim menggunakan metode dataStores.completeQuery
. Untuk mengetahui informasinya, lihat Petunjuk API: Mengirim permintaan pelengkapan otomatis untuk memilih model yang berbeda.
Fitur pelengkapan otomatis
Vertex AI Search mendukung fitur pelengkapan otomatis berikut untuk menampilkan prediksi yang paling membantu saat melakukan penelusuran:
Fitur | Deskripsi | Contoh atau informasi selengkapnya |
---|---|---|
Memperbaiki kesalahan ketik | Memperbaiki ejaan kata yang merupakan kesalahan ketik. | Milc → Milk .
|
Menghapus istilah yang tidak aman |
|
Teks yang menyinggung, seperti pornografi, vulgar, kekerasan. |
Daftar tolak |
|
Untuk mengetahui informasi selengkapnya, lihat Menggunakan daftar tolak pelengkapan otomatis. |
Menghapus Duplikat Istilah |
|
Shoes for Women , Womens Shoes , dan Womans Shoes dihapus duplikatnya,
dan hanya yang paling populer yang disarankan. |
Saran pencocokan akhir |
|
Untuk informasi selengkapnya, lihat Saran pencocokan tail. |
Saran pencocokan akhir
Saran pencocokan akhir dibuat menggunakan pencocokan awalan persis dengan kata terakhir dalam string kueri.
Misalnya, kueri "lagu dengan dia" dikirim dalam permintaan pelengkapan otomatis. Jika pencocokan akhir diaktifkan, pelengkapan otomatis mungkin menemukan bahwa awalan lengkap "songs with he" tidak memiliki kecocokan. Namun, kata terakhir dalam kueri, "he", memiliki pencocokan awalan yang sama persis dengan "hello world" dan "hello kitty". Dalam hal tersebut, saran yang ditampilkan adalah "lagu dengan hello world" dan "lagu dengan hello kitty" karena tidak ada saran kecocokan penuh.
Anda dapat menggunakan fitur ini untuk mengurangi hasil saran kosong dan meningkatkan keanekaragaman saran, sehingga fitur ini sangat berguna jika sumber data (jumlah peristiwa pengguna, histori penelusuran, dan cakupan topik dokumen) terbatas. Namun, mengaktifkan saran pencocokan akhir dapat mengurangi kualitas saran secara keseluruhan. Karena pencocokan akhir hanya cocok dengan kata akhir dari awalan, beberapa saran yang ditampilkan mungkin tidak masuk akal. Misalnya, kueri seperti "songs with he" mungkin mendapatkan saran pencocokan akhir seperti "songs with helpers guides".
Saran kecocokan akhir hanya ditampilkan jika:
include_tail_suggestions
disetel ketrue
dalam permintaandataStores.completeQuery
.Tidak ada saran kecocokan awalan lengkap untuk kueri.
Mengaktifkan atau menonaktifkan pelengkapan otomatis untuk widget
Untuk mengaktifkan atau menonaktifkan pelengkapan otomatis untuk widget, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Agent Builder.
Klik nama aplikasi yang ingin Anda edit.
Klik Configurations.
Klik tab UI.
Alihkan opsi Tampilkan saran pelengkapan otomatis untuk mengaktifkan atau menonaktifkan saran pelengkapan otomatis untuk widget. Saat Anda mengaktifkan pelengkapan otomatis, tunggu satu atau dua hari sebelum saran dimulai. Untuk penelusuran layanan kesehatan, pelengkapan otomatis adalah fitur Pratinjau.
Memperbarui setelan pelengkapan otomatis
Untuk mengonfigurasi setelan pelengkapan otomatis, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Agent Builder.
Klik nama aplikasi yang ingin Anda edit.
Klik Configurations.
Klik tab Autocomplete.
Masukkan atau pilih nilai baru untuk setelan pelengkapan otomatis yang ingin Anda perbarui:
- Jumlah maksimum saran: Jumlah maksimum saran pelengkapan otomatis yang dapat ditawarkan untuk kueri.
- Panjang minimum untuk memicu: Jumlah minimum karakter yang dapat diketik sebelum saran pelengkapan otomatis ditawarkan.
- Urutan pencocokan: Lokasi dalam string kueri yang pelengkapan otomatis dapat mulai mencocokkan sarannya.
- Model pelengkapan otomatis: Model data pelengkapan otomatis yang digunakan untuk menghasilkan
saran yang diambil. Hal ini dapat diganti di
dataStores.completeQuery
menggunakan parameterqueryModel
. Aktifkan pelengkapan otomatis: Secara default, pelengkapan otomatis tidak mulai membuat saran hingga memiliki data berkualitas yang memadai, biasanya beberapa hari. Jika Anda ingin mengganti setelan default ini dan mulai mendapatkan beberapa saran pelengkapan otomatis lebih cepat, pilih Sekarang.
Meskipun Anda memilih Sekarang, perlu waktu satu hari agar saran dibuat dan masih ada beberapa saran pelengkapan otomatis yang tidak ada atau berkualitas buruk hingga ada data yang cukup baik.
Klik Simpan dan publikasikan. Perubahan akan diterapkan dalam beberapa menit untuk mesin yang telah mengaktifkan pelengkapan otomatis.
Memperbarui anotasi kolom yang dapat diselesaikan dalam skema
Untuk mengaktifkan pelengkapan otomatis untuk kolom dalam skema data terstruktur, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Agent Builder.
Klik nama aplikasi yang ingin Anda edit. Data ini harus menggunakan data terstruktur.
Klik Data.
Klik tab Schema.
Klik Edit untuk memilih kolom skema yang akan ditandai sebagai
completable
.Klik Simpan untuk menyimpan konfigurasi kolom yang diperbarui. Saran ini memerlukan waktu sekitar satu hari untuk dibuat dan ditampilkan.
Mengirim permintaan pelengkapan otomatis
Contoh berikut menunjukkan cara mengirim permintaan pelengkapan otomatis.
REST
Untuk mengirim permintaan pelengkapan otomatis menggunakan API, ikuti langkah-langkah berikut:
Temukan ID penyimpanan data Anda. Jika Anda sudah memiliki ID penyimpanan data, lanjutkan ke langkah berikutnya.
Di konsol Google Cloud, buka halaman Agent Builder dan di menu navigasi, klik Data Stores.
Klik nama penyimpanan data Anda.
Di halaman Data untuk penyimpanan data Anda, dapatkan ID penyimpanan data.
Panggil metode
dataStores.completeQuery
.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID:completeQuery?query=QUERY_STRING"
PROJECT_ID: Nomor atau ID project Google Cloud Anda.
DATA_STORE_ID: ID penyimpanan data yang terkait dengan aplikasi Anda.
QUERY_STRING: Input typeahead yang digunakan untuk mengambil saran.
Mengirim permintaan pelengkapan otomatis ke model lain
Untuk mengirim permintaan pelengkapan otomatis dengan model data pelengkapan otomatis yang berbeda, ikuti langkah-langkah berikut:
Temukan ID penyimpanan data Anda. Jika Anda sudah memiliki ID penyimpanan data, lanjutkan ke langkah berikutnya.
Di konsol Google Cloud, buka halaman Agent Builder dan di menu navigasi, klik Data Stores.
Klik nama penyimpanan data Anda.
Di halaman Data untuk penyimpanan data Anda, dapatkan ID penyimpanan data.
Panggil metode
dataStores.completeQuery
.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID:completeQuery?query=QUERY_STRING&query_model=AUTOCOMPLETE_MODEL"
- PROJECT_ID: Nomor atau ID project Google Cloud Anda.
- DATA_STORE_ID: ID unik penyimpanan data yang dikaitkan dengan aplikasi Anda.
- QUERY_STRING: Input typeahead yang digunakan untuk mengambil saran.
- AUTOCOMPLETE_MODEL: Model data
pelengkapan otomatis yang akan digunakan untuk permintaan:
document
,document-completable
,search-history
, atauuser-event
. Untuk data layanan kesehatan, gunakanhealthcare-default
.
C#
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API C# Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Go Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Java Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Node.js Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Python Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Ruby
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Ruby Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menggunakan daftar tolak pelengkapan otomatis
Anda dapat menggunakan daftar tolak untuk mencegah istilah tertentu muncul sebagai sugesti pelengkapan otomatis.
Misalnya, perusahaan farmasi. Jika obat tidak lagi disetujui FDA, tetapi disebutkan dalam dokumen di penyimpanan datanya, mereka mungkin ingin mencegah obat tersebut muncul sebagai kueri yang disarankan. Perusahaan dapat menambahkan nama obat tersebut ke daftar tolak untuk mencegahnya disarankan.
Batasan berikut berlaku:
- Satu daftar tolak per penyimpanan data
- Mengupload daftar tolak akan menimpa daftar tolak yang ada untuk penyimpanan data tersebut
- Maksimal 1.000 istilah per daftar yang ditolak
- Istilah tidak peka huruf besar/kecil
- Setelah mengimpor daftar tolak, perlu waktu 1-2 hari agar perubahan diterapkan
Setiap entri daftar tolak Anda terdiri dari blockPhrase
dan matchOperator
:
blockPhrase
: Masukkan string sebagai istilah daftar tolak Anda. Istilah tidak peka huruf besar/kecil.matchOperator
: Menerima nilai berikut:EXACT_MATCH
: Mencegah kecocokan persis dengan istilah daftar tolak agar tidak muncul sebagai kueri yang disarankan.CONTAINS
: Mencegah saran yang berisi istilah daftar yang ditolak agar tidak muncul.
Berikut adalah contoh daftar tolak dengan empat entri:
{ "entries": [ {"blockPhrase":"Oranges","matchOperator":"CONTAINS"}, {"blockPhrase":"bAd apples","matchOperator":"EXACT_MATCH"}, {"blockPhrase":"Cool as A Cucumber","matchOperator":"EXACT_MATCH"}, {"blockPhrase":"cherry pick","matchOperator":"CONTAINS"} ] }
Sebelum mengimpor daftar tolak, pastikan kontrol akses yang diperlukan ditetapkan untuk akses editor Discovery Engine.
Daftar tolak dapat diimpor dari data JSON lokal atau dari Cloud Storage. Untuk menghapus daftar tolak dari penyimpanan data, hapus daftar tolak.
Mengimpor daftar tolak dari data JSON lokal
Untuk mengimpor daftar tolak dari file JSON lokal yang berisi daftar tolak Anda, lakukan hal berikut:
Buat daftar tolak di file JSON lokal dengan format berikut. Pastikan setiap entri daftar tolak berada di baris baru tanpa jeda baris.
{ "inlineSource": { "entries": [ { "blockPhrase":"TERM_1","matchOperator":"MATCH_OPERATOR_1" }, { "blockPhrase":"TERM_2","matchOperator":"MATCH_OPERATOR_2" } ] } }
Buat permintaan POST ke metode
suggestionDenyListEntries:import
, dengan memberikan nama file JSON Anda.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @DENYLIST_FILE \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/suggestionDenyListEntries:import"
- DENYLIST_FILE: Jalur lokal file JSON yang berisi istilah daftar tolak.
- PROJECT_ID: Nomor atau ID project Google Cloud Anda.
- DATA_STORE_ID: ID penyimpanan data yang terkait dengan aplikasi Anda.
Setelah mengimpor daftar tolak, perlu waktu 1-2 hari untuk mulai memfilter saran.
Mengimpor daftar tolak dari Cloud Storage
Untuk mengimpor daftar tolak dari file JSON di Cloud Storage, lakukan hal berikut:
Buat daftar tolak dalam file JSON dengan format berikut dan impor ke bucket Cloud Storage. Pastikan setiap entri daftar tolak berada di baris baru tanpa jeda baris.
{ "blockPhrase":"TERM_1","matchOperator":"MATCH_OPERATOR_1" } { "blockPhrase":"TERM_2","matchOperator":"MATCH_OPERATOR_2" }
Buat file JSON lokal yang berisi objek
gcsSource
. Gunakan ini untuk mengarah ke lokasi file daftar tolak di bucket Cloud Storage.{ "gcsSource": { "inputUris": [ "DENYLIST_STORAGE_LOCATION" ] } }
- DENYLIST_STORAGE_LOCATION: Lokasi daftar tolak Anda di Cloud Storage. Anda hanya dapat memasukkan satu URI. URI harus dimasukkan dalam
format ini:
gs://BUCKET/FILE_PATH
.
- DENYLIST_STORAGE_LOCATION: Lokasi daftar tolak Anda di Cloud Storage. Anda hanya dapat memasukkan satu URI. URI harus dimasukkan dalam
format ini:
Buat permintaan POST ke metode
suggestionDenyListEntries:import
, termasuk objekgcsSource
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @GCS_SOURCE_FILE \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/suggestionDenyListEntries:import"
- GCS_SOURCE_FILE: Jalur lokal file yang berisi
objek
gcsSource
yang mengarah ke daftar tolak Anda. - PROJECT_ID: Nomor atau ID project Google Cloud Anda.
- DATA_STORE_ID: ID penyimpanan data yang terkait dengan aplikasi Anda.
- GCS_SOURCE_FILE: Jalur lokal file yang berisi
objek
Setelah mengimpor daftar tolak, perlu waktu 1-2 hari untuk mulai memfilter saran.
Menghapus daftar tolak
Untuk menghapus daftar tolak dari penyimpanan data, lakukan hal berikut:
Buat permintaan POST ke metode
suggestionDenyListEntries:purge
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/suggestionDenyListEntries:purge"
- PROJECT_ID: Nomor atau ID project Google Cloud Anda.
- DATA_STORE_ID: ID penyimpanan data yang terkait dengan aplikasi Anda.
Model data dokumen lanjutan
Vertex AI Agent Builder menyediakan model data lanjutan untuk pelengkapan otomatis. Berdasarkan dokumen yang Anda impor, model data ini menghasilkan saran pelengkapan otomatis berkualitas tinggi dengan memanfaatkan model bahasa besar (LLM) Google.
Fitur ini bersifat eksperimental. Jika Anda tertarik untuk menggunakan fitur ini, hubungi tim akun Google Cloud Anda dan minta untuk ditambahkan ke daftar yang diizinkan.
Fitur ini tidak tersedia untuk penelusuran layanan kesehatan atau di multi-region Amerika Serikat dan Uni Eropa.