Halaman ini diterjemahkan oleh Cloud Translation API.

Mendapatkan cuplikan dan konten yang diekstrak

Vertex AI Search dapat memberikan cuplikan penelusuran, jawaban ekstraktif, dan segmen ekstraktif dengan setiap respons penelusuran untuk meningkatkan kualitas hasil Anda.

Cuplikan: Cuplikan adalah rangkuman singkat dari teks dari dokumen hasil penelusuran yang memberikan pratinjau konten hasil penelusuran. Objek ini mencakup penyorotan kecocokan yang dapat Anda render di UI Anda. Cuplikan biasanya ditampilkan di bawah setiap hasil penelusuran untuk membantu pengguna akhir menilai relevansi dan kegunaan hasil tersebut. Cuplikan tersedia untuk penyimpanan data dengan data tidak terstruktur dan data situs (baik penelusuran situs dasar maupun pengindeksan situs lanjutan).
Jawaban ekstraktif: Jawaban ekstraktif adalah teks verbatim yang ditampilkan dengan setiap hasil penelusuran. Informasi ini diekstrak langsung dari dokumen asli. Jawaban ekstraktif biasanya ditampilkan di dekat bagian atas halaman web untuk memberikan jawaban singkat kepada pengguna akhir yang relevan secara kontekstual dengan kueri mereka. Jawaban ekstraktif tersedia untuk penyimpanan data dengan data tidak terstruktur dan dengan pengindeksan situs lanjutan.
Segmen ekstraktif: Segmen ekstraktif adalah teks verbatim yang ditampilkan dengan setiap hasil penelusuran. Segmen ekstraktif biasanya lebih panjang daripada jawaban ekstraktif. Segmen ekstraktif dapat ditampilkan sebagai jawaban atas kueri, dan dapat digunakan untuk melakukan tugas pasca-pemrosesan dan sebagai input untuk model bahasa besar guna membuat jawaban atau teks baru. Segmen ekstraktif tersedia untuk penyimpanan data dengan data tidak terstruktur dan dengan pengindeksan situs lanjutan.

Contoh

Contoh berikut membantu menggambarkan perbedaan antara cuplikan, jawaban ekstraktif, dan segmen ekstraktif.

Kueri: "apa itu aplikasi ai?"

Cuplikan:

Untuk mengaktifkannya, kami mengumumkan Aplikasi AI baru kami, cara tercepat bagi developer untuk memulai pembuatan aplikasi generatif seperti bot, ...
Jawaban ekstraktif:

Aplikasi AI memungkinkan developer mengirimkan pengalaman baru dengan cepat, termasuk bot, antarmuka chat, mesin telusur kustom, asisten digital, dan banyak lagi. Developer memiliki akses API ke model dasar Google dan dapat menggunakan template siap pakai untuk memulai pembuatan aplikasi generatif dalam hitungan menit atau jam.
Segmen ekstraktif:
Perusahaan dan pemerintah juga ingin menjadikan interaksi pelanggan, partner, dan karyawan lebih efektif dan bermanfaat dengan teknologi AI baru ini. Untuk mengaktifkannya, kami mengumumkan Aplikasi AI baru kami.

Aplikasi AI memungkinkan developer mengirimkan pengalaman baru dengan cepat, termasuk bot, antarmuka chat, mesin telusur kustom, asisten digital, dan banyak lagi. Developer memiliki akses API ke model dasar Google dan dapat menggunakan template siap pakai untuk memulai pembuatan aplikasi generatif dalam hitungan menit atau jam. Dengan Aplikasi AI, developer juga akan:
- Menggabungkan data organisasi dan teknik penarikan informasi untuk memberikan jawaban yang relevan.
- Cari dan berikan respons tidak hanya dengan teks.
- Gabungkan percakapan alami dengan alur terstruktur.
- Jangan hanya memberi tahu — lakukan transaksi.

Sebelum memulai

Bergantung pada jenis aplikasi yang Anda miliki, selesaikan prasyarat berikut:

Aplikasi tidak terstruktur:
- Untuk cuplikan, tidak ada persyaratan.
- Untuk jawaban ekstraktif dan segmen ekstraktif, aktifkan Fitur edisi Enterprise.
Aplikasi situs:
- Untuk cuplikan, aktifkan:
  - Fitur edisi Enterprise.
- Untuk jawaban ekstraktif, aktifkan:
  - Fitur edisi Enterprise.
  - Pengindeksan situs lanjutan.

Cuplikan

Cuplikan adalah potongan singkat yang diekstrak kata demi kata dari setiap dokumen hasil penelusuran. Hal ini mencakup penyorotan hit dalam tag HTML tebal untuk merender pratinjau hasil penelusuran di UI. Biasanya, cuplikan ditampilkan sebagai teks pratinjau di bawah hasil penelusuran untuk membantu pengguna akhir memutuskan apakah mengklik hasil penelusuran tersebut akan berguna.

Cuplikan tersedia untuk penelusuran situs dan tidak terstruktur.

Mendapatkan cuplikan

Untuk mendapatkan cuplikan:

Kirim permintaan penelusuran yang menyertakan ContentSearchSpec.SnippetSpec dan tetapkan returnSnippet ke benar (true).

Contoh SnippetSpec berikut menentukan bahwa cuplikan dapat ditampilkan untuk setiap hasil penelusuran.
```
"contentSearchSpec":
{
  "snippetSpec":
  {
    "returnSnippet": true
  }
}
```
- returnSnippet: Jika ditetapkan ke true, akan menampilkan cuplikan.

Dapatkan cuplikan dari respons penelusuran. Cuplikan ditampilkan dengan setiap hasil penelusuran di derivedStructData.snippets.

Dalam contoh dokumen yang ditampilkan sebagai salah satu hasil dalam respons penelusuran ini, cuplikan dengan penyorotan kecocokan tebal disertakan dengan hasil:

{
  "id": "54321",
  "document": {
    "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
    "id": "54321",
    "derivedStructData": {
      "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
      "snippets": [
        {
          "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
          "snippet_status": "SUCCESS"
        }
      ]
    }
  }
}

snippet: Berisi cuplikan yang dibuat untuk hasil penelusuran dokumen. Penyorotan kecocokan disertakan dalam tag HTML tebal.
snippet_status: Jika cuplikan dibuat, kolom ini ditampilkan sebagai SUCCESS. Jika tidak ada cuplikan yang dibuat, kolom ini akan ditampilkan sebagai NO_SNIPPET_AVAILABLE.

Jawaban ekstraktif

Jawaban ekstraksi adalah bagian teks yang diambil kata demi kata dari dokumen. Saat dokumen ditampilkan sebagai hasil penelusuran dalam respons penelusuran, jawaban ekstraktif yang relevan dapat ditampilkan bersama hasil tersebut.

Jawaban ekstraktif dapat berupa teks seperti paragraf, tabel, atau daftar berbutir yang diekstrak dari dokumen hasil penelusuran. Jawaban ekstraktif lebih pendek daripada segmen ekstraktif.

Jawaban ekstraktif dapat digunakan sebagai alternatif untuk respons ringkasan dalam kasus ketika jawaban yang tepat dan kata demi kata lebih disukai daripada ringkasan yang diubah kata-katanya.

Jawaban ekstraktif tersedia untuk penyimpanan data dengan data tidak terstruktur dan dengan pengindeksan situs tingkat lanjut.

Mendapatkan jawaban ekstraktif

Untuk mendapatkan jawaban ekstraktif:

Kirim permintaan penelusuran yang menggunakan ContentSearchSpec.extractiveContentSpec untuk menentukan maxExtractiveAnswerCount.

Contoh extractiveContentSpec berikut menentukan bahwa jawaban dapat ditampilkan untuk setiap hasil penelusuran.
```
"contentSearchSpec":
{
  "extractiveContentSpec": {
    "maxExtractiveAnswerCount": 1
  }
}
```
- maxExtractiveAnswerCount: Jumlah jawaban ekstraktif yang akan ditampilkan untuk setiap hasil penelusuran. Nilai defaultnya adalah 0 dan nilai maksimumnya adalah 5.

Mendapatkan jawaban ekstraktif dari respons penelusuran. Jawaban ekstraktif ditampilkan dengan setiap hasil penelusuran di extractive_answers.

Dalam contoh dokumen yang ditampilkan sebagai salah satu hasil dalam respons penelusuran ini, jawaban ekstraktif disertakan bersama hasil:

{
  "id": "54321",
  "document": {
    "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
    "id": "54321",
    "derivedStructData": {
      "extractive_answers": [
        {
          "pageNumber": "2",
          "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
        }
      ],
      "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
    }
}
}

pageNumber: Jika nomor halaman dapat diekstrak dari dokumen, kolom ini menunjukkan tempat jawaban diekstrak.
content: Konten jawaban ekstraktif.

Segmen ekstraktif

Segmen ekstraktif adalah bagian teks yang diekstrak kata demi kata dari dokumen hasil penelusuran. Segmen ekstraktif mirip dengan jawaban ekstraktif, tetapi segmen ekstraktif biasanya lebih lengkap dan panjang. Biasanya, segmen ekstraktif digunakan sebagai input untuk LLM Anda sendiri guna menghasilkan jawaban atau teks baru.

Segmen ekstraktif dapat berupa beberapa paragraf, termasuk teks yang diformat seperti tabel dan daftar berbutir.

Segmen ekstraktif tersedia untuk penyimpanan data dengan data tidak terstruktur dan dengan pengindeksan situs lanjutan.

Opsi segmen ekstraktif

Opsi berikut tersedia untuk segmen ekstraktif:

Jumlah segmen: Anda dapat menentukan hingga 10 segmen ekstraktif yang akan ditampilkan untuk setiap hasil penelusuran.
Skor relevansi: Skor relevansi didasarkan pada kemiripan kueri dengan segmen yang diekstrak. Anda dapat menentukan bahwa segmen ekstraktif ditampilkan dengan skor relevansi. Skor berkisar dari -1,0 (kurang relevan) hingga 1,0 (lebih relevan). Mengaktifkan skor relevansi dapat meningkatkan latensi.

Catatan: Urutan hasil yang ditampilkan didasarkan pada banyak faktor. Meskipun skor relevansi dipertimbangkan selama penentuan peringkat, skor tersebut tidak menentukan peringkat hasil.
Segmen berdekatan: Anda dapat menetapkan numPreviousSegments dan numNextSegments untuk mendapatkan hingga 3 segmen dari sebelum dan setelah segmen yang relevan. Segmen yang berdekatan dapat menambahkan konteks dan akurasi ke segmen yang relevan.

Mengaktifkan segmen yang berdekatan dapat meningkatkan latensi.

Mendapatkan segmen ekstraktif

Langkah-langkah berikut menunjukkan cara mendapatkan segmen ekstraktif untuk data tidak terstruktur. Anda dapat mengikuti langkah-langkah serupa untuk mendapatkan segmen ekstraktif untuk data situs.

Kirim permintaan penelusuran yang menggunakan ContentSearchSpec.extractiveContentSpec untuk menentukan maxExtractiveSegmentCount.

Contoh extractiveContentSpec berikut menentukan bahwa satu segmen dapat ditampilkan untuk setiap hasil penelusuran.
```
"contentSearchSpec":
{
  "extractiveContentSpec": {
    "maxExtractiveSegmentCount": 1
  }
}
```
- maxExtractiveSegmentCount: Jumlah segmen ekstraktif yang akan ditampilkan untuk setiap hasil penelusuran. Nilai defaultnya adalah 0 dan nilai maksimumnya adalah 10.
Opsi tambahan:
- returnExtractiveSegmentScore: Tetapkan ke true untuk menampilkan skor relevansi dengan setiap segmen yang ditampilkan.
- numPreviousSegments: Jumlah segmen berdekatan yang akan ditampilkan sebelum segmen yang relevan. Nilai defaultnya adalah 0 dan maksimumnya adalah 3. Menggunakan segmen yang berdekatan dapat meningkatkan latensi.
- numNextSegments: Jumlah segmen berdekatan yang akan ditampilkan setelah segmen yang relevan. Nilai defaultnya adalah 0 dan maksimumnya adalah 3. Menggunakan segmen yang berdekatan dapat meningkatkan latensi.
Untuk mengetahui informasi selengkapnya tentang opsi ini, lihat Opsi segmen ekstraktif.

Dapatkan segmen dari respons penelusuran. Segmen ditampilkan dengan setiap hasil penelusuran di extractive_segments.

Dalam contoh dokumen yang ditampilkan sebagai salah satu hasil dalam respons penelusuran ini, segmen disertakan dengan hasil:

{
  "id": "54321",
  "document": {
    "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
    "id": "54321",
    "derivedStructData": {
      "extractive_segments": [
        {
          "pageNumber": "2",
          "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
        }
      ],
      "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
    }
}
}

pageNumber: Jika nomor halaman dapat diekstrak dari dokumen, kolom ini menunjukkan tempat jawaban diekstrak.
content: Konten segmen ekstraktif.

Langkah berikutnya

Melihat pratinjau hasil penelusuran