Vertex AI Search kann Such-Snippets, extrahierte Antworten und extrahierte Segmente mit jeder Suchantwort bereitstellen, um die Ergebnisse zu verbessern.
Snippets: Ein Snippet ist ein kurzer Textauszug aus dem Suchergebnisdokument, der eine Vorschau des Inhalts eines Suchergebnisses bietet. Sie enthält Treffer hervorhebungen, die Sie in Ihrer Benutzeroberfläche rendern können. Snippets werden in der Regel unter jedem Suchergebnis angezeigt, damit Endnutzer die Relevanz und Nützlichkeit des Ergebnisses besser beurteilen können. Snippets sind für Datenspeicher mit unstrukturierten Daten und Websitedaten verfügbar (sowohl für die grundlegende Websitesuche als auch für die erweiterte Websiteindexierung).
Extraktionsantworten: Eine Extraktionsantwort ist wörtlicher Text, der mit jedem Suchergebnis zurückgegeben wird. Er wird direkt aus dem Originaldokument extrahiert. Ausgewählte Antworten werden in der Regel oben auf Webseiten angezeigt, um Endnutzern eine kurze Antwort zu geben, die für ihre Suchanfrage kontextbezogen relevant ist. Extrahierte Antworten sind für Datenspeicher mit unstrukturierten Daten und mit erweiterter Websiteindexierung verfügbar.
Auszugsegmente: Ein Auszugsegment ist wörtlicher Text, der mit jedem Suchergebnis zurückgegeben wird. Ein extrahiertes Segment ist in der Regel länger als eine extrahierte Antwort. Sie können als Antwort auf eine Suchanfrage angezeigt werden und für die Nachbearbeitung sowie als Eingabe für Large Language Models verwendet werden, um Antworten oder neuen Text zu generieren. Extrahierte Segmente sind für Datenspeicher mit unstrukturierten Daten und mit erweiterter Websiteindexierung verfügbar.
Beispiele
Die folgenden Beispiele veranschaulichen die Unterschiede zwischen Snippets, extrahierten Antworten und extrahierten Segmenten.
Anfrage: „Was ist Vertex AI Agent Builder?“
Snippet:
Dazu haben wir unseren neuen Vertex AI Agent Builder entwickelt. Damit können Entwickler schnell und einfach Gen Apps wie Bots, ...
Extraktive Antwort:
Mit Vertex AI Agent Builder können Entwickler schnell neue Funktionen wie Bots, Chat-Oberflächen, benutzerdefinierte Suchmaschinen und digitale Assistenten bereitstellen. Entwickler haben API-Zugriff auf die Foundation Models von Google und können mithilfe von sofort einsatzbereiten Vorlagen in Minuten oder Stunden mit der Erstellung von generativen Apps beginnen.
Extrahiertes Segment:
Unternehmen und Behörden möchten mit dieser neuen KI-Technologie auch die Interaktionen mit Kunden, Partnern und Mitarbeitern effektiver und hilfreicher gestalten. Dazu haben wir unseren neuen Vertex AI Agent Builder entwickelt.
Mit Vertex AI Agent Builder können Entwickler schnell neue Funktionen wie Bots, Chat-Oberflächen, benutzerdefinierte Suchmaschinen und digitale Assistenten bereitstellen. Entwickler haben API-Zugriff auf die Foundation Models von Google und können mithilfe von sofort einsatzbereiten Vorlagen in Minuten oder Stunden mit der Erstellung von generativen Apps beginnen. Mit Vertex AI Agent Builder haben Entwickler außerdem folgende Möglichkeiten:
- Kombinieren Sie organisatorische Daten und Techniken zur Informationsabfrage, um relevante Antworten zu liefern.
- Sie können nicht nur Text eingeben, sondern auch mit anderen Inhalten suchen und antworten.
- Kombinieren Sie natürliche Unterhaltungen mit strukturierten Abläufen.
- Informieren Sie nicht nur, sondern handeln Sie.
Hinweise
Je nach Art der App müssen die folgenden Voraussetzungen erfüllt sein:
Unstrukturierte App:
Für Snippets gibt es keine Anforderungen.
Wenn Sie extraktive Antworten und extraktive Segmente verwenden möchten, aktivieren Sie die Features der Enterprise-Version.
Website-App:
Aktivieren Sie für Snippets Folgendes:
Aktivieren Sie für extrahierte Antworten Folgendes:
Snippets
Snippets sind kurze Textstücke, die aus jedem Suchergebnisdokument wörtlich extrahiert werden. Sie enthalten Hervorhebungen von Treffern in fett formatierten HTML-Tags, um Suchergebnisse in einer Benutzeroberfläche als Vorschau zu rendern. In der Regel werden Snippets als Vorschautext unter einem Suchergebnis gerendert, damit Endnutzer entscheiden können, ob es sinnvoll ist, auf das Suchergebnis zu klicken.
Snippets sind für die Websitesuche und die unstrukturierte Suche verfügbar.
Snippets abrufen
So rufen Sie Snippets ab:
Senden Sie eine Suchanfrage, die
ContentSearchSpec.SnippetSpec
enthält undreturnSnippet
auf „true“ setzt.Im folgenden Beispiel für
SnippetSpec
wird angegeben, dass für jedes Suchergebnis ein Snippet zurückgegeben werden kann."contentSearchSpec": { "snippetSpec": { "returnSnippet": true } }
returnSnippet
: Wenn dieser Wert auftrue
gesetzt ist, wird ein Snippet zurückgegeben.
Snippets aus der Suchantwort abrufen Snippets werden mit jedem Suchergebnis in
derivedStructData.snippets
zurückgegeben.In diesem Beispiel für ein Dokument, das als eines der Ergebnisse in einer Suchantwort zurückgegeben wurde, ist ein Snippet mit fett formatierten Treffern enthalten:
{ "id": "54321", "document": { "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321", "id": "54321", "derivedStructData": { "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf", "snippets": [ { "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.", "snippet_status": "SUCCESS" } ] } } }
snippet
: Enthält ein Snippet, das für das Dokumentsuchergebnis generiert wurde. Die Hervorhebung von Treffern erfolgt in fett formatierten HTML-Tags.snippet_status
: Wenn ein Snippet generiert wird, wird dieses Feld alsSUCCESS
zurückgegeben. Wenn kein Snippet generiert wird, wird dieses Feld alsNO_SNIPPET_AVAILABLE
zurückgegeben.
Extraktive Antworten
Eine Antwort vom Typ „Extraktion“ ist ein Textabschnitt, der wörtlich aus einem Dokument übernommen wurde. Wenn ein Dokument als Suchergebnis in einer Suchantwort zurückgegeben wird, kann mit diesem Ergebnis eine relevante Antwort mit Textauszügen zurückgegeben werden.
Eine extrahierte Antwort kann Text wie ein Absatz, eine Tabelle oder eine Aufzählungsliste sein, die aus dem Suchergebnisdokument extrahiert wird. Extraktive Antworten sind kürzer als extraktive Segmente.
Auszugsweise Antworten können als Alternative zu zusammengefassten Antworten verwendet werden, wenn präzise, wörtliche Antworten gegenüber umformulierten Zusammenfassungen bevorzugt werden.
Extrahierte Antworten sind für Datenspeicher mit unstrukturierten Daten und mit erweiterter Websiteindexierung verfügbar.
Extraktive Antworten erhalten
So erhalten Sie extrahierte Antworten:
Senden Sie eine Suchanfrage, in der
maxExtractiveAnswerCount
mitContentSearchSpec.extractiveContentSpec
angegeben wird.Im folgenden Beispiel für
extractiveContentSpec
wird angegeben, dass für jedes Suchergebnis eine Antwort zurückgegeben werden kann."contentSearchSpec": { "extractiveContentSpec": { "maxExtractiveAnswerCount": 1 } }
maxExtractiveAnswerCount
: Die Anzahl der extrahierten Antworten, die für jedes Suchergebnis zurückgegeben werden sollen. Der Standardwert ist 0 und der Höchstwert ist 5.
Sie erhalten Antworten aus der Suchantwort. In
extractive_answers
werden bei jedem Suchergebnis extrahierte Antworten zurückgegeben.In diesem Beispiel für ein Dokument, das als eines der Ergebnisse in einer Suchantwort zurückgegeben wurde, war eine extrahierte Antwort enthalten:
{ "id": "54321", "document": { "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321", "id": "54321", "derivedStructData": { "extractive_answers": [ { "pageNumber": "2", "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion." } ], "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf" } } }
pageNumber
: Wenn Seitennummern aus dem Dokument extrahiert werden können, gibt dieses Feld an, woher die Antwort extrahiert wurde.content
: Der Inhalt der Antwort.
Extrahierte Segmente
Ein Textextrakt ist ein Textabschnitt, der wörtlich aus einem Suchergebnisdokument extrahiert wird. Sie ähneln zusammenfassenden Antworten, sind aber in der Regel vollständiger und ausführlicher. Normalerweise werden extrahierte Segmente als Eingabe für Ihre eigenen LLMs verwendet, um Antworten oder neuen Text zu generieren.
Sie können aus mehreren Absätzen bestehen, einschließlich formatierten Texts wie Tabellen und Aufzählungslisten.
Extrahierte Segmente sind für Datenspeicher mit unstrukturierten Daten und mit erweiterter Websiteindexierung verfügbar.
Optionen für die Segmentierung durch Datenextraktion
Für extrahierte Segmente sind die folgenden Optionen verfügbar:
Anzahl der Segmente: Sie können bis zu 10 extensive Segmente angeben, die für jedes Suchergebnis zurückgegeben werden sollen.
Relevanzbewertungen: Relevanzbewertungen basieren auf der Ähnlichkeit der Suchanfrage mit dem extrahierten Segment. Sie können angeben, dass extrahierte Segmente mit Relevanzbewertungen zurückgegeben werden. Die Bewertungen reichen von −1,0 (weniger relevant) bis 1,0 (relevanter). Das Aktivieren von Relevanzbewertungen kann die Latenz erhöhen.
Benachbarte Segmente (Vorabversion): Sie können
numPreviousSegments
undnumNextSegments
so einstellen, dass bis zu drei Segmente direkt vor und nach dem gewünschten Segment erfasst werden. Benachbarte Segmente können dem relevanten Segment Kontext und Genauigkeit verleihen.Das Aktivieren benachbarter Segmente kann die Latenz erhöhen.
Segmente mit Textextrakten abrufen
In den folgenden Schritten wird beschrieben, wie Sie extrahierte Segmente für unstrukturierte Daten abrufen. Sie können ähnliche Schritte ausführen, um Segmente mit extrahierten Daten für Websitedaten zu erhalten.
Senden Sie eine Suchanfrage, in der
maxExtractiveSegmentCount
mitContentSearchSpec.extractiveContentSpec
angegeben wird.Im folgenden Beispiel für
extractiveContentSpec
wird angegeben, dass für jedes Suchergebnis ein Segment zurückgegeben werden kann."contentSearchSpec": { "extractiveContentSpec": { "maxExtractiveSegmentCount": 1 } }
maxExtractiveSegmentCount
: Die Anzahl der extrahierten Segmente, die für jedes Suchergebnis zurückgegeben werden sollen. Der Standardwert ist 0 und der Höchstwert ist 10.
Zusätzliche Optionen:
returnExtractiveSegmentScore
: Legen Sie diesen Wert auftrue
fest, um für jedes zurückgegebene Segment einen Relevanzwert zu erhalten.numPreviousSegments
: Die Anzahl der benachbarten Segmente, die vor dem relevanten Segment zurückgegeben werden sollen. Der Standardwert ist 0 und der maximale Wert ist 3. Die Verwendung benachbarter Segmente kann die Latenz erhöhen.numNextSegments
: Die Anzahl der benachbarten Segmente, die nach dem relevanten Segment zurückgegeben werden sollen. Der Standardwert ist 0 und der maximale Wert ist 3. Die Verwendung benachbarter Segmente kann die Latenz erhöhen.
Weitere Informationen zu diesen Optionen finden Sie unter Optionen für die Segmentierung durch Extrahieren.
Segmente aus der Suchantwort abrufen Segmente werden mit jedem Suchergebnis in
extractive_segments
zurückgegeben.In diesem Beispiel für ein Dokument, das als eines der Ergebnisse in einer Suchantwort zurückgegeben wurde, war ein Segment im Ergebnis enthalten:
{ "id": "54321", "document": { "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321", "id": "54321", "derivedStructData": { "extractive_segments": [ { "pageNumber": "2", "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5" } ], "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf" } } }
pageNumber
: Wenn Seitennummern aus dem Dokument extrahiert werden können, gibt dieses Feld an, woher die Antwort extrahiert wurde.content
: Der Inhalt des extrahierten Abschnitts.