Datenspeicher werden von Datenspeicher-Handlern und Playbook-Datenspeichertools verwendet, um Antworten auf Fragen von Endnutzern anhand Ihrer Daten zu finden. Datenspeicher sind eine Sammlung von Websites und Dokumenten, die alle auf Ihre Daten verweisen.
Wenn ein Endnutzer dem Kundenservicemitarbeiter eine Frage stellt, sucht dieser in den angegebenen Quellinhalten nach einer Antwort und fasst die Ergebnisse in einer kohärenten Antwort zusammen. Außerdem enthält sie Links zu den Quellen der Antwort, damit der Endnutzer mehr darüber erfahren kann. Der Kundenservicemitarbeiter kann für eine bestimmte Frage bis zu fünf Antwort-Snippets angeben.
Datenspeicherquellen
Es gibt verschiedene Quellen, aus denen Sie Ihre Daten beziehen können:
- Website-URLs: Websiteinhalte aus einer Liste von Domains oder Webseiten werden automatisch gecrawlt.
- BigQuery: Daten aus Ihrer BigQuery-Tabelle importieren
- Cloud Storage: Daten aus Ihrem Cloud Storage-Bucket importieren
Website content
Wenn Sie Websitecontent als Quelle hinzufügen, können Sie mehrere Websites hinzufügen und ausschließen.
Wenn Sie eine Website angeben, können Sie einzelne Seiten oder *
als Platzhalter für ein Muster verwenden.
Alle HTML- und PDF-Inhalte werden verarbeitet.
Wenn Sie Websitecontent als Quelle verwenden, müssen Sie Ihre Domain bestätigen.
Einschränkungen:
- Dateien aus öffentlichen URLs müssen vom Google-Suchindex gecrawlt worden sein, sodass sie im Suchindex erscheinen. Sie können dies mit der Google Search Console prüfen.
- Es werden maximal 200.000 Seiten indexiert. Wenn der Datenspeicher mehr Seiten enthält, schlägt die Indexierung fehl und die zuletzt indexierten Inhalte bleiben erhalten.
Daten importieren
Sie können Ihre Daten entweder aus BigQuery oder Cloud Storage importieren. Diese Daten können strukturiert oder unstrukturiert sein und Metadaten oder keine Metadaten enthalten.
Folgende Optionen für den Datenimport sind verfügbar:
- Daten hinzufügen/aktualisieren: Die bereitgestellten Dokumente werden dem Datenspeicher hinzugefügt. Wenn ein neues Dokument dieselbe ID wie ein altes Dokument hat, wird das alte Dokument durch das neue ersetzt.
- Vorhandene Daten überschreiben: Alle alten Daten werden gelöscht und dann werden neue Daten hochgeladen. Dieser Vorgang kann nicht rückgängig gemacht werden.
Datenspeicher für strukturierte Daten
In strukturierten Datenspeichern können Antworten auf häufig gestellte Fragen (FAQs) gespeichert werden. Wenn Nutzerfragen mit hoher Wahrscheinlichkeit mit einer hochgeladenen Frage übereinstimmen, gibt der Kundenservicemitarbeiter die Antwort auf diese Frage ohne Änderungen zurück. Sie können für jedes Frage- und Antwortpaar, das dem Kundenservicemitarbeiter angezeigt wird, einen Titel und eine URL angeben.
Beim Hochladen von Daten in den Datenspeicher muss das CSV-Format verwendet werden. Jede Datei muss eine Kopfzeile mit einer Beschreibung der Spalten enthalten.
Beispiel:
"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""
Die Spalten title
und url
sind optional und können weggelassen werden:
"answer","question"
"42","What is the meaning of life?"
Während des Uploads kann ein Ordner ausgewählt werden, in dem jede Datei unabhängig von der Erweiterung als CSV-Datei behandelt wird.
Einschränkungen:
- Ein zusätzliches Leerzeichen nach
,
führt zu einem Fehler. - Leere Zeilen (auch am Ende der Datei) führen zu einem Fehler.
Unstrukturierter Datenspeicher
Unstrukturierte Datenspeicher können Inhalte in den folgenden Formaten enthalten:
- HTML
- TXT
- CSV
Einschränkungen:
- Die maximale Dateigröße beträgt 2,5 MB für textbasierte Formate und 100 MB für andere Formate.
Datenspeicher mit Metadaten
Als Metadaten können ein Titel und eine URL angegeben werden. Wenn der Kundenservicemitarbeiter mit einem Nutzer spricht, kann er ihm diese Informationen zur Verfügung stellen. So können Nutzer schnell auf interne Webseiten verlinken, auf die der Indexer der Google Suche nicht zugreifen kann.
Wenn Sie Inhalte mit Metadaten importieren möchten, müssen Sie eine oder mehrere JSON Lines-Dateien angeben. Jede Zeile dieser Datei beschreibt ein Dokument. Die eigentlichen Dokumente werden nicht direkt hochgeladen. In der JSON Lines-Datei sind URIs angegeben, die mit den Cloud Storage-Pfaden verknüpft sind.
Wenn Sie Ihre JSON Lines-Dateien bereitstellen, geben Sie einen Cloud Storage-Ordner an, der diese Dateien enthält. Legen Sie keine anderen Dateien in diesen Ordner.
Feldbeschreibungen:
Feld | Typ | Beschreibung |
---|---|---|
id | String | Eindeutige Kennung für das Dokument. |
content.mimeType | String | MIME-Typ des Dokuments. „application/pdf“ und „text/html“ werden unterstützt. |
content.uri | String | URI für das Dokument in Cloud Storage. |
structData | String | Einzeiliges JSON-Objekt mit optionalen Feldern title und url . |
Beispiel:
{ "id": "d001", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/first_doc.pdf"}, "structData": {"title": "First Document", "url": "https://internal.example.com/documents/first_doc.pdf"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"title": "Second Document", "url": "https://internal.example.com/documents/second_doc.pdf"} }
{ "id": "d003", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/mypage.html"}, "structData": {"title": "My Page", "url": "https://internal.example.com/mypage.html"} }
Datenspeicher ohne Metadaten
Dieser Inhaltstyp hat keine Metadaten. Reichen Sie einfach die zu importierenden Dokumente ein. Der Inhaltstyp wird durch die Dateiendung bestimmt.
Parse- und Chunk-Konfiguration
Je nach Datenquelle können Sie möglicherweise die von Vertex AI Search definierten Einstellungen für die Textanalyse und die Datensegmentierung konfigurieren.
Datenspeicher erstellen
So erstellen Sie einen Datenspeicher:
Rufen Sie die Agent Builder-Konsole auf:
Wählen Sie Ihr Projekt im Drop-down-Menü der Console aus.
Lesen und akzeptieren Sie die Nutzungsbedingungen und klicken Sie anschließend auf Fortfahren und API aktivieren.
Klicken Sie im linken Navigationsbereich auf Datenspeicher.
Klicken Sie auf Neuer Datenspeicher.
Wählen Sie eine Datenquelle aus.
Aktivieren Sie die erweiterte Websiteindexierung. Dies ist für Datenspeicher-Agenten erforderlich.
Geben Sie Daten und die Konfiguration für die ausgewählte Datenspeicherquelle an. Der Speicherort des Datenspeichers muss mit dem Standort des Kundenservicemitarbeiters übereinstimmen.
Klicken Sie auf Erstellen, um den Datenspeicher zu erstellen.
Optional können Sie die Sprache des Datenspeichers festlegen:
- Klicken Sie in der Liste der Datenspeicher auf den Datenspeicher, den Sie gerade erstellt haben.
- Klicken Sie auf die Schaltfläche zum Bearbeiten der Spracheinstellung.
- Wählen Sie eine Sprache aus und klicken Sie auf das Häkchen, um sie anzuwenden.
Cloud Storage für ein Datenspeicherdokument verwenden
Wenn Ihr Inhalt nicht öffentlich ist, sollten Sie Ihre Inhalte in Cloud Storage speichern.
Beim Erstellen von Datenspeicherdokumenten geben Sie die URLs für Ihre Cloud Storage-Objekte in folgendem Format an:
gs://bucket-name/folder-name
.
Jedes Dokument im Ordner wird dem Datenspeicher hinzugefügt.
Beim Erstellen des Cloud Storage-Buckets:
- Achten Sie darauf, dass Sie das Projekt ausgewählt haben, das Sie für den Kundenservicemitarbeiter verwenden.
- Verwenden Sie die Standard Storage-Klasse.
- Legen Sie den Bucket-Speicherort auf denselben Standort wie Ihren Agenten fest.
Folgen Sie der Cloud Storage-Kurzanleitung, um einen Bucket zu erstellen und Dateien hochzuladen.
Sprachen
Eine Liste der unterstützten Sprachen finden Sie in der Spalte „Datenspeicher“ in der Sprachreferenz.
Für eine optimale Leistung wird empfohlen, Datenspeicher in einer einzigen Sprache zu erstellen.
Nachdem Sie einen Datenspeicher erstellt haben, können Sie optional die Sprache des Datenspeichers angeben. Wenn Sie die Sprache des Datenspeichers festlegen, können Sie den Datenspeicher mit einem Agenten verbinden, der für eine andere Sprache konfiguriert ist. Sie können beispielsweise einen französischen Datenspeicher erstellen, der mit einem englischsprachigen Kundenservicemitarbeiter verbunden ist.
Unterstützte Regionen
Eine Liste der unterstützten Regionen finden Sie in der Regionenreferenz.