Datenspeicher

Datenspeicher werden von Datenspeichertools verwendet, um anhand Ihrer Daten Antworten auf Fragen von Endnutzern zu finden. Datenspeicher sind eine Sammlung von Websites, Dokumenten oder Daten in Drittanbietersystemen, die alle auf Ihre Daten verweisen.

Wenn ein Endnutzer dem Kundenservicemitarbeiter eine Frage stellt, sucht der Kundenservicemitarbeiter in den angegebenen Quellinhalten nach einer Antwort und fasst die Ergebnisse in einer kohärenten Antwort zusammen. Außerdem enthält sie Links zu den Quellen der Antwort, über die der Endnutzer weitere Informationen erhält. Der Kundenservicemitarbeiter kann für eine bestimmte Frage bis zu fünf Antwort-Snippets angeben.

Datenspeicherquellen

Es gibt verschiedene Quellen, aus denen Sie Ihre Daten beziehen können:

Datenspeicherquellen mit eingeschränktem Zugriff

Google bietet viele zusätzliche Datenspeicherquellen von Erst- und Drittanbietern als Funktion mit eingeschränktem Zugriff an. Eine Liste der verfügbaren Quellen und Informationen zum Beantragen des Zugriffs finden Sie auf dieser Seite im Abschnitt Zusätzliche Datenspeicherquellen.

Website content

Wenn Sie Websitecontent als Quelle hinzufügen, können Sie mehrere Websites hinzufügen und ausschließen. Wenn Sie eine Website angeben, können Sie einzelne Seiten oder * als Platzhalter für ein Muster verwenden. Alle HTML- und PDF-Inhalte werden verarbeitet.

Wenn Sie Websitecontent als Quelle verwenden, müssen Sie Ihre Domain bestätigen.

Einschränkungen:

  • Dateien aus öffentlichen URLs müssen vom Google-Suchindex gecrawlt worden sein, sodass sie im Suchindex erscheinen. Sie können dies mit der Google Search Console prüfen.
  • Es werden maximal 200.000 Seiten indexiert. Wenn der Datenspeicher mehr Seiten enthält, schlägt die Indexierung an diesem Punkt fehl. Bereits indexierte Inhalte bleiben erhalten.

Daten importieren

Sie können Ihre Daten entweder aus BigQuery oder Cloud Storage importieren. Diese Daten können in Form von FAQs oder unstrukturiert vorliegen und Metadaten oder keine Metadaten enthalten.

Folgende Optionen für den Datenimport sind verfügbar:

  • Daten hinzufügen/aktualisieren: Die bereitgestellten Dokumente werden dem Datenspeicher hinzugefügt. Wenn ein neues Dokument dieselbe ID wie ein altes Dokument hat, wird das alte Dokument durch das neue ersetzt.
  • Vorhandene Daten überschreiben: Alle alten Daten werden gelöscht und dann werden neue Daten hochgeladen. Dieser Vorgang kann nicht rückgängig gemacht werden.

Datenspeicher für FAQs

FAQ-Datenspeicher können Antworten auf häufig gestellte Fragen enthalten. Wenn Nutzerfragen mit hoher Wahrscheinlichkeit mit einer hochgeladenen Frage übereinstimmen, gibt der Kundenservicemitarbeiter die Antwort auf diese Frage ohne Änderungen zurück. Sie können für jedes Frage- und Antwortpaar, das dem Kundenservicemitarbeiter angezeigt wird, einen Titel und eine URL angeben.

Die Daten müssen im CSV-Format in den Datenspeicher hochgeladen werden. Jede Datei muss eine Kopfzeile mit den Spaltenbeschreibungen enthalten.

Beispiel:

"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""

Die Spalten title und url sind optional und können weggelassen werden:

"answer","question"
"42","What is the meaning of life?"

Während des Uploads können Sie einen Ordner auswählen, in dem jede Datei unabhängig von der Erweiterung als CSV-Datei behandelt wird.

Einschränkungen:

  • Ein zusätzliches Leerzeichen nach , führt zu einem Fehler.
  • Leere Zeilen (auch am Ende der Datei) führen zu einem Fehler.

Unstrukturierter Datenspeicher

Unstrukturierte Datenspeicher können Inhalte in den folgenden Formaten enthalten:

  • HTML
  • PDF
  • TXT
  • CSV

Es ist möglich (aber nicht üblich), Dateien aus dem Cloud Storage-Bucket eines anderen Projekts zu importieren. Dazu müssen Sie dem Importprozess expliziten Zugriff gewähren. Folgen Sie der Anleitung in der Fehlermeldung. Sie enthält den Namen des Nutzers, der Lesezugriff auf den Bucket benötigt, um den Import ausführen zu können.

Einschränkungen:

  • Die maximale Dateigröße beträgt 2,5 MB für textbasierte Formate und 100 MB für andere Formate.

Datenspeicher mit Metadaten

Als Metadaten können ein Titel und URL angegeben werden. Wenn der Kundenservicemitarbeiter mit einem Nutzer spricht, kann er ihm diese Informationen zur Verfügung stellen. So können Nutzer schnell interne Webseiten verknüpfen, auf die der Indexer der Google Suche nicht zugreifen kann.

Wenn Sie Inhalte mit Metadaten importieren möchten, müssen Sie eine oder mehrere JSON Lines-Dateien angeben. Jede Zeile dieser Datei beschreibt ein Dokument. Die eigentlichen Dokumente werden nicht direkt hochgeladen. Die URIs, die mit den Cloud Storage-Pfaden verknüpft sind, werden in der JSON Lines-Datei bereitgestellt.

Sie müssen einen Cloud Storage-Ordner mit diesen Dateien angeben. Legen Sie keine anderen Dateien in diesen Ordner.

Feldbeschreibungen:

Feld Typ Beschreibung
id String Eindeutige Kennung für das Dokument.
content.mimeType String MIME-Typ des Dokuments. „application/pdf“ und „text/html“ werden unterstützt.
content.uri String URI für das Dokument in Cloud Storage.
structData String Einzeiliges JSON-Objekt mit optionalen Feldern title und url.

Beispiel:

{ "id": "d001", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/first_doc.pdf"}, "structData": {"title": "First Document", "url": "https://internal.example.com/documents/first_doc.pdf"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"title": "Second Document", "url": "https://internal.example.com/documents/second_doc.pdf"} }
{ "id": "d003", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/mypage.html"}, "structData": {"title": "My Page", "url": "https://internal.example.com/mypage.html"} }

Datenspeicher ohne Metadaten

Dieser Inhaltstyp hat keine Metadaten. Stattdessen geben Sie URI-Links zu den einzelnen Dokumenten an. Der Inhaltstyp wird durch die Dateiendung bestimmt.

Konfiguration für das Parsen und Aufteilen in Blöcke

Je nach Datenquelle können Sie möglicherweise die von Vertex AI Search definierten Einstellungen für die Textanalyse und die Datensegmentierung konfigurieren.

Cloud Storage für ein Datenspeicherdokument verwenden

Wenn Ihr Inhalt nicht öffentlich ist, wird die Speicherung Ihrer Inhalte in Cloud Storage empfohlen. Beim Erstellen von Datenspeicherdokumenten geben Sie die URLs für Ihre Cloud Storage-Objekte in folgendem Format an: gs://bucket-name/folder-name. Jedes Dokument im Ordner wird dem Datenspeicher hinzugefügt.

Beim Erstellen des Cloud Storage-Buckets:

  • Achten Sie darauf, dass Sie das Projekt ausgewählt haben, das Sie für den Kundenservicemitarbeiter verwenden.
  • Verwenden Sie die Standard Storage-Klasse.
  • Legen Sie den Bucket-Speicherort auf denselben Standort wie Ihren Agenten fest.

Folgen Sie der Cloud Storage-Kurzanleitung, um einen Bucket zu erstellen und Dateien hochzuladen.

Sprachen

Eine Liste der unterstützten Sprachen finden Sie in der Spalte „Datenspeicher“ in der Sprachreferenz.

Für eine optimale Leistung wird empfohlen, Datenspeicher in einer einzigen Sprache zu erstellen.

Nachdem Sie einen Datenspeicher erstellt haben, können Sie optional die Sprache des Datenspeichers angeben. Wenn Sie die Sprache des Datenspeichers festlegen, können Sie den Datenspeicher mit einem Agenten verbinden, der für eine andere Sprache konfiguriert ist. Sie können beispielsweise einen französischen Datenspeicher erstellen, der mit einem englischsprachigen Kundenservicemitarbeiter verbunden ist.

Unterstützte Regionen

Eine Liste der unterstützten Regionen finden Sie in der Regionenreferenz.

(Eingeschränkter Zugriff) Zusätzliche Datenspeicherquellen

Weitere Datenspeichertypen sind in der folgenden Tabelle aufgeführt. Sie sind als Funktionen mit eingeschränktem Zugriff verfügbar. Füllen Sie das Formular für die Zulassungsliste aus, um Zugriff anzufordern. Nach der Genehmigung sind diese Optionen verfügbar, wenn Sie in Agent Builder einen neuen Datenspeicher erstellen.

Google-Datenspeicherquellen

Datenspeicherquelle Beschreibung
Cloud SQL Importieren Sie Daten aus einer Cloud SQL-Tabelle.
(Vorabversion) Spanner Daten aus einer Spanner-Tabelle importieren
(Vorabversion) Bigtable Daten aus einer Bigtable-Tabelle importieren
Firestore Daten aus Ihrer Firestore-Sammlung importieren.
(Vorabversion) AlloyDB Importieren Sie Daten aus Ihrem AlloyDB-Cluster.
Google Drive Link zum Drive Ihrer Organisation
(Vorabversion) Google Gmail Link zu Gmail Ihrer Organisation.
(Vorabversion) Google Sites Link zu den Sites Ihrer Organisation
(Vorabversion) Google Kalender Link zum Kalender Ihrer Organisation.
(Vorabversion) Google Groups Link zu den Gruppen Ihrer Organisation.

Datenspeicherquellen von Drittanbietern

Datenspeicherquelle Beschreibung
(Vorabversion) AODocs Daten aus Ihrem AODocs-Dokumentenverwaltungssystem importieren
Hinweise für Box Importieren Sie Daten von der Box-Website Ihrer Organisation.
Confluence Cloud Importieren Sie Daten aus Ihrem Confluence Cloud-Arbeitsbereich.
(Vorabversion) Confluence Data Center Daten aus Ihrem Confluence Data Center-Arbeitsbereich importieren
Dropbox Daten aus Ihrem Dropbox-Speicher importieren
(Vorabversion) EntraID Daten aus dem EntraID-System Ihrer Organisation importieren.
(Vorabversion) HubSpot Importieren Sie Daten aus der HubSpot-Website Ihrer Organisation.
Jira Cloud Daten aus Ihrem Jira-Aufgabenverwaltungssystem importieren
(Vorabversion) Jira Data Center Importieren Sie Daten von Ihrer Jira Data Center-Website.
(Vorabversion) Marketo Daten aus dem Marketo-Marketingsystem Ihrer Organisation importieren
(Vorabversion) Notion Daten aus dem Notion-Arbeitsbereich Ihrer Organisation importieren
OneDrive Daten aus dem OneDrive-Speicher Ihrer Organisation importieren
Microsoft Outlook Daten aus Microsoft Outlook importieren
Salesforce Daten aus Salesforce importieren
ServiceNow Daten aus ServiceNow importieren
SharePoint Daten aus dem SharePoint-System Ihrer Organisation importieren
(Vorabversion) Shopify Daten aus dem Shopify-System Ihrer Organisation importieren
Slack Daten aus Slack importieren
Microsoft Teams Daten aus Microsoft Teams importieren
(Vorabversion) WordPress Daten von der WordPress-Website Ihrer Organisation importieren

Datenspeicher eines Drittanbieters mit einem Connector einrichten

In diesem Abschnitt wird beschrieben, wie Sie einen Datenspeicher mit Drittanbieterdaten einrichten. Eine Anleitung für die einzelnen Drittanbieterdatenquellen finden Sie in der Dokumentation zu generativer KI.

Identitätsanbieter

Mit Identitätsanbietern können Sie Nutzer, Gruppen und die Authentifizierung verwalten. Wenn Sie einen Datenspeicher eines Drittanbieters einrichten, können Sie entweder einen Google-Identitätsanbieter oder einen Drittanbieter-Identitätsanbieter verwenden.

Google-Identitätsanbieter:

  • Alle Nutzer des Kundenservicemitarbeiters müssen sich mit ihren Google-Anmeldedaten anmelden. Dies kann eine beliebige @gmail.com-E-Mail-Adresse oder ein beliebiges Konto sein, das Google als Identitätsanbieter verwendet (z. B. Google Workspace). Dieser Schritt wird übersprungen, wenn Nutzer direkt über Google Cloud mit dem Kundenservicemitarbeiter sprechen, da die Google-Identität automatisch in das System eingebunden ist.
  • Sie können mit IAM Zugriff auf Google-Konten zuweisen.

Drittanbieter-Identitätsanbieter:

  • Nutzer des Kundenservicemitarbeiters melden sich mit Anmeldedaten eines anderen Anbieters an, z. B. einer Microsoft-E-Mail-Adresse.
  • Sie müssen einen Personalpool mit Google Cloud erstellen, der die Identitätsanbieter enthält, die nicht zu Google gehören. Anschließend können Sie mit IAM Zugriff entweder auf den gesamten Pool oder auf einzelne Nutzer innerhalb dieses Pools gewähren.
  • Diese Methode kann nicht für Google Cloud Projekte verwendet werden, die unter der Organisation@google.com eingerichtet wurden.

Connectors

Drittanbieterdatenspeicher werden über einen Connector implementiert. Jeder Connector kann mehrere Datenspeicher enthalten, die im Conversational Agents-System (Dialogflow CX) als Entitäten gespeichert werden.

  • Bevor Sie einen Datenspeicher erstellen, müssen Sie jede Region mit einem einzelnen Identitätsanbieter unter Google Cloud  -> Agent Builder -> Einstellungen einrichten. Alle Datenspeicher in dieser Region verwenden denselben Identitätsanbieter. Sie können entweder eine Google-Identität oder eine Drittanbieteridentität in einem Workforce-Pool auswählen. Dieselben Google-Anmeldedaten gelten als unterschiedliche Identität, wenn sie sich in einem Workforce-Pool befinden. Beispielsweise wird test@gmail.com als eine andere Identität als workforcePools/test-pool/subject/test@gmail.com betrachtet.

    • Erstellen Sie bei Bedarf einen Workforce-Pool.
    • Rufen Sie die Einstellungen von Agent Builder auf und wählen Sie entweder Google Identity oder Drittanbieter-Identität aus. Klicken Sie auf SPEICHERN, um die Identität in der Region zu speichern.
    • Sie können jetzt einen Datenspeicher in der Region erstellen.
  • Jeder Datenspeicher speichert ACL-Daten (Access Control List) mit jedem Dokument. Hier wird erfasst, welche Nutzer oder Gruppen Lesezugriff auf welche Entitäten haben. Während der Laufzeit erhält ein Nutzer oder Gruppenmitglied nur Antworten vom Agenten, die von Entitäten stammen, auf die er Lesezugriff hat. Wenn ein Nutzer keinen Lesezugriff auf Entitäten im Datenspeicher hat, gibt der Agent eine leere Antwort zurück.

  • Da die Daten im Datenspeicher eine Kopie der Drittanbieterinstanz sind, müssen sie regelmäßig aktualisiert werden. Sie können die Aktualisierungsintervalle in Stunden oder Tagen konfigurieren.

  • Nachdem Sie den Datenspeicher konfiguriert und auf Erstellen geklickt haben, kann es bis zu einer Stunde dauern, bis er in der Liste der Datenspeicher angezeigt wird.

Nächste Schritte

Eine Anleitung zum Erstellen eines Datenspeichers und zur Verwendung mit einem Kundenservicemitarbeiter finden Sie in der Dokumentation zu Datenspeichertools.