Best Practices für die Einführung von Conversational Analytics mit Looker

Mit Conversational Analytics können Nutzer Daten abfragen, die in LookML modelliert sind. Dazu stellen sie in einer Looker-Instanz Fragen in natürlicher Sprache.

Dieser Leitfaden enthält Strategien und Best Practices, mit denen Looker-Administratoren und LookML-Entwickler Conversational Analytics erfolgreich konfigurieren, bereitstellen und optimieren können. In dieser Anleitung werden folgende Themen behandelt:

Wenn Sie Ihr LookML-Modell und Conversational Analytics vorbereiten, können Sie die Akzeptanz bei den Nutzern steigern und dafür sorgen, dass sie genaue und nützliche Antworten auf ihre Fragen erhalten.

Weitere Informationen dazu, wie und wann Gemini für Google Cloud Ihre Daten verwendet

LookML-Best Practices für Conversational Analytics

Bei Conversational Analytics werden Fragen in natürlicher Sprache anhand von zwei primären Eingaben interpretiert:

  1. Das LookML-Modell: Conversational Analytics analysiert die Struktur, die Felder (Dimensionen, Messwerte), die Labels und die Beschreibungen, die in den Looker-Explores definiert sind.

  2. Eindeutige Feldwerte: Bei Conversational Analytics werden die Datenwerte in Feldern (insbesondere String-Dimensionen) untersucht, um die verfügbaren Kategorien und Einheiten zu ermitteln, nach denen Nutzer fragen könnten. Die Kardinalität (die Anzahl der eindeutigen Werte) kann beeinflussen, wie diese Werte verwendet werden.

Die Leistungsfähigkeit von Conversational Analytics hängt direkt von der Qualität und Klarheit dieser beiden Eingaben ab. In der folgenden Tabelle finden Sie häufige Beispiele dafür, wie unklare oder mehrdeutige LookML Conversational Analytics negativ beeinflussen kann, sowie Lösungen zur Verbesserung der Ausgabe und Nutzerfreundlichkeit.

Häufiges Problem mit der LookML-Qualität Lösung für übersichtlichere Conversational Analytics
Mangelnde Klarheit:Felder ohne eindeutige Labels oder Beschreibungen sind sowohl für Conversational Analytics als auch für die Nutzer mehrdeutig. Deutliche Labels anwenden:Verwenden Sie den Parameter label, um Feldern intuitive, geschäftsfreundliche Namen zu geben, die Nutzer wahrscheinlich in ihren Fragen verwenden.
Zu viele Felder:Wenn zu viele Felder verfügbar sind, insbesondere interne IDs (Primärschlüssel), doppelte Felder, die aus Joins übernommen werden, oder Felder für Zwischenberechnungen, kann das die Optionen, die für Conversational Analytics verfügbar sind, unübersichtlich machen. Irrelevante Felder ausblenden:Alle Primärschlüssel, Fremdschlüssel, redundanten Felder aus Joins und rein technischen Felder müssen ausgeblendet werden.

(Optional) Explorative Datenanalysen erweitern:Wenn Ihre explorative Datenanalyse viele Felder enthält, sollten Sie eine neue erstellen, die eine vorhandene erweitert. So können Sie eine spezielle Version beliebter Inhalte für Conversational Analytics erstellen, ohne Explores zu ändern, auf die andere Inhalte angewiesen sind.
Namenskonflikte:Wenn mehrere Felder in verschiedenen Ansichten des Explores ähnliche oder identische Namen oder Labels haben, kann dies zu einer falschen Feldauswahl führen. Aussagekräftige Beschreibungen verfassen:Beschreibungen liefern wichtigen Kontext für Conversational Analytics. Verwenden Sie den Parameter description für die folgenden Aufgaben:
  • Beschreiben Sie das Feld klar und in natürlicher Sprache.
  • Fügen Sie unternehmens- oder branchenspezifische Begriffe oder Synonyme ein.
  • Erklären Sie Berechnungen oder den Kontext. Bei Conversational Analytics werden Beschreibungen verwendet, um die Bedeutung von Feldern besser zu erkennen und Nutzerbegriffe zuzuordnen.

Ein Feld mit dem Label user_count könnte beispielsweise die Beschreibung „Die Gesamtzahl der einzelnen Nutzer, die die Website besucht haben“ haben.

Benennung standardisieren:Überprüfen Sie Feldnamen und Labels auf Einheitlichkeit und Klarheit.
Verborgene Komplexität:Wenn Sie sich stark auf benutzerdefinierte Felder oder Tabellenberechnungen auf Dashboard-Ebene verlassen, ist die möglicherweise kritische Geschäftslogik für Conversational Analytics nicht zugänglich. Benutzerdefinierte Logik einbinden:Ermitteln Sie wichtige und häufig verwendete benutzerdefinierte Felder oder Tabellenkalkulationen. Wandeln Sie die Logik für diese Felder in LookML-Dimensionen und ‑Messwerte um, damit sie in Conversational Analytics verwendet werden können.
Unsaubere Daten:Die folgenden Arten von inkonsistenten oder schlecht strukturierten Daten erschweren es Conversational Analytics, Anfragen genau zu interpretieren.
  • Wertabweichungen:Inkonsistente Groß- und Kleinschreibung oder Namenskonventionen (z. B. eine Mischung aus den Werten complete, Complete und COMPLETE) können zu Datenduplizierung oder falschen Datenbeziehungen in Conversational Analytics führen.
  • Inkonsistente Datentypen:Spalten, die numerisch sein sollen und gelegentlich Stringwerte enthalten, erzwingen den Feldtyp string, was numerische Operationen verhindert.
  • Mehrdeutigkeit der Zeitzone:Das Fehlen standardisierter Zeitzonen in Zeitstempelfeldern kann zu einer falschen Filterung oder Aggregation führen.
Datenqualität verbessern:Kennzeichnen Sie nach Möglichkeit Probleme mit der Datenqualität (inkonsistente Werte, Typen, Zeitzonen), die Sie bei der Datenaufbereitung feststellen. Mit Data Engineering-Teams zusammenarbeiten, um die Quelldaten zu bereinigen oder Transformationen in der ETL-/Datenmodellierungsebene anzuwenden

Weitere Best Practices für das Schreiben von sauberem, effizientem LookML finden Sie in der folgenden Dokumentation:

Wann sollte Kontext in LookML und wann in Conversational Analytics hinzugefügt werden?

In Conversational Analytics können Sie sowohl LookML als auch Agent-Anweisungen Kontext-Eingaben wie Feldsynonyme und Beschreibungen hinzufügen. Wenn Sie entscheiden, wo Sie Kontext hinzufügen möchten, sollten Sie die folgenden Richtlinien beachten: Kontext, der immer zutrifft, sollte direkt Ihrem LookML-Modell hinzugefügt werden. Looker-Explores können an mehreren Stellen verwendet werden, z. B. in Dashboards und in Conversational Analytics. Daher muss der in LookML angewendete Kontext für alle möglichen Nutzer gelten, die mit den Daten interagieren.

Der Agent-Kontext sollte qualitativ und nutzerorientiert sein. Es kann viele Agents geben, die verschiedene Nutzer über einen Explore bedienen. Beispiele für Kontext, der in Agent-Anweisungen, aber nicht in LookML enthalten sein sollte:

  • Wer ist der Nutzer, der mit dem Agent interagiert? Welche Funktionen haben diese Personen? Sind sie intern oder extern? Welche Analytics-Erfahrung haben sie?
  • Was ist das Ziel des Nutzers? Welche Art von Entscheidung möchten sie am Ende des Gesprächs treffen?
  • Welche Arten von Fragen wird dieser Nutzer stellen?
  • Welche sind die wichtigsten Felder, die für diesen Nutzer spezifisch sind? Welche Felder muss dieser Nutzer nie verwenden?

In diesem Leitfaden wird der folgende stufenweise Ansatz für die Implementierung von Conversational Analytics in Looker empfohlen:

So können Sie mit einem kleinen, kontrollierten Umfang beginnen, Ihre Einrichtung validieren und dann auf mehr Nutzer und Daten ausweiten.

Phase 1: Daten zusammenstellen und ersten Umfang definieren

In dieser Phase bereiten Sie Ihre Daten für Nutzer vor, damit sie sie mit Conversational Analytics abfragen können. Außerdem definieren Sie den Umfang der ersten Bereitstellung. Hier sind einige Empfehlungen für den Einstieg mit einem kleinen und kontrollierten Umfang:

  • Anfänglichen Nutzerzugriff einschränken: Verwenden Sie das Berechtigungssystem von Looker, um internen Tests und der Validierung die Gemini-Rolle einer kleinen Gruppe von Nutzern zuzuweisen, die mit den Daten vertraut sind.
  • Looker-Modellzugriff für Gemini einschränken: Wenn Sie die Gemini-Rolle zuweisen, können Sie auch einschränken, auf welche Modelle Gemini zugreifen kann. Beschränken Sie den Gemini-Zugriff zunächst auf ein oder zwei Modelle, die Sie für Conversational Analytics zusammengestellt haben.
  • Ausgewählte Explores auswählen: Beginnen Sie mit ein oder zwei gut strukturierten Explores, die auf relativ sauberen Daten basieren und einen klaren geschäftlichen Nutzen bieten. Optimieren Sie diese Explores für Conversational Analytics in Looker, indem Sie der detaillierten Anleitung unter LookML-Best Practices für Conversational Analytics folgen.

Phase 2: Agents konfigurieren und intern validieren

In dieser Phase erstellen und optimieren Sie Ihre Conversational Analytics-Agents und testen sie dann gründlich mit internen Nutzern, um ihre Genauigkeit und Effektivität zu bestätigen. Diese Phase umfasst die folgenden Schritte:

  1. Kuratierte Agents erstellen: Erstellen Sie Conversational Analytics-Agents, die nur auf den kuratierten Explores basieren, die Sie während der Kuratierungs- und Ersteinrichtungsphase vorbereitet haben.
  2. Mit Agent-Anweisungen optimieren: Verwenden Sie Agent-Anweisungen, um zusätzlichen Kontext und weitere Anleitungen bereitzustellen. Beispiel:

    • Synonyme für Feldnamen oder ‑werte definieren
    • Geben Sie einen bestimmten Kontext oder Regeln für die Verwendung bestimmter Felder an.
  3. Intern validieren und iterieren: Testen Sie die Agents gründlich mit Nutzern, die mit den Daten vertraut sind. Stellen Sie verschiedene Fragen, testen Sie Grenzfälle und ermitteln Sie Schwachstellen. Nehmen Sie die folgenden Änderungen auf Grundlage des Testfeedbacks vor:

    1. LookML verfeinern Passen Sie beispielsweise die Werte für die LookML-Parameter label, description oder hidden an.
    2. Agent-Anweisungen anpassen
    3. Melden Sie weiterhin Probleme mit der Datenqualität.

Phase 3: Conversational Analytics auf weitere Nutzer ausweiten

In dieser Phase weiten Sie die Nutzung von Conversational Analytics auf weitere Nutzer aus, indem Sie Zugriff gewähren, Feedback einholen und Ihre Agents optimieren. Diese Phase umfasst die folgenden Schritte:

  1. Gezielten Zugriff gewähren: Gewähren Sie zusätzlichen Nutzern mit der Gemini-Rolle Zugriff auf Conversational Analytics und fordern Sie diese Nutzer auf, die von Ihnen erstellten, geprüften Agents zu verwenden.
  2. Einführung und Feedback: Holen Sie aktiv Feedback zu den folgenden Themen ein:

    • Genauigkeit der Antworten
    • Nutzerfreundlichkeit
    • Fehlende Informationen oder verwirrende Ergebnisse
  3. Kontinuierlich iterieren: Nutzen Sie Feedback, um LookML und Agentenanweisungen weiter zu optimieren, und priorisieren Sie die Datenbereinigung.

  4. Zugriff erweitern: Sobald sich die Agents als stabil und nützlich erweisen, können Sie den Zugriff auf andere relevante Nutzergruppen ausweiten und neue kuratierte Agents einführen, indem Sie die Gemini-Rolle zuweisen. Sie können auch neue kuratierte Agents einführen und den Zugriff auf die Modelle, die für die Gemini-Rolle verfügbar sind, erweitern. Dabei können Sie die gleichen Prozesse wie in den vorherigen Phasen verwenden.