Práticas recomendadas para implementar as Estatísticas de conversas com o Looker

A análise conversacional permite que os utilizadores consultem dados modelados em LookML fazendo perguntas em linguagem natural numa instância do Looker.

Este guia fornece estratégias e práticas recomendadas para ajudar os administradores do Looker e os programadores de LookML a configurar, implementar e otimizar com êxito as estatísticas de conversas. Este guia aborda os seguintes tópicos:

Ao preparar o modelo LookML e a análise conversacional, pode aumentar a adoção por parte dos utilizadores e garantir que estes recebem respostas precisas e úteis às suas perguntas.

Saiba como e quando o Gemini para Google Cloud usa os seus dados.

Práticas recomendadas do LookML para as Estatísticas de conversas

As estatísticas de conversação interpretam perguntas em linguagem natural através de duas entradas principais:

  1. O modelo LookML: a análise conversacional analisa a estrutura, os campos (dimensões, medidas), as etiquetas e as descrições definidos nas explorações do Looker.

  2. Valores de campos distintos: a análise conversacional examina os valores de dados nos campos (especificamente, dimensões de strings) para identificar as categorias e as entidades disponíveis sobre as quais os utilizadores podem fazer perguntas. A cardinalidade (o número de valores únicos) pode influenciar a forma como estes valores são usados.

Embora seja poderosa, a capacidade de o Analytics conversacional ser eficaz está diretamente relacionada com a qualidade e a clareza destas duas entradas. A tabela seguinte contém formas comuns em que o LookML pouco claro ou ambíguo pode afetar negativamente as análises conversacionais, juntamente com soluções para melhorar o resultado e a experiência do utilizador.

Problema de qualidade do LookML comum Solução para estatísticas de conversas mais claras
Falta de clareza: os campos que não têm etiquetas ou descrições claras são ambíguos para a estatística de conversação e para os respetivos utilizadores. Aplique etiquetas claras: use o parâmetro label para dar aos campos nomes intuitivos e adequados para empresas que os utilizadores provavelmente usarão nas suas perguntas.
Proliferação de campos: expor demasiados campos, especialmente IDs internos (chaves primárias), campos duplicados herdados de junções ou campos de cálculo intermédios, pode desorganizar as opções disponíveis para a análise conversacional. Oculte campos irrelevantes: certifique-se de que todas as chaves principais, chaves estrangeiras, campos redundantes de junções e campos puramente técnicos permanecem ocultos.

(Opcional) Estenda as explorações: se a sua exploração contiver um grande número de campos, considere criar uma nova exploração que estenda uma existente. Isto permite-lhe personalizar uma versão dedicada de conteúdo popular para a análise conversacional sem modificar as explorações das quais outro conteúdo possa depender.
Conflitos de nomenclatura: vários campos com nomes ou etiquetas semelhantes ou idênticos em diferentes vistas na funcionalidade Explorar podem levar a uma seleção de campos incorreta. Escreva descrições detalhadas: as descrições fornecem contexto essencial para a análise de conversas. Use o parâmetro description para as seguintes tarefas:
  • Descreva o campo de forma clara através da linguagem natural.
  • Inclua terminologia ou sinónimos específicos da empresa ou do setor.
  • Explicar cálculos ou contexto. A análise conversacional usa descrições para identificar melhor os significados dos campos e mapear os termos do utilizador.

Por exemplo, um campo com a etiqueta user_count pode ter a descrição "O número total de utilizadores únicos que visitaram o Website".

Padronize a nomenclatura: reveja os nomes dos campos e as etiquetas para garantir consistência e clareza.
Complexidade oculta: depender fortemente de campos personalizados ou cálculos de tabelas ao nível do painel de controlo significa que a lógica de negócio potencialmente crítica não vai estar acessível ao Conversational Analytics. Incorporar lógica personalizada: identifique campos personalizados ou cálculos de tabelas importantes e usados com frequência. Converta a lógica destes campos em dimensões e medidas do LookML para que o Conversational Analytics os possa usar.
Dados desorganizados: os seguintes tipos de dados inconsistentes ou mal estruturados dificultam a interpretação precisa das consultas por parte da análise conversacional.
  • Variações de valores: a utilização inconsistente de maiúsculas e minúsculas ou convenções de nomenclatura (por exemplo, uma combinação dos valores complete, Complete e COMPLETE) pode originar duplicação de dados ou relações de dados incorretas no Conversational Analytics.
  • Tipos de dados inconsistentes: as colunas que se destinam a ser numéricas e que contêm valores de string ocasionais forçam o tipo de campo a ser string, o que impede as operações numéricas.
  • Ambiguidade do fuso horário: a falta de fusos horários padronizados nos campos de data/hora pode levar a uma filtragem ou agregação incorreta.
Resolva problemas de qualidade de dados: sempre que possível, sinalize problemas de qualidade de dados (valores, tipos e fusos horários inconsistentes) que identificar durante a organização dos dados. Trabalhe com equipas de engenharia de dados para limpar os dados de origem ou aplicar transformações na camada de modelagem de dados/ETL.

Para ver mais práticas recomendadas para escrever LookML limpo e eficiente, consulte a seguinte documentação:

Quando adicionar contexto ao LookML em comparação com as estatísticas de conversas

Na análise conversacional, pode adicionar entradas de contexto, como sinónimos de campos e descrições, tanto ao LookML como às instruções do agente. Quando estiver a decidir onde adicionar contexto, aplique as seguintes orientações: o contexto que é sempre verdadeiro deve ser adicionado diretamente ao seu modelo LookML. Os Explorar do Looker podem ser usados em vários locais, incluindo em painéis de controlo e na análise conversacional, pelo que o contexto aplicado no LookML tem de ser válido para todos os utilizadores possíveis que vão interagir com os dados.

O contexto do agente deve ser qualitativo e focado no utilizador, e pode haver muitos agentes a servir diferentes utilizadores a partir de uma única página Explorar. Seguem-se exemplos de contexto que devem ser incluídos nas instruções do agente, mas não no LookML:

  • Quem é o utilizador que está a interagir com o agente? Qual é a respetiva função? São internos ou externos à empresa? Qual é a respetiva experiência anterior com o Analytics?
  • Qual é o objetivo do utilizador? Que tipo de decisão querem tomar no final da conversa?
  • Quais são alguns tipos de perguntas que este utilizador vai fazer?
  • Quais são os principais campos específicos deste utilizador? Quais são os campos que este utilizador nunca vai precisar de usar?

Este guia recomenda a seguinte abordagem faseada para implementar a análise conversacional no Looker:

Esta abordagem permite-lhe começar com um âmbito pequeno e controlado, validar a configuração e, em seguida, expandir para mais utilizadores e dados.

Fase 1: organize os dados e defina o âmbito inicial

Nesta fase, prepare os seus dados para que os utilizadores possam consultá-los com a análise conversacional e defina o âmbito da implementação inicial. Siga estas recomendações para começar com um âmbito pequeno e controlado:

  • Limite o acesso inicial dos utilizadores: para ativar os testes e a validação internos, use o sistema de autorizações do Looker para conceder a função do Gemini a um pequeno conjunto de utilizadores que estejam familiarizados com os dados.
  • Limite o acesso ao modelo do Looker para o Gemini: quando concede a função do Gemini, também pode limitar os modelos aos quais o Gemini pode aceder. Para começar, considere limitar o acesso do Gemini a um ou dois modelos que tenha organizado para a análise conversacional.
  • Selecione análises detalhadas organizadas: comece com uma ou duas análises detalhadas bem estruturadas que se baseiam em dados relativamente limpos e que oferecem um valor empresarial claro. Otimize estas análises detalhadas para as Estatísticas de conversas no Looker seguindo as instruções detalhadas nas práticas recomendadas do LookML para as Estatísticas de conversas.

Fase 2: configure os agentes e valide-os internamente

Nesta fase, crie e refine os seus agentes de estatísticas de conversação e, em seguida, teste-os exaustivamente com utilizadores internos para confirmar a precisão e a eficácia. Esta fase envolve os seguintes passos:

  1. Criar agentes preparados: crie agentes de estatísticas conversacionais baseados apenas nas explorações preparadas que preparou durante a fase de preparação e configuração inicial.
  2. Refine com instruções do agente: use instruções do agente para fornecer contexto adicional e mais orientações. Por exemplo:

    • Definir sinónimos para nomes ou valores de campos.
    • Fornecer contexto ou regras específicas sobre como determinados campos devem ser usados.
  3. Valide internamente e itere: teste exaustivamente os agentes com utilizadores que estão familiarizados com os dados. Fazer várias perguntas, testar casos extremos e identificar pontos fracos. Faça as seguintes alterações com base no feedback dos testes:

    1. Refinar o LookML. Por exemplo, ajuste os valores dos parâmetros LookML label, description ou hidden.
    2. Ajuste as instruções do agente.
    3. Continuar a denunciar problemas com a qualidade de dados.

Fase 3: expanda a adoção das estatísticas de conversas a mais utilizadores

Nesta fase, expanda a adoção da análise conversacional a mais utilizadores concedendo acesso, recolhendo feedback e iterando nos seus agentes. Esta fase envolve os seguintes passos:

  1. Conceda acesso segmentado: conceda acesso às estatísticas de conversação a utilizadores adicionais que tenham a função do Gemini e incentive esses utilizadores a usar os agentes específicos e validados que criou.
  2. Inicie e recolha feedback: solicite ativamente feedback sobre os seguintes tópicos:

    • Precisão das respostas
    • Facilidade de utilização
    • Informações em falta ou resultados confusos
  3. Itere continuamente: use o feedback para fazer mais refinamentos ao LookML e às instruções do agente, e priorize os esforços de limpeza de dados.

  4. Expanda o acesso: assim que os agentes se revelarem estáveis e valiosos, expanda o acesso a outros grupos de utilizadores relevantes e introduza novos agentes personalizados concedendo a função do Gemini. Também pode introduzir novos agentes organizados e expandir o acesso aos modelos disponíveis para a função do Gemini, seguindo os mesmos processos usados nas fases anteriores.