Configurar e usar a resolução de entidades no BigQuery
Neste documento, mostramos como implementar a resolução de entidades para usuários finais (daqui em diante chamados de usuários finais) e provedores de identidade.
Os usuários finais podem usar este documento ao se conectar e usar o serviço de um provedor de identidade para fazer correspondência de registros. Por sua vez, os provedores de identidade podem usar este documento para definir e configurar serviços a serem compartilhados com usuários finais no Google Cloud Marketplace.
Fluxo de trabalho para usuários finais
As seções a seguir mostram aos usuários finais como configurar a resolução de entidades no BigQuery. Para uma representação visual da configuração completa, consulte a arquitetura para resolução de entidades.
Antes de começar
- Entre em contato e estabeleça um relacionamento com um provedor de identidade. O BigQuery é compatível com a resolução de entidades, com o LiveRamp.
- Adquira os seguintes itens do provedor de identidade:
- Credenciais da conta de serviço
- Assinatura da função remota
- Crie dois conjuntos de dados no seu projeto:
- Conjunto de dados de entrada
- Conjunto de dados de saída
Funções exigidas
Para receber as permissões necessárias para executar jobs de resolução de entidades, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Para que a conta de serviço do provedor de identidade leia o conjunto de dados de entrada e grave-o no conjunto de saída:
-
Visualizador de dados do BigQuery (
roles/bigquery.dataViewer
) no conjunto de dados de origem -
Editor de dados do BigQuery (
roles/bigquery.dataEditor
) no conjunto de dados de saída
-
Visualizador de dados do BigQuery (
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias com papéis personalizados ou outros papéis predefinidos.
Traduzir ou resolver entidades
Para instruções específicas sobre provedores de identidade, consulte as seções a seguir.
LiveRamp
Pré-requisitos
- Configurar a identidade incorporada do LiveRamp no BigQuery Para mais informações, consulte Ativar a identidade incorporada do LiveRamp no BigQuery.
- Coordenar com o LiveRamp para ativar as credenciais da API para uso com o Embedded Identity. Para mais informações, consulte Autenticação.
Configuração
As etapas abaixo são necessárias ao usar a identidade incorporada do LiveRamp pela primeira vez. Depois que a configuração for concluída, apenas as tabelas de entrada e de metadados precisarão ser modificadas entre as execuções.
Criar uma tabela de entrada
Crie uma tabela no conjunto de dados de entrada. Preencha a tabela com RampIDs, domínios e tipos de destino. Para mais detalhes e exemplos, consulte Colunas e descrições da tabela de entrada.
Criar uma tabela de metadados
A tabela de metadados é usada para controlar a execução da identidade incorporada do LiveRamp no BigQuery. Crie uma tabela de metadados no conjunto de dados de entrada. Preencha a tabela de metadados com IDs do cliente, modos de execução, domínios e tipos de destino. Para detalhes e exemplos, consulte Colunas e descrições da tabela de metadados.
Compartilhar tabelas com o LiveRamp
Conceda ao LiveRamp acesso à conta de serviço do Google Cloud para ver e processar dados no conjunto de entrada. Para mais detalhes e exemplos, consulte Compartilhar tabelas e conjuntos de dados com o LiveRamp.
Executar um job de identidade embedded
Para executar um job de identidade embedded com o LiveRamp no BigQuery, faça o seguinte:
- Confirme que todos os RampIDs codificados no seu domínio estão na sua tabela de entrada.
- Confirme a precisão da tabela de metadados antes de executar o job.
- Entre em contato com LiveRampIdentitySupport@liveramp.com com uma solicitação de processo do job. Inclua os IDs do projeto, do conjunto de dados e da tabela (se aplicável) referentes às tabelas de entrada, de metadados e de saída. Para saber mais, consulte Notificar o LiveRamp para iniciar a transcodificação.
Os resultados geralmente são entregues ao conjunto de dados de saída em até três dias úteis.
Suporte ao LiveRamp
Em caso de problemas de suporte, entre em contato com o Suporte de identidade do LiveRamp.
Faturamento do LiveRamp
O LiveRamp processa o faturamento da resolução de entidades.
Fluxo de trabalho para provedores de identidade
As seções a seguir mostram aos provedores de identidade como configurar a resolução de entidades no BigQuery. Para uma representação visual da configuração completa, consulte a arquitetura da resolução de entidades.
Antes de começar
- Crie um job do Cloud Run ou uma função do Cloud para integração com a função remota. As duas opções são adequadas para esse propósito.
Observe o nome da conta de serviço associada ao Cloud Run ou à função do Cloud:
No console do Google Cloud, acesse a página Cloud Functions.
Clique no nome da função e, em seguida, clique na guia Detalhes.
No painel Informações gerais, localize e anote o nome da conta de serviço para a função remota.
Crie uma função remota.
Colete os principais do usuário final.
Funções exigidas
Para receber as permissões necessárias para executar jobs de resolução de entidades, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Na conta de serviço associada à sua função, você pode fazer a leitura e gravação nos conjuntos de dados associados e iniciar jobs:
-
Editor de dados do BigQuery (
roles/bigquery.dataEditor
) no projeto -
Usuário de jobs do BigQuery (
roles/bigquery.jobUser
) no projeto
-
Editor de dados do BigQuery (
-
Para que o principal do usuário final acesse e se conecte à função remota:
-
Usuário de conexão do BigQuery (
roles/bigquery.connectionUser
) na conexão -
Visualizador de dados do BigQuery (
roles/bigquery.dataViewer
) no conjunto de dados do plano de controle com a função remota
-
Usuário de conexão do BigQuery (
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias com papéis personalizados ou outros papéis predefinidos.
Compartilhar função remota de resolução de entidades
Modifique e compartilhe o código de interface remota a seguir com o usuário final. O usuário final precisa desse código para iniciar o job de resolução de entidades.
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
Substitua LIST_OF_PARAMETERS pela lista de parâmetros que são transmitidos à função remota.
Opcional: fornecer metadados do job
Como alternativa, forneça metadados do job usando uma função remota separada ou gravando uma nova tabela de status no conjunto de dados de saída do usuário. Exemplos de metadados incluem status e métricas do job.
Faturamento de provedores de identidade
Para simplificar o faturamento e a integração do cliente, recomendamos que você integre seu serviço de resolução de entidades ao Google Cloud Marketplace. Isso permite configurar um modelo de preços com base no uso do job de resolução de entidades, e o Google processa o faturamento para você. Para mais informações, consulte Como oferecer produtos de software como serviço (SaaS).