Criar perfil de dados da Vertex AI em um único projeto

Nesta página, descrevemos como configurar a descoberta de dados da Vertex AI no nível do projeto. Se você quiser criar um perfil de uma organização ou pasta, consulte Criar perfil de dados da Vertex AI em uma organização ou pasta.

Para mais informações sobre o serviço de descoberta, consulte Perfis de dados.

Antes de começar

  1. Verifique se a API Cloud Data Loss Prevention está ativada no seu projeto:

    1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
    2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    3. Make sure that billing is enabled for your Google Cloud project.

    4. Enable the required API.

      Enable the API

    5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    6. Make sure that billing is enabled for your Google Cloud project.

    7. Enable the required API.

      Enable the API

    8. Confirme se você tem as permissões do IAM necessárias para configurar perfis de dados no nível do projeto.

    9. É necessário ter um modelo de inspeção em cada região com dados que serão criados para o perfil. Se você quiser usar um único modelo para várias regiões, use um modelo armazenado na região global. Se as políticas organizacionais impedirem a criação de um modelo de inspeção na região global, defina um modelo de inspeção dedicado para cada região. Para mais informações, consulte Considerações sobre a residência de dados.

      Esta tarefa permite criar um modelo de inspeção apenas na região global. Se você precisar de modelos de inspeção dedicados para uma ou mais regiões, crie esses modelos antes de realizar esta tarefa.

    10. É possível configurar a Proteção de Dados Sensíveis para enviar notificações ao Pub/Sub quando determinados eventos ocorrerem, como quando a Proteção de Dados Sensíveis cria o perfil de um novo conjunto de dados. Se quiser usar esse recurso, primeiro crie um tópico do Pub/Sub.

    11. Criar uma configuração de verificação

      1. Acesse a página Criar configuração de verificação.

        Acessar "Criar configuração de verificação"

      2. Acesse seu projeto. Na barra de ferramentas, clique no seletor de projetos e selecione seu projeto.

      As seções a seguir fornecem mais informações sobre as etapas na página Criar configuração de verificação. No final de cada seção, clique em Continuar.

      Selecione um tipo de descoberta

      Selecione Vertex AI.

      Selecionar escopo

      Escolha uma destas opções:

      • Se você quiser verificar um único conjunto de dados, selecione Verificar um conjunto de dados.

        Para cada conjunto de dados, é possível ter apenas uma configuração de verificação de recurso único. Para mais informações, consulte Criar perfil de um único recurso de dados.

        Preencha os detalhes do conjunto de dados que você quer criar um perfil.

      • Se quiser fazer o perfil padrão no nível do projeto, selecione Verificar o projeto selecionado.

      Gerenciar programações

      Se a frequência de criação de perfil padrão atender às suas necessidades, pule esta seção da página Criar configuração de verificação.

      Configure esta seção pelos seguintes motivos:

      • Para fazer ajustes refinados na frequência de criação de perfis de todos os seus dados ou de determinados subconjuntos.
      • Para especificar os conjuntos de dados que você não quer criar perfis.
      • Para especificar os conjuntos de dados que você não quer que sejam criados mais de uma vez.

      Para fazer ajustes refinados na frequência de criação de perfil, siga estas etapas:

      1. Clique em Adicionar programação.
      2. Na seção Filtros, defina um ou mais filtros que especificam quais conjuntos de dados estão no escopo do cronograma. Um conjunto de dados é considerado no escopo do cronograma se corresponder a pelo menos um dos filtros definidos.

        Para configurar um filtro, especifique um ID do projeto ou uma expressão regular que especifique um ou mais projetos.

        As expressões regulares precisam seguir a sintaxe RE2.

        Por exemplo, se você quiser que todos os conjuntos de dados de um projeto sejam incluídos no filtro, insira o ID do projeto no campo ID do projeto.

        Se quiser adicionar mais filtros, clique em Adicionar filtro e repita essa etapa.

      3. Clique em Frequência.

      4. Na seção Frequência, especifique se o serviço de descoberta deve criar perfis dos conjuntos de dados selecionados e, em caso afirmativo, com que frequência:

        • Se você não quiser que os conjuntos de dados sejam analisados, desative a opção Criar perfil desses dados.

        • Se você quiser que os conjuntos de dados sejam analisados pelo menos uma vez, deixe a opção Analisar esses dados ativada.

          Nos campos seguintes desta seção, especifique se o sistema precisa criar um novo perfil dos seus dados e quais eventos devem acionar uma operação de recriação de perfil. Para mais informações, consulte Frequência de geração de perfis de dados.

          1. Em Em uma programação, especifique a frequência com que você quer que os conjuntos de dados sejam reprofilados. Os conjuntos de dados são reprofilados, independentemente de terem sofrido alterações.
          2. Para Ao inspecionar mudanças no modelo, especifique se você quer que os dados sejam reformulados quando o modelo de inspeção associado for atualizado e, em caso afirmativo, com que frequência.

            Uma mudança no modelo de inspeção é detectada quando ocorre uma destas situações:

            • O nome de um modelo de inspeção muda na sua configuração de verificação.
            • O updateTime de um modelo de inspeção muda.

          3. Por exemplo, se você definir um modelo de inspeção para a região us-west1 e atualizar esse modelo, apenas os dados na região us-west1 serão reformulados.

      5. Opcional: clique em Condições.

        Na seção Condições, especifique as condições que os conjuntos de dados, definidos nos filtros, precisam atender antes que a Proteção de Dados Sensíveis crie um perfil deles.

        Se necessário, defina o seguinte:

        • Condição mínima: se você quiser atrasar a criação de perfil de um conjunto de dados até que ele atinja uma determinada idade, ative essa opção. Em seguida, insira a duração mínima.

        • Condição de tempo: se você não quiser que conjuntos de dados antigos sejam criados, ative essa opção. Em seguida, use o seletor de data para escolher uma data e hora. Todos os conjuntos de dados criados até o carimbo de data/hora selecionado são excluídos da criação de perfis.

        Exemplos de condições

        Suponha que você tenha a seguinte configuração:

        • Condições mínimas

          • Duração mínima: 24 horas
        • Condição de tempo

          • Carimbo de data/hora: 05/04/22, 23h59

        Nesse caso, a Proteção de dados sensíveis exclui todos os conjuntos de dados criados até 4 de maio de 2022, às 23h59. Entre os conjuntos de dados criados após essa data e hora, a Proteção de Dados Sensíveis cria perfis apenas dos conjuntos de dados com pelo menos 24 horas.

      6. Clique em Concluído.

      7. Opcional: para adicionar mais programações, clique em Adicionar programação e repita as etapas anteriores.

      8. Para especificar a precedência entre as programações, reordene-as usando as setas para cima e para baixo .

        A ordem dos horários especifica como os conflitos entre eles são resolvidos. Se um conjunto de dados corresponder aos filtros de duas programações diferentes, a que estiver mais acima na lista vai determinar a frequência de criação de perfis para esse conjunto.

      9. Opcional: edite ou desative a Programação geral.

        A última programação na lista é a programação geral. Essa programação abrange os conjuntos de dados no escopo selecionado que não correspondem a nenhuma das programações criadas. A programação catch-all segue a frequência padrão de criação de perfis do sistema.

        • Para ajustar a programação de captura total, clique em Editar programação e ajuste as configurações conforme necessário.
        • Para evitar que a Proteção de Dados Sensíveis crie o perfil de qualquer recurso coberto pela programação catch-all, desative a opção Criar perfil dos recursos que não correspondem a nenhuma programação personalizada.

      Selecionar modelo de inspeção

      Dependendo de como você quer fornecer uma configuração de inspeção, escolha uma das opções a seguir. Independentemente da opção escolhida, a Proteção de dados sensíveis verifica seus dados na região em que eles estão armazenados. Ou seja, seus dados não saem da região de origem.

      Opção 1: criar um modelo de inspeção

      Escolha essa opção se quiser criar um modelo de inspeção na região global.

      1. Clique em Criar novo modelo de inspeção.
      2. Opcional: para modificar a seleção padrão de infoTypes, clique em Gerenciar infoTypes.

        Para mais informações sobre como gerenciar infoTypes integrados e personalizados, consulte Gerenciar infoTypes no console doGoogle Cloud .

        É preciso selecionar pelo menos um infoType para continuar.

      3. Opcional: configure o modelo de inspeção ainda mais adicionando conjuntos de regras e definindo um limite de confiança. Para mais informações, consulte Configurar detecção.

      Quando a proteção de dados sensíveis cria a configuração de verificação, ela armazena esse novo modelo de inspeção na região global.

      Opção 2: usar um modelo de inspeção existente

      Escolha essa opção se você tiver modelos de inspeção que quer usar.

      1. Clique em Selecionar modelo de inspeção existente.
      2. Insira o nome completo do recurso do modelo de inspeção que você quer usar. O campo Região é preenchido automaticamente com o nome da região em que o modelo de inspeção está armazenado.

        O modelo de inspeção inserido precisa estar na mesma região dos dados que serão criados para o perfil.

        Para respeitar a residência de dados, a Proteção de Dados Sensíveis não usa um modelo de inspeção fora da região em que ele está armazenado.

        Para encontrar o nome completo do recurso de um modelo de inspeção, siga estas etapas:

        1. Acesse a lista de modelos de inspeção. Essa página é aberta em uma guia separada.

          Acessar modelos de inspeção

        2. Mude para o projeto que contém o modelo de inspeção que você quer usar.
        3. Na guia Modelos, clique no ID do modelo que você quer usar.
        4. Na página exibida, copie o nome completo do recurso do modelo. O nome completo do recurso segue este formato:
          projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
        5. Na página Criar configuração de verificação, no campo Nome do modelo, cole o nome completo do recurso do modelo.
      3. Para adicionar um modelo de inspeção de outra região, clique em Adicionar modelo de inspeção e insira o nome completo do recurso. Repita esse processo para cada região em que você tem um modelo de inspeção dedicado.
      4. Opcional: adicione um modelo de inspeção armazenado na região global. A Proteção de dados sensíveis usa automaticamente esse modelo para dados em regiões onde você não tem um modelo de inspeção dedicado.

      Adicionar ações

      Nesta seção, descrevemos como especificar as ações que você quer que a Proteção de dados sensíveis realize depois de criar um perfil de um conjunto de dados. Essas ações são úteis se você quiser enviar insights coletados de perfis de dados para outros serviços doGoogle Cloud .

      Publicar no Security Command Center

      As descobertas dos perfis de dados fornecem contexto ao fazer a triagem e desenvolver planos de resposta para suas descobertas de vulnerabilidade e ameaças no Security Command Center.

      Antes de usar essa ação, o Security Command Center precisa ser ativado no nível da organização. Ao ativar o Security Command Center no nível da organização, você permite o fluxo de descobertas de serviços integrados, como a proteção de dados sensíveis. A Proteção de Dados Sensíveis trabalha com o Security Command Center em todos os níveis do serviço.

      Se o Security Command Center não estiver ativado no nível da organização, as descobertas da proteção de dados sensíveis não vão aparecer no Security Command Center. Para mais informações, consulte Verificar o nível de ativação do Security Command Center.

      Para enviar os resultados dos seus perfis de dados ao Security Command Center, verifique se a opção Publicar no Security Command Center está ativada.

      Para mais informações, consulte Publicar perfis de dados no Security Command Center.

      Salvar cópias do perfil de dados no BigQuery

      A Proteção de Dados Sensíveis salva uma cópia de cada perfil de dados gerado em uma tabela do BigQuery. Se você não fornecer os detalhes da tabela preferida, a Proteção de Dados Sensíveis vai criar um conjunto de dados e uma tabela no projeto. Por padrão, o conjunto de dados é chamado de sensitive_data_protection_discovery e a tabela de discovery_profiles.

      Essa ação permite manter um histórico de todos os perfis gerados. Esse histórico pode ser útil para criar relatórios de auditoria e visualizar perfis de dados. Também é possível carregar essas informações em outros sistemas.

      Além disso, essa opção permite ver todos os perfis de dados em uma única visualização, independentemente da região dos dados. Embora também seja possível ver os perfis de dados no console doGoogle Cloud , ele mostra os perfis em apenas uma região por vez.

      Quando a Proteção de dados sensíveis não consegue criar um perfil de um conjunto de dados, ela tenta novamente de forma periódica. Para minimizar o ruído nos dados exportados, a proteção de dados sensíveis exporta apenas os perfis gerados com êxito para o BigQuery.

      A Proteção de Dados Sensíveis começa a exportar perfis a partir do momento em que você ativa essa opção. Os perfis gerados antes da ativação da exportação não são salvos no BigQuery.

      Para ver exemplos de consultas que podem ser usadas ao analisar perfis de dados, consulte Analisar perfis de dados.

      Salvar as descobertas de amostra no BigQuery

      A Proteção de Dados Sensíveis pode adicionar descobertas de amostra a uma tabela do BigQuery de sua escolha. As descobertas de amostra representam um subconjunto de todas as descobertas e podem não representar todos os infoTypes descobertos. Normalmente, o sistema gera cerca de 10 exemplos de descobertas por conjunto de dados, mas esse número pode variar para cada execução de descoberta.

      Cada descoberta inclui a string real (também chamada de citação) que foi detectada e o local exato dela.

      Essa ação é útil se você quiser avaliar se a configuração de inspeção está correspondendo corretamente ao tipo de informação que você quer sinalizar como sensível. Usando os perfis de dados e as descobertas de amostra exportados, você pode executar consultas para receber mais informações sobre os itens específicos sinalizados, os infoTypes correspondentes, os locais exatos, os níveis de sensibilidade calculados e outros detalhes.

      Para salvar descobertas de amostra em uma tabela do BigQuery, siga estas etapas:

      1. Ative a opção Salvar as descobertas de amostra no BigQuery.

      2. Insira os detalhes da tabela do BigQuery em que você quer salvar os resultados da amostra.

        A tabela especificada para essa ação precisa ser diferente da tabela usada para a ação Salvar cópias do perfil de dados no BigQuery.

        • Em ID do projeto, digite o ID de um projeto em que você quer exportar os resultados.

        • Em ID do conjunto de dados, insira o nome de um conjunto de dados existente no projeto.

        • Em ID da tabela, insira o nome da tabela do BigQuery em que você quer salvar as descobertas. Se ela não existir, a Proteção de Dados Sensíveis a criará automaticamente usando o nome fornecido.

      Para informações sobre o conteúdo de cada descoberta salva na tabela do BigQuery, consulte DataProfileFinding.

      Publicar no Pub/Sub

      Ao ativar a opção Publicar no Pub/Sub, você pode realizar ações programáticas com base nos resultados do perfil. É possível usar as notificações do Pub/Sub para desenvolver um fluxo de trabalho de detecção e correção de descobertas com risco ou sensibilidade de dados significativos.

      Para enviar notificações a um tópico do Pub/Sub, siga estas etapas:

      1. Ative a opção Publicar no Pub/Sub.

        Uma lista de opções vai aparecer. Cada opção descreve um evento que faz com que a Proteção de dados sensíveis envie uma notificação ao Pub/Sub.

      2. Selecione os eventos que devem acionar uma notificação do Pub/Sub.

        Se você selecionar Enviar uma notificação do Pub/Sub sempre que um perfil for atualizado, a Proteção de dados sensíveis vai enviar uma notificação quando houver uma mudança no nível de sensibilidade, no nível de risco de dados, nos infoTypes detectados, no acesso público e em outras métricas importantes do perfil.

      3. Para cada evento selecionado, siga estas etapas:

        1. Insira o nome do tema. O nome precisa estar no seguinte formato:

          projects/PROJECT_ID/topics/TOPIC_ID
          

          Substitua:

          • PROJECT_ID: o ID do projeto associado ao tópico do Pub/Sub.
          • TOPIC_ID: o ID do tópico do Pub/Sub.
        2. Especifique se você quer incluir o perfil completo do conjunto de dados na notificação ou apenas o nome completo do recurso do conjunto de dados que foi analisado.

        3. Defina os níveis mínimos de risco e sensibilidade dos dados que precisam ser atendidos para que a Proteção de Dados Sensíveis envie uma notificação.

        4. Especifique se apenas uma ou ambas as condições de risco e sensibilidade dos dados precisam ser atendidas. Por exemplo, se você escolher AND, as condições de risco de dados e sensibilidade precisarão ser atendidas antes que a Proteção de Dados Sensíveis envie uma notificação.

      Enviar para o Dataplex Universal Catalog como aspectos

      Com essa ação, é possível adicionar aspectos do Dataplex Universal Catalog a conjuntos de dados com perfil com base em insights dos perfis de dados. Essa ação só é aplicada a perfis novos e atualizados. Os perfis que não forem atualizados não serão enviados para o Catálogo Universal do Dataplex.

      Quando você ativa essa ação, a proteção de dados sensíveis anexa o aspecto Sensitive Data Protection profile à entrada do Dataplex Universal Catalog para cada conjunto de dados novo ou atualizado que você cria um perfil. Os aspectos gerados contêm insights coletados dos perfis de dados. Em seguida, pesquise na sua organização e nos projetos entradas com valores de aspecto Sensitive Data Protection profile específicos.

      Para enviar os perfis de dados ao Dataplex Universal Catalog, verifique se a opção Enviar como aspectos para o Dataplex Catalog está ativada.

      Para mais informações, consulte Adicionar aspectos do Dataplex Universal Catalog com base em insights de perfis de dados.

      Definir locais de processamento substitutos para imagens

      Em geral, a Proteção de dados sensíveis processa seus dados no local em que eles são armazenados. No entanto, as imagens só podem ser processadas em uma multirregião ou na região global. Se você definir um local substituto, a Proteção de dados sensíveis vai usar esse local para processar imagens que não estão em uma multirregião ou na região global. Se você pular esta seção, essas imagens não serão processadas.

      Para definir locais substitutos para o processamento de imagens, selecione uma ou ambas as opções a seguir:

      • Reverter para a multirregião: se uma imagem não puder ser processada no local original, ela será processada na multirregião correspondente ao local original. Se o local original da imagem não tiver uma multirregião correspondente, ela será ignorada.
      • Voltar para global: se uma imagem não puder ser processada no local original, ela será processada na região global.

      Se você selecionar as duas opções, a Proteção de Dados Sensíveis vai escolher qual local usar como alternativa.

      Definir o local para armazenar a configuração

      Clique na lista Local do recurso e selecione a região em que você quer armazenar essa configuração de verificação. Todas as configurações de verificação que você criar depois também serão armazenadas nesse local.

      O local em que você decide armazenar a configuração da verificação não afeta os dados a serem verificados. Os dados são verificados na mesma região em que estão armazenados. Para mais informações, consulte Considerações sobre a residência de dados.

      Revisar e criar

      1. Se você quiser garantir que a criação de perfil não seja iniciada automaticamente depois de criar a configuração de verificação, selecione Criar verificação no modo pausado.

        Essa opção é útil nos seguintes casos:

        • Você optou por salvar perfis de dados no BigQuery e quer garantir que o agente de serviço tenha acesso de gravação à tabela do BigQuery em que as cópias do perfil de dados serão salvas.
        • Você optou por salvar as descobertas de amostra no BigQuery e quer garantir que o agente de serviço tenha acesso de gravação à tabela do BigQuery em que as descobertas de amostra serão salvas.
        • Você configurou as notificações do Pub/Sub e quer conceder acesso de publicação ao agente de serviço.
      2. Revise suas configurações e clique em Criar.

        A Proteção de Dados Sensíveis cria a configuração de verificação e a adiciona à lista de configurações de verificação de descoberta.

      Para ver ou gerenciar as configurações de verificação, consulte Gerenciar configurações de verificação.

      A seguir

    12. Saiba como gerenciar perfis de dados.
    13. Saiba como gerenciar configurações de verificação.
    14. Saiba como receber e analisar mensagens do Pub/Sub publicadas pelo criador de perfil de dados.
    15. Saiba como resolver problemas com perfis de dados.