Tipos de veiculação on-line

O Feature Store da Vertex AI oferece os seguintes tipos de disponibilização on-line que podem ser usados para disponibilizar atributos para previsões on-line:

veiculação on-line do Bigtable

A disponibilização on-line do Bigtable é adequada para grandes volumes de dados (na ordem de terabytes de dados) com alta durabilidade de dados. É comparável à veiculação on-line no Feature Store da Vertex AI (legado), mas não está otimizado para se ajustar rapidamente a bursts de tráfego repentinos.

Geralmente, a veiculação on-line do Bigtable tem maior latência do que a veiculação on-line otimizada, mas é mais econômica. A veiculação on-line do Bigtable oferece suporte a sincronização de dados programada e contínua para as visualizações de recursos.

A exibição on-line do Bigtable não oferece suporte ao gerenciamento de embeddings. Se para gerenciar e exibir embeddings, use a Veiculação on-line otimizada.

Para usar a veiculação on-line do Bigtable, siga estas etapas:

  1. Criar uma loja on-line para veiculação on-line do Bigtable.

  2. Criar uma instância de visualização de recursos.

  3. Buscar valores de atributos usando a veiculação on-line do Bigtable.

Veiculação on-line otimizada

A veiculação on-line otimizada permite disponibilizar recursos em latências significativamente menores do que a veiculação on-line do Bigtable. Ele fornece uma arquitetura de veiculação on-line que é mais rápida, escalonável e responsiva a um aumento nos volumes de dados. A veiculação on-line otimizada é adequada para cenários em que é fundamental disponibilizar recursos em latências ultrabaixas.

Com a exibição on-line otimizada, é possível exibir valores de recursos de um endpoint público ou do Private Service Connect.

Todas as instâncias de lojas on-line criadas para compatibilidade com veiculação on-line otimizada de embeddings.

A veiculação on-line otimizada oferece suporte à sincronização de dados programada, mas não à sincronização contínua de dados para visualizações de recursos. Se você quiser usar a sincronização de dados contínua para sincronizar dados da fonte de dados do BigQuery com suas visualizações de recursos quase em tempo real, use a veiculação on-line do Bigtable.

Veiculação on-line otimizada com endpoint público

Por padrão, uma loja on-line criada para exibição on-line otimizada permite exibir recursos com um endpoint público. Para usar a exibição on-line otimizada com um endpoint público, execute as seguintes etapas:

  1. Crie uma loja on-line para veiculação on-line otimizada com um endpoint público.

  2. Criar uma instância de visualização de recursos.

  3. Buscar valores de atributos usando a exibição on-line otimizada em um endpoint público.

Veiculação on-line otimizada com o endpoint do Private Service Connect

Um endpoint do Private Service Connect é um endpoint de exibição dedicado. Use um endpoint do Private Service Connect se quiser exibir recursos em uma rede VPC com latências menores do que um endpoint público. Para usar a exibição on-line otimizada com um endpoint do Private Service Connect, siga estas etapas:

  1. Crie uma loja on-line para exibição on-line otimizada com um endpoint do Private Service Connect.

  2. Criar uma instância de visualização de recursos.

  3. Buscar valores de atributos usando a exibição on-line otimizada do endpoint do Private Service Connect.

Configurar a veiculação on-line para mostrar valores de recurso nulos ou apenas valores de recurso não nulos

Durante a veiculação on-line, se você quiser veicular apenas os valores de recursos mais recentes, incluindo valores nulos, use a seguinte configuração:

  1. Registre sua fonte de dados de elementos criando um grupo de recursos com o parâmetro dense definido como true.

  2. Escolha a veiculação on-line do Bigtable ao criar a instância da loja on-line.

  3. Use o parâmetro cron para configurar a sincronização de dados programada ao criar suas visualizações de recursos.

Se você usar qualquer outra configuração ao configurar a fonte de dados de recursos e a veiculação on-line, o Vertex AI Feature Store vai mostrar apenas os valores de atributos não nulos mais recentes. Se o valor mais recente de um recurso for nulo, o Vertex AI Feature Store vai exibir o valor histórico não nulo mais recente do recurso. Se um valor histórico não nulo não estiver disponível, o Feature Store da Vertex AI vai usar nulo como o valor do recurso.

A seguir