O Feature Store da Vertex AI oferece os seguintes tipos de disponibilização on-line que podem ser usados para disponibilizar atributos para previsões on-line:
Veiculação on-line otimizada, em que é possível escolher uma das seguintes configurações:
veiculação on-line do Bigtable
A disponibilização on-line do Bigtable é adequada para grandes volumes de dados (na ordem de terabytes de dados) com alta durabilidade de dados. É comparável à veiculação on-line no Feature Store da Vertex AI (legado), mas não está otimizado para se ajustar rapidamente a bursts de tráfego repentinos.
Geralmente, a veiculação on-line do Bigtable tem maior latência do que a veiculação on-line otimizada, mas é mais econômica. A veiculação on-line do Bigtable oferece suporte a sincronização de dados programada e contínua para as visualizações de recursos.
A exibição on-line do Bigtable não oferece suporte ao gerenciamento de embeddings. Se para gerenciar e exibir embeddings, use a Veiculação on-line otimizada.
Para usar a veiculação on-line do Bigtable, siga estas etapas:
Veiculação on-line otimizada
A veiculação on-line otimizada permite disponibilizar recursos em latências significativamente menores do que a veiculação on-line do Bigtable. Ele fornece uma arquitetura de veiculação on-line que é mais rápida, escalonável e responsiva a um aumento nos volumes de dados. A veiculação on-line otimizada é adequada para cenários em que é fundamental disponibilizar recursos em latências ultrabaixas.
Com a exibição on-line otimizada, é possível exibir valores de recursos de um endpoint público ou do Private Service Connect.
Todas as instâncias de lojas on-line criadas para compatibilidade com veiculação on-line otimizada de embeddings.
A veiculação on-line otimizada oferece suporte à sincronização de dados programada, mas não à sincronização contínua de dados para visualizações de recursos. Se você quiser usar a sincronização de dados contínua para sincronizar dados da fonte de dados do BigQuery com suas visualizações de recursos quase em tempo real, use a veiculação on-line do Bigtable.
Veiculação on-line otimizada com endpoint público
Por padrão, uma loja on-line criada para exibição on-line otimizada permite exibir recursos com um endpoint público. Para usar a exibição on-line otimizada com um endpoint público, execute as seguintes etapas:
Crie uma loja on-line para veiculação on-line otimizada com um endpoint público.
Buscar valores de atributos usando a exibição on-line otimizada em um endpoint público.
Veiculação on-line otimizada com o endpoint do Private Service Connect
Um endpoint do Private Service Connect é um endpoint de exibição dedicado. Use um endpoint do Private Service Connect se quiser exibir recursos em uma rede VPC com latências menores do que um endpoint público. Para usar a exibição on-line otimizada com um endpoint do Private Service Connect, siga estas etapas:
Configurar a veiculação on-line para mostrar valores de recurso nulos ou apenas valores de recurso não nulos
Durante a veiculação on-line, se você quiser veicular apenas os valores de recursos mais recentes, incluindo valores nulos, use a seguinte configuração:
Registre sua fonte de dados de elementos criando um grupo de recursos com o parâmetro
dense
definido comotrue
.Escolha a veiculação on-line do Bigtable ao criar a instância da loja on-line.
Use o parâmetro
cron
para configurar a sincronização de dados programada ao criar suas visualizações de recursos.
Se você usar qualquer outra configuração ao configurar a fonte de dados de recursos e a veiculação on-line, o Vertex AI Feature Store vai mostrar apenas os valores de atributos não nulos mais recentes. Se o valor mais recente de um recurso for nulo, o Vertex AI Feature Store vai exibir o valor histórico não nulo mais recente do recurso. Se um valor histórico não nulo não estiver disponível, o Feature Store da Vertex AI vai usar nulo como o valor do recurso.
A seguir
Saiba como criar uma instância de loja on-line.
Saiba como criar uma visualização de recursos.
Saiba como veicular valores de recursos.