Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Antes de começar a exibir atributos on-line usando
o Vertex AI Feature Store, configure sua fonte de dados de atributos no
BigQuery da seguinte maneira:
Crie uma tabela ou visualização do BigQuery com seus dados de recursos. Para carregar dados de recursos em uma tabela ou visualização do BigQuery, crie um conjunto de dados do BigQuery usando essas informações, crie uma tabela do BigQuery e carregue os dados do recurso na tabela.
Depois de carregar os dados de recursos na tabela ou visualização do BigQuery, é necessário disponibilizar essa fonte de dados para a Vertex AI Feature Store para exibição on-line. Há duas maneiras de
conectar a fonte de dados a recursos de exibição on-line, como
lojas on-line e instâncias de visualização de atributos:
Registre a fonte de dados criando grupos e recursos de atributos:
é possível associar grupos e recursos a instâncias de visualização de atributos
na sua loja on-line. É possível formatar os dados de duas maneiras:
Inclua uma coluna de carimbo de data/hora de recurso para formatar seus dados como uma série temporal. O Vertex AI Feature Store exibe apenas os valores de atributos mais recentes para cada ID de entidade exclusivo, com base no carimbo de data/hora do atributo nessa coluna.
Formate os dados sem incluir colunas de carimbo de data/hora do recurso.
A Feature Store da Vertex AI gerencia os carimbos de data/hora e exibe
apenas os valores de recursos mais recentes para cada ID de entidade exclusivo.
Para mais informações sobre como criar grupos de recursos, consulte
Criar um grupo de recursos. Para
saber mais sobre como criar recursos em um grupo, consulte
Criar um recurso.
Disponibilizar recursos diretamente da fonte de dados sem criar grupos e recursos:é possível especificar o URI da fonte de dados na visualização de recursos.
Nesse cenário, não é possível formatar os dados como uma série temporal ou incluir dados históricos na origem do BigQuery. Cada linha precisa conter os valores mais recentes do recurso correspondentes a um ID exclusivo. Não há suporte para várias ocorrências do mesmo ID de entidade em linhas diferentes.
Como o Vertex AI Feature Store permite manter dados de recursos
no BigQuery e exibir recursos da fonte de dados
do BigQuery, não é necessário importar ou copiar os recursos para um armazenamento
off-line.
Diretrizes de preparação de fontes de dados
Siga estas diretrizes para entender o esquema e as restrições ao preparar a fonte de dados no BigQuery:
Inclua as seguintes colunas na fonte de dados:
Colunas de ID da entidade: a fonte de dados precisa ter pelo menos uma coluna de ID da entidade com valores string ou int. O nome padrão dessa coluna é
entity_id. Você pode usar um nome diferente para essa coluna. O
tamanho de cada valor nesta coluna precisa ser menor que 4 KB.
Também é possível designar um registro de elemento construindo o ID da entidade usando elementos de várias colunas. Nesse cenário, é possível incluir
várias colunas de ID de entidade na fonte de dados. O nome de cada coluna de ID de entidade precisa ser exclusivo. Se você registrar a fonte de dados criando grupos de recursos, defina as colunas de ID da entidade para cada grupo.
Caso contrário, se você associar diretamente a fonte de dados a uma visualização de recursos,
configure as visualizações de recursos para especificar as colunas de ID de entidade.
É possível incluir várias colunas de ID em uma fonte de dados. Nesse
cenário, o nome de cada coluna de ID de entidade precisa ser exclusivo. É possível
configurar grupos ou visualizações de recursos para construir o ID da entidade
usando os valores de cada coluna para um registro de recurso.
Coluna de carimbo de data/hora do recurso: opcional. Se você registrar a fonte de dados usando recursos e grupos de recursos e precisar formatar os dados como uma série temporal, inclua uma coluna de carimbo de data/hora do atributo. A coluna de carimbo de data/hora contém
valores do tipo timestamp. O nome padrão da coluna de marcação de tempo é
feature_timestamp. Se você quiser usar um nome de coluna diferente, use o parâmetro time_series para definir a coluna de carimbo de data/hora do grupo de atributos.
Se você não especificar uma coluna de carimbo de data/hora para formatar seus dados como uma série temporal,
o Vertex AI Feature Store vai gerenciar os carimbos de data/hora dos recursos
e exibir os valores mais recentes.
Se você associar diretamente uma fonte de dados do BigQuery a uma visualização de recurso, a coluna feature_timestamp não será necessária. Nesse cenário, você
precisa incluir apenas os valores de recursos mais recentes na fonte de dados, e
o Vertex AI Feature Store não procura o carimbo de data/hora.
Inserir e filtrar colunas: opcional. Se você quiser usar o gerenciamento de
incorporação em uma loja on-line criada para a veiculação on-line otimizada, a
fonte de dados precisa conter as seguintes colunas:
Uma coluna embedding contendo matrizes do tipo float.
Opcional: uma ou mais colunas de filtragem do tipo string ou matriz string.
Opcional: uma coluna de agrupamento do tipo int.
Cada linha na fonte de dados é um registro completo de valores de recursos associados a um ID de entidade. Se um valor de recurso estiver ausente em uma das colunas, ele será considerado nulo.
Cada coluna da tabela ou visualização do BigQuery representa um recurso.
Forneça os valores de cada recurso em uma coluna separada. Caso você esteja associando
a fonte de dados a um grupo de recursos e recursos, associe cada coluna a um recurso separado.
Os tipos de dados compatíveis com valores de recursos incluem bool, int, float,
string, timestamp, matrizes desses tipos de dados e bytes. Durante a
sincronização de dados, os valores de recursos do tipo timestamp são convertidos em
int64.
A fonte de dados precisa estar localizada na mesma região da instância de loja on-line ou em uma multirregião que inclua ou se sobreponha à região do armazenamento on-line. Por exemplo, se a loja on-line estiver em us-central, a fonte do BigQuery poderá estar localizada em us-central ou US.
Sincronize os dados em uma visualização de recursos
antes da veiculação on-line para garantir que você exiba apenas os valores de atributos mais recentes.
Se você estiver usando a sincronização de dados programada, talvez seja necessário sincronizar manualmente os dados
na visualização de recursos.
No entanto, se você estiver usando a sincronização de dados contínua com a veiculação on-line otimizada,
não será necessário sincronizar os dados manualmente.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[],[],null,["# Prepare data source\n\nBefore you can start serving features online using\nVertex AI Feature Store, you need to set up your feature data source in\nBigQuery, as follows:\n\n1. Create a BigQuery table or view using your feature data. To load\n feature data into a BigQuery table or view, you can create a\n BigQuery dataset using the data, create a BigQuery\n table, and then load the feature data from the dataset into the table.\n\n2. After you load the feature data into the BigQuery table or\n view, you need to make this data source available to\n Vertex AI Feature Store for online serving. There are two ways in\n which you can connect the data source to online serving resources, such as\n online stores and feature view instances:\n\n - **Register the data source by creating feature groups and features:**\n You can associate feature groups and features with feature view instances\n in your online store. You can format the data in either of the following ways:\n\n - Format your data as a time series by including a feature timestamp\n column. Vertex AI Feature Store serves only the latest\n feature values for each unique entity ID, based on the feature\n timestamp in this column.\n\n - Format the data without including a feature timestamp columns.\n Vertex AI Feature Store manages the timestamps and serves\n only the latest feature values for each unique entity ID.\n\n For information about how to create feature groups, see\n [Create a feature group](/vertex-ai/docs/featurestore/latest/create-featuregroup). For\n information about how to create features within a feature group, see\n [create a feature](/vertex-ai/docs/featurestore/latest/create-feature).\n - **Directly serve features from the data source without creating feature groups and features:**\n You can specify the URI of the data source in the feature view.\n Note that in this scenario, you can't format your data as a time series or\n include historical data in the BigQuery source. Each row must contain\n the latest feature values corresponding to a unique ID. Multiple occurrences\n of the same entity ID in different rows are not supported.\n\nSince Vertex AI Feature Store lets you maintain feature data\nin BigQuery and serves features from the BigQuery\ndata source, there's no need to import or copy the features to an offline\nstore.\n\nData source preparation guidelines\n----------------------------------\n\nFollow these guidelines to understand the schema and constraints while preparing\nthe data source in BigQuery:\n\n1. Include the following columns in the data source:\n\n - **Entity ID columns** : The data source must have at least one entity ID\n column with `string` or `int` values. The default name for this column is\n `entity_id`. You can optionally use a different name for this column. The\n size of each value in this column must be less than 4 KB.\n\n Note that you can also designate a feature record by constructing the entity\n ID using features from multiple columns. In this scenario, you can include\n multiple entity ID columns in the data source. The name of each entity ID\n column must be unique. If you register the data source by creating feature\n groups, set the entity ID columns for each feature group.\n Otherwise, if you directly associate the data source with a feature view,\n configure the feature views to specify the entity ID columns.\n\n Note that you can include multiple ID columns in a data source. In such a\n scenario, the name of each entity ID column must be unique. You can\n configure your feature groups or feature views to construct the entity ID\n using the values from each column for a feature record.\n - **Feature timestamp column** : Optional. If you register the data source\n using feature groups and features, and need to format the data as a time\n series, include a feature timestamp column. The timestamp column contains\n values of type `timestamp`. The default name for the timestamp column is\n `feature_timestamp`. If you want to use a different column name, use the\n `time_series` parameter to set the timestamp column for the feature group.\n\n If you don't specify a timestamp column to format your data as a time series,\n Vertex AI Feature Store manages the timestamps for the features\n and serves the latest feature values.\n\n If you directly associate a BigQuery data source with a feature\n view, the `feature_timestamp` column isn't required. In this scenario, you\n must include only the latest feature values in the data source and\n Vertex AI Feature Store doesn't look up the timestamp.\n - **Embedding and filtering columns**: Optional. If you want to use embedding\n management in an online store created for Optimized online serving, the\n data source must contain the following columns:\n\n - An `embedding` column containing arrays of type `float`.\n\n - Optional: One or more filtering columns of type `string` or `string` array.\n\n - Optional: A crowding column of type `int`.\n\n2. Each row in data source is a complete record of feature values associated\n with an entity ID. If a feature value is missing in one of the columns, then\n it's considered a null value.\n\n3. Each column of the BigQuery table or view represents a feature.\n Provide the values for each feature in a separate column. If you're associating\n the data source with a feature group and features, associate each column with a separate feature.\n\n4. Supported data types for feature values include `bool`, `int`, `float`,\n `string`, `timestamp`, arrays of these data types, and bytes. Note that during\n [data sync](/vertex-ai/docs/featurestore/latest/sync-data), feature values of type `timestamp` are converted to\n `int64`.\n\n5. The data source must be located in the same region as the online store\n instance, or in a multi-region that includes or overlaps with the region for the\n online store. For example, if the online store is in `us-central`, the\n BigQuery source might be located in `us-central` or `US`.\n\n6. [Sync the data in a feature view](/vertex-ai/docs/featurestore/latest/create-featureview#sync_featuredata)\n before online serving to ensure that you serve only the latest feature values.\n If you're using scheduled data sync, you might need to [manually sync the data\n in the feature view](/vertex-ai/docs/featurestore/latest/sync-data).\n However, if you're using continuous data sync with Optimized online serving,\n then you don't need to manually sync the data.\n\nWhat's next\n-----------\n\n- Learn how to create [feature groups](/vertex-ai/docs/featurestore/latest/create-featuregroup) and [features](/vertex-ai/docs/featurestore/latest/create-feature).\n\n- Learn how to [create a feature view](/vertex-ai/docs/featurestore/latest/create-featureview).\n\n- [Online serving types](/vertex-ai/docs/featurestore/latest/online-serving-types) in Vertex AI Feature Store."]]