Disponibilização de atributos

Neste documento, descrevemos as opções para disponibilizar recursos para treinamento e inferência de modelos do BigQuery ML. Para todas as opções, é necessário salvar os recursos nas tabelas do BigQuery como uma primeira etapa obrigatória.

Correção pontual

Os dados usados para treinar um modelo geralmente têm dependências de tempo integradas. Ao criar uma tabela de atributos com alteração de horário, inclua uma coluna de carimbo de data/hora para representar os valores do atributo como existiam em um determinado momento para cada linha. Use funções de pesquisa pontual ao consultar dados de tabelas de recursos para garantir que não haja vazamento de dados entre o treinamento e a disponibilização. Isso permite a precisão pontual.

Use as funções a seguir para especificar limites pontuais ao recuperar recursos sensíveis ao tempo:

Fornecer recursos no BigQuery ML

Para treinar modelos e realizar inferências em lote no BigQuery ML, é possível recuperar recursos usando uma das funções de pesquisa pontual descritas na seção Precisão pontual. É possível incluir essas funções na cláusula query_statement da instrução CREATE MODEL para treinamento ou na cláusula query_statement da função com valor de tabela adequada, como ML.PREDICT, para veiculação.

Disponibilizar recursos com a Vertex AI Feature Store

Para veicular recursos para modelos do BigQuery ML que estão registrados na Vertex AI, use a Vertex AI Feature Store. A Vertex AI Feature Store funciona em cima das tabelas de atributos no BigQuery para gerenciar e disponibilizar recursos com baixa latência. É possível usar a disponibilização on-line para extrair recursos em tempo real para a previsão on-line e usar a disponibilização off-line para extrair recursos para o treinamento do modelo.

Para mais informações sobre como preparar dados de recursos do BigQuery para serem usados no Feature Store da Vertex AI, consulte Preparar a fonte de dados.