Visão geral dos pesos do modelo do BigQuery ML
Neste documento, descrevemos como o BigQuery ML é compatível com a detecção de pesos de modelo para modelos de machine learning (ML).
Um modelo de ML é um artefato salvo após a execução de um algoritmo de ML em dados de treinamento. O modelo representa as regras, números e qualquer outra estrutura de dados específica de algoritmo necessária para fazer previsões. Veja alguns exemplos:
- Um modelo de regressão linear é composto por um vetor de coeficientes que têm valores específicos.
- Um modelo de árvore de decisão é composto por uma ou mais árvores de instruções “if-then” com valores específicos.
- Um modelo de rede neural profunda é composto por uma estrutura de gráfico com vetores ou matrizes de pesos que têm valores específicos.
No BigQuery ML, o termo pesos de modelo é usado para descrever os componentes que compõem um modelo.
Para informações sobre as funções e instruções SQL compatíveis com cada tipo de modelo, consulte Jornada do usuário completa de cada modelo.
Ofertas de pesos de modelo no BigQuery ML
O BigQuery ML oferece várias funções que podem ser usadas para recuperar os pesos de modelos diferentes.
Categoria do modelo | Tipos de modelos | Funções de pesos do modelo | O que a função faz |
---|---|---|---|
Modelos supervisionados | Regressão linear e logística | ML.WEIGHTS |
Recupera os coeficientes do recurso e a interceptação. |
Modelos não supervisionados | Kmeans | ML.CENTROIDS |
Recupera os coeficientes do recurso para todos os centroides. |
Fatoração de matrizes | ML.WEIGHTS |
Recupera os pesos de todos os fatores latentes. Eles representam as duas matrizes decompostas, a matriz do usuário e a matriz de itens. | |
PCA | ML.PRINCIPAL_COMPONENTS |
Recupera os coeficientes do recurso de todos os componentes principais, também conhecidos como vetores independentes. | |
ML.PRINCIPAL_COMPONENT_INFO |
Recupera as estatísticas de cada componente principal, como eigenvalue. | ||
Modelos de série temporal | ARIMA_PLUS | ML.ARIMA_COEFFICIENTS |
Recupera os coeficientes do modelo ARIMA, usados para modelar o componente de tendência da série temporal de entrada. Para informações sobre outros componentes, como padrões sazonais presentes na série temporal, use ML.ARIMA_EVALUATE . |
O BigQuery ML não oferece suporte a funções de peso de modelo para os tipos de modelos a seguir:
- Árvore aprimorada
- Floresta aleatória
- Rede neural profunda (DNN)
- Amplitude e profundidade
- AutoML Tables
Para ver os pesos de todos esses tipos de modelo, exceto os do AutoML Tables, exporte o modelo do BigQuery ML para o Cloud Storage. É possível usar a biblioteca XGBoost para ver a estrutura de árvore para modelos de árvore otimizada e floresta aleatória ou a biblioteca do TensorFlow para visualizar a estrutura de gráficos de DNN e modelos de amplitude e profundidade. Não há um método para receber informações de peso de modelos para modelos do AutoML Tables.
Para mais informações sobre como exportar um modelo, consulte a instrução EXPORT MODEL
e Exportar um modelo do BigQuery ML para previsão on-line.