Recorridos de usuario integrales para modelos de aprendizaje automático

En este documento se describen los flujos de trabajo de los modelos de aprendizaje automático (ML) que se entrenan en BigQuery ML, incluidas las instrucciones y funciones que puede usar para trabajar con modelos de ML. BigQuery ML ofrece los siguientes tipos de modelos de aprendizaje automático:

Recorridos de usuario de creación de modelos

En la siguiente tabla se describen las instrucciones y funciones que puedes usar para crear y ajustar modelos:

Categoría de modelo Tipo de modelo Creación de modelos Preprocesamiento de funciones Ajuste de hiperparámetros1 Pesos del modelo Información sobre funciones y formación Tutoriales
Aprendizaje supervisado Regresión lineal y logística CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
ML.WEIGHTS ML.FEATURE
_INFO


ML.TRAINING
_INFO
Usar la regresión lineal para predecir el peso de los pingüinos

Clasificar con un modelo de regresión logística
Redes neuronales profundas (DNN) CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
N/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
N/A
Redes Wide & Deep CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
N/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
N/A
Árboles de potenciación CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
N/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
Clasificar con un modelo de árbol de decisión potenciado
Bosque aleatorio CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
N/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
N/A
Clasificación y regresión de AutoML CREATE MODEL AutoML realiza automáticamente la ingeniería de características AutoML realiza automáticamente el ajuste de hiperparámetros N/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
N/A
Aprendizaje no supervisado K‑medias CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
ML.CENTROIDS ML.FEATURE
_INFO


ML.TRAINING
_INFO
Encontrar clústeres en los datos de las estaciones de bicicletas
Factorización de matriz CREATE MODEL N/A Ajuste de hiperparámetros

ML.TRIAL
_INFO
ML.WEIGHTS ML.FEATURE
_INFO


ML.TRAINING
_INFO
Generar recomendaciones de películas a partir de comentarios explícitos

Generar recomendaciones de contenido a partir de comentarios implícitos
Análisis de componentes principales (ACP) CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
N/A ML.PRINCIPAL
_COMPONENTS


ML.PRINCIPAL
_COMPONENT
_INFO
ML.FEATURE
_INFO


ML.TRAINING
_INFO
N/A
Autocodificador CREATE MODEL Preprocesamiento automático

Preprocesamiento manual
Ajuste de hiperparámetros

ML.TRIAL
_INFO
N/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
N/A
Solo transformación Solo transformación CREATE MODEL Preprocesado manual N/A N/A ML.FEATURE
_INFO
N/A

1Para ver un ejemplo detallado de cómo usar el ajuste de hiperparámetros, consulta el artículo Mejora el rendimiento de los modelos con el ajuste de hiperparámetros.

2BigQuery ML no ofrece una función para obtener los pesos de este modelo. Para ver los pesos del modelo, puedes exportarlo de BigQuery ML a Cloud Storage y, a continuación, usar la biblioteca XGBoost o la biblioteca TensorFlow para visualizar la estructura de árbol de los modelos de árbol o la estructura de grafo de las redes neuronales. Para obtener más información, consulta EXPORT MODEL y Exportar un modelo de BigQuery ML para hacer predicciones online.

Modelar recorridos de usuario

En la siguiente tabla se describen las instrucciones y funciones que puede usar para evaluar, explicar y obtener predicciones de los modelos:

Categoría de modelo Tipo de modelo Evaluación Inferencia Explicación de la IA Monitorización de modelos
Aprendizaje supervisado Regresión lineal y logística ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Redes neuronales profundas (DNN) ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Redes Wide & Deep ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Árboles de potenciación ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.FEATURE_IMPORTANCE4
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Bosque aleatorio ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.FEATURE_IMPORTANCE4
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Clasificación y regresión de AutoML ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT ML.GLOBAL_EXPLAIN ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Aprendizaje no supervisado K‑medias ML.EVALUATE ML.PREDICT
ML.DETECT
_ANOMALIES


ML.TRANSFORM
N/A ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Factorización de matriz ML.EVALUATE ML.RECOMMEND

ML.GENERATE
_EMBEDDING
N/A N/A
Análisis de componentes principales (ACP) ML.EVALUATE ML.PREDICT
ML.GENERATE
_EMBEDDING

ML.DETECT
_ANOMALIES


ML.TRANSFORM
N/A ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Autocodificador ML.EVALUATE ML.PREDICT

ML.GENERATE
_EMBEDDING

ML.DETECT
_ANOMALIES


ML.RECONSTRUCTION
_LOSS


ML.TRANSFORM
N/A ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Solo transformación Solo transformación N/A ML.TRANSFORM N/A N/A

1ML.CONFUSION_MATRIX solo se aplica a los modelos de clasificación.

2ML.ROC_CURVE solo se aplica a los modelos de clasificación binaria.

3 La función ML.EXPLAIN_PREDICT abarca la función ML.PREDICT porque su resultado es un superconjunto de los resultados de ML.PREDICT.

4Para entender la diferencia entre ML.GLOBAL_EXPLAIN y ML.FEATURE_IMPORTANCE, consulta la descripción general de la IA explicable.

5 La función ML.ADVANCED_WEIGHTS abarca la función ML.WEIGHTS porque su resultado es un superconjunto de los resultados de ML.WEIGHTS.