Descripción general del preprocesamiento de funciones

El preprocesamiento de las características es uno de los pasos más importantes del ciclo de vida del aprendizaje automático. Consiste en crear funciones y limpiar los datos de entrenamiento. La creación de funciones también se conoce como ingeniería de funciones.

BigQuery ML ofrece las siguientes técnicas de preprocesamiento de funciones:

  • Preprocesamiento automático. BigQuery ML realiza un preprocesamiento automático durante el entrenamiento. Para obtener más información, consulta Preprocesamiento automático de funciones.

  • Preprocesado manual. Puede usar la cláusula TRANSFORM en la instrucción CREATE MODEL para definir un preprocesamiento personalizado mediante funciones de preprocesamiento manual. También puedes usar estas funciones fuera de la cláusula TRANSFORM para procesar los datos de entrenamiento antes de crear el modelo.

Obtener información sobre una función

Puedes usar la ML.FEATURE_INFO función para obtener las estadísticas de todas las columnas de características de entrada.

Si usas la configuración predeterminada de las instrucciones CREATE MODEL y las funciones de inferencia, puedes crear y usar modelos de BigQuery ML aunque no tengas muchos conocimientos sobre aprendizaje automático. Sin embargo, tener conocimientos básicos sobre el ciclo de vida del desarrollo de ML, como la ingeniería de funciones y el entrenamiento de modelos, te ayuda a optimizar tanto tus datos como tu modelo para obtener mejores resultados. Te recomendamos que utilices los siguientes recursos para familiarizarte con las técnicas y los procesos de aprendizaje automático:

Siguientes pasos