Descripción general del preprocesamiento de funciones
El preprocesamiento de las características es uno de los pasos más importantes del ciclo de vida del aprendizaje automático. Consiste en crear funciones y limpiar los datos de entrenamiento. La creación de funciones también se conoce como ingeniería de funciones.
BigQuery ML ofrece las siguientes técnicas de preprocesamiento de funciones:
Preprocesamiento automático. BigQuery ML realiza un preprocesamiento automático durante el entrenamiento. Para obtener más información, consulta Preprocesamiento automático de funciones.
Preprocesado manual. Puede usar la cláusula
TRANSFORM
en la instrucciónCREATE MODEL
para definir un preprocesamiento personalizado mediante funciones de preprocesamiento manual. También puedes usar estas funciones fuera de la cláusulaTRANSFORM
para procesar los datos de entrenamiento antes de crear el modelo.
Obtener información sobre una función
Puedes usar la ML.FEATURE_INFO
función para
obtener las estadísticas de todas las columnas de características de entrada.
Conocimientos recomendados
Si usas la configuración predeterminada de las instrucciones CREATE MODEL
y las funciones de inferencia, puedes crear y usar modelos de BigQuery ML aunque no tengas muchos conocimientos sobre aprendizaje automático. Sin embargo, tener conocimientos básicos sobre el ciclo de vida del desarrollo de ML, como la ingeniería de funciones y el entrenamiento de modelos, te ayuda a optimizar tanto tus datos como tu modelo para obtener mejores resultados. Te recomendamos que utilices los siguientes recursos para familiarizarte con las técnicas y los procesos de aprendizaje automático:
- Curso intensivo de aprendizaje automático
- Introducción al aprendizaje automático
- Limpieza de datos
- Ingeniería de funciones
- Aprendizaje automático intermedio
Siguientes pasos
- Consulta información sobre el servicio de características en BigQuery ML.
Para obtener más información sobre las instrucciones y funciones de SQL admitidas en los modelos que admiten el preprocesamiento de características, consulta los siguientes documentos: