Este documento explica las diferencias clave entre el entrenamiento de un modelo en Vertex AI mediante AutoML o el entrenamiento personalizado y el entrenamiento de un modelo con el AA de BigQuery.
Con AutoML, puedes crear y entrenar un modelo con un esfuerzo técnico mínimo. Puedes usar AutoML para prototipar modelos con rapidez y explorar conjuntos de datos nuevos antes de invertir en el desarrollo. Por ejemplo, puedes usarlo para saber qué atributos son mejores en un conjunto de datos determinado.
Con el entrenamiento personalizado, puedes crear una aplicación de entrenamiento optimizada para tu resultado objetivo. Tienes el control completo sobre la funcionalidad de la aplicación de entrenamiento. Es decir, puedes fijar cualquier objetivo, usar cualquier algoritmo, desarrollar tus propias funciones o métricas de pérdida, o hacer cualquier otra personalización.
Con BigQuery ML, puedes entrenar modelos mediante los datos de BigQuery directamente en BigQuery. Mediante los comandos de SQL, puedes crear con rapidez un modelo y usarlo para obtener predicciones por lotes.
Para comparar la funcionalidad y experiencia diferentes que se requieren para cada servicio, revisa la siguiente tabla.
AutoML | Entrenamiento personalizado | BigQuery ML | |
---|---|---|---|
Experiencia necesaria en ciencia de datos | No | Sí, para desarrollar la aplicación de entrenamiento y también algo de la preparación de datos, como la ingeniería de atributos. | No. |
Habilidad de programación necesaria | No, AutoML no requiere código. | Sí, para desarrollar la aplicación de entrenamiento. | Habilidad de programación de SQL que se requiere para compilar, evaluar y usar el modelo en BigQuery ML. |
Tiempo para generar el modelo entrenado | Menor. Se requiere menos preparación de datos y no se necesita desarrollo. | Mayor. Se requiere más preparación de datos y se necesita desarrollar aplicaciones de entrenamiento. | Menor. La velocidad de desarrollo de modelos aumenta, ya que no necesitas compilar la infraestructura necesaria para las predicciones por lotes o el entrenamiento de modelos porque la AA de BigQuery aprovecha el motor de procesamiento de BigQuery. Esto aumenta la velocidad del entrenamiento, la evaluación y la predicción. |
Límites de los objetivos de aprendizaje automático | Sí, es necesario fijar uno de los objetivos predefinidos de AutoML. | No | Sí. |
Se puede optimizar el rendimiento de los modelos de forma manual con el ajuste de hiperparámetros | No. AutoML realiza un ajuste de hiperparámetros automatizado, pero no puedes modificar los valores usados. | Sí. Puedes ajustar el modelo durante cada ejecución de entrenamiento para la experimentación y la comparación. | Sí. BigQuery ML es compatible con el ajuste de hiperparámetros cuando se entrenan modelos de AA con sentencias `CREATE MODEL`. |
Se pueden controlar aspectos del entorno de entrenamiento | Limitado. Para los conjuntos de datos tabulares y de imágenes, puedes especificar la cantidad de horas de procesamiento de nodo que se entrenarán y si permitirás la detención anticipada del entrenamiento. | Sí. Puedes especificar aspectos del entorno, como el tipo de máquina de Compute Engine, el tamaño del disco, el framework de aprendizaje automático y la cantidad de nodos. | No. |
Límites de tamaño de los datos |
Sí. AutoML usa conjuntos de datos administrados. Las limitaciones de tamaño de los datos varían según el tipo de conjunto de datos. Consulta uno de los siguientes temas para obtener información específica: |
En el caso de los conjuntos de datos no administrados, tienen los mismos límites que los objetos de conjuntos de datos administrados que crea y aloja Vertex AI y se usan para entrenar modelos de AutoML. | Sí. BigQuery ML aplica las cuotas adecuadas para cada proyecto. Para obtener más información, consulta Cuotas y límites. |
¿Qué sigue?
- Elige un instructivo introductorio para comenzar con Vertex AI Training.
- Obtén más información sobre el entrenamiento de un modelo de AutoML.
- Obtén más información sobre cómo crear un trabajo de entrenamiento personalizado con Python.