Usa la consola Google Cloud para crear un conjunto de datos tabulares y entrenar un modelo de clasificación.
Crear un conjunto de datos tabulares
En la Google Cloud consola, en la sección Vertex AI, vaya a la página Conjuntos de datos.
Haz clic en Crear en la barra de botones para crear un conjunto de datos.
Introduce
Structured_AutoML_Tutorial
como nombre del conjunto de datos y selecciona la pestaña Tabular.Selecciona el objetivo Regresión/Clasificación.
Deje el valor us-central1 en el campo Región.
Haz clic en Crear para crear el conjunto de datos.
En este tutorial, usarás un conjunto de datos bancarios disponible públicamente alojado en Cloud Storage.
En Seleccionar una fuente de datos, haga clic en Seleccionar archivos CSV de Cloud Storage.
En Ruta del archivo de importación, introduce
cloud-ml-tables-data/bank-marketing.csv
.Haz clic en Continuar.
Analizar el conjunto de datos
La sección de análisis le permite ver más información sobre el conjunto de datos, como los valores que faltan o los valores NULL.
Como nuestro conjunto de datos tiene el formato correcto para este tutorial, no tienes que hacer nada en esta página y puedes saltarte esta sección.
Opcional. Haga clic en Generar estadísticas para ver el número de valores que faltan o NULL en el conjunto de datos. Este proceso puede tardar 10 minutos o más.
Opcional. Haz clic en una de las columnas de funciones para obtener más información sobre los valores de los datos.
Entrenar un modelo de clasificación de AutoML
Haz clic en Entrenar un modelo nuevo.
Selecciona Otro.
En el panel Método de entrenamiento, comprueba que el conjunto de datos que has creado anteriormente esté seleccionado en el campo Conjunto de datos.
En el campo Objetivo, selecciona Clasificación.
Comprueba que el método de entrenamiento de AutoML esté seleccionado.
Haz clic en Continuar.
En el panel Detalles del modelo, selecciona Depósito en la columna de destino y haz clic en Continuar.
La columna de destino es lo que estamos usando para entrenar el modelo y que haga predicciones. En el conjunto de datos
bank-marketing.csv
, la columnaDeposit
indica si el cliente ha comprado un depósito a plazo fijo (2 = sí, 1 = no).El panel Opciones de entrenamiento te permite añadir funciones y transformar datos de columnas. Si no se selecciona ninguna columna, de forma predeterminada se usarán como funciones de entrenamiento todas las columnas que no sean de destino. Este conjunto de datos está listo para usarse, por lo que no es necesario aplicar ninguna transformación.
Haz clic en Continuar.
En el panel Computación y precios, introduce
1
en el presupuesto de entrenamiento.El presupuesto de entrenamiento es el tiempo máximo (puede variar ligeramente) que el modelo dedica al entrenamiento. Este valor se multiplica por el precio por hora de nodo para calcular el coste total del entrenamiento. Cuantas más horas de entrenamiento se dediquen, más preciso será el modelo (hasta cierto punto), pero el coste será mayor. Para el desarrollo, un presupuesto bajo es suficiente, pero para la producción es importante encontrar un equilibrio entre el coste y la precisión.
Haz clic en Iniciar entrenamiento.
Cuando el modelo termine de entrenarse, se mostrará en la pestaña de modelos como un enlace activo, con un icono de estado de marca de verificación verde.
Siguientes pasos
Tu modelo se está entrenando, lo que puede tardar una hora o más en completarse. Recibirás un correo cuando termine la preparación. Cuando tu modelo haya terminado de entrenarse, sigue las instrucciones de la página siguiente de este tutorial para desplegar tu modelo y solicitar una predicción.
En este tutorial se usa un conjunto de datos que se ha limpiado y formateado para el entrenamiento de AutoML, pero la mayoría de los datos requerirán cierto trabajo antes de que estén listos para usarse. La calidad de los datos de entrenamiento influye en la eficacia de los modelos que crees. Más información sobre cómo preparar los datos
Obtener y preparar los datos es fundamental para asegurarse de que el modelo de aprendizaje automático sea preciso. Más información sobre las prácticas recomendadas.
Más información sobre cómo crear un conjunto de datos tabulares
Vertex AI ofrece dos métodos de entrenamiento de modelos: AutoML y entrenamiento personalizado. AutoML te permite entrenar modelos sin apenas esfuerzo ni necesidad de tener experiencia en aprendizaje automático, mientras que el entrenamiento personalizado te ofrece un control total sobre la funcionalidad de entrenamiento. Más información sobre los métodos de entrenamiento
Vertex AI examina el tipo de datos de origen y los valores de las características, e infiere cómo utilizará esa característica en el entrenamiento del modelo. Te recomendamos que revises el tipo de datos de cada columna para comprobar que se ha interpretado correctamente. Si es necesario, puede especificar una transformación admitida diferente para cualquier elemento. Más información sobre las transformaciones
Más información sobre cómo entrenar un modelo de AutoML para clasificación o regresión