Datos tabulares de Hello: crea un conjunto de datos y entrena un modelo de clasificación de AutoML

Usa la consola de Google Cloud para crear un conjunto de datos tabular y entrenar un modelo de clasificación.

Cree un conjunto de datos tabular

  1. En la sección Vertex AI de la consola de Google Cloud, ve a la página Conjuntos de datos.

    Ir a la página Conjuntos de datos

  2. Haz clic en Crear en la barra de botones para crear un conjunto de datos nuevo.

  3. Ingresa Structured_AutoML_Tutorial para el nombre del conjunto de datos y selecciona la pestaña Tabular.

  4. Selecciona el objetivo Regresión/Clasificación.

    Deja la Región configurada como us-central1.

  5. Haga clic en Crear para crear el conjunto de datos.

    Para este instructivo, usarás un conjunto de datos bancario disponible de forma pública y alojado en Cloud Storage.

  6. En Selecciona una fuente de datos, haz clic en Seleccionar archivos CSV desde Cloud Storage.

  7. En Importar ruta de archivo, ingresa cloud-ml-tables-data/bank-marketing.csv.

  8. Haz clic en Continuar.

Analiza el conjunto de datos

La sección de análisis te permite ver más información sobre el conjunto de datos, como los valores faltantes o NULL.

Debido a que el conjunto de datos tiene el formato correcto para este instructivo, no necesitas hacer nada en esta página y puedes omitir esta sección.

  1. Opcional. Haz clic en Generar estadísticas para ver la cantidad de valores faltantes o NULL en el conjunto de datos. Este proceso puede tardar 10 minutos o más.

  2. Opcional: Haz clic en una de las columnas de atributos para obtener más información sobre los valores de datos.

Entrene un modelo de clasificación de AutoML

  1. Haga clic en Entrenar un modelo nuevo.

  2. Selecciona Otros.

  3. En el panel Método de entrenamiento, confirma que el conjunto de datos que creaste antes esté seleccionado para el campo Conjunto de datos.

  4. En el campo Objetivo, selecciona Clasificación.

  5. Confirma que el método de entrenamiento de AutoML esté seleccionado.

  6. Haz clic en Continuar.

  7. En el panel Detalles del modelo, selecciona Depósito para la columna de destino y haz clic en Continuar.

    Entrenaremos el modelo para que prediga el valor de la columna objetivo. En el conjunto de datos bank-marketing.csv, la columna Deposit indica si el cliente compró un depósito a plazo (2 = sí, 1 = no).

    El panel Opciones de entrenamiento te da la oportunidad de agregar atributos y transformar datos de columna. Si no hay columnas seleccionadas, todas las columnas que no sean objetivo se usarán como atributos para el entrenamiento de forma predeterminada. Este conjunto de datos está listo para usarse, por lo que no es necesario aplicar transformaciones.

  8. Haz clic en Continuar.

  9. En el panel Procesamiento y precio, ingresa 1 para el presupuesto de entrenamiento.

    El presupuesto de entrenamiento determina el tiempo de entrenamiento real, pero el tiempo para completarlo incluye otras actividades, por lo que todo el proceso puede tardar más de una hora. Cuando el modelo termina de entrenarse, se muestra en la pestaña del modelo como un vínculo disponible junto a un ícono de estado con una marca de verificación verde.

  10. Haga clic en Comenzar entrenamiento.

¿Qué sigue?

Tu modelo ya se está entrenando y esta tarea puede tardar una hora o más en completarse. Cuando termine el entrenamiento, recibirás un correo electrónico. Cuando tu modelo haya finalizado el entrenamiento, sigue la página siguiente de este instructivo para implementar tu modelo y solicitar una predicción.

En este instructivo, se usa un conjunto de datos que se limpió y al que se agregó el formato necesario para el entrenamiento de AutoML, pero la mayoría de los datos necesitarán algunos cambios antes de que estén listos para usarse. La calidad de los datos de entrenamiento influye en la eficacia de los modelos que crees. Obtén más información sobre la preparación de datos.

La obtención y la preparación de tus datos es fundamental para garantizar un modelo de aprendizaje automático preciso. Obtén más información sobre las recomendaciones.

Obtén más información sobre cómo crear un conjunto de datos tabulares.

Vertex AI ofrece dos métodos de entrenamiento de modelos: AutoML y el entrenamiento personalizado. AutoML te permite entrenar con un esfuerzo mínimo y una experiencia de aprendizaje automático, mientras que el entrenamiento personalizado te brinda control total de su funcionalidad. Más información sobre los métodos de entrenamiento.

Vertex AI examina el tipo de datos de origen y los valores de los atributos y también infiere cómo se usarán esos atributos en el entrenamiento de modelos. Se recomienda que revises el tipo de datos de cada columna para verificar que se haya interpretado correctamente. Si es necesario, puedes especificar una transformación compatible diferente para un atributo. Más información sobre las transformaciones.

Obtén más información sobre cómo entrenar AutoML para una clasificación o regresión.