df_for_prediction
para hacer una solicitud de predicción. La solicitud de predicción invoca tu modelo para predecir qué especie de pingüino se representa con las características de pingüino de cada fila de df_for_prediction
.
Preparar datos de prueba de predicción
Antes de poder usar los datos de prueba para crear predicciones, debes eliminar la columna species
. Como lo que quieres predecir es la especie de pingüino, no se puede incluir en los datos de prueba que se usan para crear una predicción. Después de quitar la columna species
, convierte los datos en una lista de Python, ya que es lo que el método predict
toma como entrada. Ejecuta el siguiente código para convertir tus datos en una lista de Python:
# Remove the species column
df_for_prediction.pop(LABEL_COLUMN)
# Convert data to a Python list
test_data_list = df_for_prediction.values.tolist()
(Opcional) Ver datos de prueba
Para entender los datos de prueba, puedes ejecutar la siguiente línea de código para verlos:
test_data_list
En cada fila, los valores correspondientes de cada una de las seis columnas hacen referencia a las siguientes características de un pingüino:
Columna | Característica de Penguin |
---|---|
0 | island : isla donde se encuentra una especie de pingüino. La asignación de valores de la isla es 0 para Dream , 1 para Biscoe y 2 para Torgersen . |
1 | culmen_length_mm : longitud de la cresta a lo largo de la parte superior del pico de un pingüino. |
2 | culmen_depth_mm : altura del pico de un pingüino. |
3 | flipper_length_mm : longitud del ala en forma de aleta de un pingüino. |
4 | body_mass_g : la masa del cuerpo de un bolígrafo. |
5 | sex : sexo del pingüino. 0 es FEMALE y 1 es MALE . |
Enviar la solicitud de predicción
Para crear una solicitud de predicción, pasa la lista de Python de datos de prueba que has creado al método predict
de endpoint
.
El método predict
evalúa las características de cada fila y las usa para predecir qué tipo de pingüino representa. Ejecuta el siguiente código para crear tus predicciones. Las predicciones devueltas contienen una lista de filas, donde cada fila tiene tres columnas (Pingüino de Adelia (Pygoscelis adeliae) [columna 1], Pingüino barbijo (Pygoscelis antarctica) [columna 2] o Pingüino papúa (Pygoscelis papua) [columna 3]).
# Get your predictions.
predictions = endpoint.predict(instances=test_data_list)
# View the predictions
predictions.predictions
Cada columna de una fila contiene un valor. Cuanto mayor sea el valor, mayor será la confianza de que la especie de pingüino representada por esa columna sea una predicción correcta. Por ejemplo, en la siguiente fila de salida de predicción de muestra, el modelo usa las características de la fila de datos de pingüino de muestra para predecir que el pingüino es muy probablemente de la especie pingüino de Adelia (Pygoscelis adeliae). Esto se debe a que el valor más alto, 0.732703805
, está en la primera columna.
[0.732703805, 0.233752429, 0.0335437432]
En el siguiente código, el método argmax
de NumPy devuelve la columna de cada fila
que contiene el valor más alto. El valor más alto corresponde a la predicción que tiene más probabilidades de ser correcta. La segunda línea muestra la matriz de predicciones.
# Get the prediction for each set of input data.
species_predictions = np.argmax(predictions.predictions, axis=1)
# View the best prediction for the penguin characteristics in each row.
species_predictions
Cada resultado de la matriz species_predictions
predice a qué especie de pingüino corresponden los valores de la fila de datos de prueba correspondiente. Por ejemplo, el primer valor es 0
, que se corresponde con la especie pingüino de Adelia (Pygoscelis adeliae). Esto significa que tu modelo predice que la especie de un pingüino con las características de la primera fila de tus datos de prueba es pingüino de Adelia (Pygoscelis adeliae).
Eliminar los recursos
Ahora que has terminado, puedes seguir usando tu cuaderno para explorar y obtener más información sobre los recursos que has creado y cómo funcionan.
Eliminar recursos
Cuando lo tengas todo listo, te recomendamos que elimines los recursos de Google Cloud que hayas creado durante este tutorial para no incurrir en cargos innecesarios. Hay dos formas de eliminar recursos:
Elimina el proyecto, lo que también eliminará todos los recursos asociados a él. Para obtener más información, consulta Cerrar (eliminar) proyectos.
Ejecuta el código que elimina tu tarea de entrenamiento (un objeto
CustomTrainingJob
), el modelo (un objetoModel
), el endpoint (un objetoEndpoint
) y el segmento de Cloud Storage. Con esta opción, se conservarán tu proyecto y cualquier otro recurso que hayas creado y que no hayas eliminado explícitamente con tu código.Debes retirar tu modelo antes de poder eliminarlo pasando
force=True
al métodoendpoint.delete
.Para conservar tu proyecto y eliminar solo los recursos que has creado durante este tutorial, ejecuta el siguiente código en tu cuaderno:
import os
# Delete the training job
job.delete()
# Delete the endpoint and undeploy the model from it
endpoint.delete(force=True)
# Delete the model
model.delete()
# Delete the storage bucket and its contents
bucket.delete(force=True)
Eliminar una instancia de Vertex AI Workbench
Puedes conservar tu instancia de Vertex AI Workbench para usarla en el futuro. Si lo conservas, asegúrate de conocer su coste. Para obtener más información, consulta los precios de Vertex AI Workbench.
Si quieres eliminar la instancia de Vertex AI Workbench, haz lo siguiente:
En la Google Cloud consola, ve a la página Instancias de Vertex AI Workbench.
Selecciona tu instancia de Vertex AI Workbench.
En el menú de la parte superior, haz clic en
Eliminar.En el cuadro de diálogo de confirmación Eliminar instancia, haz clic en Confirmar. La eliminación tarda unos minutos en completarse.