Para implementar un modelo con la CLI de gcloud o la API de Vertex AI, primero debes crear un extremo público.
Si ya tienes un extremo público existente, puedes omitir este paso y continuar con Cómo implementar un modelo con la CLI de gcloud o la API de Vertex AI.
En este documento, se describe el proceso para crear un nuevo extremo público.
Crea un extremo público dedicado (recomendado)
El tiempo de espera de solicitudes predeterminado para un extremo público dedicado es de 10 minutos.
En la API de Vertex AI y el SDK de Vertex AI para Python, puedes especificar un tiempo de espera de solicitud diferente de manera opcional. Para ello, agrega un objeto clientConnectionConfig
que contenga un valor inferenceTimeout
nuevo, como se muestra en el siguiente ejemplo. El valor máximo de tiempo de espera es de 3,600 segundos (1 hora).
Consola de Google Cloud
-
En la consola de Google Cloud, en la sección Vertex AI, ve
a la página Predicción en línea.
Ve a la página Predicción en línea - Haz clic en Crear.
- En el panel Nuevo extremo, haz lo siguiente:
- Ingresa el Nombre del extremo.
- Selecciona Estándar para el tipo de acceso.
- Selecciona la casilla de verificación Habilitar DNS dedicado.
- Haz clic en Continuar.
- Haz clic en Listo.
REST
Antes de usar cualquiera de los datos de solicitud a continuación, haz los siguientes reemplazos:
- LOCATION_ID: Tu región.
- PROJECT_ID: El ID del proyecto.
- ENDPOINT_NAME: el nombre visible para el extremo.
- INFERENCE_TIMEOUT_SECS: Es la cantidad de segundos en el campo opcional
inferenceTimeout
(opcional).
Método HTTP y URL:
POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/endpoints
Cuerpo JSON de la solicitud:
{ "display_name": "ENDPOINT_NAME" "dedicatedEndpointEnabled": true, "clientConnectionConfig": { "inferenceTimeout": { "seconds": INFERENCE_TIMEOUT_SECS } } }
Para enviar tu solicitud, expande una de estas opciones:
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/endpoints/ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreateEndpointOperationMetadata", "genericMetadata": { "createTime": "2020-11-05T17:45:42.812656Z", "updateTime": "2020-11-05T17:45:42.812656Z" } } }
"done":
true
.
Python
Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Reemplaza lo siguiente:
- PROJECT_ID: ID del proyecto
- LOCATION_ID: la región en la que usas Vertex AI.
- ENDPOINT_NAME: el nombre visible para el extremo.
- INFERENCE_TIMEOUT_SECS: Es la cantidad de segundos en el valor opcional
inference_timeout
(opcional).
from google.cloud import aiplatform
PROJECT_ID = "PROJECT_ID"
LOCATION = "LOCATION_ID"
ENDPOINT_NAME = "ENDPOINT_NAME"
INFERENCE_TIMEOUT_SECS = "INFERENCE_TIMEOUT_SECS"
aiplatform.init(
project=PROJECT_ID,
location=LOCATION,
api_endpoint=ENDPOINT_NAME,
)
dedicated_endpoint = aiplatform.Endpoint.create(
display_name=DISPLAY_NAME,
dedicated_endpoint_enabled=True,
sync=True,
inference_timeout=INFERENCE_TIMEOUT_SECS,
)
Crea un extremo público compartido
Consola de Google Cloud
-
En la consola de Google Cloud, en la sección Vertex AI, ve
a la página Predicción en línea.
Ve a la página Predicción en línea - Haz clic en Crear.
- En el panel Nuevo extremo, haz lo siguiente:
- Ingresa el Nombre del extremo.
- Selecciona Estándar para el tipo de acceso.
- Haz clic en Continuar.
- Haz clic en Listo.
gcloud
En el siguiente ejemplo, se usa el comando gcloud ai endpoints create
:
gcloud ai endpoints create \
--region=LOCATION_ID \
--display-name=ENDPOINT_NAME
Reemplaza lo siguiente:
- LOCATION_ID: la región en la que usas Vertex AI.
- ENDPOINT_NAME: el nombre visible para el extremo.
La herramienta de la CLI de Google Cloud puede tardar unos segundos en crear el extremo.
REST
Antes de usar cualquiera de los datos de solicitud a continuación, haz los siguientes reemplazos:
- LOCATION_ID: Tu región.
- PROJECT_ID: El ID del proyecto.
- ENDPOINT_NAME: el nombre visible para el extremo.
Método HTTP y URL:
POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/endpoints
Cuerpo JSON de la solicitud:
{ "display_name": "ENDPOINT_NAME" }
Para enviar tu solicitud, expande una de estas opciones:
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/endpoints/ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreateEndpointOperationMetadata", "genericMetadata": { "createTime": "2020-11-05T17:45:42.812656Z", "updateTime": "2020-11-05T17:45:42.812656Z" } } }
"done":
true
.
Terraform
En el siguiente ejemplo, se usa el recurso google_vertex_ai_endpoint
de Terraform para crear un extremo.
Si deseas obtener más información para aplicar o quitar una configuración de Terraform, consulta los comandos básicos de Terraform.
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Java.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Antes de probar este ejemplo, sigue las instrucciones de configuración para Node.js incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Node.js.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
SDK de Vertex AI para Python
Si deseas obtener información para instalar o actualizar el SDK de Vertex AI para Python, consulta Instala el SDK de Vertex AI para Python. Si deseas obtener más información, consulta la documentación del SDK de Vertex AI de referencia de la API de Vertex para Python.
¿Qué sigue?
- Implementa un modelo con la CLI de gcloud o la API de Vertex AI.
- Obtén más información para obtener una predicción en línea.