Para diseñar una instrucción que funcione bien, prueba diferentes versiones del mensaje y experimenta con parámetros de la instrucción para determinar qué resultados son los óptimos. Puedes probar instrucciones de manera programática con las APIs de Codey en la consola de Google Cloud con Generative AI Studio.
Mensajes de finalización de código de prueba
Para probar las instrucciones de finalización de código, elige uno de los siguientes métodos.
REST
Para probar una instrucción de finalización de código con la API de Vertex AI, envía una solicitud POST al extremo del modelo del publicador.
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
- PROJECT_ID: El ID del proyecto.
- PREFIX:
En los modelos de código,
prefix
representa el comienzo de un fragmento de código de programación significativo o una instrucción de lenguaje natural que describe el código que se generará. El modelo intenta completar el código entreprefix
ysuffix
. - SUFFIX:
para completar el código,
suffix
representa el final de un fragmento de código de programación significativo. El modelo intenta completar el código entreprefix
ysuffix
. - TEMPERATURE:
la temperatura se usa para el muestreo durante la generación de la respuesta. La temperatura controla el grado de aleatorización en la selección de tokens. Las temperaturas más bajas son buenas para los mensajes que requieren una respuesta menos
abierta o creativa, mientras que las temperaturas más altas pueden generar resultados más diversos o
creativos. Una temperatura de
0
significa que siempre se eligen los tokens de probabilidad más alta. En este caso, las respuestas para un mensaje determinado son, en su mayoría, determinísticas, pero es posible que haya una pequeña cantidad de variación. - MAX_OUTPUT_TOKENS:
Cantidad máxima de tokens que se pueden generar en la respuesta. Un token tiene casi cuatro caracteres. 100 tokens corresponden a casi 60 u 80 palabras.
Especifica un valor más bajo para las respuestas más cortas y un valor más alto para las respuestas potencialmente más largas.
- CANDIDATE_COUNT: La cantidad de variaciones de respuesta que se mostrará. Por cada solicitud, se te cobra por los
tokens de salida de todos los candidatos, pero solo se te cobra una vez por los tokens de entrada.
Especificar varios candidatos es una función de vista previa que funciona con
generateContent
(no se admitestreamGenerateContent
). Se admiten los siguientes modelos:- Gemini 1.5 Flash:
1
-8
, predeterminado:1
- Gemini 1.5 Pro:
1
-8
, predeterminado:1
- Gemini 1.0 Pro:
1
-8
, predeterminado:1
int
entre 1 y 4. - Gemini 1.5 Flash:
Método HTTP y URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/code-gecko:predict
Cuerpo JSON de la solicitud:
{ "instances": [ { "prefix": "PREFIX", "suffix": "SUFFIX"} ], "parameters": { "temperature": TEMPERATURE, "maxOutputTokens": MAX_OUTPUT_TOKENS, "candidateCount": CANDIDATE_COUNT } }
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/code-gecko:predict"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/code-gecko:predict" | Select-Object -Expand Content
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
Python
Si deseas obtener información para instalar o actualizar el SDK de Vertex AI para Python, consulta Instala el SDK de Vertex AI para Python. Si deseas obtener más información, consulta la documentación de referencia de la API de Python.
Node.js
Antes de probar este ejemplo, sigue las instrucciones de configuración para Node.js incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Node.js.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Java.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Console
Para probar un mensaje de finalización de código con Generative AI Studio en la consola de Google Cloud, haz lo siguiente:
- En la sección de Vertex AI de la consola de Google Cloud, ve a Vertex AI Studio.
- Haz clic en Comenzar.
- Haz clic en la Instrucción de código .
- En Modelo, selecciona el modelo con el nombre que comienza con
code-gecko
. Un número de tres dígitos después decode-gecko
indica el número de versión del modelo. Por ejemplo,code-gecko@002
es el nombre de la versión dos de la versión estable del modelo de finalización de código. - En Mensaje, ingresa un mensaje de finalización de código.
- Ajusta la Temperatura y el Límite de tokens para experimentar cómo afectan la respuesta. Para obtener más información, consulta Parámetros del modelo de finalización de código.
- Haz clic en Enviar para generar una respuesta.
- Haz clic en Guardar si deseas guardar una instrucción.
- Haz clic en Ver código para ver el código de Python o un comando curl para la instrucción
A continuación, se muestra un ejemplo del comando curl:
MODEL_ID="code-gecko"
PROJECT_ID=PROJECT_ID
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/${MODEL_ID}:predict -d \
$"{
'instances': [
{ 'prefix': 'def reverse_string(s):',
'suffix': ''
}
],
'parameters': {
'temperature': 0.2,
'maxOutputTokens': 64,
'candidateCount': 1
}
}"
Si deseas obtener más información sobre el diseño de mensajes para completar el código, consulta Crea instrucciones para completar el código.
Respuesta de transmisión del modelo de código
Para ver solicitudes de código y respuestas de muestra con la API de REST, consulta Ejemplos que usan la API de REST de transmisión.
Si deseas ver las solicitudes de código y las respuestas de muestra con el SDK de Vertex AI para Python, consulta Ejemplos que usan el SDK de Vertex AI para Python para la transmisión.
¿Qué sigue?
- Aprende a crear instrucciones de finalización de código.
- Aprende a crear mensajes de generación de código.
- Obtén información sobre las prácticas recomendadas de IA responsable y los filtros de seguridad de Vertex AI.