Configura los parámetros del modelo de Gemini

Genera texto a partir de una imagen con el modelo de Gemini y muestra el texto generado. En este ejemplo, se muestra cómo establecer los parámetros de configuración del modelo.

Muestra de código

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.

Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

import base64
import vertexai

from vertexai.generative_models import GenerationConfig, GenerativeModel, Part

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

model = GenerativeModel("gemini-1.5-flash-002")

# Load example image from local storage
encoded_image = base64.b64encode(open("scones.jpg", "rb").read()).decode("utf-8")
image_content = Part.from_data(
    data=base64.b64decode(encoded_image), mime_type="image/jpeg"
)

# Generation Config
config = GenerationConfig(
    max_output_tokens=2048, temperature=0.4, top_p=1, top_k=32
)

# Generate text
response = model.generate_content(
    [image_content, "what is this image?"], generation_config=config
)
print(response.text)
# Example response:
# That's a lovely overhead shot of a rustic still life featuring blueberry scones.
# Here's a breakdown of what's in the image:
# * **Blueberry Scones:** Several freshly baked blueberry scones are arranged on
# a piece of parchment paper. They appear to be homemade and slightly crumbly.
# ...

¿Qué sigue?

Para buscar y filtrar muestras de código para otros productos de Google Cloud, consulta el navegador de muestra de Google Cloud.