Vertex AI Model Optimizer

Vertex AI Model Optimizer es un endpoint dinámico diseñado para simplificar la selección de modelos aplicando automáticamente el modelo de Gemini que mejor se adapte a tus necesidades. De esta forma, puedes dirigir tus peticiones a un único metaendpoint y el servicio seleccionará de forma inteligente el modelo de Gemini más adecuado para tu consulta (Pro, Flash, etc.) en función de tus preferencias de coste y calidad.

Para obtener más información sobre los precios de Model Optimizer, consulta la página de precios.

Ventajas

Model Optimizer te permite hacer lo siguiente:

  • Simplifica la selección de modelos en lugar de elegir un modelo para cada aplicación
  • Optimiza los costes, la calidad o ambos para equilibrar el rendimiento y el presupuesto
  • Integración perfecta con las APIs y los SDKs de Gemini
  • Monitorizar el uso e identificar posibles ahorros
  • Gestionar de forma eficiente las tareas basadas en texto sin necesidad de seleccionar manualmente el endpoint

Modelos admitidos

Idiomas disponibles

Model Optimizer admite todos los idiomas que también admiten los modelos de Gemini. Consulta los idiomas disponibles en Gemini.

Modalidad

Model Optimizer admite casos prácticos de texto, como los siguientes:

  • Programación, incluidas llamadas de funciones y ejecución de código
  • Creación de resúmenes
  • Conversación de un solo turno y multiturno
  • Preguntas y respuestas

Para obtener información sobre las limitaciones y cómo gestionarlas, consulte el artículo Gestionar funciones no admitidas.

Primeros pasos

Para empezar a usar Model Optimizer, consulta nuestro cuaderno de Colab de inicio rápido.

Usar Vertex AI Model Optimizer

Python

Instalar

pip install --upgrade google-genai

Para obtener más información, consulta la documentación de referencia del SDK.

Define variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

#     from google import genai
#     from google.genai.types import (
#         FeatureSelectionPreference,
#         GenerateContentConfig,
#         HttpOptions,
#         ModelSelectionConfig
#     )
#
#     client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
#     response = client.models.generate_content(
#         model="model-optimizer-exp-04-09",
#         contents="How does AI work?",
#         config=GenerateContentConfig(
#             model_selection_config=ModelSelectionConfig(
#                 feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
#             ),
#         ),
#     )
#     print(response.text)
#     # Example response:
#     # Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#     #
#     # Here's a simplified overview:
#     # ...

Go

Consulta cómo instalar o actualizar Go.

Para obtener más información, consulta la documentación de referencia del SDK.

Define variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

import (
	"context"
	"fmt"
	"io"

	"google.golang.org/genai"
)

// generateModelOptimizerWithTxt shows how to generate text using a text prompt and model optimizer.
func generateModelOptimizerWithTxt(w io.Writer) error {
	ctx := context.Background()

	clientConfig := &genai.ClientConfig{
		HTTPOptions: genai.HTTPOptions{APIVersion: "v1beta1"},
	}

	client, err := genai.NewClient(ctx, clientConfig)

	if err != nil {
		return fmt.Errorf("failed to create genai client: %w", err)
	}

	modelSelectionConfig := &genai.ModelSelectionConfig{
		FeatureSelectionPreference: genai.FeatureSelectionPreferenceBalanced,
	}

	generateContentConfig := &genai.GenerateContentConfig{
		ModelSelectionConfig: modelSelectionConfig,
	}

	modelName := "gemini-2.5-flash"
	contents := genai.Text("How does AI work?")

	resp, err := client.Models.GenerateContent(ctx,
		modelName,
		contents,
		generateContentConfig,
	)
	if err != nil {
		return fmt.Errorf("failed to generate content: %w", err)
	}

	respText := resp.Text()

	fmt.Fprintln(w, respText)
	// Example response:
	// That's a great question! Understanding how AI works can feel like ...
	// ...
	// **1. The Foundation: Data and Algorithms**
	// ...

	return nil
}

Gestionar funciones no admitidas

Model Optimizer solo admite entradas y salidas de texto. Sin embargo, la solicitud podría incluir modalidades o herramientas diferentes que no se admiten. En las siguientes secciones se explica cómo gestiona Model Optimizer estas funciones no admitidas.

Solicitudes multimodales

Las solicitudes que incluyan peticiones con datos multimodales, como vídeo, imágenes o audio, devolverán un error INVALID_ARGUMENT.

Herramientas no admitidas

Model Optimizer solo admite la declaración de funciones para las solicitudes. Si una solicitud contiene otros tipos de herramientas, como google_maps, google_search, enterprise_web_search, retrieval o browse, se produce un error INVALID_ARGUMENT.

Enviar comentarios

Para enviar comentarios sobre tu experiencia con Model Optimizer, rellena nuestra encuesta de opinión.

Si tienes alguna pregunta, problema técnico o comentario sobre Model Optimizer, ponte en contacto con model-optimizer-support@google.com.

Grupo de debate con clientes

Para ponerte en contacto directamente con el equipo de desarrollo, puedes unirte al grupo de escucha de Vertex AI Model Optimizer, donde podrás obtener información sobre el producto y ayudarnos a entender cómo hacer que las funciones funcionen mejor para ti. Entre las actividades del grupo se incluyen las siguientes:

  • Talleres virtuales para obtener más información sobre las funciones
  • Encuestas de comentarios para compartir tus necesidades y prioridades
  • Sesiones individuales con Google Cloud empleados para descubrir nuevas funciones

Las actividades se ofrecen aproximadamente una vez cada 6-8 semanas. Puedes participar en tantas como quieras o dejar de hacerlo por completo en cualquier momento. Para unirte al grupo, rellena el formulario de registro del grupo de debate de Vertex AI Model Optimizer.