Vertex AI Model Optimizer es un endpoint dinámico diseñado para simplificar la selección de modelos aplicando automáticamente el modelo de Gemini que mejor se adapte a tus necesidades. De esta forma, puedes dirigir tus peticiones a un único metaendpoint y el servicio seleccionará de forma inteligente el modelo de Gemini más adecuado para tu consulta (Pro, Flash, etc.) en función de tus preferencias de coste y calidad.
Para obtener más información sobre los precios de Model Optimizer, consulta la página de precios.
Ventajas
Model Optimizer te permite hacer lo siguiente:
- Simplifica la selección de modelos en lugar de elegir un modelo para cada aplicación
- Optimiza los costes, la calidad o ambos para equilibrar el rendimiento y el presupuesto
- Integración perfecta con las APIs y los SDKs de Gemini
- Monitorizar el uso e identificar posibles ahorros
- Gestionar de forma eficiente las tareas basadas en texto sin necesidad de seleccionar manualmente el endpoint
Modelos admitidos
- Gemini 2.5 Flash
- Gemini 2.5 Pro
(solo endpoint
gemini-2.5-pro-exp-03-25
)
Idiomas disponibles
Model Optimizer admite todos los idiomas que también admiten los modelos de Gemini. Consulta los idiomas disponibles en Gemini.
Modalidad
Model Optimizer admite casos prácticos de texto, como los siguientes:
- Programación, incluidas llamadas de funciones y ejecución de código
- Creación de resúmenes
- Conversación de un solo turno y multiturno
- Preguntas y respuestas
Para obtener información sobre las limitaciones y cómo gestionarlas, consulte el artículo Gestionar funciones no admitidas.
Primeros pasos
Para empezar a usar Model Optimizer, consulta nuestro cuaderno de Colab de inicio rápido.
Usar Vertex AI Model Optimizer
Python
Instalar
pip install --upgrade google-genai
Para obtener más información, consulta la documentación de referencia del SDK.
Define variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Consulta cómo instalar o actualizar Go.
Para obtener más información, consulta la documentación de referencia del SDK.
Define variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Gestionar funciones no admitidas
Model Optimizer solo admite entradas y salidas de texto. Sin embargo, la solicitud podría incluir modalidades o herramientas diferentes que no se admiten. En las siguientes secciones se explica cómo gestiona Model Optimizer estas funciones no admitidas.
Solicitudes multimodales
Las solicitudes que incluyan peticiones con datos multimodales, como vídeo, imágenes o audio, devolverán un error INVALID_ARGUMENT
.
Herramientas no admitidas
Model Optimizer solo admite la declaración de funciones para las solicitudes. Si una solicitud contiene otros tipos de herramientas, como google_maps
, google_search
, enterprise_web_search
, retrieval
o browse
, se produce un error INVALID_ARGUMENT
.
Enviar comentarios
Para enviar comentarios sobre tu experiencia con Model Optimizer, rellena nuestra encuesta de opinión.
Si tienes alguna pregunta, problema técnico o comentario sobre Model Optimizer, ponte en contacto con model-optimizer-support@google.com.
Grupo de debate con clientes
Para ponerte en contacto directamente con el equipo de desarrollo, puedes unirte al grupo de escucha de Vertex AI Model Optimizer, donde podrás obtener información sobre el producto y ayudarnos a entender cómo hacer que las funciones funcionen mejor para ti. Entre las actividades del grupo se incluyen las siguientes:
- Talleres virtuales para obtener más información sobre las funciones
- Encuestas de comentarios para compartir tus necesidades y prioridades
- Sesiones individuales con Google Cloud empleados para descubrir nuevas funciones
Las actividades se ofrecen aproximadamente una vez cada 6-8 semanas. Puedes participar en tantas como quieras o dejar de hacerlo por completo en cualquier momento. Para unirte al grupo, rellena el formulario de registro del grupo de debate de Vertex AI Model Optimizer.