Migra tu aplicación a Gemini 2 con la API de Gemini en Vertex AI

En esta guía, se muestra cómo migrar aplicaciones de IA generativa de los modelos de Gemini 1.x y PaLM a los modelos de Gemini 2.

¿Por qué migrar a Gemini 2?

Gemini 2 ofrece mejoras significativas en el rendimiento en comparación con los modelos Gemini 1.x y PaLM, además de nuevas funciones. Además, cada versión del modelo tiene su propio período de disponibilidad y compatibilidad con versiones.

La actualización de la mayoría de las aplicaciones de IA generativa a Gemini 2 no debería requerir una reingeniería significativa de las instrucciones o el código. Sin embargo, algunas aplicaciones requieren cambios inmediatos, y estos cambios son difíciles de predecir sin ejecutar una instrucción primero a través de Gemini 2. Por lo tanto, se recomienda realizar pruebas de Gemini 2 antes de la migración.

Los cambios significativos en el código solo son necesarios para ciertos cambios drásticos o para usar las nuevas funciones de Gemini 2.

¿A qué modelo de Gemini 2 debo migrar?

Cuando elijas un modelo de Gemini 2 al que migrar, deberás tener en cuenta las funciones que requiere tu aplicación, así como el costo de esas funciones.

Para obtener una descripción general de las funciones del modelo Gemini 2, consulta Gemini 2. Para obtener una descripción general de todos los modelos de Google, consulta Modelos de Google.

Para comparar los modelos de Gemini disponibles, consulta la siguiente tabla.

Función Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
Modalidades de entrada texto, documentos, imágenes, videos y audio texto, documentos, imágenes, videos y audio texto, documentos, imágenes, videos y audio texto, documentos, imágenes, videos y audio texto, documentos, imágenes, videos y audio texto, documentos, imágenes, videos y audio
Modalidades de salida texto texto texto texto texto texto
Ventana de contexto, límite total de tokens 2,097,152 1,048,576 1,048,576 1,048,576 1,048,576 1,048,576
Longitud del contexto de salida 8,192 8,192 8,192 8,192 64,192 64,192
Fundamentación con la Búsqueda No
Llamada a función
Ejecución de código No No No
Almacenamiento en caché de contexto No
Predicción por lotes
API de Live No No No No No No
Latencia La más capaz de la familia 1.5 La más rápida en la familia 1.5 Rápido y con buena rentabilidad Rápido y rentable Es más lento que Flash, pero tiene una buena eficiencia de costos. Rápido y rentable
Ajuste
SDK recomendado SDK de Vertex AI SDK de Vertex AI SDK de IA generativa SDK de IA generativa SDK de IA generativa SDK de IA generativa
Unidades de precio “Basado “Basado Token Token Token Token

Descripción general del proceso de migración

En este documento, se describe un proceso de ocho pasos para migrar tu aplicación a Gemini 2. Usa el siguiente diagrama para navegar a cada paso.

Proceso

Antes de comenzar

Documenta los requisitos de evaluación y prueba del modelo

Actualizaciones y pruebas de código

Evaluación sin conexión

Evalúa los resultados de la evaluación y ajusta las instrucciones y los hiperparámetros de Gemini 2

Pruebas de carga

Evaluación en línea

Implementación de producción

Mejora el rendimiento del modelo

A medida que completes la migración, sigue las siguientes sugerencias para maximizar el rendimiento del modelo de Gemini 2:

  • Inspecciona las instrucciones del sistema, los prompts y los ejemplos de aprendizaje con pocos intentos para detectar incoherencias, contradicciones o instrucciones y ejemplos irrelevantes.
  • Prueba un modelo más potente. Por ejemplo, si evaluaste Gemini 2.0 Flash-Lite, prueba Gemini 2.0 Flash.
  • Examina los resultados de la evaluación automatizada para asegurarte de que coincidan con el juicio humano, en especial los resultados que usan un modelo de juez. Asegúrate de que las instrucciones de tu modelo de juez no contengan inconsistencias ni ambigüedades.
  • Una forma de mejorar las instrucciones del modelo de juez es probarlas con varias personas de forma aislada y ver si sus juicios son coherentes. Si las personas interpretan las instrucciones de manera diferente y emiten juicios distintos, las instrucciones de tu modelo de juez son ambiguas.
  • Ajusta el modelo de Gemini 2.
  • Examina los resultados de la evaluación para buscar patrones que muestren tipos específicos de fallas. Agrupar las fallas en diferentes modelos, tipos o categorías te brinda datos de evaluación más segmentados, lo que facilita el ajuste de las instrucciones para abordar estos errores.
  • Asegúrate de evaluar de forma independiente los diferentes componentes de la IA generativa.
  • Experimenta con el ajuste de los parámetros de muestreo de tokens.

Obtén ayuda

Si necesitas ayuda, Google Cloud ofrece paquetes de asistencia para satisfacer tus necesidades, como asistencia telefónica, cobertura las 24 horas, todos los días y acceso a un administrador de asistencia técnica. Para obtener más información, consulta la asistencia de Google Cloud.

¿Qué sigue?