Se usó la API de Cloud Translation para traducir esta página.

Modelos de Google

Modelos de Gemini destacados

2.5 Pro

Nuestro modelo de razonamiento más avanzado de Gemini, creado para resolver problemas complejos

Ideal para la comprensión multimodal
Capaz de procesar instrucciones complejas y brindar respuestas completas
Ideal para la programación, en especial para el desarrollo web

2.5 Flash

Nuestro mejor modelo en términos de precio y rendimiento, que ofrece capacidades integrales

Se incluyó compatibilidad con la API de Live para algunos extremos
Ver el proceso de razonamiento del modelo como parte de la respuesta
Equilibra el precio y el rendimiento

2.5 Flash-Lite

Nuestro modelo más rentable que admite tareas de alto rendimiento

El modelo más rápido de la línea de modelos 2.5
Cuenta con una ventana de contexto de 1 millón de tokens y entrada multimodal, como 2.5 Flash
Supera a 2.0 Flash en la mayoría de los parámetros de evaluación

Modelos de Gemini disponibles de forma general

diamond Gemini 2.5 Pro Nuestro modelo de razonamiento más avanzado hasta la fecha

spark Gemini 2.5 Flash Nuestro mejor modelo en términos de relación precio-rendimiento, que ofrece capacidades integrales

photo_spark Gemini 2.5 Flash Image Nuestro modelo estándar actualizado para flujos de trabajo creativos rápidos con capacidades de generación de imágenes y edición conversacional de varios turnos

performance_auto Gemini 2.5 Flash-Lite Nuestro modelo más rentable que admite tareas de alto rendimiento

spark Gemini 2.0 Flash Nuestro modelo multimodal más reciente, con funciones de próxima generación y capacidades mejoradas

performance_auto Gemini 2.0 Flash-Lite Un modelo de Gemini 2.0 Flash optimizado para la rentabilidad y la baja latencia

Vista previa de los modelos de Gemini

mic_detect_auto API de Gemini 2.5 Flash Live Nuestro modelo estándar actualizado para experiencias conversacionales en tiempo real con capacidades de transmisión

Modelos de Gemma

Gemma 3n Los modelos abiertos más recientes, diseñados para una ejecución eficiente en dispositivos de bajos recursos, capaces de entrada multimodal, gestión de texto, imágenes, vídeo y audio, y generación de salidas de texto, y entrenados con datos en más de 140 idiomas.

Gemma 3 La tercera generación de nuestros modelos abiertos, con la capacidad de resolver una amplia variedad de tareas con entrada de texto e imágenes, compatibilidad con más de 140 idiomas y una ventana de contexto de 128 K.

Gemma 2 La segunda generación de nuestros modelos abiertos con generación, resumen y extracción de texto.

Gemma Un modelo abierto, ligero y de tamaño pequeño que admite la generación, el resumen y la extracción de texto

ShieldGemma 2 Modelos optimizados por instrucciones para evaluar la seguridad del texto y las imágenes frente a un conjunto de políticas de seguridad definidas

PaliGemma Nuestro modelo de visión-lenguaje abierto que combina SigLIP y Gemma

CodeGemma Modelo abierto, ligero y potente que puede realizar diversas tareas de codificación, como la finalización de código con relleno intermedio, la generación de código, la comprensión del lenguaje natural y el razonamiento matemático. y seguimiento de instrucciones

TxGemma Genera predicciones, clasificaciones o texto basados en datos relacionados con la terapia y se puede usar para construir eficientemente modelos de IA para tareas relacionadas con la terapia con menos datos y menos computación

MedGemma Colección de variantes de Gemma 3 que se entrenan para el rendimiento en la comprensión de textos e imágenes médicas

MedSigLIP Variante de SigLIP que se entrena para codificar imágenes y textos médicos en un espacio de incrustación común

T5Gemma Una familia de modelos de investigación de codificadores y decodificadores ligeros pero potentes de Google

Modelos de embeddings

width_normal Incorporaciones para texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación, el agrupamiento en clústeres y tareas similares

width_normal Incorporaciones multimodales Genera vectores basados en imágenes, que se pueden usar para tareas posteriores, como la clasificación de imágenes, la búsqueda de imágenes y mucho más

Modelos de Imagen disponibles de forma general

photo_spark Imagen 4 for Generation Usa instrucciones de texto para generar imágenes novedosas con mayor calidad que nuestros modelos anteriores de generación de imágenes

photo_spark Imagen 4 for Fast Generation Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y menor latencia que nuestros modelos anteriores de generación de imágenes

photo_spark Imagen 4 for Ultra Generation Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y mejor cumplimiento de las instrucciones que nuestros modelos anteriores de generación de imágenes

photo_spark Imagen 3 for Generation Usa instrucciones de texto para generar imágenes novedosas

image_edit_auto Imagen 3 for Editing and Customization Usa instrucciones de texto para editar imágenes de entrada existentes o partes de una imagen con una máscara, o bien genera imágenes nuevas según el contexto proporcionado por las imágenes de referencia de entrada

photo_spark Imagen 3 for Fast Generation Usa instrucciones de texto para generar imágenes novedosas con menor latencia que nuestros otros modelos de generación de imágenes

subtitles Imagen for Captioning & VQA Usa instrucciones de texto para generar imágenes novedosas, editar las existentes, editar partes de una imagen con una máscara y mucho más

Vista previa de los modelos de Imagen

photo_spark Probador virtual Genera imágenes de personas que visten productos de indumentaria.

image_edit_auto Recontextualización de productos de Imagen en Vertex AI Usa instrucciones de texto para editar imágenes de productos en diferentes escenas o fondos.

Modelos de Veo

movie Veo 2 Usa instrucciones de texto e imágenes para generar videos novedosos

movie Veo 3 Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad que nuestro modelo anterior de generación de videos

movie Veo 3 Fast Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad y menor latencia que nuestro modelo anterior de generación de videos

Obtén una vista previa de los modelos de Veo

movie Versión preliminar de Veo 3 Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad que nuestro modelo anterior de generación de videos

movie Versión preliminar de Veo 3 Fast Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad y menor latencia que nuestro modelo anterior de generación de videos

movie Versión preliminar de Veo 3.1 Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad que nuestro modelo anterior de generación de videos

movie Versión preliminar de Veo 3.1 Fast Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad y menor latencia que nuestro modelo anterior de generación de videos

movie Versión preliminar de Veo 2 Usa instrucciones de texto e imágenes para generar videos novedosos. Esta versión del modelo admite la expansión y el relleno.

Modelos experimentales de Veo

película Veo 2 Experimental Un modelo experimental con funciones en prueba

Modelos de MedLM

medical_information MedLM-medium Conjunto de modelos ajustados médicamente que cumplen con la HIPAA y están diseñados para ayudar a los profesionales de la salud con tareas de preguntas y respuestas médicas, y tareas de resumen para documentos médicos y de atención de la salud

clinical_notes MedLM-large-large Conjunto de modelos ajustados médicamente que cumplen con la HIPAA y están diseñados para ayudar a los profesionales de la salud con tareas de preguntas y respuestas médicas, y tareas de resumen para documentos médicos y de atención de la salud

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

Afrikaans (af), Albanés (sq), Amhárico (am), Árabe (ar), Armenio (hy), Asamés (as), Azerbaiyano (az), Euskera (eu), Bielorruso (be), Bengalí (bn), Bosnio (bs), Búlgaro (bg), Catalán (ca), Cebuano (ceb), Chino (simplificado y tradicional) (zh), Corso (co), Croata (hr), Checo (cs), Danés (da), Dhivehi (dv), Neerlandés (nl), Inglés (en), Esperanto (eo), Estonio (et), Filipino (tagalo) (fil), Finlandés (fi), Francés (fr), Frisón (fy), Gallego (gl), Georgiano (ka), Alemán (de), Griego (el), Guyaratí (gu), Criollo haitiano (ht), Hausa (ha), Hawaiano (haw), Hebreo (iw), Hindi (hi), Hmong (hmn), Húngaro (hu), Islandés (is), Igbo (ig), Indonesio (id), Irlandés (ga), Italiano (it), Japonés (ja), Javanés (jv), Kannada (kn), Kazajo (kk), Khmer (km), Coreano (ko), Krio (kri), Kurdo (ku), Kirguís (ky), Laosiano (lo), Latín (la), Letón (lv), Lituano (lt), Luxemburgués (lb), Macedonio (mk), Malgache (mg), Malayo (ms), Malayalam (ml), Maltés (mt), Maorí (mi), Maratí (mr), Meiteilon (manipuri) (mni-Mtei), Mongol (mn), Birmano (my), Nepalí (ne), Noruego (no), Nyanja (chichewa) (ny), Odia (oriya) (or), Pastún (ps), Persa (fa), (pl), Portugués (pt), Panyabí (pa), Rumano (ro), Ruso (ru), Samoano (sm), Gaélico escocés (gd), Serbio (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalés (si), Eslovaco (sk), Esloveno (sl), Somalí (so), Español (es), Sundanés (su), Suajili (sw), Sueco (sv), Tayiko (tg), Tamil (ta), Telugu (te), Tailandés (th), Turco (tr), Ucraniano (uk), Urdu (ur), Uigur (ug), Uzbeko (uz), Vietnamita (vi), Galés (cy), Xhosa (xh), Yidis (yi), Yoruba (yo), y zulú (zu).

Gemma

Gemma y Gemma 2 solo admiten el idioma inglés (en). Gemma 3 y Gemma 3n proporcionan asistencia multilingüe en más de 140 idiomas.

Incorporaciones

Los modelos de incorporación de texto multilingües admiten los siguientes idiomas:

afrikaans (af), albanés (sq), amhárico (am), árabe (ar), armenio (hy), azerí (az), euskera (eu), bielorruso (be), bengalí (bn), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), checo (cs), danés (da), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), marathi (mr), mongol (mn), birmano (my), nepalí (ne), nyanja (chichewa) (ny), noruego (no), pastún (ps), persa (fa), (pl), portugués (pt), panyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (gd), serbio (sr), sesotho (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo) y zulú (zu).

Imagen 3

Imagen 3 admite los siguientes idiomas:

Inglés (en), chino (simplificado y tradicional) (zh), hindi (hi), japonés (ja), coreano (ko), portugués (pt) y español (es).

MedLM

El modelo MedLM admite el idioma inglés (en).

Explora todos los modelos en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA generativa que están disponibles en Vertex AI, ve a Model Garden en la consola de Google Cloud .

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de modelos, incluidos los modelos heredados y retirados, consulta Versiones de modelos y ciclo de vida.

¿Qué sigue?

Prueba un instructivo de guía de inicio rápido con Vertex AI Studio o la API de Vertex AI.
Explora modelos previamente entrenados en Model Garden.
Descubre cómo controlar el acceso a modelos específicos en Model Garden con una política de organización de Model Garden.
Más información sobre los precios.