Esta página se ha traducido con Cloud Translation API.

Modelos de Google

Modelos de Gemini destacados

2.5 Pro

Nuestro modelo de Gemini más avanzado, diseñado para resolver problemas complejos

Ideal para la comprensión multimodal
Capaz de procesar peticiones complejas y proporcionar respuestas completas
Ideal para programar, sobre todo para el desarrollo web

2.5 Flash

Nuestro mejor modelo en cuanto a relación precio-rendimiento, que ofrece funciones completas

Compatibilidad con la API Live incluida en algunos endpoints
Ver el proceso de pensamiento del modelo como parte de la respuesta
Equilibra el precio y el rendimiento.

2.5 Flash-Lite

Nuestro modelo más rentable, que admite tareas de alto rendimiento

El modelo más rápido de la línea 2.5
Incluye una ventana de contexto de 1 millón de tokens y entrada multimodal, como 2.5 Flash
Supera a 2.0 Flash en la mayoría de las evaluaciones comparativas

Modelos de Gemini disponibles de forma general

diamond Gemini 2.5 Pro Nuestro modelo de razonamiento más avanzado hasta la fecha

spark Gemini 2.5 Flash Nuestro mejor modelo en cuanto a relación calidad-precio, que ofrece funciones completas

photo_spark Gemini 2.5 Flash Image Nuestro modelo estándar actualizado para flujos de trabajo creativos rápidos con funciones de generación de imágenes y edición conversacional de varias interacciones

performance_auto Gemini 2.5 Flash-Lite Nuestro modelo más rentable, que admite tareas de alto rendimiento

spark Gemini 2.0 Flash Nuestro modelo multimodal más reciente, con funciones de última generación y capacidades mejoradas

performance_auto Gemini 2.0 Flash-Lite Un modelo de Gemini 2.0 Flash optimizado para ofrecer rentabilidad y baja latencia

Previsualizar modelos de Gemini

mic_detect_auto API Gemini 2.5 Flash Live Nuestro modelo estándar actualizado para ofrecer experiencias conversacionales en tiempo real con funciones de streaming

Modelos de Gemma

Gemma 3n Los modelos abiertos más recientes, diseñados para ejecutarse de forma eficiente en dispositivos con pocos recursos, capaces de procesar entradas multimodales, gestionar entradas de texto, imagen, vídeo y audio, y generar salidas de texto. Se han entrenado con datos en más de 140 idiomas.

Gemma 3 La tercera generación de nuestros modelos abiertos, que pueden resolver una amplia variedad de tareas con entradas de texto e imagen, admiten más de 140 idiomas y tienen una ventana de contexto larga de 128 K.

Gemma 2 La segunda generación de nuestros modelos abiertos, que pueden generar, resumir y extraer texto.

Gemma Un modelo abierto pequeño y ligero que puede generar, resumir y extraer texto.

ShieldGemma 2 Modelos ajustados para evaluar la seguridad de textos e imágenes en función de un conjunto de políticas de seguridad definidas.

PaliGemma Nuestro modelo abierto de visión y lenguaje que combina SigLIP y Gemma.

CodeGemma Modelo abierto potente y ligero que puede realizar diversas tareas de programación, como completar código, generar código, comprender el lenguaje natural, razonar matemáticamente y seguir instrucciones.

TxGemma Genera predicciones, clasificaciones o texto a partir de datos relacionados con terapias y se puede usar para crear de forma eficiente modelos de IA para tareas relacionadas con terapias con menos datos y menos recursos computacionales.

MedGemma Colección de variantes de Gemma 3 entrenadas para ofrecer un buen rendimiento en la comprensión de textos e imágenes médicos.

MedSigLIP Variante de SigLIP entrenada para codificar imágenes y texto médicos en un espacio de inserción común.

T5Gemma Una familia de modelos de investigación de codificador-decodificador ligeros pero potentes de Google.

Modelos de inserciones

width_normal Incrustaciones de texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación, la agrupación en clústeres y tareas similares

width_normal Incrustaciones multimodales Genera vectores basados en imágenes, que se pueden usar en tareas posteriores, como la clasificación y la búsqueda de imágenes, entre otras

Modelos de Imagen disponibles de forma general

photo_spark Imagen 4 para la generación Usa peticiones de texto para generar imágenes originales con una calidad superior a la de nuestros modelos de generación de imágenes anteriores

photo_spark Imagen 4 para la generación rápida Usa peticiones de texto para generar imágenes originales con una calidad superior y una latencia inferior a las de nuestros modelos de generación de imágenes anteriores

photo_spark Imagen 4 para la generación ultra Usa peticiones de texto para generar imágenes originales con una calidad superior y una mayor adecuación a las peticiones que nuestros modelos de generación de imágenes anteriores

photo_spark Imagen 3 para la generación Usa peticiones de texto para generar imágenes originales

image_edit_auto Imagen 3 para la edición y la personalización Usa peticiones de texto para editar imágenes de entrada o partes de una imagen con una máscara, o bien para generar imágenes nuevas a partir del contexto proporcionado por imágenes de referencia de entrada

photo_spark Imagen 3 para la generación rápida Usa peticiones de texto para generar imágenes originales con una latencia inferior a la de nuestros otros modelos de generación de imágenes

subtitles Imagen para subtitulado y VQA Usa peticiones de texto para generar imágenes originales, editar imágenes, editar partes de una imagen con una máscara y más

Vista previa de los modelos de Imagen

photo_spark Probador virtual Generar imágenes de personas que lleven prendas de vestir.

image_edit_auto Imagen product recontext on Vertex AI Usa peticiones de texto para editar imágenes de productos y colocarlos en diferentes escenas o fondos.

Modelos de Veo

Película Veo 2 Usa peticiones de texto e imágenes para generar vídeos originales

Película Veo 3 Usa peticiones de texto e imágenes para generar vídeos originales con una calidad superior a la de nuestro modelo de generación de vídeo anterior

Película Veo 3 Fast Usa peticiones de texto e imágenes para generar vídeos originales con una calidad superior y una latencia inferior a las de nuestro modelo de generación de vídeo anterior

Previsualizar modelos de Veo

película Vista previa de Veo 3 Usa peticiones de texto e imágenes para generar vídeos novedosos con una calidad superior a la de nuestro modelo de generación de vídeo anterior

película Vista previa de Veo 3 Fast Usa peticiones de texto e imágenes para generar vídeos novedosos con una calidad superior y una latencia inferior a las de nuestro modelo de generación de vídeo anterior

película Vista previa de Veo 3.1 Usa peticiones de texto e imágenes para generar vídeos novedosos con una calidad superior a la de nuestro modelo de generación de vídeo anterior

película Vista previa de Veo 3.1 Fast Usa peticiones de texto e imágenes para generar vídeos novedosos con una calidad superior y una latencia inferior a las de nuestro modelo de generación de vídeo anterior

película Vista previa de Veo 2 Usa peticiones de texto e imágenes para generar vídeos novedosos. Esta versión del modelo admite la función de pintura y la de expansión de imagen.

Modelos experimentales de Veo

Película Veo 2 Experimental Un modelo experimental con funciones en fase de prueba.

Modelos de MedLM

medical_information MedLM-medium Conjunto de modelos ajustados para el ámbito médico que cumplen la ley HIPAA y que se han diseñado para ayudar a los profesionales sanitarios con tareas de preguntas y respuestas médicas, así como con tareas de resumen de documentos médicos y sanitarios

clinical_notes MedLM-large-large Conjunto de modelos ajustados para el ámbito médico que cumplen la ley HIPAA y que se han diseñado para ayudar a los profesionales sanitarios con tareas de preguntas y respuestas médicas, así como con tareas de resumen de documentos médicos y sanitarios

Idiomas disponibles

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

Afrikáans (af), albanés (sq), amárico (am), árabe (ar), armenio (hy), assamés (as), azerí (az), vasco (eu), bielorruso (be), bengalí (bn), bosnio (bs), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), croata (hr), checo (cs), danés (da), dhivehi (dv), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), krio (kri), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), maratí (mr), meiteilon (manipuri) (mni-Mtei), mongol (mn), birmano (my), nepalí (ne), noruego (no), nyanja (chichewa) (ny), oriya (or), pashto (ps), persa (fa), polaco (pl), portugués (pt), punyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (cs), serbio (da), sesotho (dv), shona (nl), sindhi (en), cingalés (eo), eslovaco (et), esloveno (fil), somalí (fi), español (fr), sundanés (fy), suajili (gl), sueco (ka), tayiko (de), tamil (el), telugu (gu), tailandés (ht), turco (ha), ucraniano (haw), urdu (iw), uigur (hi), uzbeko (hmn), vietnamita (hu), galés (is), xhosa (ig), yidis (id), yoruba (ga) y zulú (it).gdsrstsnsdsiskslsoessuswsvtgtatethtrukuruguzvicyxhyiyozu

Gemma

Gemma y Gemma 2 solo admiten el idioma inglés (en). Gemma 3 y Gemma 3n admiten más de 140 idiomas.

Inserciones

Los modelos de inserción de texto multilingües admiten los siguientes idiomas:

Afrikáans (af), albanés (sq), amárico (am), árabe (ar), armenio (hy), azerí (az), vasco (eu), bielorruso (be), bengalí (bn), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), checo (cs), danés (da), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), maratí (mr), mongol (mn), birmano (my), nepalí (ne), nyanja (chichewa) (ny), noruego (no), pashto (ps), persa (fa), polaco (pl), portugués (pt), punyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (ca), serbio (sr), sesoto (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo) y zulú (zu).gd

Imagen 3

Imagen 3 admite los siguientes idiomas:

chino (simplificado y tradicional) (zh), español (es), hindi (hi), inglés (en), japonés (ja), coreano (ko) y portugués (pt).

MedLM

El modelo MedLM admite el idioma inglés (en).

Explorar todos los modelos de Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar y desplegar modelos y recursos propios de Google, así como modelos y recursos de código abierto. Para descubrir los modelos de IA generativa y las APIs disponibles en Vertex AI, ve a Model Garden en la Google Cloud consola.

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta el artículo Descubrir modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de los modelos, incluidos los antiguos y los retirados, consulta Versiones y ciclo de vida de los modelos.

Siguientes pasos

Prueba un tutorial de inicio rápido con Vertex AI Studio o la API de Vertex AI.
Explora los modelos preentrenados en Model Garden.
Consulta cómo controlar el acceso a modelos específicos de Model Garden mediante una política de organización de Model Garden.
Consulta información sobre los precios.