Modelos de Google

Modelos destacados de Gemini

Modelos de Gemini disponibles de forma general

diamond Gemini 2.5 Pro Nuestro modelo de razonamiento más avanzado hasta la fecha
spark Gemini 2.5 Flash Nuestro mejor modelo en términos de relación precio-rendimiento, que ofrece capacidades integrales
spark Gemini 2.0 Flash Nuestro modelo multimodal más reciente, con funciones de próxima generación y capacidades mejoradas
performance_auto Gemini 2.0 Flash-Lite Un modelo de Gemini 2.0 Flash optimizado para la eficiencia en costos y la baja latencia

Vista previa de los modelos de Gemini

vista previa Gemini 2.5 Flash-Lite Nuestro modelo más rentable que admite tareas de alto rendimiento

Modelos de Gemma

Gemma 3 Nuestro modelo abierto más reciente de Gemma, que incluye la capacidad de resolver una amplia variedad de tareas con entrada de texto y de imagen, compatibilidad con más de 140 idiomas y una ventana de contexto larga de 128 000 tokens
Gemma 2 La segunda generación de nuestros modelos abiertos que incluye generación, resumen y extracción de texto
Gemma Un modelo abierto pequeño y ligero que admite la generación, el resumen y la extracción de texto
ShieldGemma 2 Modelos ajustados con instrucciones para evaluar la seguridad de textos e imágenes en función de un conjunto de políticas de seguridad definidas
PaliGemma Nuestro modelo abierto de lenguaje visual que combina SigLIP y Gemma
CodeGemma Modelo abierto potente y ligero que puede realizar una variedad de tareas de programación, como completar código en el medio, generar código, comprender el lenguaje natural, razonar matemáticamente y seguir instrucciones
TxGemma Genera predicciones, clasificaciones o texto en función de datos relacionados con la terapia y se puede usar para compilar de manera eficiente modelos de IA para tareas relacionadas con la terapia con menos datos y menos procesamiento

Modelos de embeddings

width_normal Incorporaciones para texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación, la agrupación en clústeres y tareas similares
width_normal Incorporaciones multimodales Genera vectores basados en imágenes, que se pueden usar para tareas posteriores, como la clasificación de imágenes, la búsqueda de imágenes y mucho más

Modelos de Imagen disponibles de forma general

photo_spark Imagen 3 para la generación Usa instrucciones de texto para generar imágenes nuevas
image_edit_auto Imagen 3 para la edición y la personalización Usa instrucciones de texto para editar imágenes de entrada existentes o partes de una imagen con una máscara, o bien genera imágenes nuevas según el contexto proporcionado por las imágenes de referencia de entrada
photo_spark Imagen 3 para la generación rápida Usa instrucciones de texto para generar imágenes nuevas con una latencia más baja que la de nuestros otros modelos de generación de imágenes
subtitles Imagen para subtitulado y VQA Usa instrucciones de texto para generar imágenes nuevas, editar las existentes, editar partes de una imagen con una máscara y mucho más

Obtén una vista previa de los modelos de Imagen

photo_spark Imagen 4 para la generación Usa instrucciones de texto para generar imágenes novedosas con mayor calidad que nuestros modelos de generación de imágenes anteriores
photo_spark Imagen 4 para la generación rápida Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y menor latencia que nuestros modelos de generación de imágenes anteriores
photo_spark Imagen 4 para la generación ultra Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y mejor cumplimiento de las instrucciones que nuestros modelos de generación de imágenes anteriores

Modelos de Veo

película Veo 2 para la generación Usa instrucciones de texto e imágenes para generar videos novedosos

Obtén una vista previa de los modelos de Veo

movie Veo 3 para la generación Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad que nuestro modelo de generación de videos anterior
movie Veo 3 Fast para la generación Usa instrucciones de texto e imágenes para generar videos novedosos con mayor calidad y menor latencia que nuestro modelo de generación de videos anterior

Modelos de MedLM

medical_information MedLM-medium Conjunto de modelos ajustados médicamente que cumplen con la HIPAA y están diseñados para ayudar a los profesionales de la salud con tareas de preguntas y respuestas médicas, y tareas de resumen para documentos médicos y de atención de la salud
clinical_notes MedLM-large-large Conjunto de modelos ajustados médicamente que cumplen con la HIPAA y están diseñados para ayudar a los profesionales de la salud con tareas de preguntas y respuestas médicas, y tareas de resumen para documentos médicos y de atención de la salud

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:

Afrikaans (af), Albanés (sq), Amhárico (am), Árabe (ar), Armenio (hy), Asamés (as), Azerbaiyano (az), Euskera (eu), Bielorruso (be), Bengalí (bn), Bosnio (bs), Búlgaro (bg), Catalán (ca), Cebuano (ceb), Chino (simplificado y tradicional) (zh), Corso (co), Croata (hr), Checo (cs), Danés (da), Dhivehi (dv), Neerlandés (nl), Inglés (en), Esperanto (eo), Estonio (et), Filipino (tagalo) (fil), Finlandés (fi), Francés (fr), Frisón (fy), Gallego (gl), Georgiano (ka), Alemán (de), Griego (el), Gujarati (gu), Criollo haitiano (ht), Hausa (ha), Hawaiano (haw), Hebreo (iw), Hindi (hi), Hmong (hmn), Húngaro (hu), Islandés (is), Igbo (ig), Indonesio (id), Irlandés (ga), Italiano (it), Japonés (ja), Javanés (jv), Kannada (kn), Kazajo (kk), Jemer (km), Coreano (ko), Krio (kri), Kurdo (ku), Kirguís (ky), Laosiano (lo), Latín (la), Letón (lv), Lituano (lt), Luxemburgués (lb), Macedonio (mk), Malgache (mg), Malayo (ms), Malayalam (ml), Maltés (mt), Maorí (mi), Maratí (mr), Meiteilon (manipuri) (mni-Mtei), Mongol (mn), Birmano (my), Nepalí (ne), Noruego (no), Nyanja (chichewa) (ny), Odia (oriya) (or), Pastún (ps), Persa (fa), (pl), Portugués (pt), Panyabí (pa), Rumano (ro), Ruso (ru), Samoano (sm), Gaélico escocés (gd), Serbio (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalés (si), Eslovaco (sk), Esloveno (sl), Somalí (so), Español (es), Sundanés (su), Suajili (sw), Sueco (sv), Tayiko (tg), Tamil (ta), Telugu (te), Tailandés (th), Turco (tr), Ucraniano (uk), Urdu (ur), Uigur (ug), Uzbeko (uz), Vietnamita (vi), Galés (cy), Xhosa (xh), Yidis (yi), Yoruba (yo), y Zulú (zu).

Gemma

Gemma solo admite el idioma inglés (en).

Incorporaciones

Los modelos de incorporación de texto multilingües admiten los siguientes idiomas:

afrikaans (af), albanés (sq), amhárico (am), árabe (ar), armenio (hy), azerí (az), euskera (eu), bielorruso (be), bengalí (bn), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), checo (cs), danés (da), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), marathi (mr), mongol (mn), birmano (my), nepalí (ne), nyanja (chichewa) (ny), noruego (no), pastún (ps), persa (fa), (pl), portugués (pt), panyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (gd), serbio (sr), sesotho (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo) y zulú (zu).

Imagen 3

Imagen 3 admite los siguientes idiomas:

Inglés (en), chino (simplificado y tradicional) (zh), hindi (hi), japonés (ja), coreano (ko), portugués (pt) y español (es).

MedLM

El modelo MedLM admite el idioma inglés (en).

Explora todos los modelos en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA generativa que están disponibles en Vertex AI, ve a Model Garden en la consola de Google Cloud .

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de modelos, incluidos los modelos heredados y los retirados, consulta Versiones de modelos y ciclo de vida.

¿Qué sigue?