Google-Modelle

Enthaltene Gemini-Modelle

Allgemein verfügbare Gemini-Modelle

diamond Gemini 2.5 Pro Unser bisher fortschrittlichstes Modell für logisches Denken
spark Gemini 2.5 Flash Unser bestes Modell in Bezug auf Preis-Leistungs-Verhältnis mit umfassenden Funktionen
spark Gemini 2.0 Flash Unser neuestes multimodales Modell mit Funktionen der nächsten Generation und verbesserten Funktionen
performance_auto Gemini 2.0 Flash-Lite Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.0 Flash-Modell

Gemini-Vorschaumodelle

Vorschau Gemini 2.5 Flash-Lite Unser kostengünstigstes Modell, das Aufgaben mit hohem Durchsatz unterstützt

Gemma-Modelle

Gemma 3n Die neuesten offenen Modelle, die für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurden. Sie können multimodale Eingaben verarbeiten, Text-, Bild-, Video- und Audioeingaben verarbeiten und Textausgaben generieren. Sie wurden mit Daten in über 140 gesprochenen Sprachen trainiert.
Gemma 3 Die dritte Generation unserer offenen Modelle, die eine Vielzahl von Aufgaben mit Text- und Bildeingaben lösen können. Sie unterstützen über 140 Sprachen und haben ein langes Kontextfenster von 128.000 Tokens.
Gemma 2 Die zweite Generation unserer offenen Modelle, die Textgenerierung, Zusammenfassung und Extraktion ermöglichen
Gemma Ein kleines, leichtgewichtiges offenes Modell, das Textgenerierung, Zusammenfassung und Extraktion unterstützt
ShieldGemma 2 Auf Anweisungen abgestimmte Modelle zur Bewertung der Sicherheit von Text und Bildern anhand einer Reihe definierter Sicherheitsrichtlinien
PaliGemma Unser offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert
CodeGemma Leistungsstarkes, leichtgewichtiges offenes Modell, das eine Vielzahl von Programmieraufgaben ausführen kann, z. B. Codevervollständigung, Codeerstellung, Verarbeitung natürlicher Sprache, mathematische Argumentation und Befolgung von Anweisungen
TxGemma Generiert Vorhersagen, Klassifizierungen oder Text basierend auf therapeutischen Daten und kann verwendet werden, um effizient KI-Modelle für therapeutische Aufgaben mit weniger Daten und weniger Rechenleistung zu erstellen
MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Verarbeitung von medizinischem Text und medizinischen Bildern trainiert wurden
MedSigLIP SigLIP-Variante, die darauf trainiert wurde, medizinische Bilder und Texte in einem gemeinsamen Einbettungsraum zu codieren
T5Gemma Eine Familie von leichtgewichtigen, aber leistungsstarken Encoder-Decoder-Forschungsmodellen von Google

Einbettungsmodelle

width_normal Einbettungen für Text Konvertiert Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung, Clustering und ähnliche Aufgaben
width_normal Multimodale Einbettungen Generiert Vektoren auf Grundlage von Bildern, die für nachgelagerte Aufgaben wie Bildklassifizierung, Bildsuche und mehr verwendet werden können

Allgemein verfügbare Imagen-Modelle

photo_spark Imagen 3 für die Generierung Mit Text-Prompts neue Bilder generieren
image_edit_auto Imagen 3 für die Bearbeitung und Anpassung Mit Text-Prompts vorhandene Eingabebilder oder Teile eines Bildes mit einer Maske bearbeiten oder neue Bilder basierend auf dem Kontext generieren, der durch Eingabe-Referenzbilder bereitgestellt wird
photo_spark Imagen 3 für die schnelle Generierung Mit Text-Prompts neue Bilder mit geringerer Latenz als bei unseren anderen Modellen zur Bildgenerierung generieren
subtitles Imagen für Bildunterschriften und VQA Mit Text-Prompts neue Bilder generieren, vorhandene bearbeiten, Teile eines Bildes mit einer Maske bearbeiten und mehr

Imagen-Modelle in der Vorschau ansehen

photo_spark Imagen 4 für die Generierung Mit Text-Prompts lassen sich neue Bilder generieren. Die Qualität ist höher als bei unseren bisherigen Modellen zur Bildgenerierung.
photo_spark Imagen 4 für die schnelle Generierung Mit Text-Prompts lassen sich neue Bilder generieren. Die Qualität ist höher und die Latenz geringer als bei unseren bisherigen Modellen zur Bildgenerierung.
photo_spark Imagen 4 für die Ultra-Generierung Mit Text-Prompts lassen sich neue Bilder generieren. Die Qualität ist höher und die Prompts werden besser berücksichtigt als bei unseren bisherigen Modellen zur Bildgenerierung.

Veo-Modelle

Film Veo 2 für die Generierung Mit Text-Prompts und Bildern neue Videos generieren

Vorschau von Veo-Modellen

movie Veo 3 for Generation Mit Text-Prompts und Bildern können Sie neue Videos in höherer Qualität als mit unserem bisherigen Modell zur Videogenerierung erstellen.
movie Veo 3 Fast for Generation Mit Text-Prompts und Bildern können Sie neue Videos in höherer Qualität und mit geringerer Latenz als mit unserem bisherigen Modell zur Videogenerierung erstellen.

MedLM-Modelle

medical_information MedLM-medium HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitskräfte bei medizinischen Fragen und Antworten sowie Zusammenfassungsaufgaben für Gesundheits- und medizinische Dokumente unterstützen sollen
clinical_notes MedLM-large-large HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitskräfte bei medizinischen Fragen und Antworten sowie Zusammenfassungsaufgaben für Gesundheits- und medizinische Dokumente unterstützen sollen

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Lateinisch (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmar (Burmesisch) (my), Nepalesisch (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (iw), Uigurisch (hi), Usbekisch (hmn), Vietnamesisch (hu), Walisisch (is), Xhosa (ig), Jiddisch (id), Yoruba (ga), und Zulu (zu).uruguzvicyxhyiyo

Gemma

Gemma und Gemma 2 unterstützen nur die englische Sprache (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Mehrsprachige Texteinbettungsmodelle unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Malagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Birmanisch (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (fr), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (is).svzu

Imagen 3

Imagen 3 unterstützt die folgenden Sprachen:

Englisch (en), Chinesisch (vereinfacht und traditionell) (zh), Hindi (hi), Japanisch (ja), Koreanisch (ko), Portugiesisch (pt) und Spanisch (es).

MedLM

Das MedLM-Modell unterstützt die englische Sprache (en).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in Vertex AI verfügbaren generativen KI-Modellen und APIs finden Sie im Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Eine Liste aller Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Nächste Schritte