Diese Seite wurde von der Cloud Translation API übersetzt.

Google-Modelle

Enthaltene Gemini-Modelle

2.5 Pro

Unser fortschrittlichstes Gemini-Modell für logisches Denken, das komplexe Probleme lösen kann

Optimal für multimodales Verstehen
Kann komplexe Prompts verarbeiten und umfassende Antworten liefern
Optimal für das Programmieren, insbesondere für die Webentwicklung

2.5 Flash

Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen

Unterstützung für Live API für einige Endpunkte
Denkprozess des Modells als Teil der Antwort sehen
Ausgewogenes Preis-Leistungs-Verhältnis

2.5 Flash-Lite

Unser kostengünstigstes Modell, das Aufgaben mit hohem Durchsatz unterstützt

Das schnellste Modell der 2.5-Modellreihe
Bietet ein Kontextfenster von 1 Million Tokens und multimodale Eingabe wie Gemini 2.5 Flash
Übertrifft 2.0 Flash bei den meisten Benchmarks

Allgemein verfügbare Gemini-Modelle

diamond Gemini 2.5 Pro Unser bisher fortschrittlichstes Modell für logisches Denken

spark Gemini 2.5 Flash Unser bestes Modell in Bezug auf Preis-Leistungs-Verhältnis mit umfassenden Funktionen

spark Gemini 2.0 Flash Unser neuestes multimodales Modell mit Funktionen der nächsten Generation und verbesserten Funktionen

performance_auto Gemini 2.0 Flash-Lite Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.0 Flash-Modell

Gemini-Vorschaumodelle

Vorschau Gemini 2.5 Flash-Lite Unser kostengünstigstes Modell, das Aufgaben mit hohem Durchsatz unterstützt

Gemma-Modelle

Gemma 3n Die neuesten offenen Modelle, die für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurden. Sie können multimodale Eingaben verarbeiten, Text-, Bild-, Video- und Audioeingaben verarbeiten und Textausgaben generieren. Sie wurden mit Daten in über 140 gesprochenen Sprachen trainiert.

Gemma 3 Die dritte Generation unserer offenen Modelle, die eine Vielzahl von Aufgaben mit Text- und Bildeingaben lösen können. Sie unterstützen über 140 Sprachen und haben ein langes Kontextfenster von 128.000 Tokens.

Gemma 2 Die zweite Generation unserer offenen Modelle, die Textgenerierung, Zusammenfassung und Extraktion ermöglichen

Gemma Ein kleines, leichtgewichtiges offenes Modell, das Textgenerierung, Zusammenfassung und Extraktion unterstützt

ShieldGemma 2 Auf Anweisungen abgestimmte Modelle zur Bewertung der Sicherheit von Text und Bildern anhand einer Reihe definierter Sicherheitsrichtlinien

PaliGemma Unser offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert

CodeGemma Leistungsstarkes, leichtgewichtiges offenes Modell, das eine Vielzahl von Programmieraufgaben ausführen kann, z. B. Codevervollständigung, Codeerstellung, Verarbeitung natürlicher Sprache, mathematische Argumentation und Befolgung von Anweisungen

TxGemma Generiert Vorhersagen, Klassifizierungen oder Text basierend auf therapeutischen Daten und kann verwendet werden, um effizient KI-Modelle für therapeutische Aufgaben mit weniger Daten und weniger Rechenleistung zu erstellen

MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Verarbeitung von medizinischem Text und medizinischen Bildern trainiert wurden

MedSigLIP SigLIP-Variante, die darauf trainiert wurde, medizinische Bilder und Texte in einem gemeinsamen Einbettungsraum zu codieren

T5Gemma Eine Familie von leichtgewichtigen, aber leistungsstarken Encoder-Decoder-Forschungsmodellen von Google

Einbettungsmodelle

width_normal Einbettungen für Text Konvertiert Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung, Clustering und ähnliche Aufgaben

width_normal Multimodale Einbettungen Generiert Vektoren auf Grundlage von Bildern, die für nachgelagerte Aufgaben wie Bildklassifizierung, Bildsuche und mehr verwendet werden können

Allgemein verfügbare Imagen-Modelle

photo_spark Imagen 3 für die Generierung Mit Text-Prompts neue Bilder generieren

image_edit_auto Imagen 3 für die Bearbeitung und Anpassung Mit Text-Prompts vorhandene Eingabebilder oder Teile eines Bildes mit einer Maske bearbeiten oder neue Bilder basierend auf dem Kontext generieren, der durch Eingabe-Referenzbilder bereitgestellt wird

photo_spark Imagen 3 für die schnelle Generierung Mit Text-Prompts neue Bilder mit geringerer Latenz als bei unseren anderen Modellen zur Bildgenerierung generieren

subtitles Imagen für Bildunterschriften und VQA Mit Text-Prompts neue Bilder generieren, vorhandene bearbeiten, Teile eines Bildes mit einer Maske bearbeiten und mehr

Imagen-Modelle in der Vorschau ansehen

photo_spark Imagen 4 für die Generierung Mit Text-Prompts lassen sich neue Bilder generieren. Die Qualität ist höher als bei unseren bisherigen Modellen zur Bildgenerierung.

photo_spark Imagen 4 für die schnelle Generierung Mit Text-Prompts lassen sich neue Bilder generieren. Die Qualität ist höher und die Latenz geringer als bei unseren bisherigen Modellen zur Bildgenerierung.

photo_spark Imagen 4 für die Ultra-Generierung Mit Text-Prompts lassen sich neue Bilder generieren. Die Qualität ist höher und die Prompts werden besser berücksichtigt als bei unseren bisherigen Modellen zur Bildgenerierung.

Veo-Modelle

Film Veo 2 für die Generierung Mit Text-Prompts und Bildern neue Videos generieren

Vorschau von Veo-Modellen

movie Veo 3 for Generation Mit Text-Prompts und Bildern können Sie neue Videos in höherer Qualität als mit unserem bisherigen Modell zur Videogenerierung erstellen.

movie Veo 3 Fast for Generation Mit Text-Prompts und Bildern können Sie neue Videos in höherer Qualität und mit geringerer Latenz als mit unserem bisherigen Modell zur Videogenerierung erstellen.

MedLM-Modelle

medical_information MedLM-medium HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitskräfte bei medizinischen Fragen und Antworten sowie Zusammenfassungsaufgaben für Gesundheits- und medizinische Dokumente unterstützen sollen

clinical_notes MedLM-large-large HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitskräfte bei medizinischen Fragen und Antworten sowie Zusammenfassungsaufgaben für Gesundheits- und medizinische Dokumente unterstützen sollen

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Lateinisch (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmar (Burmesisch) (my), Nepalesisch (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (iw), Uigurisch (hi), Usbekisch (hmn), Vietnamesisch (hu), Walisisch (is), Xhosa (ig), Jiddisch (id), Yoruba (ga), und Zulu (zu).uruguzvicyxhyiyo

Gemma

Gemma und Gemma 2 unterstützen nur die englische Sprache (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Mehrsprachige Texteinbettungsmodelle unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Malagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Birmanisch (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (fr), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (is).svzu

Imagen 3

Imagen 3 unterstützt die folgenden Sprachen:

Englisch (en), Chinesisch (vereinfacht und traditionell) (zh), Hindi (hi), Japanisch (ja), Koreanisch (ko), Portugiesisch (pt) und Spanisch (es).

MedLM

Das MedLM-Modell unterstützt die englische Sprache (en).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in Vertex AI verfügbaren generativen KI-Modellen und APIs finden Sie im Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Eine Liste aller Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Nächste Schritte

Wagen Sie sich an eine Kurzeinführung mit Generative AI Studio oder der Vertex AI API.
Vortrainierte Modelle in Model Garden untersuchen.
Informationen zum Steuern des Zugriffs auf bestimmte Modelle in Model Garden mithilfe einer Model Garden-Organisationsrichtlinie.
Informationen zu Preisen.