Diese Seite wurde von der Cloud Translation API übersetzt.

Google-Modelle

Enthaltene Gemini-Modelle

2.5 Pro

Unser fortschrittlichstes Gemini-Modell für logisches Denken, um komplexe Probleme zu lösen

Optimal für multimodales Verstehen
Kann komplexe Prompts verarbeiten und umfassende Antworten liefern
Optimal für das Programmieren, insbesondere für die Webentwicklung

2.5 Flash

Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen

Unterstützung für Live API für einige Endpunkte
Denkprozess des Modells als Teil der Antwort sehen
Ausgewogenes Preis-Leistungs-Verhältnis

2.5 Flash-Lite

Unser kostengünstigstes Modell, das Aufgaben mit hohem Durchsatz unterstützt

Das schnellste Modell der 2.5-Modellreihe
Bietet ein Kontextfenster mit 1 Million Tokens und multimodale Eingabe wie 2.5 Flash
Übertrifft 2.0 Flash bei den meisten Benchmarks

Allgemein verfügbare Gemini-Modelle

diamond Gemini 2.5 Pro Unser bisher fortschrittlichstes Modell für logisches Denken

spark Gemini 2.5 Flash Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen

performance_auto Gemini 2.5 Flash-Lite Unser kostengünstigstes Modell, das Aufgaben mit hohem Durchsatz unterstützt

spark Gemini 2.0 Flash Unser neuestes multimodales Modell mit Funktionen der nächsten Generation und verbesserter Leistung

performance_auto Gemini 2.0 Flash-Lite Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.0 Flash-Modell

Gemini-Vorschaumodelle

photo_spark Gemini 2.5 Flash-Bildvorschau Unser Standardmodell, das für schnelle kreative Workflows mit Bildgenerierung und konversationellen Multi-Turn-Bearbeitungsfunktionen aktualisiert wurde. und KI-Produkten.

Gemma-Modelle

Gemma 3n Die neuesten offenen Modelle, die für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurden. Sie können multimodale Eingaben verarbeiten, darunter Text-, Bild-, Video- und Audioeingaben, und Textausgaben generieren. Sie wurden mit Daten in über 140 gesprochenen Sprachen trainiert.

Gemma 3 Die dritte Generation unserer offenen Modelle, die eine Vielzahl von Aufgaben mit Text- und Bildeingaben lösen können. Sie unterstützen über 140 Sprachen und haben ein langes Kontextfenster von 128.000 Tokens.

Gemma 2 Die zweite Generation unserer offenen Modelle, die Textgenerierung, Zusammenfassung und Extraktion ermöglichen

Gemma Ein kleines, leichtgewichtiges offenes Modell, das Textgenerierung, Zusammenfassung und Extraktion unterstützt

ShieldGemma 2 Auf Anweisungen abgestimmte Modelle zur Bewertung der Sicherheit von Text und Bildern anhand einer Reihe definierter Sicherheitsrichtlinien

PaliGemma Unser offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert

CodeGemma Leistungsstarkes, leichtgewichtiges offenes Modell, das eine Vielzahl von Programmieraufgaben ausführen kann, z. B. Codevervollständigung, Codeerstellung, Verarbeitung natürlicher Sprache, mathematische Argumentation und Befolgung von Anweisungen

TxGemma Generiert Vorhersagen, Klassifizierungen oder Text auf Grundlage von Daten zu therapeutischen Maßnahmen und kann verwendet werden, um effizient KI-Modelle für therapeutische Aufgaben mit weniger Daten und weniger Rechenleistung zu erstellen

MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Verarbeitung von medizinischem Text und medizinischen Bildern trainiert wurden

MedSigLIP Eine SigLIP-Variante, die darauf trainiert wurde, medizinische Bilder und Texte in einem gemeinsamen Einbettungsraum zu codieren

T5Gemma Eine Familie von leichtgewichtigen, aber leistungsstarken Encoder-Decoder-Forschungsmodellen von Google

Einbettungsmodelle

width_normal Einbettungen für Text Konvertiert Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung, Clustering und ähnliche Aufgaben

width_normal Multimodale Einbettungen Generiert Vektoren auf Grundlage von Bildern, die für nachgelagerte Aufgaben wie Bildklassifizierung, Bildsuche und mehr verwendet werden können

Allgemein verfügbare Imagen-Modelle

photo_spark Imagen 4 für die Generierung Mit Text-Prompts neue Bilder generieren – in höherer Qualität als mit unseren bisherigen Modellen für die Bildgenerierung

photo_spark Imagen 4 für die schnelle Generierung Mit Text-Prompts neue Bilder generieren – in höherer Qualität und mit geringerer Latenz als mit unseren bisherigen Modellen für die Bildgenerierung

photo_spark Imagen 4 für die Ultra-Generierung Mit Text-Prompts neue Bilder generieren – in höherer Qualität und mit besserer Prompt-Einhaltung als mit unseren bisherigen Modellen für die Bildgenerierung

photo_spark Imagen 3 für die Generierung Mit Text-Prompts neue Bilder generieren

image_edit_auto Imagen 3 für die Bearbeitung und Anpassung Mit Text-Prompts vorhandene Eingabebilder oder Teile eines Bildes mit einer Maske bearbeiten oder neue Bilder basierend auf dem Kontext generieren, der durch Eingabe-Referenzbilder bereitgestellt wird

photo_spark Imagen 3 für die schnelle Generierung Mit Text-Prompts neue Bilder generieren – mit geringerer Latenz als mit unseren anderen Modellen für die Bildgenerierung

subtitles Imagen für Untertitelung und VQA Mit Text-Prompts neue Bilder generieren, vorhandene bearbeiten, Teile eines Bildes mit einer Maske bearbeiten und mehr

Imagen-Modelle in der Vorschau ansehen

photo_spark Virtuelles Anprobieren Bilder von Personen generieren, die Bekleidungsprodukte tragen.

image_edit_auto Imagen-Produktkontextualisierung in Vertex AI Mit Text-Prompts Produktbilder in verschiedenen Szenen oder Hintergründen bearbeiten.

Veo-Modelle

movie Veo 2 Mit Text-Prompts und Bildern neue Videos generieren

movie Veo 3 Mit Text-Prompts und Bildern neue Videos generieren, die eine höhere Qualität als unser bisheriges Videogenerierungsmodell haben

movie Veo 3 Fast Mit Text-Prompts und Bildern neue Videos generieren, die eine höhere Qualität und geringere Latenz als unser bisheriges Videogenerierungsmodell haben

Vorschau von Veo-Modellen

movie Veo 3-Vorschau Mit Text-Prompts und Bildern neuartige Videos generieren, die eine höhere Qualität als unser bisheriges Videogenerierungsmodell haben

movie Veo 3 Fast-Vorschau Mit Text-Prompts und Bildern neuartige Videos generieren, die eine höhere Qualität und geringere Latenz als unser bisheriges Videogenerierungsmodell haben

Experimentelle Veo-Modelle

Film Veo 2 (experimentell) Ein experimentelles Modell mit Funktionen, die sich in der Testphase befinden.

MedLM-Modelle

medical_information MedLM-medium HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitskräfte bei medizinischen Fragen und Antworten sowie Zusammenfassungsaufgaben für Gesundheits- und medizinische Dokumente unterstützen sollen

clinical_notes MedLM-large-large HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitskräfte bei medizinischen Fragen und Antworten sowie Zusammenfassungsaufgaben für Gesundheits- und medizinische Dokumente unterstützen sollen

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitian Creole (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Lateinisch (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmar (Burmese) (my), Nepali (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Pashto (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Swahili (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Uigurisch (ug), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (zu).

Gemma

Gemma und Gemma 2 unterstützen nur die englische Sprache (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Mehrsprachige Texteinbettungsmodelle unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreol (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (zu).

Imagen 3

Imagen 3 unterstützt die folgenden Sprachen:

Englisch (en), Chinesisch (vereinfacht und traditionell) (zh), Hindi (hi), Japanisch (ja), Koreanisch (ko), Portugiesisch (pt) und Spanisch (es).

MedLM

Das MedLM-Modell unterstützt die englische Sprache (en).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in Vertex AI verfügbaren generativen KI-Modellen und APIs finden Sie im Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Eine Liste aller Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Nächste Schritte

Wagen Sie sich an eine Kurzeinführung mit Generative AI Studio oder der Vertex AI API.
Vortrainierte Modelle in Model Garden untersuchen.
Informationen zum Steuern des Zugriffs auf bestimmte Modelle in Model Garden mithilfe einer Model Garden-Organisationsrichtlinie.
Informationen zu Preisen.