Google-Modelle

Vorgestellte Gemini-Modelle

Allgemein verfügbare Gemini-Modelle

spark Gemini 2.0 Flash Unser neuestes multimodales Modell mit Funktionen der nächsten Generation und verbesserten Funktionen
performance_auto Gemini 2.0 Flash-Lite Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.0 Flash-Modell

Gemini-Vorschaumodelle

Vorabversion Gemini 2.5 Pro Unser bisher fortschrittlichstes Modell für Schlussfolgerungen
Vorabversion Gemini 2.5 Flash Gemini 2.5 Flash ist ein Thinking-Modell mit hervorragenden, vielseitigen Funktionen. Sie soll ein ausgewogenes Verhältnis zwischen Preis und Leistung bieten.

Gemma-Modelle

Gemma 3 Unser neuestes offenes Gemma-Modell, mit dem eine Vielzahl von Aufgaben mit Text- und Bildeingabe gelöst werden kann, Unterstützung für über 140 Sprachen und ein langes Kontextfenster von 128 KB
Gemma 2 Die zweite Generation unserer offenen Modelle mit Textgenerierung, Zusammenfassung und Extraktion
Gemma Ein kleines, schlankes offenes Modell, das Textgenerierung, Zusammenfassung und Extraktion unterstützt
ShieldGemma 2 Anweisungen für die Bewertung der Sicherheit von Text und Bildern anhand einer Reihe definierter Sicherheitsrichtlinien
PaliGemma Unser offenes Modell für Vision- und Sprache, das SigLIP und Gemma kombiniert
CodeGemma Leistungsstarkes, schlankes offenes Modell, das eine Vielzahl von Codierungsaufgaben ausführen kann, z. B. Code-Eingabe, Codegenerierung, natürliche Spracherkennung, mathematisches Denken und Anweisungsausführung
TxGemma Erzeugt Vorhersagen, Klassifizierungen oder Text basierend auf therapeutisch relevanten Daten und kann verwendet werden, um effizient KI-Modelle für therapeutisch relevante Aufgaben mit weniger Daten und weniger Rechenleistung zu erstellen

Einbettungsmodelle

width_normal Embeddings für Text Konvertiert Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung, Clustering und ähnliche Aufgaben
width_normal Multimodale Einbettungen Erzeugt auf Bildern basierende Vektoren, die für nachgelagerte Aufgaben wie Bildklassifizierung und Bildsuche verwendet werden können

Imagen-Modelle

photo_spark Imagen 3 für die Generierung Mit Text-Prompts neue Bilder generieren
image_edit_auto Imagen 3 für die Bearbeitung und Anpassung Mit Text-Prompts vorhandene Eingabebilder oder Teile eines Bildes mit einer Maske bearbeiten oder neue Bilder basierend auf dem Kontext der Eingabereferenzbilder generieren
photo_spark Imagen 3 für die schnelle Generierung Mit Text-Prompts neue Bilder mit niedrigerer Latenz als bei unseren anderen Modellen für die Bildgenerierung generieren
subtitles Imagen für Untertitel und visuelle Fragen und Antworten Mit Text-Prompts neue Bilder generieren, vorhandene bearbeiten, Teile eines Bildes mit einer Maske bearbeiten und mehr

Veo-Modelle

movie Veo 2 für die Videogenerierung Mit Textprompts und Bildern neue Videos erstellen

MedLM-Modelle

medical_information MedLM-medium HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitsfachkräfte bei medizinischen Fragen und Antworten sowie bei der Zusammenfassung von Gesundheits- und medizinischen Dokumenten unterstützen
clinical_notes MedLM-large-large HIPAA-konforme Suite von medizinisch abgestimmten Modellen, die Gesundheitsfachkräfte bei medizinischen Fragen und Antworten sowie bei der Zusammenfassung von Gesundheits- und medizinischen Dokumenten unterstützen

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Deutsch (de), Arabisch (ar), Bengali (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell) (zh), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi)

Die Modelle Gemini 2.0 Flash, Gemini 1.5 Pro und Gemini 1.5 Flash können in den folgenden zusätzlichen Sprachen verstehen und antworten:

Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

Gemma

Gemma unterstützt nur die englische Sprache.

Einbettungen

Mehrsprachige Modelle für die Text-Embedding-Technologie unterstützen die folgenden Sprachen:

Afrikaans, Albanisch, Amharisch, Arabisch, Armenisch, Aserbaidschanisch, Baskisch, belarussisch, Bengali, Bulgarisch, Birmanisch, Katalanisch, Cebuano, Chichewa, Chinesisch, korsisch, tschechisch, dänisch, niederländisch, englisch, Esperanto, estnisch, philippinisch, finnisch, französisch, galicisch, georgisch, deutsch, griechisch, Gujarati, haitianisches Kreolisch, Hausa, hawaiisch, hebräisch, Hindi, Hmong, ungarisch, isländisch, Igbo, indonesisch, irisch, italienisch, japanisch, javanisch, Kannada, kasachisch, Khmer, koreanisch, kurdisch, kirgisisch, laotisch, lateinisch, lettisch, litauisch, luxemburgisch, mazedonisch, malagassisch, malaysisch, Malayalam, maltesisch, maori, Marathi, mongolisch, nepalesisch, norwegisch, pashto, persisch, polnisch, portugiesisch, Punjabi, rumänisch, russisch, samoanisch, schottisch-gälisch, serbisch, Shona, Sindhi, Sinhala, slowakisch, slowenisch, Somali, Sotho, spanisch, Sundanesisch, Suaheli, schwedisch, tadschikisch, Tamil, Telugu, thailändisch, türkisch, ukrainisch, Urdu, usbekisch, vietnamesisch, walisisch, westfriesisch, Xhosa, jiddisch, Yoruba, Zulu.

Imagen 3

Imagen 3 unterstützt die folgenden Sprachen:

Englisch, Chinesisch, Hindi, Japanisch, Koreanisch, Portugiesisch und Spanisch.

MedLM

Das MedLM-Modell unterstützt die englische Sprache.

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in Vertex AI verfügbaren generativen KI-Modellen und APIs finden Sie in der Google Cloud Console in der Model Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Alle Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Nächste Schritte