Modèles d'IA générative disponibles

Vertex AI sur Google Distributed Cloud (GDC) air-gapped propose une liste croissante de modèles d'IA générative de base que vous pouvez tester, déployer et implémenter pour vos applications air-gapped. Les modèles de fondation sont adaptés à des cas d'utilisation spécifiques et proposés à des prix différents. Cette page récapitule les familles de modèles disponibles dans les API d'IA générative sur GDC et vous guide sur le choix des modèles par cas d'utilisation.

Modèles d'embeddings

Les embeddings convertissent les données textuelles écrites dans une langue naturelle en vecteurs numériques. Ces représentations vectorielles sont conçues pour capturer la signification sémantique et le contexte des mots qu'elles représentent. Les modèles d'embeddings de texte peuvent générer des embeddings optimisés pour différents types de tâches, tels que la récupération de documents, les questions-réponses, la classification et la vérification des faits. Pour le texte en anglais, utilisez text-embedding-004. Pour le texte multilingue, utilisez text-multilingual-embedding-002.

Le tableau suivant récapitule les modèles disponibles dans l'API Embeddings. Pour en savoir plus sur les embeddings, consultez Embeddings de texte.

Modèle Description Spécifications
Embedding de texte

(text-embedding-004)
Renvoie des embeddings pour les entrées de texte en anglais. Nombre maximal de jetons d'entrée : 2 048.

Dimensions d'embedding : moins de 768.
Représentations vectorielles continues pour le texte multilingue

(text-multilingual-embedding-002)
Renvoie des embeddings pour des entrées de texte dans plus de 100 langues. Nombre maximal de jetons d'entrée : 2 048.

Dimensions d'embedding : moins de 768.