Les modèles Anthropic Claude sur Vertex AI offrent des modèles sans serveur et entièrement gérés en tant qu'API. Pour utiliser un modèle Claude sur Vertex AI, envoyez une requête directement au point de terminaison de l'API Vertex AI. Étant donné que les modèles Anthropic Claude utilisent une API gérée, vous n'avez pas à provisionner ni gérer l'infrastructure.
Vous pouvez diffuser vos réponses Claude en flux continu pour réduire la perception de la latence pour les utilisateurs finaux. Une réponse en flux continu utilise des événements envoyés par le serveur (SSE) pour diffuser la réponse de manière incrémentielle.
Les modèles Claude vous sont facturés à mesure que vous les utilisez (paiement à l'usage), ou vous devez vous acquitter de frais fixes lorsque vous utilisez le [débit provisionné][pt]. Pour connaître les tarifs de paiement à l'usage, consultez la section sur les modèles Anthropic Claude de la page des tarifs de Vertex AI.
Modèles Claude disponibles
Les modèles suivants sont disponibles auprès d'Anthropic pour une utilisation dans Vertex AI. Pour accéder à un modèle Claude, accédez à sa fiche de modèle dans Model Garden.
Les modèles Claude d'Anthropic sont compatibles avec la journalisation des requêtes et des réponses Vertex AI. Activez la journalisation des requêtes et des réponses sur 30 jours pour suivre toute utilisation abusive du modèle par vos utilisateurs. Pour en savoir plus, consultez Consigner les requêtes et les réponses.
Claude Opus 4
Claude Opus 4 est le modèle le plus intelligent d'Anthropic. Il est à la pointe de la technologie en matière de codage et de fonctionnalités d'agents, en particulier pour la recherche agentive. Elle est idéale pour les clients qui ont besoin d'une intelligence de pointe :
- Codage avancé : planifier et exécuter de manière autonome des tâches de développement complexes de bout en bout. Il s'adapte à votre style et maintient une qualité de code élevée tout au long du processus.
- Tâches à long terme et résolution de problèmes complexes (collaborateur virtuel) : débloquez de nouveaux cas d'utilisation impliquant des tâches à long terme qui nécessitent de la mémoire, un raisonnement soutenu et de longues chaînes d'actions.
- Agents d'IA : permettez aux agents de s'attaquer à des tâches complexes en plusieurs étapes qui nécessitent une précision maximale.
- Recherche et étude agentiques : connectez-vous à plusieurs sources de données pour synthétiser des insights complets dans les dépôts.
- Création de contenu : créez des contenus de qualité humaine avec une prose naturelle. Produisez des contenus créatifs longs, de la documentation technique, des textes marketing et des maquettes de conception d'interface.
- Gestion de la mémoire et du contexte : intègre des capacités de mémoire qui lui permettent de résumer et de référencer efficacement les interactions précédentes.
Accéder à la fiche de modèle Claude Opus 4
Claude Sonnet 4
Claude Sonnet 4 offre un équilibre entre des performances impressionnantes pour le codage et la vitesse et le coût adaptés aux cas d'utilisation à volume élevé :
- Codage : gérez les tâches de développement quotidiennes avec des performances améliorées. Effectuez des révisions de code, corrigez des bugs, intégrez des API et développez des fonctionnalités avec des boucles de rétroaction immédiates.
- Assistants IA : créez des assistants prêts pour la production pour les applications en temps réel, de l'automatisation du service client aux workflows opérationnels qui nécessitent à la fois intelligence et rapidité.
- Recherche efficace : effectuez des analyses ciblées sur plusieurs sources de données tout en conservant des temps de réponse rapides. Idéal pour l'informatique décisionnelle rapide, l'analyse de la concurrence et l'aide à la décision en temps réel.
- Contenus à grande échelle : générez et analysez des contenus à grande échelle avec une qualité améliorée. Créez des communications avec les clients, analysez les commentaires des utilisateurs et produisez des supports marketing en trouvant le juste équilibre entre qualité et débit.
Accéder à la fiche du modèle Claude Sonnet 4
Claude 3.7 Sonnet
Claude 3.7 Sonnet est le modèle le plus intelligent d'Anthropic à ce jour et le premier modèle Claude à proposer une réflexion étendue, c'est-à-dire la capacité de résoudre des problèmes complexes avec un raisonnement minutieux et progressif. Ce modèle unique vous permet d'équilibrer la vitesse et la qualité en choisissant entre la réflexion standard pour des réponses quasi instantanées ou la réflexion étendue pour un raisonnement avancé.
Pour en savoir plus sur la réflexion étendue, consultez la documentation d'Anthropic.
Claude 3.7 Sonnet est optimisé pour les cas d'utilisation suivants :
- Codage agentif : Claude 3.7 Sonnet est un outil de pointe pour le codage agentif. Il peut effectuer des tâches tout au long du cycle de vie du développement logiciel, de la planification initiale aux corrections de bugs, en passant par la maintenance et les refactorisations importantes. Il offre de solides performances en termes de planification et de résolution des tâches de codage complexes, ce qui en fait un choix idéal pour alimenter les processus de développement logiciel de bout en bout.
- Agents orientés client : Claude 3.7 Sonnet offre un suivi des instructions, une sélection d'outils, une correction des erreurs et un raisonnement avancé de qualité supérieure pour les agents orientés client et les workflows d'IA complexes.
- Utilisation de l'ordinateur : Claude 3.7 Sonnet est notre modèle le plus précis pour l'utilisation de l'ordinateur. Il permet aux développeurs de demander à Claude d'utiliser les ordinateurs comme les humains.
- Génération et analyse de contenu : Claude 3.7 Sonnet excelle en écriture et est capable de comprendre les nuances et le ton des contenus pour générer des contenus plus attrayants et en analyser de manière plus approfondie.
- Extraction de données visuelles : grâce à ses compétences de vision robustes, Claude 3.7 Sonnet est le choix idéal pour les équipes qui souhaitent extraire des données brutes à partir de visuels tels que des graphiques dans le cadre de leur workflow d'IA.
Accéder à la fiche du modèle Claude 3.7 Sonnet
Claude 3.5 Sonnet v2
Claude 3.5 Sonnet v2 est un modèle de pointe pour les tâches d'ingénierie logicielle et les fonctionnalités agentives en conditions réelles. Il offre ces évolutions au même prix et à la même vitesse que Claude 3.5 Sonnet.
La version améliorée du modèle Claude 3.5 Sonnet peut interagir avec des outils capables de manipuler un environnement de bureau d'ordinateur. Pour en savoir plus, consultez la documentation d'Anthropic.
Claude 3.5 Sonnet est optimisé pour les cas d'utilisation suivants :
- Tâches agentives et utilisation d'outils : Claude 3.5 Sonnet offre un suivi des instructions, une sélection d'outils, une correction des erreurs et un raisonnement avancé supérieurs pour les workflows agentifs qui nécessitent l'utilisation d'outils.
- Codage : pour les tâches de développement logiciel allant des migrations et corrections de code aux traductions, Claude 3.5 Sonnet offre de solides performances en termes de planification et de résolution des tâches de codage complexes.
- Systèmes de questions/réponses basés sur les documents : Claude 3.5 Sonnet combine une compréhension approfondie du contexte, un raisonnement avancé et une capacité de synthèse pour fournir des réponses précises et naturelles.
- Extraction de données visuelles : grâce à ses compétences de vision de pointe, Claude 3.5 Sonnet peut extraire des données brutes à partir de visuels tels que des graphiques dans le cadre de workflows d'IA.
- Génération et analyse de contenu : Claude 3.5 Sonnet peut comprendre les nuances et le ton des contenus, générer des contenus plus attrayants et en analyser de manière plus approfondie.
Accéder à la fiche du modèle Claude 3.5 Sonnet v2
Claude 3.5 Haiku
Claude 3.5 Haiku, la nouvelle génération du modèle le plus rapide et le plus économique d'Anthropic, est idéal pour les cas d'utilisation où la vitesse et le prix sont importants. Il améliore son prédécesseur dans tous les domaines. Claude 3.5 Haiku est optimisé pour les cas d'utilisation suivants :
- Complétions de code : grâce à son temps de réponse rapide et à sa compréhension des schémas de programmation, Claude 3.5 Haiku excelle dans la fourniture de suggestions et de complétions de code rapides et précises dans les workflows de développement en temps réel.
- Chatbots interactifs : les capacités de raisonnement et de conversation naturelle améliorées de Claude 3.5 Haiku en font un outil idéal pour créer des chatbots responsifs et conviviaux, capables de gérer efficacement un grand nombre d'interactions avec les utilisateurs.
- Extraction et étiquetage des données : grâce à ses capacités d'analyse améliorées, Claude 3.5 Haiku traite et classe efficacement les données, ce qui le rend utile pour l'extraction rapide des données et les tâches d'étiquetage automatisées.
- Modération de contenu en temps réel : grâce à ses solides compétences en raisonnement et à sa compréhension du contenu, Claude 3.5 Haiku assure une modération rapide et fiable des contenus pour les plates-formes qui nécessitent des temps de réponse immédiats à grande échelle.
Accéder à la fiche du modèle Claude 3.5 Haiku
Claude 3 Haiku
Claude 3 Haiku est le modèle de vision et de texte le plus rapide d'Anthropic. Il permet d'obtenir des réponses quasi instantanées pour des requêtes simples et est conçu pour offrir des expériences d'IA fluides qui imitent les interactions humaines.
Interactions et traductions avec les clients en direct.
Modération de contenus pour détecter les comportements suspects ou les demandes des clients.
Tâches permettant d'économiser des coûts, telles que la gestion des stocks et l'extraction de connaissances à partir de données non structurées.
Tâches de vision, telles que le traitement d'images pour renvoyer une sortie textuelle, l'analyse de graphiques, de schémas techniques, de rapports et d'autres contenus visuels.
Accéder à la fiche de modèle Claude 3 Haiku
Claude 3.5 Sonnet
Claude 3.5 Sonnet d'Anthropic surpasse Claude 3 Opus sur un large éventail d'évaluations internes, en raison de la rapidité et du coût de son modèle de milieu de gamme, Claude 3 Sonnet. Claude 3.5 Sonnet est optimisé pour les cas d'utilisation suivants :
Opérations de codage, comme l'écriture, la modification et l'exécution de code, avec des capacités de raisonnement et de correction d'erreurs sophistiquées.
Gestion de requêtes complexes émanant du service client grâce à la compréhension du contexte de l'utilisateur et à l'orchestration des workflows à plusieurs étapes.
Data science et analyse via la découverte des données non structurées, et exploitation de plusieurs outils pour générer des insights.
Actions de traitement visuel, comme l'interprétation de graphiques nécessitant une compréhension visuelle.
Rédaction de contenus avec un ton plus naturel et plus humain.
Accéder à la fiche du modèle Claude 3.5 Sonnet
Étapes suivantes
Découvrez comment utiliser les modèles d'Anthropic.