Ce document explique comment installer et configurer le SDK Vertex AI pour ABAP sur un système hôte SAP sur Compute Engine, sur n'importe quelle machine virtuelle cloud, sur RISE with S/4HANA Cloud Private Edition ou sur des instances sur site.
Installation
Lorsque vous installez la dernière version de l'édition sur site ou de toute édition cloud du SDK ABAP pour Google Cloud, le SDK Vertex AI pour ABAP est installé pour vous. Pour en savoir plus sur les étapes d'installation, consultez Installer et configurer l'édition sur site ou n'importe quelle édition cloud du SDK ABAP pour Google Cloud.
Si vous utilisez la version 1.7 ou une version antérieure de l'édition sur site ou de toute édition cloud du SDK ABAP pour Google Cloud, mettez à jour votre SDK vers la dernière version pour obtenir le SDK Vertex AI pour ABAP. Pour en savoir plus, consultez Mettre à jour le SDK ABAP pour Google Cloud.
Nous comprenons que l'accès à Vertex AI et aux ressources cloud peut être limité pour certains développeurs. Pour activer le prototypage et l'expérimentation avec une configuration minimale, consultez Prototypage rapide avec Gemini.
Activer l'API Vertex AI
Activez l'API Vertex AI dans votre projet Google Cloud .
Pour savoir comment activer les API Google Cloud , consultez Activer des API.
Activer les modèles partenaires dans Vertex AI
Si vous souhaitez utiliser un modèle partenaire, vous devez activer le modèle requis dans Vertex AI.
Le SDK Vertex AI pour ABAP est compatible avec les modèles Anthropic Claude suivants :
Pour activer un modèle Claude, accédez à la fiche de modèle Model Garden appropriée, puis cliquez sur Activer :
- Accéder à la fiche de modèle Claude Opus 4
- Accéder à la fiche du modèle Claude Sonnet 4
- Accéder à la fiche du modèle Claude 3.7 Sonnet
Authentification
Une fois que vous avez configuré l'authentification pour accéder aux API Google Cloud dans votre édition sur site ou toute édition cloud du SDK ABAP pour Google Cloud, le SDK Vertex AI pour ABAP utilise la même méthode d'authentification pour accéder à l'API Vertex AI. Pour savoir comment configurer l'authentification dans l'édition sur site ou dans toute édition cloud du SDK ABAP pour Google Cloud, consultez Présentation de l'authentification.
Notez la clé client que vous avez créée lors de la configuration de l'authentification. Vous utilisez cette clé client lorsque vous configurez les paramètres de génération de modèle d'IA et les paramètres de recherche.
Autorisations IAM
Assurez-vous que le compte de service dédié à l'accès à l'API que vous avez configuré dans le tableau des clés client a accès aux ressources Vertex AI.
Vertex AI
Pour utiliser les ressources Vertex AI, vous devez attribuer le rôle Utilisateur Vertex AI (roles/aiplatform.user
) au compte de service dédié auquel vous avez accordé des autorisations d'accès à l'API Vertex AI.
Si vous devez accorder des autorisations spécifiques pour créer, modifier ou déployer des artefacts, accordez les autorisations IAM Vertex AI appropriées.
Vertex AI Feature Store
Pour utiliser Vertex AI Feature Store, vous devez attribuer les rôles suivants au compte de service :
Capacité d'IA | Rôles IAM requis |
---|---|
Vertex AI Feature Store |
Configurer les paramètres de génération de modèle
Les grands modèles de langage (LLM) sont des modèles de deep learning entraînés sur d'énormes quantités de données textuelles. Un modèle inclut des valeurs de paramètres qui contrôlent la manière dont il génère une réponse. Vous pouvez obtenir différents résultats du modèle en modifiant les valeurs des paramètres.
Pour définir les paramètres de génération d'un modèle, le SDK Vertex AI pour ABAP utilise le tableau /GOOG/AI_CONFIG
.
Pour configurer les paramètres de génération d'un modèle, procédez comme suit :
Dans l'interface utilisateur graphique de SAP, exécutez le code de transaction
/GOOG/SDK_IMG
.Vous pouvez également exécuter le code de transaction
SPRO
, puis cliquer sur SAP Reference IMG (IMG de référence SAP).Cliquez sur SDK ABAP pour Google Cloud > Paramètres de base > SDK Vertex AI : configurer les paramètres de génération de modèles.
Cliquez sur Nouvelles entrées.
Choisissez votre famille de modèles et saisissez les valeurs appropriées :
Gemini
Champ Type de données Description Clé du modèle Chaîne Nom unique que vous spécifiez pour identifier la configuration du modèle, par exemple
Gemini
.Vous utilisez cette clé de modèle lorsque vous instanciez la classe de modèle génératif ou la classe d'embeddings pour spécifier la configuration de génération à appliquer.
ID du modèle Chaîne ID de modèle du LLM, tel que
gemini-1.5-flash-001
.Pour en savoir plus sur les versions de modèle Vertex AI, consultez Versions et cycle de vie des modèles.
Nom de la clé Google Cloud Chaîne Clé client que vous avez configurée pour l'authentification à Google Cloud lors de la configuration de l'authentification. ID de l'emplacement de la région Google Cloud Chaîne ID de l'emplacement de la région Google Cloud où les fonctionnalités Vertex AI que vous souhaitez utiliser sont disponibles.
En règle générale, vous utilisez la région la plus proche de votre emplacement physique ou de celui des utilisateurs prévus. Pour en savoir plus, consultez Emplacements Vertex AI.
Référence éditeur du LLM Chaîne Facultatif. Éditeur du LLM, par exemple google
.Type MIME de la réponse Chaîne Facultatif. Type MIME de la réponse de sortie du texte candidat généré. Type MIME accepté : text/plain
: (par défaut) sortie textuelle.application/json
: réponse JSON dans les candidats.
Température de la randomisation Chaîne Facultatif. Contrôle le caractère aléatoire des prédictions. Pour en savoir plus, consultez Température.
Plage : [0.0, 1.0]
Échantillonnage Top-K Float Facultatif. Top-K modifie la façon dont le modèle sélectionne les jetons pour la sortie.
Spécifiez une valeur inférieure pour obtenir des réponses moins aléatoires et une valeur supérieure pour des réponses plus aléatoires. Pour en savoir plus, consultez Top-K.
Plage : [1, 40]
Échantillonnage Top-P Float Facultatif. Top-P modifie la façon dont le modèle sélectionne les jetons pour la sortie.
Spécifiez une valeur inférieure pour obtenir des réponses moins aléatoires et une valeur supérieure pour des réponses plus aléatoires. Pour en savoir plus, consultez Top-P.
Plage : [0.0, 1.0]
Nombre maximal de jetons de sortie par message Integer Facultatif. Nombre maximal de jetons pouvant être générés dans la réponse. Un jeton correspond environ à quatre caractères. 100 jetons correspondent à environ 60-80 mots.
Spécifiez une valeur inférieure pour obtenir des réponses plus courtes et une valeur supérieure pour des réponses potentiellement plus longues.
Pénalités positives Float Facultatif. Les valeurs positives pénalisent les jetons qui sont apparus dans le texte généré, ce qui augmente la probabilité de générer des thèmes plus diversifiés.
Plage : [-2,0, 2,0]
Pénalités de fréquence Float Facultatif. Les valeurs positives pénalisent les jetons qui apparaissent de manière répétée dans le texte généré, ce qui réduit la probabilité de répétition du contenu.
Plage : [-2,0, 2,0]
Claude
Champ Type de données Description Clé du modèle Chaîne Nom unique que vous spécifiez pour identifier la configuration du modèle, par exemple
Claude
.Vous utilisez cette clé de modèle lors de l'instanciation de la classe de modèle génératif pour spécifier la configuration de génération à appliquer.
ID du modèle Chaîne ID du modèle Claude compatible, tel que
claude-sonnet-4@20250514
.Les modèles Claude suivants sont acceptés :
Nom de la clé Google Cloud Chaîne Clé client que vous avez configurée pour l'authentification à Google Cloud lors de la configuration de l'authentification. ID de l'emplacement de la région Google Cloud Chaîne ID de l'emplacement de la région Google Cloud où le modèle Claude que vous souhaitez utiliser est disponible.
En règle générale, vous utilisez la région la plus proche de votre emplacement physique ou de celui des utilisateurs prévus. Pour en savoir plus, consultez Quotas et disponibilité d'Anthropic Claude par région.
Référence éditeur du LLM Chaîne Facultatif. Éditeur du LLM, par exemple anthropic
.Type MIME de la réponse Chaîne Facultatif. Type MIME de la réponse de sortie du texte candidat généré. Type MIME accepté : text/plain
: (par défaut) sortie textuelle.application/json
: réponse JSON dans les candidats.
Température de la randomisation Chaîne Facultatif. Contrôle le caractère aléatoire des prédictions. Pour en savoir plus, consultez Température.
Plage : [0.0, 1.0]
Échantillonnage Top-K Float Facultatif. Top-K modifie la façon dont le modèle sélectionne les jetons pour la sortie.
Spécifiez une valeur inférieure pour obtenir des réponses moins aléatoires et une valeur supérieure pour des réponses plus aléatoires. Pour en savoir plus, consultez Top-K.
Plage : [1, 40]
Échantillonnage Top-P Float Facultatif. Top-P modifie la façon dont le modèle sélectionne les jetons pour la sortie.
Spécifiez une valeur inférieure pour obtenir des réponses moins aléatoires et une valeur supérieure pour des réponses plus aléatoires. Pour en savoir plus, consultez Top-P.
Plage : [0.0, 1.0]
Nombre maximal de jetons de sortie par message Integer Facultatif. Nombre maximal de jetons pouvant être générés dans la réponse. Un jeton correspond environ à quatre caractères. 100 jetons correspondent à environ 60-80 mots.
Spécifiez une valeur inférieure pour obtenir des réponses plus courtes et une valeur supérieure pour des réponses potentiellement plus longues.
Pénalités positives Float Non applicable
Pénalités de fréquence Float Non applicable
Model ID
.Enregistrez la nouvelle entrée.
Configurer les paramètres de recherche vectorielle
Pour définir les configurations Vector Search, le SDK Vertex AI pour ABAP utilise le tableau /GOOG/SEARCHCONF
.
Pour configurer les paramètres de recherche vectorielle, procédez comme suit :
Dans l'interface utilisateur graphique de SAP, exécutez le code de transaction
/GOOG/SDK_IMG
.Vous pouvez également exécuter le code de transaction
SPRO
, puis cliquer sur SAP Reference IMG (IMG de référence SAP).Cliquez sur SDK ABAP pour Google Cloud > Paramètres de base > SDK Vertex AI : configurer les paramètres de Vector Search.
Cliquez sur Nouvelles entrées.
Renseignez les champs suivants :
Champ Type de données Description Clé de recherche Chaîne Nom unique que vous spécifiez pour identifier la configuration de recherche. Nom de la clé Google Cloud Chaîne Clé client que vous avez configurée pour l'authentification à Google Cloud lors de la configuration de l'authentification. ID de l'emplacement de la région Google Cloud Chaîne ID de l'emplacement de la région Google Cloud où les fonctionnalités Vertex AI que vous souhaitez utiliser sont disponibles.
En règle générale, vous utilisez la région la plus proche de votre emplacement physique ou de celui des utilisateurs prévus. Pour en savoir plus, consultez Emplacements Vertex AI.
ID de déploiement de l'index Vector Chaîne ID de déploiement d'un index. Lorsque vous déployez un index sur un point de terminaison, vous lui attribuez un ID de déploiement unique. Pour en savoir plus sur le déploiement d'index, consultez Déployer un index vectoriel sur un point de terminaison d'index.
ID du point de terminaison de l'index Vector Chaîne ID du point de terminaison d'index sur lequel l'index est déployé.
Pour en savoir plus sur les points de terminaison d'index, consultez Créer un point de terminaison d'index vectoriel.
Enregistrez la nouvelle entrée.
Étapes suivantes
- Découvrez les démonstrations d'IA générative intégrées pour SAP.
- Découvrez l'IA générative sur Vertex AI pour SAP.