Installer et configurer le SDK Vertex AI pour ABAP

Ce document explique comment installer et configurer le SDK Vertex AI pour ABAP dans votre environnement SAP.

Installation

Lorsque vous installez la version 1.8 de l'édition sur site ou de n'importe quelle édition cloud du SDK ABAP pour Google Cloud, le SDK Vertex AI pour ABAP est installé pour vous. Pour en savoir plus sur la procédure d'installation, consultez Installer et configurer l'édition sur site ou n'importe quelle édition cloud du SDK ABAP pour Google Cloud.

Si vous utilisez déjà la version 1.7 ou une version antérieure de l'édition sur site ou de toute édition cloud du SDK ABAP pour Google Cloud, mettez à jour votre SDK vers la dernière version pour obtenir le SDK Vertex AI pour ABAP. Pour en savoir plus, consultez Mettre à jour le SDK ABAP pour Google Cloud.

Nous comprenons que l'accès à Vertex AI et aux ressources cloud puisse être limité pour certains développeurs. Pour activer le prototypage et l'expérimentation avec une configuration minimale, consultez Prototypage rapide avec Gemini.

Activer l'API Vertex AI

Activez l'API Vertex AI dans votre projet Google Cloud.

API Vertex AI

Pour en savoir plus sur l'activation des API Google Cloud, consultez la page Activer des API.

Authentification

Une fois que vous avez configuré l'authentification pour accéder aux API Google Cloud dans votre édition sur site ou cloud du SDK ABAP pour Google Cloud, le SDK Vertex AI pour ABAP utilise la même méthode d'authentification pour accéder à l'API Vertex AI. Pour savoir comment configurer l'authentification dans l'édition sur site ou dans toute édition cloud du SDK ABAP pour Google Cloud, consultez la section Présentation de l'authentification.

Notez la clé client que vous avez créée lors de la configuration de l'authentification. Vous utilisez cette clé client lorsque vous configurez les paramètres de génération de modèles d'IA et les paramètres de recherche.

Autorisations IAM

Assurez-vous que le compte de service dédié à l'accès à l'API que vous avez configuré dans la table des clés client a accès aux ressources Vertex AI.

Vertex AI

Pour utiliser les ressources Vertex AI, vous devez attribuer le rôle Utilisateur Vertex AI (roles/aiplatform.user) au compte de service dédié auquel vous avez accordé des autorisations d'accès à l'API Vertex AI.

Si vous devez fournir des autorisations spécifiques pour créer, modifier ou déployer des artefacts, accordez les autorisations IAM Vertex AI appropriées.

Vertex AI Feature Store

Pour utiliser Vertex AI Feature Store, vous devez attribuer les rôles suivants au compte de service:

Fonctionnalité d'IA Rôles IAM requis
Vertex AI Feature Store

Configurer les paramètres de génération de modèle

Les grands modèles de langage (LLM) sont des modèles de deep learning entraînés sur d'énormes quantités de données textuelles. Un modèle inclut des valeurs de paramètres qui contrôlent la manière dont le modèle génère sa réponse. Vous pouvez obtenir différents résultats du modèle en modifiant les valeurs des paramètres.

Pour définir les paramètres de génération d'un modèle, le SDK Vertex AI pour ABAP utilise la table /GOOG/AI_CONFIG.

Pour configurer les paramètres de génération d'un modèle, procédez comme suit:

  1. Dans l'interface utilisateur graphique de SAP, exécutez le code de transaction /GOOG/SDK_IMG.

    Vous pouvez également exécuter le code de transaction SPRO, puis cliquer sur SAP Reference IMG (IMG de référence SAP).

  2. Cliquez sur SDK ABAP pour Google Cloud > Paramètres de base > SDK Vertex AI: configurer les paramètres de génération de modèles.

  3. Cliquez sur Nouvelles entrées.

  4. Renseignez les champs suivants :

    Champ Type de données Description
    Clé de modèle Chaîne

    Nom unique que vous spécifiez pour identifier la configuration du modèle, par exemple Gemini.

    Vous utilisez cette clé de modèle lors de l'instanciation de la classe de modèle génératif ou de la classe d'embeddings pour spécifier la configuration de génération à prendre en compte.

    ID du modèle Chaîne

    ID de modèle du LLM, par exemple gemini-1.5-flash-001.

    Pour en savoir plus sur les versions de modèle Vertex AI, consultez la section Versions et cycle de vie des modèles.

    Nom de la clé Google Cloud Chaîne Clé client que vous avez configurée pour l'authentification auprès de Google Cloud lors de la configuration de l'authentification.
    ID de région Google Cloud Chaîne

    ID de l'emplacement de la région Google Cloud dans laquelle les fonctionnalités Vertex AI que vous souhaitez utiliser sont disponibles.

    En règle générale, utilisez la région la plus proche de votre emplacement physique ou de celui des utilisateurs prévus. Pour en savoir plus, consultez les emplacements Vertex AI.

    ID de l'éditeur de la LLM Chaîne Facultatif. Éditeur du LLM, par exemple google.
    Type MIME de la réponse Chaîne Facultatif. Type MIME de la réponse de sortie du texte candidat généré. Type MIME accepté :
    • text/plain : (par défaut) sortie textuelle.
    • application/json : réponse JSON dans les candidats.
    Le modèle doit être invité à générer le type de réponse approprié, sans quoi le comportement n'est pas défini.
    Température de la randomisation Chaîne

    Facultatif. Contrôle le caractère aléatoire des prédictions. Pour en savoir plus, consultez la section Température.

    Plage: [0,0, 1,0]

    Échantillonnage Top-K Float

    Facultatif. Top-K modifie la façon dont le modèle sélectionne les jetons pour la sortie.

    Spécifiez une valeur inférieure pour obtenir des réponses moins aléatoires et une valeur supérieure pour des réponses plus aléatoires. Pour en savoir plus, consultez Top-K.

    Plage: [1, 40]

    Échantillonnage Top-P Float

    Facultatif. Top-P modifie la façon dont le modèle sélectionne les jetons pour la sortie.

    Spécifiez une valeur inférieure pour obtenir des réponses moins aléatoires et une valeur supérieure pour des réponses plus aléatoires. Pour en savoir plus, consultez Top-P.

    Plage: [0,0, 1,0]

    Nombre maximal de jetons de sortie par message Integer

    Facultatif. Nombre maximal de jetons pouvant être générés dans la réponse. Un jeton correspond environ à quatre caractères. 100 jetons correspondent à environ 60-80 mots.

    Spécifiez une valeur inférieure pour obtenir des réponses plus courtes et une valeur supérieure pour des réponses potentiellement plus longues.

    Pénalités positives Float

    Facultatif. Les valeurs positives pénalisent les jetons qui sont apparus dans le texte généré, ce qui augmente la possibilité de générer des sujets plus diversifiés.

    Plage: [-2,0, 2,0]

    Pénalités de fréquence Float

    Facultatif. Les valeurs positives pénalisent les jetons qui apparaissent de manière répétée dans le texte généré, ce qui réduit la probabilité de répétition du contenu.

    Plage: [-2,0, 2,0]

    Si vous ne fournissez pas de valeur pour un paramètre facultatif, le SDK utilise la valeur par défaut du paramètre spécifique à la version du modèle configurée dans Model ID.

  5. Enregistrez la nouvelle entrée.

Configurer les paramètres de recherche vectorielle

Pour définir des configurations Vector Search, le SDK Vertex AI pour ABAP utilise la table /GOOG/SEARCHCONF.

Pour configurer les paramètres de recherche vectorielle, procédez comme suit:

  1. Dans l'interface utilisateur graphique de SAP, exécutez le code de transaction /GOOG/SDK_IMG.

    Vous pouvez également exécuter le code de transaction SPRO, puis cliquer sur SAP Reference IMG (IMG de référence SAP).

  2. Cliquez sur SDK ABAP pour Google Cloud > Paramètres de base > SDK Vertex AI: configurer les paramètres de recherche vectorielle.

  3. Cliquez sur Nouvelles entrées.

  4. Renseignez les champs suivants :

    Champ Type de données Description
    Touche de recherche Chaîne Nom unique que vous spécifiez pour identifier la configuration de recherche.
    Nom de la clé Google Cloud Chaîne Clé client que vous avez configurée pour l'authentification auprès de Google Cloud lors de la configuration de l'authentification.
    ID de région Google Cloud Chaîne

    ID de l'emplacement de la région Google Cloud dans laquelle les fonctionnalités Vertex AI que vous souhaitez utiliser sont disponibles.

    En règle générale, utilisez la région la plus proche de votre emplacement physique ou de celui des utilisateurs prévus. Pour en savoir plus, consultez les emplacements Vertex AI.

    ID de déploiement de l'index Vector Search Chaîne ID de déploiement d'un indice. Lorsque vous déployez un index sur un point de terminaison, vous lui attribuez un ID de déploiement unique.

    Pour en savoir plus sur le déploiement d'un index, consultez Déployer un index vectoriel sur un point de terminaison d'index.

    ID du point de terminaison de l'index Vector Chaîne

    ID du point de terminaison d'index sur lequel l'index est déployé.

    Pour en savoir plus sur les points de terminaison d'index, consultez la section Créer un point de terminaison d'index vectoriel.

  5. Enregistrez la nouvelle entrée.

Étape suivante