Installa e configura l'SDK Vertex AI per ABAP

Questo documento descrive come installare e configurare l'SDK Vertex AI per ABAP nel tuo ambiente SAP.

Installazione

Quando installi la versione 1.8 dell'edizione on-premise o di qualsiasi edizione cloud dell'SDK ABAP per Google Cloud, l'SDK Vertex AI per ABAP viene installato automaticamente. Per informazioni sulla procedura di installazione, consulta Installare e configurare la versione on-premise o qualsiasi versione cloud di ABAP SDK for Google Cloud.

Se utilizzi già la versione 1.7 o precedenti dell'edizione on-premise o cloud dell'SDK ABAP per Google Cloud, aggiorna l'SDK alla versione più recente per ottenere l'SDK Vertex AI per ABAP. Per ulteriori informazioni, consulta Aggiornare ABAP SDK per Google Cloud.

Siamo consapevoli che l'accesso a Vertex AI e alle risorse cloud potrebbe essere limitato per alcuni sviluppatori. Per abilitare la prototipazione e la sperimentazione con una configurazione minima, consulta Prototipazione rapida con Gemini.

Abilita l'API Vertex AI

Abilita l'API Vertex AI nel tuo progetto Google Cloud.

API Vertex AI

Per informazioni su come abilitare le API Google Cloud, consulta Abilitazione delle API.

Autenticazione

Dopo aver configurato l'autenticazione per accedere alle API Google Cloud nella versione on-premise o in qualsiasi versione cloud dell'ABAP SDK per Google Cloud, l'SDK Vertex AI per ABAP utilizza lo stesso metodo di autenticazione per accedere all'API Vertex AI. Per informazioni su come configurare l'autenticazione nella versione on-premise o in qualsiasi versione cloud di ABAP SDK for Google Cloud, consulta la Panoramica dell'autenticazione.

Prendi nota della chiave client che hai creato durante la configurazione dell'autenticazione. Utilizza questa chiave client per configurare i parametri di generazione del modello di AI e i parametri di ricerca.

Autorizzazioni IAM

Assicurati che l'account di servizio dedicato per l'accesso all'API che hai configurato nella tabella delle chiavi client abbia accesso alle risorse Vertex AI.

Vertex AI

Per utilizzare le risorse Vertex AI, devi concedere il ruolo Utente Vertex AI (roles/aiplatform.user) all'account di servizio dedicato a cui hai concesso le autorizzazioni per accedere all'API Vertex AI.

Se devi fornire autorizzazioni specifiche per creare, modificare ed eseguire il deployment di elementi, concessi autorizzazioni IAM Vertex AI specifiche, a seconda dei casi.

Vertex AI Feature Store

Per utilizzare Vertex AI Feature Store, devi concedere i seguenti ruoli all'account di servizio:

Funzionalità di IA Ruoli IAM richiesti
Vertex AI Feature Store

Configura i parametri di generazione del modello

I modelli linguistici di grandi dimensioni (LLM) sono modelli di deep learning addestrati su enormi quantità di dati testuali. Un modello include valori parametro che controllano il modo in cui il modello genera una risposta. Puoi ottenere risultati diversi dal modello modificando i valori parametro.

Per definire i parametri di generazione per un modello, l'SDK Vertex AI per ABAP utilizza la tabella /GOOG/AI_CONFIG.

Per configurare i parametri di generazione di un modello, segui questi passaggi:

  1. In SAP GUI, esegui il codice transazione /GOOG/SDK_IMG.

    In alternativa, esegui il codice transazione SPRO e poi fai clic su Immagine di riferimento SAP.

  2. Fai clic su ABAP SDK for Google Cloud > Impostazioni di base > SDK Vertex AI: configura i parametri di generazione del modello.

  3. Fai clic su Nuove voci.

  4. Inserisci i valori per i seguenti campi:

    Campo Tipo di dati Descrizione
    Model Key Stringa

    Un nome univoco specificato per identificare la configurazione del modello, ad esempio Gemini.

    Utilizza questa chiave del modello durante l'inizializzazione della classe del modello generativo o della classe degli embedding per specificare la configurazione di generazione da applicare.

    ID modello Stringa

    ID modello dell'LLM, ad esempio gemini-1.5-flash-001.

    Per informazioni sulle versioni dei modelli Vertex AI, consulta Versioni e ciclo di vita dei modelli.

    Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione.
    ID posizione della regione Google Cloud Stringa

    L'ID posizione della regione Google Cloud in cui sono disponibili le funzionalità di Vertex AI che vuoi utilizzare.

    In genere, si utilizza la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.

    ID publisher del LLM Stringa Facoltativo. L'editore dell'LLM, ad esempio google.
    Tipo MIME della risposta Stringa Facoltativo. Tipo MIME della risposta di output del testo candidato generato. Tipo MIME supportato:
    • text/plain: (valore predefinito) Output di testo.
    • application/json: risposta JSON nei candidati.
    Al modello deve essere richiesto di produrre il tipo di risposta appropriato, altrimenti il comportamento non è definito.
    Temperatura della casualità Stringa

    Facoltativo. Controlla la casualità delle previsioni. Per ulteriori informazioni, vedi Temperatura.

    Intervallo: [0,0, 1,0]

    Campionamento Top-K Numero in virgola mobile

    Facoltativo. Top-K cambia il modo in cui il modello seleziona i token per l'output.

    Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, consulta Top-K.

    Intervallo: [1, 40]

    Campionamento Top-P Numero in virgola mobile

    Facoltativo. Top-P cambia il modo in cui il modello seleziona i token per l'output.

    Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, consulta Top-P.

    Intervallo: [0,0, 1,0]

    Numero massimo di token di output per messaggio Numero intero

    Facoltativo. Numero massimo di token che possono essere generati nella risposta. Un token equivale a circa quattro caratteri. 100 token corrispondono a circa 60-80 parole.

    Specifica un valore più basso per risposte più brevi e un valore più alto per risposte potenzialmente più lunghe.

    Penalità positive Numero in virgola mobile

    Facoltativo. I valori positivi penalizzano i token che sono comparsi nel testo generato, aumentando così la possibilità di generare argomenti più diversi.

    Intervallo: [-2,0; 2,0]

    Sanzioni per frequenza Numero in virgola mobile

    Facoltativo. I valori positivi penalizzano i token che appaiono ripetutamente nel testo generato, diminuendo così la possibilità di ripetere gli stessi contenuti.

    Intervallo: [-2,0; 2,0]

    Se non fornisci un valore per un parametro facoltativo, l'SDK utilizza il valore predefinito del parametro specifico per la versione del modello configurata in Model ID.

  5. Salva la nuova voce.

Configurare i parametri di Vector Search

Per definire le configurazioni di Vector Search, l'SDK Vertex AI per ABAP utilizza la tabella /GOOG/SEARCHCONF.

Per configurare i parametri di ricerca vettoriale, svolgi i seguenti passaggi:

  1. In SAP GUI, esegui il codice transazione /GOOG/SDK_IMG.

    In alternativa, esegui il codice transazione SPRO e poi fai clic su Immagine di riferimento SAP.

  2. Fai clic su ABAP SDK for Google Cloud > Impostazioni di base > SDK Vertex AI: configura i parametri di ricerca di vettori.

  3. Fai clic su Nuove voci.

  4. Inserisci i valori per i seguenti campi:

    Campo Tipo di dati Descrizione
    Tasto per la ricerca Stringa Un nome univoco specificato per identificare la configurazione di ricerca.
    Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione.
    ID posizione della regione Google Cloud Stringa

    L'ID posizione della regione Google Cloud in cui sono disponibili le funzionalità di Vertex AI che vuoi utilizzare.

    In genere, si utilizza la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.

    ID deployment dell'indice vettore Stringa L'ID di deployment di un indice. Quando esegui il deployment di un indice in un endpoint, gli assegni un ID deployment univoco.

    Per informazioni sul deployment degli indici, vedi Eseguire il deployment di un indice vettoriale in un endpoint indice.

    ID endpoint dell'indice di vettori Stringa

    L'ID dell'endpoint dell'indice in cui viene eseguito il deployment dell'indice.

    Per informazioni sull'endpoint dell'indice, vedi Creare un endpoint dell'indice di vettori.

  5. Salva la nuova voce.

Passaggi successivi