Instala y configura el SDK de Vertex AI para ABAP

En este documento, se describe cómo instalar y configurar el SDK de Vertex AI para ABAP en el sistema host de SAP en Compute Engine, cualquier máquina virtual en la nube, RISE con S/4HANA Cloud Private Edition o instancias locales.

Instalación

Cuando instalas la versión más reciente de la edición local o cualquier edición en la nube del SDK de ABAP para Google Cloud, se instala el SDK de Vertex AI para ABAP. Para obtener información sobre los pasos de instalación, consulta Instala y configura las ediciones locales o cualquier edición en la nube del SDK de ABAP para Google Cloud.

Si usas la versión 1.7 o una anterior de la edición local o en la nube del SDK de ABAP para Google Cloud, actualiza tu SDK a la versión más reciente para obtener el SDK de Vertex AI para ABAP. Si deseas obtener más información, consulta Actualiza el SDK de ABAP para Google Cloud.

Entendemos que el acceso a Vertex AI y a los recursos de la nube podría estar limitado para algunos desarrolladores. Para habilitar el prototipado y la experimentación con una configuración mínima, consulta Prototipado rápido con Gemini.

Habilita la API de Vertex AI

Habilita la API de Vertex AI en tu Google Cloud proyecto.

API de Vertex AI

Para obtener información sobre cómo habilitar las Google Cloud APIs, consulta Habilita las APIs.

Habilita los modelos de socios en Vertex AI

Si quieres usar un modelo de socio, debes habilitar el modelo requerido en Vertex AI.

El SDK de Vertex AI para ABAP admite los siguientes modelos de Claude de Anthropic:

Para habilitar un modelo de Claude, ve a la tarjeta de modelo correspondiente de Model Garden y, luego, haz clic en Habilitar:

Autenticación

Una vez que configures la autenticación para acceder a las APIs de Google Cloud en tu edición local o en la nube del SDK de ABAP para Google Cloud, el SDK de Vertex AI para ABAP utilizará el mismo método de autenticación para acceder a la API de Vertex AI. Si deseas obtener información para configurar la autenticación en la edición local o en cualquier edición en la nube del SDK de ABAP para Google Cloud, consulta la Descripción general de la autenticación.

Anota la clave de cliente que creaste como parte de la configuración de autenticación. Usas esta clave de cliente cuando configuras los parámetros de generación del modelo de IA y los parámetros de búsqueda.

Permisos de IAM

Asegúrate de que la cuenta de servicio dedicada para el acceso a la API que configuraste en la tabla de claves del cliente tenga acceso a los recursos de Vertex AI.

Vertex AI

Para usar los recursos de Vertex AI, debes otorgar el rol de usuario de Vertex AI (roles/aiplatform.user) a la cuenta de servicio dedicada a la que le otorgaste permisos para acceder a la API de Vertex AI.

Si necesitas proporcionar permisos específicos para crear, modificar o implementar artefactos, otorga los permisos de IAM de Vertex AI específicos según corresponda.

Vertex AI Feature Store

Para usar Vertex AI Feature Store, debes otorgar los siguientes roles a la cuenta de servicio:

Capacidad de IA Roles de IAM obligatorios
Vertex AI Feature Store

Configura los parámetros de generación del modelo

Los modelos de lenguaje grandes (LLM) son modelos de aprendizaje profundo entrenados con cantidades masivas de datos de texto. Un modelo incluye valores de parámetros que controlan cómo el modelo genera una respuesta. Puedes obtener resultados diferentes del modelo cambiando los valores de los parámetros.

Para definir los parámetros de generación de un modelo, el SDK de Vertex AI para ABAP usa la tabla /GOOG/AI_CONFIG.

Para configurar los parámetros de generación de un modelo, sigue estos pasos:

  1. En la GUI de SAP, ejecuta el código de transacción /GOOG/SDK_IMG.

    Como alternativa, ejecuta el código de transacción SPRO y, luego, haz clic en IMG de referencia de SAP.

  2. Haz clic en SDK de ABAP para Google Cloud > Configuración básica > SDK de Vertex AI: Configura parámetros de generación de modelos.

  3. Haz clic en Entradas nuevas.

  4. Elige la familia de tu modelo y, luego, ingresa los valores según corresponda:

    Gemini

    Campo Tipo de datos Descripción
    Clave del modelo String

    Es un nombre único que especificas para identificar la configuración del modelo, como Gemini.

    Usas esta clave de modelo cuando creas una instancia de la clase de modelo generativo o de la clase de incorporaciones para especificar la configuración de generación que debe entrar en vigencia.

    ID del modelo String

    ID del modelo de LLM, como gemini-1.5-flash-001.

    Para obtener información sobre las versiones de modelos de Vertex AI, consulta Versiones y ciclo de vida de los modelos.

    Nombre de la clave de Google Cloud String Es la clave de cliente que configuraste para la autenticación en Google Cloud durante la configuración de la autenticación.
    ID de ubicación de la región de Google Cloud String

    ID de ubicación de la región Google Cloud en la que están disponibles las funciones de Vertex AI que deseas usar.

    Por lo general, debes usar la región más cercana a tu ubicación física o a la ubicación física de los usuarios previstos. Para obtener más información, consulta Ubicaciones de Vertex AI.

    ID del publicador del LLM String Opcional. Es el editor del LLM, como google.
    Tipo de MIME de respuesta String Opcional. Tipo de MIME de la respuesta de salida del texto candidato generado. Tipo de MIME admitido:
    • text/plain: la salida de texto (configuración predeterminada).
    • application/json: la respuesta JSON en los candidatos.
    Se debe solicitar al modelo que genere el tipo de respuesta adecuado; de lo contrario, el comportamiento no está definido.
    Temperatura de aleatoriedad String

    Opcional. Controla la aleatorización de las predicciones. Para obtener más información, consulta Temperatura.

    Rango: [0.0, 1.0]

    Muestreo Top-K Número de punto flotante

    Opcional. El parámetro Top-K cambia la manera en la que el modelo selecciona los tokens para el resultado.

    Especifica un valor más bajo para respuestas menos aleatorias y un valor más alto para respuestas más aleatorias. Para obtener más información, consulta Top-K.

    Rango: [1, 40]

    Muestreo Top-P Número de punto flotante

    Opcional. Top-P cambia la manera en la que el modelo selecciona los tokens para el resultado.

    Especifica un valor más bajo para respuestas menos aleatorias y un valor más alto para respuestas más aleatorias. Para obtener más información, consulta Top-P.

    Rango: [0.0, 1.0]

    Cantidad máxima de tokens de salida por mensaje Número entero

    Opcional. La cantidad máxima de tokens que se pueden generar en la respuesta. Un token tiene aproximadamente cuatro caracteres. 100 tokens corresponden a casi 60 u 80 palabras.

    Especifica un valor más bajo para respuestas más cortas y un valor más alto para respuestas posiblemente más largas.

    Penalizaciones positivas Número de punto flotante

    Opcional. Los valores positivos penalizan los tokens que aparecieron en el texto generado, lo que aumenta la posibilidad de generar temas más diversos.

    Rango: [-2.0, 2.0]

    Penalizaciones de frecuencia Número de punto flotante

    Opcional. Los valores positivos penalizan los tokens que aparecen repetidamente en el texto generado, lo que disminuye la posibilidad de repetir el mismo contenido.

    Rango: [-2.0, 2.0]

    Claude

    Campo Tipo de datos Descripción
    Clave del modelo String

    Es un nombre único que especificas para identificar la configuración del modelo, como Claude.

    Usas esta clave de modelo cuando creas una instancia de la clase del modelo generativo para especificar la configuración de generación que debe entrar en vigencia.

    ID del modelo String

    ID del modelo de Claude compatible, como claude-sonnet-4@20250514.

    Se admiten los siguientes modelos de Claude:

    Nombre de la clave de Google Cloud String Es la clave de cliente que configuraste para la autenticación en Google Cloud durante la configuración de la autenticación.
    ID de ubicación de la región de Google Cloud String

    ID de ubicación de la región Google Cloud en la que está disponible el modelo de Claude que deseas usar.

    Por lo general, debes usar la región más cercana a tu ubicación física o a la ubicación física de los usuarios previstos. Para obtener más información, consulta Cuotas de Claude Anthropic y disponibilidad de regiones.

    ID del publicador del LLM String Opcional. Es el editor del LLM, como anthropic.
    Tipo de MIME de respuesta String Opcional. Tipo de MIME de la respuesta de salida del texto candidato generado. Tipo de MIME admitido:
    • text/plain: la salida de texto (configuración predeterminada).
    • application/json: la respuesta JSON en los candidatos.
    Se debe solicitar al modelo que genere el tipo de respuesta adecuado; de lo contrario, el comportamiento no está definido.
    Temperatura de aleatoriedad String

    Opcional. Controla la aleatorización de las predicciones. Para obtener más información, consulta Temperatura.

    Rango: [0.0, 1.0]

    Muestreo Top-K Número de punto flotante

    Opcional. El parámetro Top-K cambia la manera en la que el modelo selecciona los tokens para el resultado.

    Especifica un valor más bajo para respuestas menos aleatorias y un valor más alto para respuestas más aleatorias. Para obtener más información, consulta Top-K.

    Rango: [1, 40]

    Muestreo Top-P Número de punto flotante

    Opcional. Top-P cambia la manera en la que el modelo selecciona los tokens para el resultado.

    Especifica un valor más bajo para respuestas menos aleatorias y un valor más alto para respuestas más aleatorias. Para obtener más información, consulta Top-P.

    Rango: [0.0, 1.0]

    Cantidad máxima de tokens de salida por mensaje Número entero

    Opcional. La cantidad máxima de tokens que se pueden generar en la respuesta. Un token tiene aproximadamente cuatro caracteres. 100 tokens corresponden a casi 60 u 80 palabras.

    Especifica un valor más bajo para respuestas más cortas y un valor más alto para respuestas posiblemente más largas.

    Penalizaciones positivas Número de punto flotante

    No aplicable

    Penalizaciones de frecuencia Número de punto flotante

    No aplicable

    Si no proporcionas un valor para un parámetro opcional, el SDK usa el valor predeterminado del parámetro específico de la versión del modelo configurada en Model ID.

  5. Guarda la entrada nueva.

Configura los parámetros de Vector Search

Para definir las configuraciones de Vector Search, el SDK de Vertex AI para ABAP usa la tabla /GOOG/SEARCHCONF.

Para configurar los parámetros de la Búsqueda de vectores, sigue estos pasos:

  1. En la GUI de SAP, ejecuta el código de transacción /GOOG/SDK_IMG.

    Como alternativa, ejecuta el código de transacción SPRO y, luego, haz clic en IMG de referencia de SAP.

  2. Haz clic en SDK de ABAP para Google Cloud > Configuración básica > SDK de Vertex AI: Configura los parámetros de Vector Search.

  3. Haz clic en Entradas nuevas.

  4. Ingresa los valores para los siguientes campos:

    Campo Tipo de datos Descripción
    Tecla de búsqueda String Es un nombre único que especificas para identificar la configuración de búsqueda.
    Nombre de la clave de Google Cloud String Es la clave de cliente que configuraste para la autenticación en Google Cloud durante la configuración de la autenticación.
    ID de ubicación de la región de Google Cloud String

    ID de ubicación de la región Google Cloud en la que están disponibles las funciones de Vertex AI que deseas usar.

    Por lo general, debes usar la región más cercana a tu ubicación física o a la ubicación física de los usuarios previstos. Para obtener más información, consulta Ubicaciones de Vertex AI.

    ID de la implementación del índice de vectores String Es el ID de la implementación de un índice. Cuando implementas un índice en un extremo, le asignas un ID de implementación único.

    Para obtener información sobre la implementación de índices, consulta Implementa un índice vectorial en un extremo de índice.

    ID del extremo del índice de vectores String

    Es el ID del extremo del índice en el que se implementa el índice.

    Para obtener información sobre el extremo de índice, consulta Crea un extremo de índice vectorial.

  5. Guarda la entrada nueva.

¿Qué sigue?