Appeler des prédictions avec la gestion des points de terminaison de modèle

Sélectionnez une version de la documentation :

Cette page décrit une version preview qui vous permet d'expérimenter l'enregistrement d'un point de terminaison de modèle d'IA et d'appeler des prédictions avec la gestion des points de terminaison de modèle. Pour utiliser des modèles d'IA dans des environnements de production, consultez Créer des applications d'IA générative à l'aide d'AlloyDB AI.

Une fois les points de terminaison de modèle ajoutés et enregistrés dans la gestion des points de terminaison de modèle, vous pouvez les référencer à l'aide de l'ID de modèle pour appeler des prédictions.

Avant de commencer

Assurez-vous d'avoir enregistré le point de terminaison de votre modèle dans la gestion des points de terminaison de modèle. Pour en savoir plus, consultez Enregistrer un point de terminaison de modèle avec la gestion des points de terminaison de modèle.

Appeler des prédictions pour des modèles génériques

Utilisez la fonction SQL google_ml.predict_row() pour appeler un point de terminaison de modèle générique enregistré afin d'appeler des prédictions. Vous pouvez utiliser la fonction google_ml.predict_row() avec n'importe quel type de modèle.

SELECT
  google_ml.predict_row(
    model_id => 'MODEL_ID',
    request_body => 'REQUEST_BODY');

Remplacez les éléments suivants :

  • MODEL_ID : ID du modèle que vous avez défini lors de l'enregistrement du point de terminaison du modèle.
  • REQUEST_BODY : paramètres de la fonction de prédiction, au format JSON.

Exemples

Cette section présente quelques exemples d'appel de prédictions à l'aide de points de terminaison de modèles enregistrés.

Pour générer des prédictions pour un point de terminaison de modèle gemini-pro enregistré, exécutez l'instruction suivante :

    SELECT
        json_array_elements(
        google_ml.predict_row(
            model_id => 'gemini-pro',
            request_body => '{
        "contents": [
            {
                "role": "user",
                "parts": [
                    {
                        "text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
                    }
                ]
            }
        ]
        }'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';

Pour générer des prédictions pour un point de terminaison de modèle facebook/bart-large-mnli enregistré sur Hugging Face, exécutez l'instruction suivante :

  SELECT
  google_ml.predict_row(
    model_id => 'facebook/bart-large-mnli',
    request_body =>
      '{
       "inputs": "Hi, I recently bought a device from your company but it is not working as advertised and I would like to get reimbursed!",
    "parameters": {"candidate_labels": ["refund", "legal", "faq"]}
    }'
  );