使用模型端点管理调用预测

选择文档版本：

本页面介绍了预览版，您可以使用该预览版试验注册 AI 模型端点并使用模型端点管理调用预测。如需在生产环境中使用 AI 模型，请参阅使用 AlloyDB AI 构建生成式 AI 应用。

在模型端点管理中添加并注册模型端点后，您可以使用模型 ID 引用它们以调用预测。

准备工作

确保您已使用模型端点管理注册模型端点。如需了解详情，请参阅使用模型端点管理注册模型端点

调用通用模型的预测

使用 google_ml.predict_row() SQL 函数调用已注册的通用模型端点，以调用预测。您可以将 google_ml.predict_row() 函数与任何模型类型搭配使用。

SELECT
  google_ml.predict_row(
    model_id => 'MODEL_ID',
    request_body => 'REQUEST_BODY');

替换以下内容：

MODEL_ID：您在注册模型端点时定义的模型 ID。
REQUEST_BODY：预测函数的参数，采用 JSON 格式。

示例

本部分列出了一些使用已注册模型端点调用预测的示例。

如需为已注册的 gemini-pro 模型端点生成预测，请运行以下语句：

    SELECT
        json_array_elements(
        google_ml.predict_row(
            model_id => 'gemini-pro',
            request_body => '{
        "contents": [
            {
                "role": "user",
                "parts": [
                    {
                        "text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
                    }
                ]
            }
        ]
        }'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';

如需为 Hugging Face 上的已注册 facebook/bart-large-mnli 模型端点生成预测，请运行以下语句：

  SELECT
  google_ml.predict_row(
    model_id => 'facebook/bart-large-mnli',
    request_body =>
      '{
       "inputs": "Hi, I recently bought a device from your company but it is not working as advertised and I would like to get reimbursed!",
    "parameters": {"candidate_labels": ["refund", "legal", "faq"]}
    }'
  );

使用模型端点管理调用预测 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

准备工作

调用通用模型的预测

示例

使用模型端点管理调用预测