适用于 AutoML 文本用户的 Gemini

本页面比较 AutoML 文本和 Gemini,以帮助 AutoML 文本用户了解如何使用 Gemini。

查看适用于您的使用场景的表格以及可能影响您的工作流的更改。

常规用法

这些差异适用于所有 Gemini 用户。

操作 AutoML Text Gemini
训练数据格式 您可以使用 CSV 或 JSON 行文件(文本实体提取除外)添加内嵌文本片段或引用类型为 TXT 的文档。实体提取仅支持 JSON 行文件。 您只能使用 JSON Line 文件。文件中的每一行应代表一个训练示例。您可以下载示例数据集来微调 Gemini 模型。文件应存储在 Cloud Storage 中。
数据集注释 注释组合为一个 AnnotationSet 对象。您可以将不同的注解集用于同一数据集。 数据集注释不适用于 Gemini。
数据集导入 您可以在 CSV 的可选列(与数据位于同一行)中指定机器学习用途值;或在与数据相同的 JSON 对象中以 JSON 行格式指定为标记。如果您未指定机器学习用途值,则数据会被自动拆分以用于训练、测试和验证。
对于情感分析,CSV 文件必须在每一行的最后一列包含情感最大值。
您需要准备两个单独的 JSONL 文件,一个用于训练,另一个用于验证。验证文件是可选的。验证文件应包含 10-256 个示例。
存储费用 创建数据集时,数据会加载到项目的 Cloud Storage 中。使用此存储空间是需要付费的。 了解详情 创建数据集时,数据会加载到项目的 Cloud Storage 中。使用此存储空间是需要付费的。 了解详情
为数据加标签 使用网址提供添加标签说明。注解是 Dataset 对象的一部分,无法使用 API 来操纵。 数据标记不适用于 Gemini。
模型部署 创建一个 Endpoint 对象来提供用于执行在线预测的资源。然后,将模型部署到端点。调用 predict() 方法来请求预测。 微调 Gemini 后,模型会存储在 Vertex AI Model Registry 中,系统会自动创建一个端点。您可以使用 Python SDK、REST API 或控制台请求经过调优的模型的在线预测。您可以先提取经过调优的端点,然后使用 generate_content() 方法来请求预测。
使用项目编号或项目 ID project-numberproject-id 都适用于 Vertex AI。 Gemini 使用 project-id
置信度分数 AutoML 文本支持置信度分数。 Gemini 不支持置信度分数。

API 用户

如需详细了解该 API,请参阅 Vertex AI 生成式 AI 调优 API 参考文档

操作或实体 AutoML Text Gemini
模型创建 创建 TrainingPipeline 对象,该对象返回训练作业。 您创建一个监督式微调作业,该作业会返回调优作业。
使用客户端库 每个 API 资源都有不同的 API 客户端。 您可以使用 Python SDK、REST API 或控制台为 Gemini 创建监督式微调作业。
请求预测 通过对 Endpoint 资源调用 predict() 方法来请求预测。 您可以先提取经过调优的端点,然后使用 generate_content 方法来请求预测。
在线预测端点 将下行中的 REGION 替换为预测模型所在的区域。
REGION-aiplatform.googleapis.com。 例如:
us-central1-aiplatform.googleapis.com
将下行中的 TUNING_JOB_REGION 替换为调整作业运行的区域。
TUNING_JOB_REGION-aiplatform.googleapis.com。 例如:
us-central1-aiplatform.googleapis.com
架构和定义文件 某些请求和响应字段在架构和定义文件中定义。数据格式使用预定义的架构文件定义。这为 API 和数据格式提供了灵活性。 请求正文模型参数响应正文与未调优的 Gemini 模型相同。请参阅示例请求
主机名 aiplatform.googleapis.com aiplatform.googleapis.com
区域主机名 必需。例如:
us-central1-aiplatform.googleapis.com
必需。例如:
us-central1-aiplatform.googleapis.com

后续步骤