控制字词的翻译方式

如果必须以一致的方式翻译特定于网域的术语和命名实体,请创建术语表。术语表是一种自定义字典,包含两种或更多种语言的对应术语。在机器翻译过程中,Translation Hub 会自动将匹配的源语言术语替换为关联的目标语言术语。

您可以使用术语表来微调特定术语或实体的翻译方式。例如,您可以添加术语表条目,以防止产品名称(例如“Google Home”)被翻译。

创建术语表后,请将其添加到门户,以便门户用户使用。

术语表与其他翻译资源的对比

除了术语表之外,您还可以提供其他资源来帮助门户用户进行翻译。以下部分介绍了每种资源之间的区别。

  • 翻译记忆库会按句段进行匹配,而术语表会按术语进行匹配。使用翻译记忆库可重复使用导入的译文、在后期编辑过程中捕获的译文,或二者兼有。翻译记忆库可以包含任意数量的句段对,并且可以使用任意数量的语言。
  • 自定义模型是使用您的句子对进行训练的,当您没有全面的术语表或译文存储库时,它们可以帮助您改进机器翻译。如果您想针对特定领域和写作风格优化机器翻译,请使用 AutoML Translation 构建自定义模型,以生成更贴合的预测结果。

门户用户可以组合使用这些资源,以帮助提高翻译质量。如需详细了解 Translation Hub 如何在翻译过程中应用资源,请参阅翻译文档

无效搜索字词

Translation Hub 会忽略术语表中包含的一些术语:这些术语称为无效搜索字词。Translation Hub 仍会翻译无效搜索字词,但会忽略任何匹配的术语表条目。如需查看所有无效搜索字词的列表,请参阅术语表无效搜索字词

准备工作

如需填充术语表,您需要一个包含相应语言术语的文件。源文件的格式取决于您创建的术语表的类型:单向等同术语集

术语表条目区分大小写。对于不区分大小写的条目,请在术语表中添加这两种形式。

单向

单向术语表以源语言和目标语言对的形式指定术语的所需翻译。这些术语表的运作方式是单向的。例如,英语到西班牙语的单向术语表不适用于西班牙语到英语的翻译。

您可以提供 TSV(制表符分隔值)、CSV(逗号分隔值)或 TMX(Translation Memory eXchange)文件。对于 TSV 和 CSV 文件,请勿添加标题行来标识源语言和目标语言。您可以在创建术语表时指定这些字词。对于 TMX 文件,请使用 TMX 1.4 版标准。

如需了解术语表的详细信息和示例,请参阅 Cloud Translation 文档中的创建和使用术语表

等效术语集

等效术语集包含多种语言的等效术语,并且必须在 CSV 文件中定义。每行包含不同语言的对应术语。这些术语表是双向的。标题行必须通过相应的语言代码标识每一列对应的语言。

如需了解术语表的详细信息和示例,请参阅 Cloud Translation 文档中的创建和使用术语表

术语库限制

Translation Hub 对源文件的大小和每个术语表条目的大小设置了限制。如需了解详情,请参阅配额和限制

创建术语表

您可以使用 Google Cloud 控制台创建术语表。如果您之前通过 Cloud Translation API 创建了资源,Translation Hub 会将其提供给您。您可以将这些资源分配给门户。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。

    转到“资源”页面

  2. 点击 添加资源

  3. 添加资源窗格中,选择术语表标签页。

  4. 为该术语表指定名称。

  5. 选择术语表类型。

  6. 将本地术语表文件上传到 Cloud Storage,或从 Cloud Storage 中选择现有术语表文件。

  7. 指定术语表语言。

  8. 点击添加以创建术语表。

向门户添加术语表

创建术语表后,将其添加到门户,以便门户用户在申请翻译时使用。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。

    转到“资源”页面

  2. 从资源列表中,选择要添加到一个或多个门户的一个或多个术语表。

  3. 点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。

  4. 在“门户”字段中,选择一个或多个要将该术语表添加到的门户。

  5. 点击分配

    资源页面上,您可以通过查看每个资源的门户名称列来确认添加操作。

后续步骤