保存和重复使用经过人工审核的译文

翻译记忆库(仅限高级层级)是经过人工审核的翻译的存储库。门户用户可以对其翻译作业应用翻译记忆库,以便将源语言句段中的完全匹配内容替换为对应的目标语言句段。翻译记忆库有助于重复使用人工审核的翻译,并保持翻译的一致性。

您可以从空翻译记忆库开始,也可以导入自己的翻译。 在后期编辑过程中,Translation Hub 会使用后期编辑的译文填充翻译记忆库。

Translation Hub 仅将最新的后期编辑翻译保存在内存中。例如,如果门户用户修改了 Translation Hub 使用翻译记忆库翻译的句段,Translation Hub 会将现有句段替换为新编辑的句段。如需防止替换,您可以将翻译记忆库设置为只读。

翻译记忆库与其他翻译资源相比

除了翻译记忆库之外,您还可以提供其他资源来帮助门户用户进行翻译。以下部分介绍了每种资源之间的差异。

  • 术语表会匹配术语,而翻译记忆库会匹配片段。使用术语表翻译特定于网域的术语或实体。 词库也有大小限制;翻译记忆库可以包含任意数量的语言的任意数量的片段对。
  • 自定义模型是使用您的句子对进行训练的,当您没有全面的词汇表或翻译记忆库时,它们可以帮助您改进机器翻译。如果您想针对特定领域和写作风格调整机器翻译,请使用 AutoML Translation 构建可生成更贴合要求的预测结果的自定义模型。

门户用户可以结合使用这些资源,以帮助提高翻译质量。如需详细了解 Translation Hub 在翻译期间如何应用资源,请参阅翻译文档

准备工作

创建翻译记忆库时,您可以选择导入现有翻译。如果需要,请以 Translation Memory eXchange (TMX) 1.4 版格式提供译文。TMX 是一种用于提供源文本和目标译文的标准 XML 格式。以下示例展示了所需的 TMX 结构:

<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
  <header segtype="sentence" o-tmf="UTF-8"
  adminlang="en" srclang="en" datatype="PlainText"/>
  <body>
    <tu>
      <tuv xml:lang="en">
        <seg>Hello world!</seg>
      </tuv>
      <tuv xml:lang="es">
        <seg>¡Hola Mundo!</seg>
      </tuv>
    </tu>
  </body>
</tmx>

分段和匹配

按句子对 TMX 文件中的源语言条目进行分段。在翻译过程中,Translation Hub 会按句子对内容分段。然后,Translation Hub 会将这些句段与翻译记忆库中的句段进行比较。如果句段完全匹配,Translation Hub 会使用您对应的翻译。

如果您将部分句子或多个句子添加为源语言句段,则 Translation Hub 将不会匹配该句段。因此,您的匹配率可能会低于预期。

创建翻译记忆库

管理员可以使用 Google Cloud 控制台创建翻译记忆库。创建翻译记忆库后,只能通过后期编辑或自行编辑流程对其进行修改。例如,您无法导入其他文件来修改或附加到现有翻译记忆库。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往资源页面。

    转到“资源”页面

  2. 点击 添加资源

  3. 添加资源窗格中,选择翻译记忆库标签页。

  4. 指定翻译记忆库的名称。

  5. 选择创建空的翻译记忆库以创建空的翻译记忆库,或选择创建翻译记忆库并导入数据以导入现有翻译。

    1. 如需导入现有翻译,请将本地 TMX 文件上传到 Cloud Storage,或从 Cloud Storage 中选择现有 TMX 文件。
  6. 点击添加以创建翻译记忆库。

向门户添加翻译记忆库

创建翻译记忆库后,请将其添加到现有门户,以便门户用户在申请翻译时开始使用该记忆库。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往资源页面。

    转到“资源”页面

  2. 从资源列表中,选择要添加到一个或多个门户的翻译记忆库。

  3. 点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。

  4. 在“门户”字段中,选择一个或多个要添加翻译记忆库的门户。

  5. 点击分配

    资源页面上,您可以通过查看每个资源的门户名称列来确认添加。

设置默认翻译记忆库

您可以设置一个默认翻译记忆库,以便 Translation Hub 在门户用户请求翻译时自动选择该记忆库。

默认翻译记忆库有助于始终如一地应用一组人工审核的翻译,捕获后期编辑期间的修改,或同时实现上述两个目标。 用户无需记住要选择哪个翻译记忆库或使用哪个翻译记忆库。 他们仍然可以选择其他翻译记忆库或不选择任何翻译记忆库。门户用户在初始翻译完成后(例如在请求后期编辑时)无法更改此选择。

在开始之前,您必须先将要设为默认的翻译记忆库添加到门户

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。

    前往“门户”页面

  2. 选择要指定默认翻译记忆库的门户。

  3. 翻译记忆库部分中,找到要设为默认的翻译记忆库,然后依次选择 更多 > 设为默认

    如果您已有默认翻译记忆库,Translation Hub 会将其移除,并将您选择的翻译记忆库设为默认翻译记忆库。

移除默认翻译记忆库

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。

    前往“门户”页面

  2. 选择包含要移除的默认翻译记忆库的门户。

  3. 翻译记忆库部分中,找到要移除的默认翻译记忆库,然后依次选择 更多 > 取消设为默认

其他资源