翻译记忆库(仅限高级层级)是经过人工审核的译文的存储库。门户用户可以对其翻译作业应用翻译记忆库,以便将源语言段中的完全匹配内容替换为对应的目标语言段。翻译记忆库有助于重复使用人工审核的译文并保持一致的译文。
您可以先创建一个空翻译记忆库,也可以导入自己的译文。在后期编辑过程中,Translation Hub 会使用经过后期编辑的译文填充翻译记忆库。
Translation Hub 只会在内存中保留最新的经过后期编辑的译文。例如,如果门户用户修改了 Translation Hub 使用翻译记忆库翻译的句段,Translation Hub 会将现有句段替换为新编辑的句段。如需防止替换,您可以将翻译记忆库设为只读。
翻译记忆库与其他翻译资源的对比
除了翻译记忆之外,您还可以提供其他资源来协助门户用户进行翻译。以下部分介绍了每种资源之间的差异。
- 术语表会按术语进行匹配,而翻译记忆库会按句段进行匹配。使用术语表翻译特定于网域的术语或实体。术语表也有大小限制;而译文存储库可以包含您需要的任意数量的语言对的句子对。
- 自定义模型是使用您的句子对进行训练的,当您没有全面的术语表或译文存储库时,它们可以帮助您改进机器翻译。如果您想针对特定领域和写作风格优化机器翻译,请使用 AutoML Translation 构建自定义模型,以生成更贴合的预测结果。
门户用户可以组合使用这些资源,以帮助提高翻译质量。如需详细了解 Translation Hub 如何在翻译过程中应用资源,请参阅翻译文档。
准备工作
创建翻译记忆库时,您可以选择导入现有翻译。如果您要提供译文,请采用 Translation Memory eXchange (TMX) 1.4 版格式提供译文。TMX 是一种用于提供源文本和目标译文的标准 XML 格式。以下示例展示了所需的 TMX 结构:
<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
<header segtype="sentence" o-tmf="UTF-8"
adminlang="en" srclang="en" datatype="PlainText"/>
<body>
<tu>
<tuv xml:lang="en">
<seg>Hello world!</seg>
</tuv>
<tuv xml:lang="es">
<seg>¡Hola Mundo!</seg>
</tuv>
</tu>
</body>
</tmx>
分段和匹配
请按句子对 TMX 文件中的源语言条目进行分段。在翻译过程中,Translation Hub 会按句子对内容分段。然后,Translation Hub 会将这些句段与翻译记忆库中的句段进行比较。如果句段完全匹配,Translation Hub 会使用您的相应译文。
如果您将部分句子或多个句子添加为源语言句段,则 Translation Hub 将不会匹配该句段。因此,匹配率可能会低于预期。
创建翻译记忆库
管理员使用 Google Cloud 控制台创建翻译记忆库。创建翻译记忆库后,您只能通过后期编辑或自行编辑流程对其进行修改。例如,您无法导入其他文件来修改现有翻译记忆库或将其附加到现有翻译记忆库。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
点击 添加资源。
在添加资源窗格中,选择翻译记忆库标签页。
为翻译记忆库指定名称。
选择创建空翻译记忆库以创建空翻译记忆库,或选择创建翻译记忆库并导入数据以导入现有翻译。
- 如需导入现有翻译,请将本地 TMX 文件上传到 Cloud Storage,或从 Cloud Storage 中选择现有 TMX 文件。
点击添加以创建译文存储库。
向门户添加翻译记忆库
创建翻译记忆库后,将其添加到现有门户,以便门户用户在申请翻译时开始使用该记忆库。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
从资源列表中,选择要添加到一个或多个门户的一个或多个翻译记忆库。
点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。
在“门户”字段中,选择一个或多个要将翻译记忆库添加到的门户。
点击分配。
在资源页面上,您可以通过查看每个资源的门户名称列来确认添加操作。
设置默认翻译记忆库
您可以设置一个默认翻译记忆库,以便 Translation Hub 在门户用户请求翻译时自动选择该翻译记忆库。
默认翻译记忆库有助于一致地应用一组经过人工审核的译文,以及捕获后期编辑期间的修改内容。用户无需记得选择翻译记忆库或使用哪个翻译记忆库。他们仍然可以选择其他翻译记忆库,也可以不选择。门户用户无法在初始翻译后更改此选择,就像在请求后期编辑时一样。
开始之前,您必须先将要设为默认的翻译记忆库添加到门户。
在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。
选择您要指定默认翻译记忆库的门户。
在翻译记忆部分,找到要设为默认的翻译记忆,然后依次选择
更多 > 设为默认。如果您已有默认翻译记忆库,Translation Hub 会将其移除,并将您选择的翻译记忆库设为默认翻译记忆库。
移除默认翻译记忆库
在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。
选择包含要移除的默认翻译记忆库的门户。
在翻译记忆部分,找到要移除的默认翻译记忆,然后依次选择
更多 > 取消设为默认。
其他资源
- 了解如何将翻译记忆库设为只读。