儲存並重複使用經過人工審核的翻譯

翻譯記憶庫 (僅限進階級別) 是人工審核翻譯的存放區。入口網站使用者可以在翻譯工作中套用翻譯記憶庫,這樣一來,完全相符的原文語言片段就會替換為相應的指定語言片段。翻譯記憶庫可用於重複使用經過人工審核的翻譯內容,並維持一致的翻譯品質。

您可以從空翻譯記憶庫開始,也可以匯入自己的翻譯內容。在譯後編輯程序中,Translation Hub 會將譯後編輯的翻譯內容填入翻譯記憶庫。

Translation Hub 只會在記憶體中保留最新的修訂後翻譯內容。舉例來說,如果入口網站使用者編輯 Translation Hub 使用翻譯記憶庫翻譯的片段,Translation Hub 就會將現有片段替換為新編輯的片段。如要避免取代,您可以將翻譯記憶庫設為唯讀。

翻譯記憶庫與其他翻譯資源的比較

除了翻譯記憶庫之外,您也可以提供其他資源,協助 Portal 使用者進行翻譯。下一個章節將說明各項資源的差異。

  • 詞彙表會根據字詞進行比對,而翻譯記憶庫則會根據片段進行比對。使用詞彙表翻譯特定領域的詞彙或實體。詞彙也設有大小限制;翻譯記憶庫可包含任意數量的片段組合,且支援任意語言。
  • 自訂模型會使用您的語句組合進行訓練,如果您沒有完整的詞彙表或翻譯記憶庫,這類模型有助於改善機器翻譯品質。如果您想針對特定領域和寫作風格調整機器翻譯,請使用 AutoML Translation 建構自訂模型,以便產生更合適的預測結果。

入口網站使用者可以同時使用這些資源,以提升翻譯品質。如要進一步瞭解 Translation Hub 如何在翻譯期間套用資源,請參閱「翻譯文件」。

事前準備

建立翻譯記憶庫時,您可以選擇匯入現有的翻譯內容。如要提供翻譯,請使用 Translation Memory eXchange (TMX) 1.4 版格式。TMX 是用來提供原文和譯文翻譯的標準 XML 格式。以下範例說明必要的 TMX 結構:

<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
  <header segtype="sentence" o-tmf="UTF-8"
  adminlang="en" srclang="en" datatype="PlainText"/>
  <body>
    <tu>
      <tuv xml:lang="en">
        <seg>Hello world!</seg>
      </tuv>
      <tuv xml:lang="es">
        <seg>¡Hola Mundo!</seg>
      </tuv>
    </tu>
  </body>
</tmx>

區隔和比對

請在 TMX 檔案中依句子劃分原文語言項目。在翻譯過程中,Translation Hub 會依句子區隔內容。接著,Translation Hub 會將這些片段與翻譯記憶庫中的片段進行比較。如果片段完全相符,Translation Hub 就會使用對應的翻譯。

如果您將部分句子或多個句子納入原文片段,Translation Hub 就不會比對該片段。因此,媒合率可能會低於預期。

建立翻譯記憶庫

管理員可使用 Google Cloud 控制台建立翻譯記憶庫。建立翻譯記憶庫後,您只能透過後續編輯或自行編輯程序進行修改。舉例來說,您無法匯入其他檔案來修改或附加至現有的翻譯記憶庫。

  1. 在 Google Cloud 控制台的「Translation Hub」專區中,前往「Resources」頁面。

    前往「資源」頁面

  2. 按一下「新增資源」

  3. 在「新增資源」窗格中,選取「翻譯記憶庫」分頁標籤。

  4. 指定翻譯記憶庫的名稱。

  5. 選取「建立空白的翻譯記憶庫」可建立空白的翻譯記憶庫,或選取「建立翻譯記憶庫及匯入檔案」可匯入現有的翻譯內容。

    1. 如要匯入現有的翻譯內容,請將本機 TMX 檔案上傳至 Cloud Storage,或從 Cloud Storage 選取現有的 TMX 檔案。
  6. 按一下「新增」建立翻譯記憶庫。

在入口網站中新增翻譯記憶庫

建立翻譯記憶庫後,請將其新增至現有入口網站,以便入口網站使用者在要求翻譯時開始使用。

  1. 在 Google Cloud 控制台的「Translation Hub」專區中,前往「Resources」頁面。

    前往「資源」頁面

  2. 從資源清單中選取一或多個要新增至一或多個入口網站的翻譯記憶。

  3. 按一下「指派給入口網站」,開啟「將資源指派給入口網站」窗格。

  4. 在「入口網站」欄位中,選取一或多個要新增翻譯回憶的入口網站。

  5. 按一下「指派」

    在「資源」頁面上,您可以查看每個資源的「Portal names」欄,確認是否已新增。

設定預設翻譯記憶庫

您可以設定預設翻譯記憶庫,讓 Translation Hub 在入口網站使用者要求翻譯時自動選取。

預設翻譯記憶庫可用於一律套用一組經過人工審核的翻譯,或擷取譯後編輯期間的編輯內容。使用者不必記得要選取翻譯記憶庫或使用哪一個。但仍可選擇其他翻譯記憶庫或不使用翻譯記憶庫。在初始翻譯完成後,入口網站使用者無法變更這項選項,就像要求譯後編輯一樣。

開始前,您必須新增翻譯記憶庫,並將其設為入口網站的預設值。

  1. 在 Google Cloud 控制台的「Translation Hub」專區中,前往「Portals」頁面。

    前往「Portals」(入口網站) 頁面

  2. 選取要指定預設翻譯記憶庫的入口網站。

  3. 在「翻譯記憶庫」部分中,找出要設為預設的翻譯記憶庫,然後依序選取 「更多」>「設為預設」

    如果您已設定預設翻譯記憶庫,Translation Hub 會將該翻譯記憶庫設為預設,並移除現有的預設翻譯記憶庫。

移除預設翻譯記憶庫

  1. 在 Google Cloud 控制台的「Translation Hub」專區中,前往「Portals」頁面。

    前往「Portals」(入口網站) 頁面

  2. 選取含有要移除的預設翻譯記憶庫的入口網站。

  3. 在「翻譯記憶庫」部分中,找出要移除的預設翻譯記憶庫,然後依序選取 「更多」>「取消設為預設」

其他資源