本頁面由 Cloud Translation API 翻譯而成。

在語音轉文字中啟用語言辨識

本頁面說明如何為傳送至 Speech-to-Text 的語音轉錄要求啟用語言辨識功能。

有時您可能不確定錄音內容包含何種語言。舉例來說，如果您是在擁有多種官方語言的國家/地區發佈服務、應用程式或產品，收到的音訊內容可能來自各種不同語言的使用者。如此一來，如果要替語音轉錄要求指定單一語言代碼，難度可能就更高了。

多語言辨識

Speech-to-Text 可讓您指定音訊資料可能包含的一組替代語言。將音訊轉錄要求傳送至 Speech-to-Text 時，您可以提供音訊資料可能包含的其他語言清單。如果在要求中加入語言清單，Speech-to-Text 會根據您提供的替代語言，嘗試轉錄最符合樣本的語言。接著，Speech-to-Text 會為轉錄結果加上預測的語言代碼。

此功能適用於需要對語音指令或搜尋指令等簡短陳述式，執行語音轉錄的應用程式。除了主要語言外，您最多可以列出三種Speech-to-Text 支援的語言做為替代語言 (總共四種語言)。

即使可以為語音轉錄要求指定替代語言，您仍須在 languageCode 欄位中提供主要語言代碼。此外，請盡量將要求的語言數限縮至最低程度。要求的替代語言代碼越少，Speech-to-Text 越能成功選取正確的代碼。指定單一語言能獲得最理想的結果。

在音訊語音轉錄要求中啟用語言辨識

如要在語音轉錄中指定替代語言，您必須在要求的 RecognitionConfig 參數中，將 alternativeLanguageCodes 欄位設為語言代碼清單。Speech-to-Text 支援所有語音辨識方法的替代語言代碼：speech:recognize、speech:longrunningrecognize 和串流。

使用本機檔案

通訊協定

如要瞭解完整的詳細資訊，請參閱 speech:recognize API 端點。

如要執行同步語音辨識，請提出 POST 要求並提供適當的要求內容。以下為使用 curl 的 POST 要求示例。這個範例使用 Google Cloud CLI 產生存取權杖。如需安裝 gcloud CLI 的操作說明，請參閱快速入門導覽課程。

下列範例會說明如何對可能包含英文、法文或德文語音的音訊檔案，要求執行語音轉錄。

curl -s -H "Content-Type: application/json" \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    https://speech.googleapis.com/v1p1beta1/speech:recognize \
    --data '{
    "config": {
        "encoding": "LINEAR16",
        "languageCode": "en-US",
        "alternativeLanguageCodes": ["fr-FR", "de-DE"],
        "model": "command_and_search"
    },
    "audio": {
        "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav"
    }
}' > multi-language.txt

如果要求成功，伺服器會傳回 200 OK HTTP 狀態碼與 JSON 格式的回應，並另存成名為 multi-language.txt 的檔案。

{
  "results": [
    {
      "alternatives": [
        {
          "transcript": "hi I'd like to buy a Chromecast I'm ..."
          "confidence": 0.9466864
        }
      ],
      "languageCode": "en-us"
    },
    {
      "alternatives": [
        {
          "transcript": " let's go with the black one",
          "confidence": 0.9829583
        }
      ],
      "languageCode": "en-us"
    },
  ]
}