本頁面說明如何為傳送至 Speech-to-Text 的語音轉錄要求啟用語言辨識功能。
有時您可能不確定錄音內容包含何種語言。舉例來說,如果您是在擁有多種官方語言的國家/地區發佈服務、應用程式或產品,收到的音訊內容可能來自各種不同語言的使用者。如此一來,如果要替語音轉錄要求指定單一語言代碼,難度可能就更高了。
多語言辨識
Speech-to-Text 可讓您指定音訊資料可能包含的一組替代語言。將音訊轉錄要求傳送至 Speech-to-Text 時,您可以提供音訊資料可能包含的其他語言清單。如果在要求中加入語言清單,Speech-to-Text 會根據您提供的替代語言,嘗試轉錄最符合樣本的語言。接著,Speech-to-Text 會為轉錄結果加上預測的語言代碼標籤。
此功能適用於需要對語音指令或搜尋指令等簡短陳述式,執行語音轉錄的應用程式。除了主要語言外,您最多可以列出三種Speech-to-Text 支援的語言做為替代語言 (總共四種語言)。
即使可以為語音轉錄要求指定替代語言,您仍須在 languageCode
欄位中提供主要語言代碼。此外,請盡量將要求的語言數限縮至最低程度。要求的替代語言代碼越少,Speech-to-Text 越能成功選取正確的代碼。指定單一語言能獲得最理想的結果。
在音訊語音轉錄要求中啟用語言辨識
如要在音訊轉錄中指定替代語言,您必須在要求的 RecognitionConfig
參數中,將 alternativeLanguageCodes
欄位設為語言代碼清單。Speech-to-Text 針對下列所有語音辨識方法提供替代語言代碼的支援:speech:recognize
、speech:longrunningrecognize
和串流。
使用本機檔案
通訊協定
如要瞭解完整的詳細資訊,請參閱 speech:recognize
API 端點。
如要執行同步語音辨識,請提出 POST
要求並提供適當的要求內容。以下為使用 curl
的 POST
要求示例。這個範例使用 Google Cloud CLI 產生存取權杖。如需安裝 gcloud CLI 的操作說明,請參閱快速入門導覽課程。
下列範例會說明如何對可能包含英文、法文或德文語音的音訊檔案,要求執行語音轉錄。
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
如果要求成功,伺服器會傳回 200 OK
HTTP 狀態碼與 JSON 格式的回應,並另存成名為 multi-language.txt
的檔案。
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Java API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Node.js
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Node.js API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Python
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Python API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
使用遠端檔案
Java
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Java API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Node.js
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Node.js API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Python
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Python API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。