您可以指定讓「語音轉文字」針對語音轉錄中的個別字詞,標明準確率或信賴度的值。
字詞層級信賴度
「語音轉文字」對音訊剪輯執行語音轉錄時,也會測量回應的準確度。從語音轉文字功能傳送的回應會以 0.0 至 1.0 的數字,表明整個語音轉錄要求的信賴度。下列程式碼範例示範了語音轉文字傳回的信賴度。
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.96748614 } ] } ] }
除了整個語音轉錄的信賴度外,語音轉文字亦可提供語音轉錄中個別字詞的信賴度資訊。回覆隨後會在語音轉錄中加入 WordInfo
詳細資料,指出個別字詞的信賴度,如下列範例所示。
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98360395, "words": [ { "startOffset": "0s", "endOffset": "0.300s", "word": "how", "confidence": SOME NUMBER }, ... ] } ] } ] }
在要求中啟用字詞層級信心值
下列程式碼片段會示範如何在「語音轉文字」的語音轉錄要求中啟用字詞層級的信賴度,並使用本機和遠端檔案。
使用本機檔案
通訊協定
如要瞭解完整的詳細資訊,請參閱 speech:recognize
API 端點。
如要執行同步語音辨識,請提出 POST
要求並提供適當的要求內容。以下為使用 curl
的 POST
要求示例。這個範例使用 Google Cloud CLI 產生存取權杖。如需安裝 gcloud CLI 的操作說明,請參閱快速入門導覽課程。
以下範例說明如何使用 curl
傳送 POST
要求,其中要求主體會啟用字詞層級的信賴度。
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v2/projects/{project}/locations/global/recognizers/{recognizers}:recognize \ --data '{ "config": { "features": { "enableWordTimeOffsets": true, "enableWordConfidence": true } }, "uri": "gs://cloud-samples-tests/speech/brooklyn.flac" }' > word-level-confidence.txt
如果要求成功,伺服器會傳回 200 OK
HTTP 狀態碼與 JSON 格式的回應,並另存成名為 word-level-confidence.txt
的檔案。
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98360395, "words": [ { "startTime": "0s", "endTime": "0.300s", "word": "how", "confidence": 0.98762906 }, { "startTime": "0.300s", "endTime": "0.600s", "word": "old", "confidence": 0.96929157 }, { "startTime": "0.600s", "endTime": "0.800s", "word": "is", "confidence": 0.98271006 }, { "startTime": "0.800s", "endTime": "0.900s", "word": "the", "confidence": 0.98271006 }, { "startTime": "0.900s", "endTime": "1.100s", "word": "Brooklyn", "confidence": 0.98762906 }, { "startTime": "1.100s", "endTime": "1.500s", "word": "Bridge", "confidence": 0.98762906 } ] } ], "languageCode": "en-us" } ] }
Python
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Python API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。