本文說明 Speech-to-Text 的現行 API 限制和用量限制。這些限制和用量上限如有變更,本頁面也會進行更新,以反映這些變更。Google 保留更改這些限制的權利。
如有需要,您可以申請提高配額。如要進一步瞭解如何查看及管理配額,請參閱 Google Cloud 配額頁面。
在您提交申請之後,Google 可能會與您聯絡,以便進一步瞭解相關資訊,並通知您申請是否獲得核准。
內容限制
同步要求
同步辨識要求 (使用 Recognize
方法) 會接受音訊資料,這些資料可在要求的 content
欄位中內嵌,或以uri
欄位中的 Cloud Storage URI 形式提供。傳送至同步要求的音訊大小上限為 10 MB,或音訊長度上限為 1 分鐘 (以先到達者為準)。如要進一步瞭解同步辨識功能,請參閱同步辨識功能總覽。
串流要求
串流辨識要求 (使用 StreamingRecognize
方法) 只接受要求的 audio
欄位中內嵌的音訊。串流中的每個要求都受限於 25 KB 的音訊。串流可保持開啟狀態最多 5 分鐘,且音訊必須以近乎即時的速率傳送。如果您需要串流超過 5 分鐘的內容,請參閱無限串流教學課程。如要進一步瞭解串流辨識功能,請參閱「串流辨識功能總覽」。
批次要求
批次辨識要求 (使用 BatchRecognize
方法) 只接受音訊,且必須在要求的 uri
欄位中以 Cloud Storage URI 的形式提供。每個 BatchRecognizeRequest
最多可包含 15 個 files
供轉錄。每個檔案的長度上限為 8 小時。如要進一步瞭解非同步辨識功能,請參閱批次辨識功能總覽。
多語言辨識
多語言辨識功能僅適用於全球、美國和歐盟的 Speech-to-Text 端點。
調適
您也可以在任何要求中提供 PhraseSet 和 CustomClass 資源。以下限制適用於這些資源:
語音調整限制 | 值 |
---|---|
允許的詞組增強值上限 | 20 |
PhraseSet 中的詞組 | 1,200 |
每次要求的詞組數 | 5,000 |
每個詞組的字元數 | 100 |
每次要求的字元總數 | 100,000 |
CustomClass 中的項目數量上限 | 500 |
每個自訂類別項目的字元數上限 | 500 |
每個 SpeechAdaptation 的 PhraseSet 數量上限 | 20 |
每個 SpeechAdaptation 的自訂類別數量上限 | 20 |
資源限制
Speech-to-Text 目前的 API 資源限制如下 (隨時可能變動):
限制類型 | 用量限制 |
---|---|
辨識器數量 (每個區域) | 5,000 |
自訂類別數量 (每個區域) | 5,000 |
詞組集數量 (每個區域) | 5,000 |
要求限制
Speech-to-Text 目前的 API 用量限制如下 (未來可能異動):
限制類型 | 用量限制 |
---|---|
每 60 秒的資源要求數 (每個區域) | 100 |
每 60 秒的作業要求次數 (每個區域) | 150 |
每 60 秒的同步辨識要求數 (每個區域) | 300 |
每 60 秒的串流辨識要求數 (每個區域) * | 3,000 |
每 5 分鐘的串流辨識工作階段數 (每個區域) * | 300 |
每 60 秒的批次辨識要求數 (每個區域) | 150 |
* 串流辨識的配額限制為每 5 分鐘 300 個並行工作階段,以及每分鐘 3,000 個要求,這些限制同時適用於所有並行工作階段。工作階段的初始設定要求不會計入要求配額。
這些限制適用於每項 Speech-to-Text 開發人員專案,而且使用該開發人員專案的所有應用程式和 IP 位址必須共用上述額度。