配額與限制

本文說明 Speech-to-Text 的現行 API 限制和用量限制。這些限制和用量上限如有變更,本頁面也會進行更新,以反映這些變更。Google 保留更改這些限制的權利。

如有需要,您可以申請提高配額。如要進一步瞭解如何查看及管理配額,請參閱 Google Cloud 配額頁面

在您提交申請之後,Google 可能會與您聯絡,以便進一步瞭解相關資訊,並通知您申請是否獲得核准。

內容限制

同步要求

同步辨識要求 (使用 Recognize 方法) 會接受音訊資料,這些資料可在要求的 content 欄位中內嵌,或以uri 欄位中的 Cloud Storage URI 形式提供。傳送至同步要求的音訊大小上限為 10 MB,或音訊長度上限為 1 分鐘 (以先到達者為準)。如要進一步瞭解同步辨識功能,請參閱同步辨識功能總覽

串流要求

串流辨識要求 (使用 StreamingRecognize 方法) 只接受要求的 audio 欄位中內嵌的音訊。串流中的每個要求都受限於 25 KB 的音訊。串流可保持開啟狀態最多 5 分鐘,且音訊必須以近乎即時的速率傳送。如果您需要串流超過 5 分鐘的內容,請參閱無限串流教學課程。如要進一步瞭解串流辨識功能,請參閱「串流辨識功能總覽」。

批次要求

批次辨識要求 (使用 BatchRecognize 方法) 只接受音訊,且必須在要求的 uri 欄位中以 Cloud Storage URI 的形式提供。每個 BatchRecognizeRequest 最多可包含 15 個 files 供轉錄。每個檔案的長度上限為 8 小時。如要進一步瞭解非同步辨識功能,請參閱批次辨識功能總覽

多語言辨識

多語言辨識功能僅適用於全球、美國和歐盟的 Speech-to-Text 端點。

調適

您也可以在任何要求中提供 PhraseSet 和 CustomClass 資源。以下限制適用於這些資源:

語音調整限制
允許的詞組增強值上限 20
PhraseSet 中的詞組 1,200
每次要求的詞組數 5,000
每個詞組的字元數 100
每次要求的字元總數 100,000
CustomClass 中的項目數量上限 500
每個自訂類別項目的字元數上限 500
每個 SpeechAdaptation 的 PhraseSet 數量上限 20
每個 SpeechAdaptation 的自訂類別數量上限 20

資源限制

Speech-to-Text 目前的 API 資源限制如下 (隨時可能變動):

限制類型 用量限制
辨識器數量 (每個區域) 5,000
自訂類別數量 (每個區域) 5,000
詞組集數量 (每個區域) 5,000

要求限制

Speech-to-Text 目前的 API 用量限制如下 (未來可能異動):

限制類型 用量限制
每 60 秒的資源要求數 (每個區域) 100
每 60 秒的作業要求次數 (每個區域) 150
每 60 秒的同步辨識要求數 (每個區域) 300
每 60 秒的串流辨識要求數 (每個區域) * 3,000
每 5 分鐘的串流辨識工作階段數 (每個區域) * 300
每 60 秒的批次辨識要求數 (每個區域) 150

* 串流辨識的配額限制為每 5 分鐘 300 個並行工作階段,以及每分鐘 3,000 個要求,這些限制同時適用於所有並行工作階段。工作階段的初始設定要求不會計入要求配額。

這些限制適用於每項 Speech-to-Text 開發人員專案,而且使用該開發人員專案的所有應用程式和 IP 位址必須共用上述額度。