配額與限制

本文說明現行的 Speech-to-Text API 限制和用量上限。這些限制和用量上限如有變更,本頁面也會進行更新,以反映這些變更。Google 保留更改這些限制的權利。

如有需要,您也可以申請提高配額。如要進一步瞭解如何查看及管理配額,請參閱 Google Cloud 配額頁面

在提出申請後,Google 可能會與您聯絡以便進一步瞭解相關資訊,並且會通知您申請是否獲得核准。

內容限制

同步要求

同步辨識要求 (使用 Recognize 方法) 接受音訊資料,可直接在要求的 content 欄位中提供,或在要求的 uri 欄位中提供 Cloud Storage URI。傳送至同步要求的音訊大小上限為 10 MB,或音訊長度上限為 1 分鐘 (以先達到者為準)。如要進一步瞭解同步辨識,請參閱同步辨識總覽

串流要求

串流辨識要求 (使用 StreamingRecognize 方法) 只會接受要求 audio 欄位中的內嵌音訊。串流中的每個要求音訊大小上限為 25 KB。串流最多可保持開啟 5 分鐘,且音訊必須以近乎即時的速率傳送。如要串流超過 5 分鐘的內容,請參閱無限串流教學課程。如要進一步瞭解串流辨識功能,請參閱串流辨識總覽

批次要求

批次辨識要求 (使用 BatchRecognize 方法) 只接受以 Cloud Storage URI 形式提供的音訊,且必須位於要求的 uri 欄位中。每個 BatchRecognizeRequest 最多可包含 15 個 files 轉錄內容。每個檔案的長度上限為 8 小時。如要進一步瞭解非同步辨識,請參閱批次辨識總覽

多語言辨識

多語言辨識功能僅適用於全球、美國和歐盟的 Speech-to-Text 端點。

調適

您也可以在任何要求中提供 PhraseSet 和 CustomClass 資源。這些資源適用下列限制:

語音調整限制
詞組增幅值上限 20
PhraseSet 中的詞組 1,200
每次要求的詞組數 5,000
每個詞組的字元數 100
每次要求的字元總數 100,000
CustomClass 中的項目數量上限 500
每個 CustomClass 項目最多可輸入的字元數 500
每個 SpeechAdaptation 的 PhraseSet 數量上限 20
每個 SpeechAdaptation 的 CustomClass 數量上限 20

資源限制

Speech-to-Text 目前的 API 資源限制如下 (未來可能異動):

限制類型 用量限制
每個區域的辨識器數量 5,000
自訂類別數量 (每個區域) 5,000
詞組集數量 (每個區域) 5,000

要求限制

Speech-to-Text 目前的 API 用量限制如下 (未來可能異動):

限制類型 用量限制
每 60 秒的資源要求數 (每個區域) 100
每 60 秒的作業要求數 (每個區域) 150
每 60 秒的同步辨識要求數 (每個區域) 300
每 60 秒串流辨識要求數 (每個區域) * 1,000,000
每 5 分鐘的串流辨識工作階段數 (每個區域) * 300
每 60 秒的批次辨識要求數 (每個區域) 150

* 串流辨識的配額限制為每 5 分鐘 300 個並行工作階段,以及每分鐘 3,000 項要求,這項限制適用於所有並行工作階段。工作階段的初始設定要求不會計入要求配額。

這些限制適用於每項 Speech-to-Text 開發人員專案,而且使用該開發人員專案的所有應用程式和 IP 位址必須共用上述額度。