評估模型

使用 Cloud Speech-to-Text 控制台的基準測試功能,評估 Speech-to-Text V2 API 中所用轉錄模型的準確度。

Cloud 語音轉文字控制台提供預先訓練和自訂語音轉文字模型的視覺基準測試。您可以比較多個轉錄模型的 Word-Error-Rate (WER) 評估指標,藉此檢查辨識品質,並決定哪個模型最適合您的應用程式。

事前準備

請確認您已註冊 Google Cloud 帳戶、建立專案、訓練自訂語音模型,並使用端點部署模型。

建立真實值資料集

如要建立自訂基準資料集,請收集音訊樣本,確實反映轉錄模型在實際工作環境中會遇到的流量類型。這些音訊檔案的總長度應至少為 30 分鐘,且不得超過 10 小時。如要組合資料集,您需要:

  1. 在所選 Cloud Storage 值區中建立目錄,用來儲存資料集的音訊和文字檔案。
  2. 針對資料集中的每個音訊檔案,建立相當準確的轉錄稿。每個音訊檔案 (例如 example_audio_1.wav) 都必須建立對應的真值文字檔案 (example_audio_1.txt)。這項服務會使用 Cloud Storage 值區中的音訊-文字配對,組合成資料集。

基準測試模型

請按照評估和改善準確度的指南,使用自訂 Speech-to-Text 模型和基準資料集來評估模型的準確度。