除了其他標準和強化版語音辨識模型,Speech-to-Text 還提供兩種醫療模型。醫療模型專門用於辨識醫療環境中常見的字詞,例如診斷、藥物、症狀、治療和病況。如要辨識這類音訊資料,可以使用這些模型來提升轉錄結果的準確度。
我們提供兩種醫療模型,分別適用於特定用途:
medical_conversation
:適用於醫療服務提供者 (例如醫生或護士) 與病患之間的對話。如果醫療服務提供者和病患都會說話,請使用這個模型。系統會自動偵測每位說話者說的字詞,並在傳回的轉錄稿中加上標籤。medical_dictation
:適用於單一醫療服務提供者口述的筆記,例如醫生口述病患的血液檢測結果。
請只搭配下列 Speech-to-Text 功能使用醫療模型。這份清單中未列出的功能無法與任一醫療模型搭配使用。自動標點符號功能預設為啟用。
醫療對話模型支援下列功能:
醫療聽寫模型支援下列功能:
傳送轉錄要求
REST
以下程式碼範例會使用 medical_conversation
模型,轉錄公開 Cloud Storage bucket 中的音訊檔案。
使用任何要求資料之前,請先替換以下項目:
LANGUAGE_CODE
:音訊片段中使用的語言 BCP-47 代碼。 醫療模型僅支援 en-US。ENCODING
:要轉錄的音訊編碼。如果您使用公開音訊樣本,編碼為LINEAR16
。PROJECT_ID
:專案的英數字元 ID。 Google Cloud
HTTP 方法和網址:
POST https://speech.googleapis.com/v1/speech:recognize
JSON 要求主體:
{ "config": { "languageCode": "LANGUAGE_CODE", "encoding": "ENCODING", "model": "medical_conversation" }, "audio": { "uri": "gs://cloud-samples-data/speech/medical_conversation_2.wav" } }
如要傳送要求,請展開以下其中一個選項:
您應該會收到如下的 JSON 回應:
"results": [ { "alternatives": [ { "transcript": "Um-hum . Yeah. Hello , good morning . Good morning . So , tell me what's going on . Uh , sure , so , um , I woke up probably three or four days ago , which , uh , wheezing and short of breath . Okay , any cough or chest pain ? I cough infrequently , but no , uh , chest pain . Have you been exposed to anyone with covid ? Uh , no , and I also took a test , which was negative . Uh , is it getting worse , or better ? Uh , it has been getting a lot worse" } ] }, { "alternatives": [ { "transcript": "Okay . Was there something that triggered this exposure to cold , for example ? Um , I had a gone hiking , and I got caught in the rain the day before this all started ." } ] } ] }
口說標點符號
醫療聽寫模型支援口說標點符號,方便你撰寫醫療筆記。這項功能預設為啟用,且無法停用。語音轉錄稿中的標點符號會以方括號標示。舉例來說,傳回的轉錄稿可能如下所示:
Patient could be showing signs of trauma [question mark] They said they were [quote] having elevated heart rate [unquote]
。
Speech-to-Text 支援下列口說標點符號:
- 英文句號鍵
- 逗號鍵
- 冒號鍵
- 帽子
- 斜線鍵
- 破折號
- 連字號鍵
- 問號
- 分號鍵
- 引號
- unquote
- 後引號
- 左括弧
- 右括弧
- 右括號
格式設定指令
醫療聽寫模型支援語音指令,可格式化附註。這項功能預設為啟用,且無法停用。語音轉錄稿會以方括號標示口語指令。舉例來說,傳回的轉錄稿可能如下所示:
[next line] Patient says they are experiencing fever [next point]
。
語音轉文字功能支援下列語音指令:
- 下一個點
- 下一個號碼
- 下一段
- 帽子
- 大寫
- 換行符號
- 下一個項目
- 下一個問題
- 下一個問題編號
- 下一列
- 下一個區段
- 下一個號碼
- scratch
- scratch that
- 結束語音輸入
語音標題
醫療聽寫模型支援為聽寫的附註加上口語標題。這項功能預設為啟用,且無法停用。轉錄稿中的標題會以方括號標示,並以大寫字母開頭。舉例來說,傳回的轉錄稿可能如下所示:
[CURRENT MEDICATIONS] Patient is currently taking no medications
。
語音轉文字功能支援下列口語標題:
- 主要申訴
- 目前服用的藥物
- 出院用藥
- 出院計畫
- 家族病史
- 發現項目
- 系統審查
- 現病史
- 適應症
- LABS
- 過去手術史
- 身體檢查
- 系統審查
- RADIOLOGY