Dialogflow 음성 에이전트는 음성 인식을 위해 Dialogflow 가격 책정에 포함된 Speech-to-Text를 사용합니다. Dialogflow는 음성 인식 모델을 자동으로 선택하지만 개발자가 선택적으로 모델을 지정할 수 있습니다.
사용 가능한 모델
사용 가능한 모든 모델은 Speech-to-Text 모델에 나열되어 있습니다. 도메인에 가장 적합하고 에이전트 언어와 음성 기능을 지원하는 모델을 선택합니다.
모델을 명시적으로 지정하지 않으면 Dialogflow는 API 요청 및 에이전트 설정의 오디오 구성을 기반으로 모델을 자동으로 선택합니다.
일반적으로 다음 모델의 성능이 가장 좋습니다.
- telephony_short(telephony Dialogflow에 적합)
- telephony(Agent Assist에 적합) (제한 시간 기반 고급 음성 종료 민감도가 사용 설정된 경우 telephony Dialogflow에도 적합)
- phone_call(Agent Assist 및 telephony Dialogflow에 적합)
- latest_short(비 telephony Dialogflow에 적합)
- command_and_search(다른 모델을 사용할 수 없는 언어에 적합)
모델 지정
모델 선택 설정을 사용하여 에이전트, 흐름, 페이지에 대한 모델을 제공할 수 있습니다.Sessions.detectIntent
또는 Sessions.streamingDetectIntent
메서드를 호출할 때 모델을 제공할 수도 있습니다.
세션 참조의 프로토콜 및 버전을 선택합니다.
프로토콜 | V3 | V3beta1 |
---|---|---|
REST | 세션 리소스 | 세션 리소스 |
RPC | 세션 인터페이스 | 세션 인터페이스 |
C++ | SessionsClient | 해당 사항 없음 |
C# | SessionsClient | 해당 사항 없음 |
Go | SessionsClient | 해당 사항 없음 |
자바 | SessionsClient | SessionsClient |
Node.js | SessionsClient | SessionsClient |
PHP | 없음 | 해당 사항 없음 |
Python | SessionsClient | SessionsClient |
Ruby | 없음 | 해당 사항 없음 |
ConversationProfile
를 구성할 때.
요청 수준 음성 모델 재정의 설정을 사용하는 경우를 제외하고 인텐트 인식 또는 대화 프로필 API 호출에서 모델을 지정하면 에이전트, 흐름, 페이지에 적용되는 모델 선택이 재정의됩니다.