okcc呼叫系统语音识别asr接口

公司新闻

okcc呼叫系统语音识别asr接口

发布时间： 2022-05-22 10:14 更新时间： 2024-05-03 09:10

语音识别接口（ASR）

启动ASR识别

例子：weixin@yuyinjiqiren

API

uuid_cti_start_detect_speech uuid asrproxy_addr vad_mode vad_min_active_time_ms vad_max_end_silence_time_ms vad_level vad_filter wait_speech_timeout_ms max_speech_time_ms hot_word asr_params asr_notify asr_notify_uuid asr_mode

asrproxy_addr asrproxy程序IIP和端口

vad_mode 0：本地VAD 1：远端VAD 2:本地检测声音开始，远端检测声音结束

vad_min_active_time_ms 说话时间大于这个值才开始提交ASR

vad_max_end_silence_time_ms 静音时间大于这个值认为说话停止

vad_level vad检测灵敏度 0-3，值越大越迟钝，建议3

vad_filter 噪音过滤等级0-1.0，建议0.2，值越大过滤范围越大，会导致小的声音给过滤。

wait_speech_timeout_ms Zui大等待说话时间，用于一句话识别（asr_mod：0），等待时间超过这个值还没说话，就停止。

max_speech_time_ms 说话事件超过这个值，会强制认为一句话结束。如果对接是是一句话识别ASR接口，建议设置60000以内。

hot_word ASR热词

asr_params ASR自定义参数

asr_notify ASR识别结果通知类型 0：ESL事件 1：FS的内部队列 2:ESL事件和FS的内部队列

asr_notify_uuid asr识别结果通知uuid

asr_mod 0：只识别一句话就停止 1：执行一次会持续进行ASR识别，直到挂机或者调用uuid_cti_stop_detect_speech才停止ASR识别

停止ASR识别

API

uuid_cti_stop_detect_speech uuid

uuid 操作通道的UUID

放音的同时执行ASR识别

app

cti_play_and_detect_speech <vad_mode> <vad_filter> <asrproxy_addr> vad_min_active_time_ms vad_max_end_silence_time_ms wait_speech_timeout_ms max_speech_time_ms hot_word asr_params asr_notify_uuid

file 放音文件

mode 0:不启动ASR识别 1：放音的同时开启ASR识别; 2：放音完成之后才开启ASR识别。

interrupt 0：关键词打断； 1：检测到声音打断； 2：有识别结果打断； 3：识别到一句话打断。

vad_mode 0:使用本地VAD算法检测说话停止 2:等待ASR反馈说话结束。

vad_filter 噪音过滤等级0-1。

asrproxy_addr asr代理地址。

vad_min_active_time_ms 说话时间大于这个值才开始提交ASR。

vad_max_end_silence_time_ms 静音时间大于这个值认为说话停止。

wait_speech_timeout_ms 放音完成后等待用户说话的等待时间。

max_speech_time_ms Zui大说话时间，说话时间超过这个值就停止ASR。

hot_word ASR热词。

asr_params ASR私有参数,JOSN格式{\”变量\”=\”名字\”}。