合作伙伴工作台
注册
能力简介
对30分钟以内的实时音频流进行识别,识别结果自动断句,标记每句话的开始和结束时间;可应用于智能语音助手、法庭庭审记录等实时音频流场景。
能力详述
接收30分钟以内的语音数据,仅支持PCM、WAV格式,8K16b和16k16B,单声道语音输入。支持常见词汇,可根据需要支持专业领域词汇,支持自动断句、同音词识别、中英文混合识别、热词优化等功能。针对各行业领域进行专门优化,准确率高,平均响应时间快,云端接入,维护方便。