该项服务能对整个录音文件进行语音转写。可用于对实时性要求不高的客服通话转写,也可用于会议或访谈录音的离线转写。
该项服务有助于增强语音识别的准确率,通过添加某些需要特殊出来的词汇,能够帮助用户快速地自主优化语音识别效果,如人名、产品名、业务特殊用语等词汇类型。
实时语音转写服务适用场景如实时会议记录、视频直播实时字幕等,应用场景丰富,支持PCM和非压缩 WAV 格式的语音数据。
汉语普通话,东北、河南、四川等方言,粤语,英语,支持用户自定义热词功能,输入特定的行业、领域词汇。
流式”和“普通”两种模式。提供Java、Android、iOS、C++ 等平台的SDK。支持音频格式:PCM/WAV/SPEEX/OPUS。
服务已经提供?针对?同领域优化过的模型,如果希望在一些?特殊,?专业的领域获得?好的识 别效果,可以使用定制化语言识别服务。定制化语音识别服务允许用户上传某个领域的训练数据并训练定制模型,训练出的定制模型可以在相应的领域上获得?高的识别准确率。
目前支持的定制模型服务包括一句话识别、录音文件识别和实时语音识别。