本文源自:金融界
金融界2024年9月17日消息,天眼查知识产权信息显示,平安科技(深圳)有限公司申请一项名为“一种语音解析方法、装置、设备及其存储介质“,公开号CN202410876845.0,申请日期为2024年6月。
专利摘要显示,本申请实施例属于语音解耦技术领域,应用于语音特征解析场景中,涉及一种语音解析方法、装置、设备及其存储介质,包括获取待解析语音数据输入训练完成的语音解析模型;通过模型中音色编码器提取待解析语音数据中的音色信息,基于模型中韵律编码器提取待解析语音数据中的韵律信息;将所述音色信息和所述韵律信息作为解析结果输出。本申请通过预先对语音解析模型中的音色编码器和韵律编码器进行训练,后续通过训练后的音色编码器/韵律编码器提取出音色信息/韵律信息,相较于通过常规语音解析方式,先解析出文本信息和声学信息,再对声学信息进行解耦处理,获得音色信息/韵律信息,一定程度上提高了语音解析效率,简化了解析步骤。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有