北京达佳互联申请语音表征模型训练方法及装置等专利,提升语音表征质量

北京达佳互联申请语音表征模型训练方法及装置等专利,提升语音表征质量
2024年10月29日 13:00 金融界网站

本文源自:金融界

金融界2024年10月29日消息,国家知识产权局信息显示,北京达佳互联信息技术有限公司申请一项名为“语音表征模型训练方法、装置及相关设备”的专利,公开号 CN 118824233 A,申请日期为 2024 年 6 月 。

专利摘要显示,本公开关于语音表征模型训练方法、装置及相关设备,该方法包括获取样本文本、对应的样本梅尔谱及对应的样本音素序列;通过初始模型的音素编码器对样本音素序列进行编码得到样本音素特征;通过初始模型的语音编码器对样本梅尔谱进行编码得到样本语音特征;对样本语音特征进行量化得到样本语音量化特征;对样本梅尔谱进行截取得到提示梅尔谱;通过初始模型的提示编码器对提示梅尔谱进行编码得到样本提示特征;通过初始模型的语音解码器,基于样本提示特征对样本语音量化特征进行解码得到预测梅尔谱;通过初始模型的音素解码器,对样本语音量化特征进行解码得到预测音素序列;基于模型损失训练初始模型得到语音表征模型。本公开可提升语音表征质量。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部