本文源自:金融界
金融界2024年10月22日消息,国家知识产权局信息显示,云知声智能科技股份有限公司申请一项名为“语音合成方法、系统、终端及存储介质”的专利,公开号CN 118762683 A,申请日期为2024年8月。
专利摘要显示,本发明提供了一种语音合成方法、系统、终端及存储介质, 该方法包括:将文本样本输入语音合成模型进行音素提取,得到文本音素;对文本音素进行音素编码,得到音素特征,将风格样本音频输入语音合成模型进行特征提取,得到情感特征和全局特征;将音素特征、情感特征和全局特征进行特征组合,得到样本组合特征,对样本组合特征进行特征解码,得到解码音频;根据解码音频和文本样本的标准音频确定模型损失,根据模型损失对语音合成模型进行参数更新;将待合成文本和目标风格标签输入收敛后的语音合成模型进行语音合成,得到目标风格音频。本发明实施例,收敛后的语音合成模型能有效地进行不同风格语音的合成,提高了语音合成风格的多样性。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有