本文源自:金融界
金融界2024年11月28日消息,国家知识产权局信息显示,北京有竹居网络技术有限公司申请一项名为“语音合成方法、装置、可读介质及电子设备”的专利,公开号CN 119028313 A,申请日期为2023年5月。
专利摘要显示,本公开涉及一种语音合成方法、装置、可读介质及电子设备,该方法包括:获取目标文本和目标音色标识;确定源语音的目标情感标识;将目标文本、目标音色标识以及目标情感标识输入语音合成模型,以获取语音合成模型输出的目标梅尔谱特征,其中,语音合成模型通过互信息确定模型和多个样本集对目标神经网络模型进行训练得到;根据目标梅尔谱特征,生成目标语音。通过互信息确定模型实现音色特征和情感特征的解耦,使得根据语音合成模型确定目标梅尔谱特征过程中,只会提取源语音中的情感特征,该情感特征中不会夹杂源语音的音色信息,提高了情感迁移的效果,使得生成的目标语音的音质更好。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有