南京硅基智能申请文本到语音生成相关专利,提高合成语音的真实性和丰富性

南京硅基智能申请文本到语音生成相关专利,提高合成语音的真实性和丰富性
2024年09月10日 19:15 金融界网站

本文源自:金融界

金融界 2024 年 9 月 10 日消息,天眼查知识产权信息显示,南京硅基智能科技有限公司申请一项名为“文本到语音的生成方法、装置及电子设备“,公开号 CN202411066953.8,申请日期为 2024 年 8 月。

专利摘要显示,本申请涉及计算机技术领域,公开了一种文本到语音的生成方法、装置及电子设备,该方法包括:获取待处理文本和目标参考语音;对待处理文本进行预处理,得到待处理文本对应的目标编码;基于目标编码、目标参考语音,以及目标语音生成模型中的风格向量单元,生成目标风格向量;基于目标风格向量、待处理文本,以及目标语音生成模型中的生成单元,生成待处理文本和目标参考语音对应的目标合成语音。本申请实施例提供的文本到语音的生成方法所生成的目标合成语音具有待处理文本的韵律特征和目标参考语音的韵律特征,提高了合成语音的真实性和丰富性。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部