本文源自:金融界
金融界2024年10月18日消息,国家知识产权局信息显示,北京嘀嘀无限科技发展有限公司申请一项名为“语音合成的方法、装置及电子设备”的专利,公开号CN 118782017 A,申请日期为2023年3月。
专利摘要显示,本申请属于语音合成技术领域,公开了语音合成的方法、装置及电子设备,该方法包括采用个性化声学模型,对待合成文本进行编码,获得语音编码信息;基于基础声学模型,获得目标选择对象的声纹信息;基于目标选择对象的声纹信息,采用选择的目标语音合成方向对应设置的声纹迁移方式,对语音编码信息进行声纹迁移处理,获得迁移处理信息;基于迁移处理信息进行语音合成,获得目标合成语音。这样,可以针对不同的语音合成需求选择不同的声纹迁移方式进行语音合成,实现了对语音合成方向的可控迁移优化,提高了语音合成的效果。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有