本文源自:金融界
金融界 2024 年 11 月 28 日消息,国家知识产权局信息显示,星创艺(昆山)文娱有限公司申请一项名为“一种语音生成方法、装置、电子设备及可读存储介质”的专利,公开号 CN 119028316 A,申请日期为 2024 年 8 月。
专利摘要显示,本发明公开了一种语音生成方法、装置、电子设备及可读存储介质,属于人工智能技术领域,包括将文本文件输入语音生成模型;将文本转化为音素文件;提取每个音素的时间长度,并对各音素按文本文件文字内容顺序排列;判断每个音素前后是否需要插入音素间隔特征,所述音素间隔特征包括音素延长音或每个音素前后的空白音中的至少一种;判断每个音素前后是否需要插入语言习惯特征,所述语言习惯特征为整个文本文件语言环境中,每个音素前后的口癖习惯;根据的生成结果合成语音文件。在本发明的方案中,在音素级别特征合成语音前,判断每个音素前后是否需要插入音素延长音或空白音或口癖习惯,可以有效的确保生成语音的拟人程度,提升用户的使用体验。

4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有