本文源自:金融界
金融界 2024 年 8 月 30 日消息,天眼查知识产权信息显示,广州市百果园信息技术有限公司申请一项名为“一种音频转换方法、系统、设备及存储介质“,公开号 CN202410486133.8,申请日期为 2024 年 4 月。
专利摘要显示,本申请实施例公开了一种音频转换方法、系统、设备及存储介质。本申请实施例提供的技术方案,通过输入原始音频,基于预构建的音素后验概率图模型提取原始音频的音素后验概率特征,音素后验概率图模型以训练音频和对应的标注文本构建训练数据进行模型训练,在模型训练过程中,将标注文本拆分为指定粒度的建模单元,基于建模单元进行训练音频的音素后验概率计算;将原始音频的音素后验概率特征输入预构建的声学模型,转换为对应目标音色的目标频谱特征;将目标频谱特征输入声码器,输出对应目标音色的目标音频。采用上述技术手段,可以精准进行原始音频的音素后验概率特征计算,进而实现精准、稳定的音频转换,提升音频转换的自然度和鲁棒性。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有