本文源自:金融界
金融界2024年11月28日消息,国家知识产权局信息显示,中国移动通信有限公司研究院、中国移动通信集团有限公司申请一项名为“一种音频数据处理方法、装置、设备及可读存储介质”的专利,公开号 CN 119028358 A,申请日期为 2023 年 5 月。
专利摘要显示,本申请公开了一种音频数据处理方法、装置、设备及可读存储介质,涉及通信技术领域,以保证声纹识别效果。该方法包括:获取带有标注的声纹识别数据集,其中,声纹识别数据集包括第一音频集合和第二音频集合,第一音频集合包括每个用户的时长最长的音频,第二音频集合包括声纹识别数据集中除第一音频集合之外的音频;将第一音频集合中的音频进行切分,得到第三音频集合;基于第三音频集合,得到声纹识别数据集的声纹特征向量集合;基于声纹特征向量集合和第一音频集合确定注册音频;基于注册音频,对第二音频集合中的音频重新进行标注,得到第四音频集合,其中,第四音频集合不包括标签噪声。本申请实施例可以保证声纹识别效果。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有