本文源自:金融界
金融界2024年10月29日消息,国家知识产权局信息显示,北京云行在线软件开发有限责任公司申请一项名为“一种基于声纹聚类的网约车音频角色识别方法及设备”的专利,公开号CN 118824276 A,申请日期为2024年9月。
专利摘要显示,本申请涉及一种基于声纹聚类的网约车音频角色识别方法及设备,包括:获取网约车在日内录制的原始音频数据;提取原始音频数据中的人声音频数据;对人声音频数据进行切分,得到多个人声音频数据片段;对人声音频数据片段进行聚类,得到待筛选司机音频数据集和乘客音频数据集;将待筛选司机音频数据集输入预先训练的重叠检测模型,通过重叠检测模型在待筛选司机音频数据集中拆分出重叠音频和司机音频数据集。本技术方案中,将待筛选司机音频数据集输入预先训练的重叠检测模型,以将重叠音频和司机音频数据集进行拆分,最终得到准确的司机音频数据集和乘客音频数据集,从而解决现有技术中由于语音重叠等因素,导致分类结果不准确的问题。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有