北京云行在线申请基于声纹聚类的网约车音频角色识别方法及设备专利，解决现有技术中分类结果不准确的问题_

本文源自:金融界

金融界2024年10月29日消息，国家知识产权局信息显示，北京云行在线软件开发有限责任公司申请一项名为“一种基于声纹聚类的网约车音频角色识别方法及设备”的专利，公开号CN 118824276 A，申请日期为2024年9月。

专利摘要显示，本申请涉及一种基于声纹聚类的网约车音频角色识别方法及设备，包括：获取网约车在日内录制的原始音频数据；提取原始音频数据中的人声音频数据；对人声音频数据进行切分，得到多个人声音频数据片段；对人声音频数据片段进行聚类，得到待筛选司机音频数据集和乘客音频数据集；将待筛选司机音频数据集输入预先训练的重叠检测模型，通过重叠检测模型在待筛选司机音频数据集中拆分出重叠音频和司机音频数据集。本技术方案中，将待筛选司机音频数据集输入预先训练的重叠检测模型，以将重叠音频和司机音频数据集进行拆分，最终得到准确的司机音频数据集和乘客音频数据集，从而解决现有技术中由于语音重叠等因素，导致分类结果不准确的问题。