本文源自:金融界
金融界2024年11月11日消息,国家知识产权局信息显示,苏州科达科技股份有限公司申请一项名为“基于音视频融合的声音处理方法、系统、设备及存储介质”的专利,公开号CN 118918914 A,申请日期为2024年6月。
专利摘要显示,本申请提供了一种基于音视频融合的声音处理方法、系统、设备及存储介质,所述方法包括:获取声源定位结果,并基于所述声源定位结果确定第一声源定位角度信息;获取待处理人员图像,并基于各个人员在所述待处理人员图像中的待匹配像素坐标得到各个人员的待匹配角度信息;基于所述各个人员的待匹配角度信息,判断是否存在与所述第一声源定位角度信息相匹配的人员的角度信息,且所述第一声源定位角度信息和该匹配的人员的角度信息均位于预设的声幕角度范围之内;如果存在,则对所述第一声源定位角度信息对应的声源音频进行增强。通过采用本申请,能够有效识别需增强的声源音频并进行增强处理。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有