本文源自:金融界
金融界2024年12月9日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“目标检测方法、目标检测模型及目标检测装置”的专利,公开号CN 119091121 A,申请日期为2024年8月。
专利摘要显示,本公开涉及计算机视觉技术领域,尤其涉及目标检测方法、目标检测模型及目标检测装置。具体实现方案为:从待检测图像中提取出第一图像特征;从待检测图像中获取提示图像,并从提示图像中提取出第二图像特征;获取提示文本,从提示文本中提取出文本特征;将文本特征与第二图像特征融合得到多模态特征;对多模态特征和第一图像特征进行相似度匹配,并根据相似度匹配结果输出对应的目标检测结果。本公开在纯文本提示的基础上增加了视觉提示,通过这种多模态查询方式解决了仅使用纯文本提示的局限性。并且本公开中的第二图像特征是从待检测图像抠出的更具有代表性的图像区域,可以有针对地挖掘目标对象的视觉信息,进一步地提示查询精度。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有