本文源自:金融界
金融界 2024 年 9 月 18 日消息,天眼查知识产权信息显示,腾讯科技(深圳)有限公司申请一项名为“一种图像识别方法、装置、设备、存储介质及程序产品“,公开号 CN202411139995.X,申请日期为 2024 年 8 月。
专利摘要显示,本申请实施例提供了一种图像识别方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:对待识别图像进行视觉编码,获得目标图像特征,基于目标图像特征从细粒度类别集合中获得 N 个候选类别。对 N 个候选类别的类别描述文本进行理解,以检索出用于区分 N 个候选类别的目标属性,并提取 N 个候选类别在目标属性下的属性信息。将 N 个候选类别的类别描述文本、N 个候选类别在目标属性的属性信息作为增强信息,加入到针对待识别图像的细粒度图像识别过程中,以结合多种模态的信息进行细粒度图像识别,有效提高对细粒度类别之间的区别特征的理解,有助于获得更为准确的细粒度图像识别结果,从而提高细粒度图像识别的准确性。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有