本文源自:金融界
金融界 2024 年 12 月 2 日消息,国家知识产权局信息显示,小红书科技有限公司申请一项名为“图文模型训练方法、识别样本生成方法、设备及介质”的专利,公开号 CN 119049073 A,申请日期为 2023 年 5 月。
专利摘要显示,本申请涉及人工智能技术领域,特别涉及图文模型训练方法、识别样本生成方法、设备及介质。该图文模型训练方法包括:获取训练数据,训练数据包括与商品相关的文本和图片;从与商品相关的图片中提取商品的图片信息,并且从商品的图片信息中识别第一字符串;对于第一字符串,从与商品相关的文本中提取第二字符串,其中,相比于从文本中所提取的其它字符串,第二字符串与第一字符串之间的编辑距离最小;利用与第一字符串对应的商品的图片信息、第一字符串、第一字符串中的每个字符的识别置信度以及第二字符串来训练预先构建的模型,获得经训练的图文模型。本申请能够进一步提升 OCR 识别的准确率,并且能够快速生成兼具丰富性和真实性的识别样本。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有