本文源自:金融界
金融界2024年11月22日消息,国家知识产权局信息显示,拉扎斯网络科技(上海)有限公司申请一项名为“文本信息的提取方法、系统、设备以及存储介”的专利,公开号 CN 118982832 A,申请日期为2024年7月。
专利摘要显示,本说明书公开了一文本信息的提取方法、系统、设备以及存储介质,获取待处理的目标图像和针对该目标图像的目标问题文本,该目标图像携带文本信息,该目标问题文本用于指示从该目标图像中提取目标文本信息。对该目标图像进行文本识别,得到该目标图像对应的图像文本,该图像文本包括该目标图像中所携带的文本信息。将该目标图像、该图像文本以及该目标问题文本输入多模态处理模型,通过该多模态处理模型对该目标图像、该图像文本以及该目标问题文本进行处理,得到该目标文本信息,实现了对目标图像进行智能化的文本信息提取,在上述过程中,利用多模态处理模型的多模态理解能力,也即是利用不同模态的信息来进行文本信息提取,泛化能力较强。
![](http://n.sinaimg.cn/finance/pc/cj/kandian/img/article_pic05.png)
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有