四川语言桥申请 PDF 转 Word 二维数组表格识别专利,极大提升表格的识别生成效率

四川语言桥申请 PDF 转 Word 二维数组表格识别专利,极大提升表格的识别生成效率
2025年01月15日 20:55 金融界网站

本文源自:金融界

金融界 2025 年 1 月 15 日消息,国家知识产权局信息显示,四川语言桥信息技术有限公司申请一项名为“一种 PDF 转 Word 二维数组表格识别方法、装置及可读存储介质”的专利,公开号 CN 119294374 A,申请日期为 2024 年 10 月。

专利摘要显示,本发明属于 PDF 文件解析技术领域提供了一种 PDF 转 Word 二维数组表格识别方法、装置及可读存储介质。采用本发明,直接读取 PDF 底层的操作符信息,根据操作符携带的信息,来生成线框信息,再将线框信息转换成二维数组,不需要再关注线段的连续性已经是否应该合并,在转换二维数组的过程中实际上已经借助数组完成了这件事,后续利用感染算法、孤岛算法、预处理数组,可以快速的定位出表格区域、单元格区域以及边框信息,由此极大的提升了表格的识别生成效率,兼具了速度和准确性的优势。

天眼查资料显示,四川语言桥信息技术有限公司,成立于2009年,位于成都市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2000万人民币,实缴资本2000万人民币。通过天眼查大数据分析,四川语言桥信息技术有限公司共对外投资了11家企业,参与招投标项目836次,知识产权方面有商标信息50条,专利信息50条,此外企业还拥有行政许可5个。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部