本文源自:金融界
金融界 2024 年 12 月 18 日消息,国家知识产权局信息显示,广联达科技股份有限公司申请一项名为“PDF 文档的转换方法、装置、设备、存储介质及产品”的专利,公开号 CN 119129529 A,申请日期为 2024 年 8 月。
专利摘要显示,本发明涉及计算机技术领域,公开了 PDF 文档的转换方法、装置、设备、存储介质及产品,该方法包括获取待转换的 PDF 文档以及 PDF 文档的页面信息;基于页面信息对所述 PDF 文档进行逐页解析,得到 PDF 文档中各个页面的内容类型对应的网页元素;基于网页元素进行渲染,生成 PDF 文档对应的网页页面。通过对 PDF 文档进行逐页解析,能够避免全文解析带来的处理并发量,同时,还可以保证解析结果的准确性以及后续渲染结果的准确性在此基础上,保证了网页页面能够真实表征 PDF 文档。同时,通过网页元素生成具有结构化标记的网页页面,由此在语义上具备逻辑关系的内容,在页面上同样能呈现完整的逻辑结构,能够便于后续在此基础上进行相似内容的检索与对比显示。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有