本文源自:金融界
金融界2024年8月25日消息,天眼查知识产权信息显示,北京智谱华章科技有限公司取得一项名为“一种含数学公式的输入文本的智能提取方法及系统“,授权公告号CN118230348B,申请日期为2024年3月。
专利摘要显示,本发明属于文本处理技术领域,涉及一种含数学公式的输入文本的智能提取方法及系统,所述方法包括:1)输入文本的格式判定、转换和预处理;2)对预处理后的图片格式的文本进行角度矫正;3)进行公式检测;4)进行版面分析;5)对于嵌入公式,根据公式检测框判断矫正后的OCR检测框是否包含嵌入公式并对包含嵌入公式的OCR检测框进行拆分,以获得纯文本的OCR检测框;6)进行公式识别,以获得公式识别结果;7)进行文本识别,以获得文本识别结果;8)结合版面分析框及其版面类别对公式识别结果与文本识别结果进行同行检测框判定和合并,以获得输入文本的提取结果。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有