本文源自:金融界
金融界2024年11月27日消息,国家知识产权局信息显示,阿里巴巴(中国)有限公司申请一项名为“一种文档处理方法及装置”的专利,公开号CN 119025613 A,申请日期为2024年8月。
专利摘要显示,本申请实施例公开了一种文档处理方法及装置。主要技术方案包括:获取待处理的文档;对所述文档进行解析,依据解析结果和所述文档的结构构建所述文档对应的文档树;从所述文档树的叶节点开始,调用第二大语言模型逐层进行迭代总结,直至得到根节点的总结结果;其中,叶节点的总结结果是第二大语言模型利用叶节点的文本内容推理得到的,非叶节点的总结结果是第二大语言模型利用该非叶节点的子节点的总结结果推理得到的;利用所述根节点的总结结果,得到所述文档的总结结果。本申请基于文档的结构将总结任务拆解为多级任务,大语言模型能够更好的理解文档各部分的语义内容以及各部分之间的结构关系,进而得到高质量的总结结果。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有