超图软件申请面向大语言模型的知识库构建方法等专利,保证存入知识库的知识完整性

超图软件申请面向大语言模型的知识库构建方法等专利,保证存入知识库的知识完整性
2024年11月11日 15:00 金融界网站

本文源自:金融界

金融界2024年11月11日消息,国家知识产权局信息显示,北京超图软件股份有限公司申请一项名为“面向大语言模型的知识库构建方法、检索方法及相关装置”的专利,公开号CN 118916441 A,申请日期为2024年7月。

专利摘要显示,本申请公开了一种面向大语言模型的知识库构建方法、检索方法及相关装置,该知识库构建方法中,首先,获取多个知识文档;而后,基于多个知识文档的类型所各自对应的存储规则,将多个知识文档存入向量数据库,得到知识库;其中,存储规则至少包括:若知识文档的类型为包含章节信息的第一类型,则基于章节标题将知识文档划分为多个章节块,章节块包括章节标题和章节正文;在一个章节块中,基于章节标题和按句划分章节正文得到的多个单句文本,得到拼接文本;将拼接文本存为知识、章节正文作为补充信息存为所属章节块中所有知识的元数据,逐个章节块存入向量数据库。由此,不会因按句划分知识文档而破坏其完整型,保证了存入知识库的知识的完整性。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部