本文源自:金融界
金融界2024年11月11日消息,国家知识产权局信息显示,天逸财金科技服务(武汉)有限公司申请一项名为“一种基于知识图谱的自动数据清洗方法及系统”的专利,公开号CN 118916354 A,申请日期为2024年10月。
专利摘要显示,本发明涉及电数字数据处理领域,更具体地,本发明涉及一种基于知识图谱的自动数据清洗方法及系统。本发明根据各数据源对应的数据表构建各数据源对应的知识图谱;将所有知识图谱中的实体进行分类以获得多组相似实体;对于任一组相似实体,根据各实体的名称分类并以名称相同的实体为一类,确定数量最多的任一类实体的名称为该组相似实体的目标实体的名称;对于任一组相似实体,确定该组相似实体的相关实体。对于各组相似实体,根据其目标实体的名称文本及其所有组相关实体对应的相似实体的目标实体的名称文本构建并输出目标数据表。本发明实现了对多源数据所构成的知识图谱的整合以实现对多源数据的清洗。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有