赛力斯凤凰智创申请数据提取方法等专利,避免所适用的数据提取场景使用单一化

赛力斯凤凰智创申请数据提取方法等专利,避免所适用的数据提取场景使用单一化
2024年11月11日 15:00 金融界网站

本文源自:金融界

金融界2024年11月11日消息,国家知识产权局信息显示,重庆赛力斯凤凰智创科技有限公司申请一项名为“数据提取方法、装置、电子设备及存储介质”的专利,公开号 CN 118916537 A,申请日期为 2024 年 6 月。

专利摘要显示,本申请的实施例揭示了一种数据提取方法、装置、设备及存储介质。该方法包括:基于预设数据工具包提取出网页中的文本信息;若所述文本信息为有效文本信息,则基于预设场景信息生成数据提取接口;基于所述数据提取接口获取所述有效文本信息中的关键文本数据,所述关键文本数据包括网页标题、网页摘要以及网页标签;对所述关键文本数据进行数据清洗,将清洗后的关键文本数据结合所述网页标题、所述网页摘要以及所述网页标签进行存储。本申请的实施例能够避免了耗费大量时间编写提取规则,并且通过预设场景信息使得数据采集技术具有拓展性,避免了所适用的数据提取场景使用单一化。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部