戎行技术申请基于筛选条件的数据采集专利,解决对网站数据采集效率低问题

戎行技术申请基于筛选条件的数据采集专利,解决对网站数据采集效率低问题
2024年12月02日 08:35 金融界网站

本文源自:金融界

金融界2024年12月2日消息,国家知识产权局信息显示,戎行技术有限公司申请一项名为“基于筛选条件的数据采集方法及装置”的专利,公开号CN 119046562 A,申请日期为2024年11月。

专利摘要显示,本申请提供了一种基于筛选条件的数据采集方法及装置,涉及数据处理技术领域,解决了对网站数据的采集效率较低技术问题。该方法包括:确定数据采集请求的请求加载方式;如果请求加载方式为静态加载,则根据目标采集格式、目标采集内容类型以及目标接口协议通过指定静态筛选条件从多个表达式中确定目标表达式,并通过目标表达式对目标网站进行数据的选择提取以及采集得到目标网站的第一数据采集结果;如果请求加载方式为动态加载,则通过指定动态筛选条件利用自动化工具模拟采集行为操作,获取目标网站的页面元素;基于目标网站的页面元素通过 CSS 选择器以及元素选择器对页面元素进行识别,得到页面元素对应的正文内容。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部