简数采集器是新一代的网页数据采集器,集成了智能识别引擎:

        采集数据时,只需输入一个URL(网址),平台会使用智能算法进行数据提取,包括列表页、翻页和网页详情(如标题,正文,日期,作者,标签等),全自动化比传统采集器配置要简单和高效很多倍!而且不需要懂代码!

只需以下简单三步就可以完成一个采集规则的配置:

1. 输入采集网址

 进入简数采集器,点击创建采集任务,输入要采集的网址(URL),接着点击下一步即可。

2. 智能配置采集规则

接着系统会智能识别并配置对应的列表页、文章详情页采集规则,只需点击下一步按钮即可。

智能配置的列表页规则:

智能配置的文章详情页规则:

3. 启动采集

采集规则配置完成后,就可以启动采集了,以下是完成采集的结果。

完成,配置采集规则和数据采集就这么简单!!!

不用手写规则,不用研究网页源代码,仅需输入一个URL就能完成采集规则配置,简单高效!

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐