scrapy,scrapy-redis显示:什么都没爬取到:Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
解决方法一、问题:刚开始爬取有,但是后面都是Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)。解决:可能是里面没有设置 yield scrapy.Request(dont_filter=True),dont_filter=True,默认的去重将一些网页去除了,导致没有数据。解决方法二问题:分布式爬虫一直都是...
·
解决方法一、
问题:刚开始爬取有,但是后面都是Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)。
解决:可能是里面没有设置 yield scrapy.Request(dont_filter=True),dont_filter=True,默认的去重将一些网页去除了,导致没有数据。
解决方法二
问题:分布式爬虫一直都是显示Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)。
解决:你使用的肯定是window的redis数据库,而且lpush时,使用的是redis。windos那个文件,这样插入的redis_key,在你爬虫服务器上是查不到这个值的。
使用 redis-cli -h redis的ip -p 6379 这样链接数据,再lpush值进去才行。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
已为社区贡献1条内容
所有评论(0)