爬虫python可以干嘛_【Python爬虫】什么是爬虫，爬虫能做什么？

❤️爬虫背景 & 简介❤️网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine)，例如传统的通用搜索引擎AltaVis

weixin_40007668

114人浏览 · 2020-11-20 23:00:48

weixin_40007668 · 2020-11-20 23:00:48 发布

❤️爬虫背景 & 简介❤️

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine)，例如传统的通用搜索引擎AltaVista，Yahoo!和Google等，作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是，这些通用性搜索引擎也存在着一定的局限性。

为了解决这些问题，定向抓取相关网页资源的聚焦爬虫应运而生。聚焦爬虫是一个自动下载网页的程序，它根据既定的抓取目标，有选择的访问万维网上的网页与相关的链接，获取所需要的信息。与通用爬虫(general purpose web crawler)不同，聚焦爬虫并不追求大的覆盖，而将目标定为抓取与某一特定主题内容相关的网页，为面向主题的用户查询准备数据资源。

❤️爬虫用途:❤️抓取知乎数据分析知乎用户并做出图谱。

抓取网页云音乐评论做自然语言处理得到人们对不同歌手的评价。

抓取豆瓣电影按评分挑出自己喜欢看

周边租房的房价

网站各种优惠?

知乎上点赞数很高的文章..

快手粉丝数量..

某站的所有图片,电影!!

价值最高的还是用来做商业分析，这也催生了爬虫工程师这个职业。

研究SEO. 就得知道爬虫.

收集大量的代理服务器!!来获得不同的IP 让后刷票什么的!!!!

抓twitter 上亿条的的说说..储存到数据库.更深入的了解数据库