查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码。

(F12)检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染 。

【注】在源代码中找不到的代码,是在浏览器执行js动态生成的。

当我们在爬虫时需要对js在加载的数据进行爬取时,就不能像普通爬虫一样进行获取了,这时通常有两种方法

1. 通过selenum自动化技术

2. 通过在页面上进行抓包,获取js链接以及表单元素进行请求

 

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐