需求 :抓取某站博主发布的视频/文章等信息

第一步:找到数据所在的HTTP/HTTPS请求包

 第二步:查看请求包所需的条件

其中有mid、ps、tid、pn、keyword、order、platform、web_location、order_avoided、w_rid、wts;根据职业敏感度,很明显w_rid是一个加密串来的,wts是个时间戳(秒级)、ps为个数、pn为页数。其他参数暂时先不管

 

  第三步:全局搜索(search)查看是否有w_rid参数的js文件,如果未有及选择利用rul地址请求去做全局断点

 

目前搜除3处,然后逐一断点,调试,查看有没有跟该json包请求参数一致的数据

 第四步:经过断点调式得知,该t字典为接口主传参数

 找到这一步,已经算成功一半,另一半才是最耗时间、精力的时候,那就调试参数、函数传递、扣js代码

  第五步:扣JS代码

 首先:

  1. 先看 w_rid: s(b + c),明细就是s函数,传递了b和c相加的结果进行运算
  2. 我们先看b参数从何而来;
  3. 由var b = h.join("&"),h做字符串转化而来,那么就得找h是什么了

其实找到这里,按道理是继续往上找的。但是一个小妙招是:既然只需要s函数和b+c即可,那我们就看b和c是长什么样的,内容是如何,我们手动拼凑就行。具体它是怎么计算出来的可以不用管。

其次:

  1. s函数的话 ,将鼠标放置s函数位置就行跳转即可

 

 

这里即为S函数所在的JS代码

 根据这样一步一步扣去下去,最终得到

 第五步:最终得出结果

 想要源码的小伙伴们,即可评论联系我哟!!!具体的思路已经很明确了,可以动手试试。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐