python 爬虫bs4,BeautifulSoup解析
注:此资料亲身使用,真实可靠,如果运行方面有问题,可以私聊资源代码都是近一年亲身运行过的,欢迎交流课程2.py源代码如下:from bs4 import BeautifulSoupres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spder-men0.0.html')print
·
注:此资料亲身使用,真实可靠,如果运行方面有问题,可以私聊
资源代码都是近一年亲身运行过的,欢迎交流
课程2.py
源代码如下:
from bs4 import BeautifulSoup
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spder-men0.0.html')
print(res.status_code)
soup = BeautifulSoup(res.content,'html.parser')
#soup输出的内容于text一样,但格式不一样
#(soup)
item = soup.find('div')
#print(type(item))
#print(item)
items = soup.find_all('div')
#print(items)
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')
soup = BeautifulSoup(res.text,'html.parser')
items = soup.find_all('div',class_='books')
#print(items)
#print(type(items))
for item in items:
#print('想找的数据都包含在这里了:\n',item)
#print(type(item))
kind = item.find('h2')
title = item.find(class_='title')
bref = item.find(class_='info')
print(kind.text,'\n',title.text,'\n',title['href'],'\n',bref.text)
print(type(kind),type(title),type(bref))
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
已为社区贡献3条内容
所有评论(0)