注:此资料亲身使用,真实可靠,如果运行方面有问题,可以私聊
资源代码都是近一年亲身运行过的,欢迎交流

课程2.py

源代码如下:

from bs4 import BeautifulSoup

res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spder-men0.0.html')

print(res.status_code)
soup = BeautifulSoup(res.content,'html.parser')
#soup输出的内容于text一样,但格式不一样
#(soup)
item = soup.find('div')

#print(type(item))

#print(item)

items = soup.find_all('div')

#print(items)

res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')

soup = BeautifulSoup(res.text,'html.parser')

items = soup.find_all('div',class_='books')

#print(items)

#print(type(items))

for item in items:

    #print('想找的数据都包含在这里了:\n',item)

#print(type(item))
    kind = item.find('h2')
    title = item.find(class_='title')
    bref = item.find(class_='info')
    print(kind.text,'\n',title.text,'\n',title['href'],'\n',bref.text)
    print(type(kind),type(title),type(bref))
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐