solo一个小爬虫

小半 • 2022年5月14日上午11:14 • 后端开发 • 阅读 157

导读：本篇文章讲解 solo一个小爬虫，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com

import requests
from bs4 import BeautifulSoup

headers = {"user-agent":"User-Agent:Mozilla/5.0"}
url = 'http://corp.efu.com.cn/list-1-19-0-0-330000-330200-1.html'
rep = requests.get(url, headers=headers)
html = rep.text

soup = BeautifulSoup(html, 'lxml')
for item in soup.find_all('div', class_='titBox'):
    #print(item)            #item是一个div的列表
    links = item.find_all('a')   #在div列表里找到a的列表links
    for link in links:          #遍历links得到link表示取a列表中的单个a
        url = link['href']    #得到url
        print(url)          #打印

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/5479.html

赞 (0)

0 0

Django自学教程

Django笔记十之取值指定字段及去重

000254

小半
2023年12月7日
Python

动态规划系列之六01背包问题

000268

小半
2023年12月29日
.NET

UWP 使用exe程序

000230

小半
2022年5月21日
后端开发

源码分析——new ArrayList() 和 new ArrayList(0)区别

000187

小半
2023年1月31日
后端开发

Spring创建和使用 (存储和读取) — 1

000211

小半
2023年2月6日
Java

3、Mybatis之CURD

000206

小半
2023年12月30日
Java

try{}catch{}final{}详解

000175

小半
2022年5月21日
Python

frida Python与js脚本交互

000283

小半
2024年1月5日
后端开发

解决zsh中无法补全ROS 2、Colcon相关命令

000208

飞熊
2023年7月24日
后端开发

Bean property ‘xxxDao’ is not writable or has an invalid setter method. Does the parameter type of

000152

小半
2022年5月27日
Python

Python中的并发编程（7）协程

000209

小半
2024年3月14日
后端开发

语音信号预处理——数字滤波器

000294

飞熊
2023年8月12日

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！