Python技术栈

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 2636|回复: 2

[实例学习] Python 娱乐项目:用BeautifulSoup抓取时光网图片

[复制链接]

4

主题

4

帖子

54

积分

注册会员

Rank: 2

积分
54
发表于 2018-9-28 10:50:13 | 显示全部楼层 |阅读模式
最近学了BeautifulSoup,也算是为了以后找测试样例方便,写了一个抓取图片的小例子:
平台:python3.6
[Python] 纯文本查看 复制代码
from bs4 import BeautifulSoup
from urllib import request

def getpage(url):
    page = request.urlopen(url)
    html = page.read()
    return html
soup = BeautifulSoup(getpage(r'http://movie.mtime.com/'))
img = soup.find_all('img')
cnt = 0
for i in img:
    path = 'img/%d.jpg'%(cnt)
    request.urlretrieve(i['src'],path)
    print('processing--------->count=%d-------->'%(cnt))
    cnt+=1
print('end-------->result=%d'%(cnt))


最后的成果:



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
Python 总 群
回复

使用道具 举报

0

主题

7

帖子

16

积分

新手上路

Rank: 1

积分
16
发表于 2020-2-12 18:41:51 | 显示全部楼层
程序没通过
= RESTART: C:/Users/Administrator/AppData/Local/Programs/Python/Python38-32/p1.py
Traceback (most recent call last):
  File "C:/Users/Administrator/AppData/Local/Programs/Python/Python38-32/p1.py", line 1, in <module>
    from bs4 import BeautifulSoup
ModuleNotFoundError: No module named 'bs4'
Python 总 群
回复

使用道具 举报

0

主题

14

帖子

86

积分

版主

Rank: 7Rank: 7Rank: 7

积分
86
发表于 2020-2-17 18:12:49 | 显示全部楼层
喜洋洋 发表于 2020-2-12 18:41
程序没通过
= RESTART: C:/Users/Administrator/AppData/Local/Programs/Python/Python38-32/p1.py
Traceba ...

提示没有bs4这个模块,你可能需要安装这个模块,pip install Beautifulsoup4
Python 总 群
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


QQ|Archiver|手机版|小黑屋|Python.BBS ( 鲁ICP备18046958号 )

GMT+8, 2020-8-9 10:32 , Processed in 0.189105 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表