博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python 基于学习 网络小爬虫
阅读量:5992 次
发布时间:2019-06-20

本文共 790 字,大约阅读时间需要 2 分钟。

## 百度贴吧图片网络小爬虫#import reimport urllib def getHtml(url):    page = urllib.urlopen(url)    html = page.read()    return html def getImg(html):    reg = r'src="(.+?\.jpg)" pic_ext'    imgre = re.compile(reg)    imglist = imgre.findall(html)    x = 0    l=len(imglist)    print "总共同拥有%d张图片"%(l)    print "-------------------"    for imgurl in imglist:        print "第%d张图片" %(x+1)        urllib.urlretrieve(imgurl,'E:\\Pythoncode\\picture\\%s.jpg' % x)        x = x + 1           html = getHtml("http://tieba.baidu.com/p/3093487131")getImg(html)
总共同拥有38张图片-------------------第1张图片第2张图片第3张图片第4张图片第5张图片第6张图片第7张图片第8张图片第9张图片第10张图片第11张图片第12张图片第13张图片第14张图片第15张图片第16张图像文章17图片文章18图片文章19图片文章20图片文章21图片文章22图片文章23图片文章24图片文章25图片文章26图片文章27图片文章28图片文章29图片文章30图片文章31图片文章32图片文章33图片文章34图片文章35图片文章36图片文章37图片文章38图片
 

转载地址:http://vdtlx.baihongyu.com/

你可能感兴趣的文章
通过学习JFinal框架后的学习方法个人体会
查看>>
Eclipse使用技巧
查看>>
利用iOS API编写简单微博客户端全过程
查看>>
SET XACT_ABORT各种用法及显示结果
查看>>
JavaWeb应用中获取Spring的ApplicationContext
查看>>
关于数据库对象版本比较的脚本
查看>>
Lync Server外部访问系列PART6:启用外部访问
查看>>
漫谈ASP.NET设计中的性能优化问题
查看>>
优秀开源项目:MyXls
查看>>
文件同步工具Unison使用介绍
查看>>
图表highcharts联合jquery ajax 后端取数据前端图表渲染
查看>>
理性运维 综合管控
查看>>
stl中stacks的基本用法
查看>>
软件开发核心趋势
查看>>
求证:a^4+b^4 ≧a^3*b+a*b^3
查看>>
L4,C16:差1墩,从张数最多的套上去找
查看>>
分页sql存储过程
查看>>
spring注解
查看>>
高可用Hadoop平台-实战尾声篇
查看>>
Silverlight for Windows Phone 7开发系列(3):多媒体开发
查看>>