## 百度贴吧图片网络小爬虫#import reimport urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = imgre.findall(html) x = 0 l=len(imglist) print "总共同拥有%d张图片"%(l) print "-------------------" for imgurl in imglist: print "第%d张图片" %(x+1) urllib.urlretrieve(imgurl,'E:\\Pythoncode\\picture\\%s.jpg' % x) x = x + 1 html = getHtml("http://tieba.baidu.com/p/3093487131")getImg(html)
总共同拥有38张图片-------------------第1张图片第2张图片第3张图片第4张图片第5张图片第6张图片第7张图片第8张图片第9张图片第10张图片第11张图片第12张图片第13张图片第14张图片第15张图片第16张图像文章17图片文章18图片文章19图片文章20图片文章21图片文章22图片文章23图片文章24图片文章25图片文章26图片文章27图片文章28图片文章29图片文章30图片文章31图片文章32图片文章33图片文章34图片文章35图片文章36图片文章37图片文章38图片