简单爬取图片

来源:互联网 发布:爱名网域名注册 编辑:程序博客网 时间:2024/06/11 18:40
#!/usr/bin/python
# -*- coding: UTF-8 -*-

import urllib
import re

def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html

def getImg(html):
  reg = r'src="(.+?\.png)"'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  x = 0
  for imgurl in imglist:
    urllib.urlretrieve(imgurl,"%s.png" % x)
    x+=1

html = getHtml("http://www.cnblogs.com/fnng/p/3576154.html")
print getImg(html)
0 0
原创粉丝点击