Python3:网络爬虫(1)

来源:互联网 发布:360网络监测 编辑:程序博客网 时间:2024/06/10 04:05

Python3:这是今天学习的,第一个网页爬虫,可以爬去百度贴吧的十个网页并存储起来

import urllib.requestdef baidu_tieba(url,begin_page,end_page):    for i in range(begin_page,end_page+1):        sName=str(i).zfill(5)+'.html'        print('正在下载第'+str(i)+'个网页,并将其存储为'+sName+'.....')        m=urllib.request.urlopen(url+str(i)).read()        with open(sName,'wb') as file:            file.write(m)bdurl=str('http://tieba.baidu.com/p/4785143088?pn=')begin_page=1end_page=10baidu_tieba(bdurl,begin_page,end_page)
0 0
原创粉丝点击