python爬虫定向爬取中国大学排名
来源:互联网 发布:女装淘宝店铺名字特别 编辑:程序博客网 时间:2024/06/10 07:42
#CrawUnivRankingA.pyimport requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return ""def fillUnivList(ulist, html): soup = BeautifulSoup(html, "html.parser") for tr in soup.find('tbody').children: if isinstance(tr, bs4.element.Tag): tds = tr('td') ulist.append([tds[0].string, tds[1].string, tds[3].string])def printUnivList(ulist, num): print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","总分")) for i in range(num): u=ulist[i] print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))def main(): uinfo = [] url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html' html = getHTMLText(url) fillUnivList(uinfo, html) printUnivList(uinfo, 20) # 20 univsmain()
利用chr12288标准对汉字排名进行对其
使得界面更加美观有效!!
#CrawUnivRankingB.pyimport requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return ""def fillUnivList(ulist, html): soup = BeautifulSoup(html, "html.parser") for tr in soup.find('tbody').children: if isinstance(tr, bs4.element.Tag): tds = tr('td') ulist.append([tds[0].string, tds[1].string, tds[3].string])def printUnivList(ulist, num): tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}" print(tplt.format("排名","学校名称","总分",chr(12288))) for i in range(num): u=ulist[i] print(tplt.format(u[0],u[1],u[2],chr(12288)))def main(): uinfo = [] url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html' html = getHTMLText(url) fillUnivList(uinfo, html) printUnivList(uinfo, 20) # 20 univsmain()
https://xuptacm.github.io/
阅读全文
0 0
- python爬虫定向爬取中国大学排名
- python爬虫学习 之 定向爬取 中国大学排名
- 中国大学排名定向爬取实例
- python爬虫由浅入深7--基于中国大学排名的定向爬虫
- python爬虫入门之爬取大学排名
- [笔记]python网络爬虫:一个简单的定向爬取大学排名信息示例
- 爬取中国大学排名
- 中国大学排名定向爬虫(实例1)
- 定向爬虫:中国大学排名定向爬虫(一)
- Python网络爬虫与信息提取-Day10-(实例)中国大学排名定向爬虫
- python(爬取大学排名)
- Python爬虫实战:2017中国最好大学排名
- requests‐bs4路线实现中国大学排名定向爬虫
- Python3.6——"中国大学排名定向爬虫"实例介绍
- python3.x爬虫:爬取大学排名数据
- 中国大学排名爬虫
- 使用Python爬取中国大学排名,并格式化对其输出内容
- 大学排名信息爬取
- Linux学习高级篇(五)
- hdu2178 猜数字(C语言
- OJ 141 --Linked List Cycle
- Linux下利用core dump文件调试
- UTD2202C示波器如何去测试纹波
- python爬虫定向爬取中国大学排名
- 搞懂.NET Framework 历史版本(2017年)
- ECharts介绍
- 管道通信的特点及有名管道和无名管道的区别
- git pull命令
- springboot-clean1
- HDU4609 NTT||FFT
- 反射
- 分析菱形继承