爬虫代码1 - 代码天地

爬虫代码1

其他 2018-08-30 21:24:28 阅读次数: 0

#CrawUnivRankingB.py
import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr, bs4.element.Tag):
tds = tr('td')
ulist.append([tds[0].string, tds[1].string, tds[3].string])
def printUnivList(ulist, num):
tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
print(tplt.format("排名","学校名称","总分",chr(12288)))
for i in range(num):
u=ulist[i]
print(tplt.format(u[0],u[1],u[2],chr(12288)))
def main():
uinfo = []
url = 'https://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'
html = getHTMLText(url)
fillUnivList(uinfo, html)
printUnivList(uinfo, 20) # 20 univs
main()

猜你喜欢

转载自blog.csdn.net/dongdong0071/article/details/78896811

爬虫代码（1）

爬虫代码1

Python网络爬虫(1)——Requests及爬虫通用代码框架

爬虫（1）——爬虫前奏

爬虫1

爬虫（1）

爬虫(1)

爬虫（１）

爬虫--1

爬虫-1

使用postman一键生成你的爬虫代码（postman在爬虫中的应用）1

爬虫之路（1）：认识爬虫

爬虫开发.1爬虫介绍

python爬虫1 - 爬虫概要

爬虫开发_爬虫概述（1）

(转)Python新手写出漂亮的爬虫代码1——从html获取信息

Java实现网络爬虫案例代码1：获取天气预报信息

1行Python代码下载图片，爬虫从未如此简单，百度看了都害怕

1行Python代码下载图片，爬虫从未如此简单，某度看了都害怕

爬虫简单基础代码

学习笔记——爬虫（代码）

爬虫----代码段总结

Python爬虫代码框架

Google图片爬虫代码

爬虫-通用代码框架

python爬虫完整代码

python 爬虫代码：

爬虫(4)_代码分析

爬虫代码框架

爬虫代码开始：

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)