Python爬虫爬取OA幸运飞艇平台获取数据 - 代码天地

Python爬虫爬取OA幸运飞艇平台获取数据

数据库 2018-06-25 19:43:10 阅读次数: 3

安装BeautifulSoup以及requests

打开window 的cmd窗口输入命令pip install requests 执行安装，等待他安装完成就可以了

BeautifulSoup库也是同样的方法

我使用的编译器的是sublime text 3，觉得是挺好用的一个编译软件

其他工具： Chrome浏览器

Python版本： Python3.6

运行平台： Windows

1、首先我们搜索OA幸运飞艇平台排行榜：【×××。com/h5】企娥:217 1793 408
Python爬虫爬取OA幸运飞艇平台获取数据
获取网页的代码：

[python] view plain copy
def getHTMLText(url,k):
try:
if(k==0):
a={}
else:
a={'offset':k}
r = requests.get(url,params=a,headers={'User-Agent': 'Mozilla/4.0'})
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
print("Failed!")
经过观察其中因为每一页的网址其offset都不相同，故只要改变offset=k便可获取每一页的信息

通过main函数以改变URL：

[python] view plain copy
def main():
basicurl='×××。com/h5'
k=0
while k<=100:
html=getHTMLText(basicurl,k)
k+=10
getname(html)
通过BeautifulSoup的方法层层获取标签中的信息，并for循环输出

[python] view plain copy
def getname(html):
soup = BeautifulSoup(html, "html.parser")
paihangList=soup.find('dl',attrs={'class':'board-wrapper'})
mov=[]
actor=[]
for movlist in paihangList.find_all('dd'):
movitem=movlist.find('div',attrs={'class':'movie-item-info'})
movname=movitem.find('p',attrs={'class':'name'}).getText()
actors=movlist.find('div',attrs={'class':'board-item-main'})
actorname=actors.find('p',attrs={'class':'star'}).getText()
b=actorname.replace('\n','')
c=b.replace(' ','')
actor.append(c)
mov.append(movname)
mode= "{0:<30}\t{1:<50}"
for i,j in zip(mov,actor):
print(mode.format(i,j,chr(12288)))

猜你喜欢

转载自blog.51cto.com/13833489/2132578

Python爬虫爬取OA幸运飞艇平台获取数据

幸运飞艇平台

Java的业务OA幸运飞艇平台出租逻辑验证架fluent-validator

Android开发OA幸运飞艇源码出售 - 获取系统输入法高度的正确姿势

幸运飞艇倍数最高的平台

幸运飞艇老平台网址

PG数据库错误: 检测到OA幸运飞艇源码ShareLock死锁处理

ARM40-A5应用——Shell脚本OA幸运飞艇平台搭建实现进程自动拉起

OA信用盘口添加幸运飞艇和给下级充值上分功能平台搭建架设环境

python paramiko模块幸运飞艇平台搭建实现跨平台SSH

机器学习实践心得：数据平台设计与搭建US幸运飞艇平台出租

幸运飞艇

幸运飞艇平台出租使用Dto将数据封装成普通的JavaBeans

Druid使用及开启US幸运飞艇平台出租数据库密码加密

sql server 日志文件结构幸运飞艇平台出租及误操作数据找回

公众号幸运飞艇平台搭建与Adaboost算法原理

守护线程环境幸运飞艇平台定制搭建

Redis主从复制幸运飞艇平台开发的原理

可以打幸运飞艇的平台_权威专家

靠谱幸运飞艇投注平台_权威专家

赛车幸运飞艇微信平台_权威专家

哪个平台玩幸运飞艇好_权威专家

可以追号的幸运飞艇平台_权威专家

哪里有可靠幸运飞艇平台_权威专家

幸运飞艇冠亚和值小1.85的平台

利用padding-top/padding-bottom百分比OA幸运飞艇平台，进行占位和高度自适应

幸运飞艇的网址链接

幸运飞艇全天计划

幸运飞艇怎么赚钱

幸运飞艇宝宝计划

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)