python学习--采集弹幕信息 - 代码天地

python学习--采集弹幕信息

其他 2019-11-12 11:34:11 阅读次数: 0

# -*- coding: utf-8 -*-
"""
Created on Mon Nov 4 12:00:12 2019

@author: DELL
"""

"""
https://comment.bilibili.com/92542241.xml
"""

import requests
from bs4 import BeautifulSoup

u = 'https://comment.bilibili.com/92542241.xml'

r = requests.get(u)

print(r)
#返回访问结果

print(r.encoding) #显示当前网址的编码格式，一般指中文
print(r.apparent_encoding) #不管是什么格式，使用apprent_encoding一定可以解决乱码，万金油方法

r.encoding = r.apparent_encoding #解决乱码
soup = BeautifulSoup(r.text,'lxml')
#解析网址让其变成可被识别的对象
print(type(soup))
r.text

print(soup.find('d')) #找到d的标签
soup.find_all('d')

dm_lst = soup.find_all('d') #定义一个弹幕列表
print(dm_lst[0]) #打印第一个弹幕

print(dm_lst[3])

print(dm_lst[:6])

dm1 = dm_lst[0]
dm1.text #获取弹幕内容
dm1['p'] #获取弹幕属性

lst=[] #定义一个列表
for i in dm_lst: #获取前面10条弹幕的内容
dic = {} #创建一个字典
dic['其他信息'] = i['p']
dic['弹幕信息'] = i.text
print(dic) #将识别的内容通过for循环一次输出
lst.append(dic)
print(lst)

import pandas as pd
df = pd.DataFrame(lst)
df.to_excel('C:\\Users\\DELL\\Desktop\\常用Excel文件\\1106.xlsx')

猜你喜欢

转载自www.cnblogs.com/xixirang/p/11840646.html

python学习--采集弹幕信息

【Python爬虫项目实战】Python爬虫采集弹幕数据

python获取企鹅电竞弹幕信息

python爬虫学习（二）搜索页信息采集

Python采集Yarn Queue信息

【Python实战】Python采集高校信息

【Python实战】Python采集地震信息

为了自动采集B站弹幕，我用Python开发了一个下载器

python采集火热弹幕数据并做词云图可视化分析

Python自动采集淘宝信息，了解下

python实现信息采集及命令操作

Python采集股票数据信息

python爬取B站弹幕学习笔记

BiliBili直播弹幕信息抓取

视频弹幕的Python实现

【Python实战】Python采集王者最低战力信息

Python requests+BeautifulSoup 采集安居客_新房信息

Python requests+BeautifulSoup 采集房天下_新房信息

Python3采集豆瓣用户的书籍评论信息

python采集链家二手房信息

利用python+selenium采集京东商品信息

Python采集Top 250信息，看看谁最受欢迎~

汽车何其多，python真无敌，采集数据信息~

Python采集电商平台数据信息

Python采集本地房源信息，优质房源提前获取...

【Python爬虫】采集电商商品评价信息

【Python】采集电商平台数据信息

深度学习基底-“影像信息采集管理系统” 技术分享

Python向B站直播视频中发送弹幕信息-python2.7和python3.7均可

python网络数据采集学习笔记

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)