抓取b站今日热门

其他 2019-09-15 16:31:14 阅读次数: 0

一、抓取标题和视频地址并下载

二、思路

　　1.打开目标地址：http://vc.bilibili.com/p/eden/rank#/?tab=%E5%85%A8%E9%83%A8

　　2.按f12

　　3.点network查找相应url如图

　　4.开始写代码：

import requests
import json,time

headers = {
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
    }
def get_json(url,i):

    data = {
        'page_size': '10',
        'next_offset':str(i) ,
        'tag': '今日热门',
        'platform': 'pc',
    }
    html = requests.get(url,params=data,headers=headers).text
    return html

def dowm_mv(url,title):
    start = time.time()  # 开始时间
    size = 0
    response = requests.get(url, headers=headers, stream=True)  # stream属性必须带上
    chunk_size = 1024  # 每次下载的数据大小
    content_size = int(response.headers['content-length'])  # 总大小
    if response.status_code == 200:
        print('[文件大小]:%0.2f MB' % (content_size / chunk_size / 1024))  # 换算单位
        with open(title, 'wb') as file:
            for data in response.iter_content(chunk_size=chunk_size):
                file.write(data)
                size += len(data)  # 已下载的文件大小

if __name__ == '__main__':
    for i in range(0,9):
        num = i * 10 + 1
        url = 'http://api.vc.bilibili.com/board/v1/ranking/top?'
        html_json = get_json(url,num)
        html_json = json.loads(html_json)
        print(html_json)
        infos = html_json['data']['items']
        for info in infos:
            title = info['item']['description']
            mv = info['item']['video_playurl']
            print(title,mv)
            try:
                dowm_mv(mv,title = '%s.mp4'%title)
            except Exception as e:
                print('下载失败')

　　5.抓取结果如下

猜你喜欢

转载自www.cnblogs.com/a595452248/p/11523205.html

抓取b站今日热门

B 站今日黑白页是怎么实现的？

抓取B站小视频

B站视频之CC字幕抓取

爬取B站热门视频排行榜

【python爬虫】抓取B站视频相关信息（一）

抓取B站所有用户信息

python爬取B站千万级数据，发现了这些热门UP主的秘密！

爬取b站所有的热门视频并且存入mongodb数据库

Python 爬取b站热门视频信息并导入Excel表格

B站2020年每周必看热门视频数据盘点！Python数据分析

爬取b站热门视频的弹幕，并进行弹幕分析

B站电商分析，如何发现近期热门商品及优质视频带货达人？

抓取CSDN博客热门文章

【python爬虫】抓取B站视频数据及相关信息（二）

抓取b站视频信息存入excel表格 + 存进mysql （已修改）

3行！仅3行代码就能抓取B站数据

Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy

Python爬虫案例50篇-第9篇- 抓取B站迪迦奥特曼评论到Excel

笔记-抓取今日头条图片

抓取今日头条文章

今日头条街拍图片抓取

抓取今日头条街拍美图

今日头条案例抓取

Ajax数据抓取及抓取今日头条上的图片

b站弹幕

B站与知乎

b站封面提取

B站视频下载

B站视频爬虫

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)