【暗恋不可耻但无用】QQ空间爬虫-Java版(jzone-crawler)

版权声明:[ EXP技术分享博客(http://exp-blog.com) ] 版权所有,转载请注明出处: https://blog.csdn.net/lyy289065406/article/details/82716901

完整原文(含 源码 与 发布版 下载):http://exp-blog.com/2018/09/15/pid-2347/
(转载请注明出处,仅供分享学习,严禁用于商业用途)


声明

  • 在你心中是否有一个默默关注的小姐姐?
  • 你是否想知道在遇见她之前在她身边的一切?
  • 确认过眼神,让你总在对的时间遇上对的人

  • 写这个插件纯粹是出于学习目的,此博文主要作用是功能展示
  • 之后会围绕这个插件,写一个系列的爬虫教程
  • 请勿使用此软件做不可描述的事情
  • 未经允许禁止出于商用目的使用此插件,违者列入授权黑名单并公开示众,所带来的一切后果自负

运行环境


软件介绍

 此插件主要用于QQ空间,主要功能包括:

  • 模拟QQ登陆
  • 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
  • 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
  • 自动整理所下载的【相册/说说数据】
  • 支持两种爬取数据的模式:
      【xhr】 默认模式,用于发布版,爬取速度快,但QQ空间协议经常变动,需定期更新协议避免失效
      【selenium-phantomjs】 仿真模式,仅限开发版,爬取速度慢,但能确保在QQ空间协议变动不大时依然有效

运行界面展示

※ 登陆界面
登陆界面


※ 爬取QQ空间相册
爬取QQ空间相册


※ 爬取QQ空间说说
爬取QQ空间说说


※ 分类整理所下载的图文数据
分类整理所下载的图文数据


安装与使用

  • 01. 安装JDK环境【jdk-7u72-windows-x64.exe】,一直 下一步 到完成即可(无需修改安装路径)
  • 02. 解压并运行【QQ空间爬虫.exe】
  • 03. 选择【爬取相册数据】或【爬取说说数据】即可自动批量下载 图片及其相关信息
  • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
      ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
      ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
      ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
      ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
      ○ [mood/photos] 文件夹汇总了所有说说的图片

注:
 此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
 此程序不包含盗号后门,若不放心请勿使用
 此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限


升级记录


v2.2版本 (2018-09-15) :

  • 01. 更新软件授权通道为SSL协议
  • 02. 修正因QQ空间升级导致xhr协议失效问题


v2.1版本 (2018-08-06) :

  • 01. 修正软件授权校验接口


v2.0版本 (2018-05-27) :

  • 01. 增加自动升级功能


v1.1版本 (2018-05-26) :

  • 01. 相册爬取
  • 02. 优化相册和说说的爬取模式为XHR
  • 03. 同时支持前后端爬虫
  • 04. 增加软件授权校验


v1.0版本 (2016-06-09) :

  • 01. 支持说说图文爬取

版权声明

Copyright (C) 2016-2018 By EXP License: GPL v3


猜你喜欢

转载自blog.csdn.net/lyy289065406/article/details/82716901