通过session实现通用爬虫--爬取到开心网账户的首页界面

其他 2019-04-30 11:11:15 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载 https://blog.csdn.net/g_optimistic/article/details/89543659

目录

1.点开开心网的登录界面

2.获取login_url 以及账号和密码

第一种方法：F12 找到form表单

第二种方法：Network

3.开始写代码

开心网的网址是http://www.kaixin001.com/

我们接下来的操作是为了直接用session登录开心网，爬取账户主页的代码

1.点开开心网的登录界面

我们发现这是用form表单实现账号登录的

2.获取login_url 以及账号和密码

第一种方法：F12 找到form表单

首先在form表单中找到action,即为要提交的url

form表单里面的内容是要提交的数据，找到id；没有id，就找name

第二种方法：Network

输入账号，密码，点击登录，此时htttp的请求方法是post

打开F12 找到network

formData 里面的数据即为要提交的数据

3.开始写代码

"""
开心网登陆，获取主页
"""
import requests
# 登录的url
login_url = 'https://security.kaixin001.com/login/login_auth.php'
data_dic = {
    "loginemail": "账号",
    "password": "密码",
}
session = requests.session()
response = session.post(url=login_url, data=data_dic)
response1 = session.get(url='http://www.kaixin001.com/home/?uid=181850221&s=39')
# url为登录进去之后主页的地址
with open('kaixin001_login_result.html', 'w', encoding=response1.encoding) as fp:
    fp.write(response1.text)

4.效果

已成功获取到账户登录成功界面的代码

要是不放心的话，在运行一下，在浏览器中查看一下

这就说明我们成功的爬取到了账户主页的代码！！

成功！！！

猜你喜欢

转载自blog.csdn.net/g_optimistic/article/details/89543659

通过session实现通用爬虫--爬取到开心网账户的首页界面

Python爬虫-爬取开心网主页(有登录界面-利用cookie)

Python3-爬虫登录开心网的账号，并且爬取个人主页内容

通过爬虫实现twitter爬取

通过爬虫实现facebook爬取

实现首页界面

python3.7爬虫实战系列爬取掘金网首页存入mysql数据库

【爬虫】爬取网易首页源代码

爬虫入门四：用pyecharts展示爬取到的数据

爬虫入门三：用csv文件保存爬取到的数据

爬虫入门二：用html文件保存爬取到的数据

【爬虫】 02 将爬取到的网页写入文件中

Python爬虫(四) —— 将爬取到的数据进行存储

在HTML中，通过模板语言，request可以取到session的值

python3爬虫-通过requests爬取图虫网

python3爬虫-通过selenium获取到dj商品

用NodeJS实现一个网络爬虫小应用-爬取博客园首页文章列表

爬取新浪网股票并实现界面化1.0(pyqt5)

Python爬虫爬取CSDND首页的所有的文章

python爬虫实践——爬取百度首页

python爬虫scrapy框架爬取糗妹妹段子首页

python爬虫示例爬取网页信息，并且将爬取到的信息存入数据库。

《崔庆才Python3网络爬虫开发实战教程》学习笔记（5）：将爬虫爬取到的数据存储到TXT，Word，Excel，Json等文件中

用Python网络爬虫框架Scrapy实现对新华网的文章内容爬取

Android学习——Jsoup实现网络爬虫，爬取贤集网

Python爬虫实现使用beautifulSoup4爬取名言网功能案例

使用Bootstrap实现旅游网首页

python3爬虫 -----爬取大学信息并通过matplotlib与numpy绘制结果-----from最好大学网

爬虫爬当当网书籍信息

爬虫（5）：爬取拉钩网数据

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)