前两天爬虎扑发现,超过从第11页的帖子开始就需要验证登录了。于是跑到登陆页踩点,看看能不能利用cookie模拟登陆。
登陆界面看到一个拖动滑块验证,先不管它,
我发现在登陆过程中,给服务器发送了一个post请求
看到from data里面有我的账号密码信息,这应该就是我要找的信息。
我又试了几次发现rid每次都不一样,抱着破罐破摔的心态我打算把data拷贝下来发给服务器,看它鸟不鸟我们,结果能够顺利模拟登陆了,时候发现rid应该是有时效的,差不多五分钟以后这个rid就不能用了,就要重新去找rid。
模拟登陆主要过程如下:
def login():
data = {'username':'xxxxxxx','password’':'xxxxxxxxxxx','rid':'201808112013531864e03159dcead4e6'}
loginURL = 'https://passport.hupu.com/pc/login/member.action' # POST发送到的网址
after_login = requests.post(loginURL, data=data, headers=headers) # 发送登录信息,返回响应信息(包含cookie)
return after_login
res = requests.get(host, cookies=after_login.cookies, headers=headers)