前言
前面一篇实现了参数的关联,那种只是记流水账的完成功能,不便于维护,也没什么可读性,接下来这篇可以把每一个动作写成一个函数,这样更方便了。
参数化的思维只需记住一点:不要写死
(由于博客园登录机制变了,登录全部用cookie,不用账号和密码登录了)
一、登录函数
1.s参数是session的一个实例类,先放这里,方便写后面代码
2.登录函数传三个参数,s是需要调用前面的session类,所以必传,可以传个登录的url,然后payload是账号和密码
二、保存草稿
1.编辑内容的标题title和正文body_data参数化了,这样后面可以方便传不同值
2.这里返回了获取到新的url地址,因为后面的postid参数需要在这里提取
三、提取postid
1.这里用正则表达式提取url里面的postid
四、删除草稿
1.传个url和postid就可以了
五、参考代码:
1 # coding:utf-8
2 import requests
3
4 def login(s, url, payload):
5 '''登录'''
6 # 先打开登录首页,获取部分cookie
7 url = "https://passport.cnblogs.com/user/signin"
8 headers = {
9 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0"
10 } # get方法其它加个ser-Agent就可以了
11
12 s = requests.session()
13 r = s.get(url, headers=headers,verify=False)
14 print s.cookies
15
16 # 添加登录需要的两个cookie
17 c = requests.cookies.RequestsCookieJar()
18
19 c.set('.CNBlogsCookie', '这里是抓到的') # 填上面抓包内容
20 c.set('.Cnblogs.AspNetCore.Cookies','这里是抓到的') # 填上面抓包内容
21 c.set('AlwaysCreateItemsAsActive',"True")
22 c.set('AdminCookieAlwaysExpandAdvanced',"True")
23 s.cookies.update(c)
24 print s.cookies
25
26 def save_box(s, url2, title, body_data):
27 '''# 获取报存之后url地址'''
28 body = {"__VIEWSTATE": "",
29 "__VIEWSTATEGENERATOR":"FE27D343",
30 "Editor$Edit$txbTitle":"这是标题",
31 "Editor$Edit$EditorBody":"<p>这里正文:http://www.cnblogs.com/yoyoketang/</p>",
32 "Editor$Edit$Advanced$ckbPublished":"on",
33 "Editor$Edit$Advanced$chkDisplayHomePage":"on",
34 "Editor$Edit$Advanced$chkComments":"on",
35 "Editor$Edit$Advanced$chkMainSyndication":"on",
36 "Editor$Edit$Advanced$txbEntryName":"",
37 "Editor$Edit$Advanced$txbExcerpt":"",
38 "Editor$Edit$Advanced$tbEnryPassword":"",
39 "Editor$Edit$lkbDraft":"存为草稿",
40 }
41 r2 = s.post(url2, data=body, verify=False)
42 print r2.url
43 return r2.url
44
45 def get_postid(u):
46 '''正则提取postid'''
47 import re
48 postid = re.findall(r"postid=(.+?)&", u)
49 print postid # 这里是list
50 if len(postid) < 1:
51 return ''
52 else:
53 return postid[0]
54
55 def delete_box(s,url3, postid):
56 '''删除草稿箱'''
57 json3 = {"postId": postid}
58 r3 = s.post(url3, json=json3, verify=False)
59 print r3.json()
60
61 if __name__ == "__main__":
62 url = "https://passport.cnblogs.com/user/signin"
63 payload = {
64 "input1": "xxx",
65 "input2": "xxx",
66 "remember": True
67 }
68 s = requests.session()
69 login(s, url, payload,)
70 url2 = "https://i.cnblogs.com/EditPosts.aspx?opt=1"
71 u = save_box(s, url2, "标题", "正文内容")
72 postid = get_postid(u)
73 url3 = "https://i.cnblogs.com/post/delete"
74 delete_box(s, url3, postid)