欢迎加入QQ学习交流群,与我们一起学习,一起进步吧!
群号:225361733
可以QQ扫一扫加入群聊哦!
BUG已修复!
哈喽,大家好我是小豆,最近在研究爬虫(真·萌新)
看那些爬虫代码快看哭了……
PyCharm编辑器买不起呀,破解教程10有9.9999是假的!
只好用IDLE和Sublime写爬虫,没想到……
我想测试一下最基础的爬虫代码:(下图)
import requests
url = '网址'
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)
我就用了CSDN做了炮灰!
import requests
url = 'https://www.csdn.net/'
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)
这个代码没问题吧?请大佬指正!
结果……尴尬的事情发生了
Sublime运行结果
<title>CSDN-涓撲笟IT鎶�鏈�绀惧尯</title>
<meta data-n-head="true" data-hid="description" name="description" content="CSDN鏄�鍏ㄧ悆鐭ュ悕涓�鏂嘔T鎶�鏈�浜ゆ祦骞冲彴,鍒涘缓浜�1999骞�,鍖呭惈鍘熷垱鍗氬��銆佺簿鍝侀棶绛斻�佽亴涓氬煿璁�銆佹妧鏈�璁哄潧銆佽祫婧愪笅杞界瓑浜у搧鏈嶅姟,鎻愪緵鍘熷垱銆佷紭璐ㄣ�佸畬鏁村唴瀹圭殑涓撲笟IT鎶�鏈�寮�鍙戠ぞ鍖�.">
这是……繁体字?
我又尝试了IDLE……
我敲……
难道代码就这么写的?
于是我又看了源码……
这下我真懵了
对比图:
已哭晕在¥%&@#¥%&(不可描述的地点)
PS:问题已解决,感谢大佬画中诗意
import requests
url = "https://www.csdn.net/"
response = requests.get(url)
response.encoding = 'utf-8'
print(response.text)