深度理解会话和Cookies之一

在了解会话和Cookies之前,我们先了解HTTP的一个特点,叫做无状态

HTTP的无状态是指HTTP协议对事物处理是没有记忆能力的,也就是说服务器不知道客户端是什么状态。当我们向服务器发送请求后,服务器解析此请求,然后返回对应的响应,服务器负责完成这个过程,而且这个过程是完全独立的,服务器不会记录前后状态的变化,也就是缺少状态记录。这意味着如果后续需要处理前面的信息,则必须重传,这导致必须额外传递一些前面的重复请求,才能获取后续响应。然而这种效果不是我们想要的,为了保持前后状态,我们肯定不必将前面的请求重新传一次。对于需要登录的页面来说,这个问题更为突出。

这时两个用于保持HTTP连接状态的技术就出现了,它们分别是会话Cookies会话在服务端,也就是在网站的服务器,用来保存用户的会话信息Cookies在客户端,也可以理解为浏览器端,有了Cookies,浏览器在下次访问网页时会自动附带上它发送给服务器,服务器通过识别Cookies并鉴定出是哪个用户,然后再判断用户是否是登陆状态,然后返回对应的响应。

我们可以理解为Cookies里面保存了登录的凭证,有了它,只需要下次请求携带Cookies发送请求而不必重新输入用户名,密码等信息重新登录了。

因为在爬虫中,有时候处理需要登录才能访问的页面时,我们一般会直接将登陆成功后获取的Cookies放在请求头里面直接请求,而不必重新模拟登录。

好了,在了解了会话和Cookies的概念之后,我们来剖析它们的原理。

1.会话

会话,其本来的含义是指有始有终的一系列动作或消息,比如,打电话时,从拿起电话拨号到挂断电话这中间的一系列过程,可以称为一个会话。

而在Web中,会话对象用来存储特定用户会话所需的属性及配置信息。这样,当用户在应用程序的Web页面之间跳转时,存储在会话对象中的变量将不会丢失,而是在整个用户会话中一直存在下去。当用户请求来自应用程序的Web页时,如果该用户还没有会话,则Web服务器就自动创建一个会话对象。当会话过期或者被放弃后,服务器将终止该会话。

2.Cookies

Cookies指某些网站为了辨别用户身份、进行会话跟踪而存储在用户本地终端上的数据。

猜你喜欢

转载自blog.csdn.net/HS_blog/article/details/81384151