本文紧跟上文《图解HTTP》读书心得(一)
HTTP报文
用于HTTP协议交互的信息被称为HTTP报文。用于请求端的报文叫请求报文,用于相应端的报文叫做响应报文。HTTP报文本身是由多行(CR+LF换行)数据构成的字符串文本。HTTP协议
表1:请求报文及响应报文的结构
请求报文结构 | |
---|---|
报文首部 | 请求行 |
请求首部字段 | |
通用首部字段 | |
实体首部字段 | |
其他 | |
空行 | |
报文主体 |
响应报文结构 | |
---|---|
报文首部 | 状态码 |
响应首部字段 | |
通用首部字段 | |
实体首部字段 | |
其他 | |
空行 | |
报文主体 |
具体实例可以在浏览器上抓包看下。
请求行包含用于请求方法,URI和HTTP版本;
状态行包含响应的结果的状态码,原因短语和HTTP版本;
首部字段包含用于请求和响应的各种条件和属性的各类首部;
其他可能包含HTTP的RFC里未定义的首部(如COOKIE)。
HTTP/1.1首部字段一览表
表 6-1 :通用首部字段
首部字段名 | 说明 |
---|---|
Cache-Control | 控制缓存行为 |
Connection | 逐跳首部、连接的管理 |
Date | 创建报文的日期 |
Pragma | 报文指令 |
Trailer | 报文末端的首部一览 |
Transfer-Encoding | 制定报文主体的传输编码方式 |
Upgrade | 升级为其他协议 |
Via | 代理服务器的相关信息 |
Warning | 错误通知 |
表 6-2:请求首部字段
首部字段名 | 说明 |
---|---|
Accept | 用户代理可处理的媒体类型 |
Accept-Charset | 优先的字符集 |
Accept-Encoding | 优先的内容编码 |
Accept-Language | 优先的语言 |
Authorization | Web认证信息 |
Expect | 期待服务器的特定行为 |
From | 用户电子邮箱 |
Host | 请求资源所在的服务器 |
If-Match | 比较实体标记(ETag) |
If-Modified-Since | 比较资源的更新时间 |
If-Mone-Match | 比较实体标记(和If-Match相反) |
If-Range | 资源未更新时发送实体Byte的范围请求 |
If-Unmodified-Since | 比较资源的更新时间 |
Max-Forwards | 最大传输跳数 |
Proxy-Authorization | 代理服务器要求客户端的认证信息 |
Range | 实体的字节范围请求 |
Referer | 对请求URI的原始获取方 |
TE | 传输编码的优先级 |
User-Agent | HTTP客户端程序的信息 |
表6-3:响应首部字段
首部字段名 | 说明 |
---|---|
Accept-Ranges | 是否接受字节范围请求 |
Age | 推算资源创建经过时间 |
ETag | 资源的匹配信息 |
Location | 令客户端重定向至指定URI |
Proxy-Authenticate | 代理服务器对客户端的认证信息 |
Retry-After | 对再次发起请求的时机要求 |
Server | HTTP服务器的安装信息 |
Vary | 代理服务器的缓存管理信息 |
WWW-Authenticate | 服务器对客户端的认证信息 |
表6-4:实体首部字段
首部字段名 | 说明 |
---|---|
Allow | 资源可支持的HTTP方法 |
Content-Encoding | 实体主体适用的编码方式 |
Content-Language | 实体主体的自然语言 |
Content-Length | 实体主体的大小 |
Content-Location | 替代对应资源的URI |
Content-MD5 | 实体主体的报文摘要 |
Content-Range | 实体主体的位置范围 |
Content-Type | 实体主体的媒体类型 |
Expires | 实体主体的过期的日期时间 |
Last-Modified | 资源的最后修改日期时间 |
响应状态码
编号 | 类别 | 原因短语 |
---|---|---|
1xx | informational(信息状态码) | 接收的请求正在处理 |
2xx | Success(成功状态码) | 请求正常处理完毕 |
3xx | Redirection(重定向状态码) | 需要进行附加操作完成请求 |
4xx | Client Error(客户端错误状态码) | 服务器无法处理请求 |
5xx | Server Error(服务器错误状态码) | 服务器处理请求出错 |
与HTTP协作的Web服务器
通信数据转发程序
代理
代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端“中间人”的角色,接受由客户端发送的请求并转发给服务器,同时也接受服务器返回的响应并转发给客户端。代理的好处是:可以利用缓存技术减少网络带宽的流量,组织内部针对特定的网站的访问控制,以获取访问日志为主要目的,根据规则进行请求转发达到负载均衡等等。
请求和响应经过代理服务器转发时,需要附加via首部字段以标记经过的主机信息。按两种基准分类,一种是是否使用缓存,另一种是是否会修改报文。
1> 缓存代理(Caching Proxy)
转发响应时,会预先将资源的副本(缓存)保存在代理服务器上。当代理再次接受到相同请求时,可以不从原服务器获取资源,直接从缓存返回。
2>透明代理(Transparent Proxy)/非透明代理
转发或响应请求时不对报文加工的叫透明代理,反之为非透明代理。网关
网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,就像自己拥有资源的源服务器一样对请求进程处理。有时候客户端可能都不会察觉,自己的通信目标是一个网关。
网关和代理的区别是网关能使通信线路上的服务器提供非HTTP协议服务。利用网关能提高通信的安全性,因为可以在客户端和网关线路上加密以确保链接的安全。- 隧道
隧道是在相隔甚远的客户端和服务器两者之间进行中转,并保持双方通信连接的应用程序。