第五章:与HTTP协作的Web服务器
一台Web 服务器可搭载多个独立域名的Web网站,也可作为通信路径上的中转服务器提升传输效率。
5.1 用单台虚拟主机实现多个域名
HTTP/1.1 规范允许一台HTTP服务器搭建多个 Web站点。 比如:提供 Web 托管服务的供应商,可以用一台服务器为多位客户服务,也可以以每一位客户持有的域名运行各自不同的网站。这是因为利用虚拟主机(虚拟服务器)的功能。
即使物理层只有一台服务器,但只要使用虚拟主机的功能,则可以假象已具有多台服务器。
客户端会采用域名访问服务器,域名通过DNS服务映射到IP地址之后访问目标网站。
5.2 通信数据转发程序:代理、网关、隧道
HTTP通信时,除客户端和服务器以外,还有一些用于通信数据转发的应用程序,例如代理、网关和隧道。来配合服务器的工作。
这些应用程序和服务器可以将请求转发给通信线路上的下一站服务器,并且能接收从那台服务器发送的响应在转发给客户端。
- 代理 :是一种有转发功能的应用程序,服务器和客户端之间的中间人。
- 网关 :转发其他服务器通信数据的服务器。
- 隧道 :是在相隔很远的客户端和服务器之间进行中转,并保持双方通信连接的应用程序。
后边详细讲解。。
5.2.1 代理
代理不改变请求URI ,会直接发送给前方持有资源的目标服务器。
可多级联。转发时需要附加Via 首部字段标记出经过的主机信息。
使用代理服务器的理由:
- 利用缓存技术减少网络带宽的流量
- 组织内部针对特定网站的访问控制,以获取访问日志为主要目的。。。
代理有多种使用方法,按两种基准分类。一种是是否使用缓存,另一种是是否会修改报文。
- 缓存代理
代理转发响应时,缓存代理会预先将资源的副本保存在代理服务器上。(有个以为难道每次就都保存副本,累计会不会太多,是不有什莫清理机制?)当代理再次接收到相同的资源的请求时,就可以不从源服务器哪里获取资源,而是将之前的缓存资源作为响应返回。 - 透明代理
转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理。反之称为非透明代理。
5.2.2 网关
网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提供非HTTP协议服务。
利用网关能够提升通信的安全性,因为可以在客户端与网关之间的通信线路上加密以确保连接的安全。比如:网关可以连接数据库,使用SQL语句查询数据。
5.2.3 隧道
隧道可以按要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信。隧道的目的就是确保通信安全。
隧道本身不会解析HTTP请求,原样中转,在通信双方断开连接时结束。
5.3 保存资源的缓存
缓存是指代理服务器或客户端本地磁盘内保存的资源副本。利用缓存可减少对服务器的访问,因此也就节省了通信流量和通信时间。
缓存服务器的优势就是在于利用缓存可避免多次从服务器端转发资源。因此客户端就可以就近从缓存服务器上获取资源,而源服务器也不必多次处理相同的请求了。当然缓存也是有有效期的,若缓存失败就会获取新的资源。。
5.3.2 客户端的缓存
缓存不仅可以存放在服务器上也可以存在客户端浏览器上。(也会去判断资源的有效性)
在HTTP出现之前的协议
- FTP:传输文件时使用的协议
- NNTP:用于NetNews电子会议室内传达消息的协议
- Archie:搜索anonymous FTP 公开的文件信息的协议
- WAIS:以关键词检索多个数据库使用的协议
- Gopher:查找与互联网连接的计算机内信息的协议
参考文献:《图解HTTP》