三、TCP协议:传输控制协议
3.1 TCP简介
TCP协议,传输控制协议(英语:Transmission Control Protocol,缩写为 TCP)是一种面向连接的、可靠的、基于字节流的传输层通信协议,由IETF的RFC 793定义。TCP通信需要经过创建连接、数据传送、终止连接三个步骤。
TCP通信模型中,在通信开始之前,一定要先建立相关的链接,才能发送数据,类似于生活中,"打电话""
(1)特点:
1. 面向连接
通信双方必须先建立连接才能进行数据的传输,双方都必须为该连接分配必要的系统内核资源,以管理连接的状态和连接上的传输。
双方间的数据传输都可以通过这一个连接进行。
完成数据交换后,双方必须断开此连接,以释放系统资源。
这种连接是一对一的,因此TCP不适用于广播的应用程序,基于广播的应用程序请使用UDP协议。
2. 可靠传输
1)TCP采用发送应答机制
TCP发送的每个报文段都必须得到接收方的应答才认为这个TCP报文段传输成功
2)超时重传
发送端发出一个报文段之后就启动定时器,如果在定时时间内没有收到应答就重新发送这个报文段。
TCP为了保证不发生丢包,就给每个包一个序号,同时序号也保证了传送到接收端实体的包的按序接收。然后接收端实体对已成功收到的包发回一个相应的确认(ACK);如果发送端实体在合理的往返时延(RTT)内未收到确认,那么对应的数据包就被假设为已丢失将会被进行重传。
3)错误校验
TCP用一个校验和函数来检验数据是否有错误;在发送和接收时都要计算校验和。
4) 流量控制和阻塞管理
流量控制用来避免主机发送得过快而使接收方来不及完全收下。
(2)TCP与UDP的不同点
- 面向连接(确认有创建三方交握,连接已创建才作传输。)
- 有序数据传输
- 重发丢失的数据包
- 舍弃重复的数据包
- 无差错的数据传输
- 阻塞/流量控制
(3)TCP通信模型
TCP通信模型中,在通信开始之前,一定要先建立相关的链接,才能发送数据,类似于生活中,"打电话""
3.2 tcp客户端
tcp客户端构建流程:
from socket import *
# 创建socket
tcp_client_socket = socket(AF_INET, SOCK_STREAM)
# 目的信息
server_ip = input("输入服务器ip:")
server_port = int(input("输入服务器端口:"))
server_addr = (server_ip, server_port)
# 连接服务器
tcp_client_socket.connect(server_addr)
# 发送数据
send_mag = input("输入要发送的数据:")
tcp_client_socket.sendto(send_mag.encode('gbk'), server_addr)
# 接收数据
recv_msg = tcp_client_socket.recv(1024)
print("收到:{}".format(recv_msg.decode('gbk')))
# 关闭socket
tcp_client_socket.close()
客户端主要是与服务器端交流,具体结果:
3.3 tcp服务器端
完成一个tcp服务器的功能,需要的流程如下:
- socket创建一个套接字
- bind绑定ip和port
- listen使套接字变为可以被动链接
- accept等待客户端的链接
- recv/send接收发送数据
from socket import *
# 创建socket
tcp_server_socket = socket(AF_INET, SOCK_STREAM)
# 设定本地信息
local_addr = ("", 8888)
# 绑定本地信息
tcp_server_socket.bind(local_addr)
# 使用socket创建的套接字socket默认的属性是主动的,使用listen将其变为被动的,这样就可以接收别人的连接了
tcp_server_socket.listen(128)
# 如果有新的客户来连接服务器,那么就产生一个新的socket专门这个客户端服务
client_socket, client_addr = tcp_server_socket.accept()
print("{}已接入...".format(client_addr))
# 接收对方发送过来的数据
recv_msg = client_socket.recv(1024)
print("接收到来自{0}的信息:{1}".format(client_addr, recv_msg.decode('gbk')))
# 发送一些数据回到客户端
client_socket.send("已收到啦!".encode('gbk'))
# 关闭为这个客户端服务的socket,如果还需要服务就要重新连接服务器
client_socket.close()
服务器端的运行结果:
如果想要实现一个一直运行的服务器,同时按顺序处理用户的所有请求,并且所有的用户都可以连接到服务器(即使还没有被服务),让用户处于等待的状态,这个可以在适当的位置增加while循环来实现。
同时还要解决第二个问题:如何区分用户是否已经断开连接,从而断开服务提高服务器的效率
用户在断开连接的时候会向服务器传递一个空内容,这样使得recv()函数解堵塞,获得空长度字符串,可以据此判断是否断开
综上,就可以使用循环加上if判断返回语句是否为空来完成上面两个改进:
from socket import *
# 创建socket
tcp_server_socket = socket(AF_INET, SOCK_STREAM)
# 设定本地信息
local_addr = ("", 8888)
# 绑定本地信息
tcp_server_socket.bind(local_addr)
# 使用socket创建的套接字socket默认的属性是主动的,使用listen将其变为被动的,这样就可以接收别人的连接了
tcp_server_socket.listen(128)
# 这个while循环是整个服务器运行的循环,当一个用户正在连接时,其他的用户信息也可以传递到服务器上存储,然后按顺序连接
while True:
# 如果有新的客户来连接服务器,那么就产生一个新的socket专门这个客户端服务
client_socket, client_addr = tcp_server_socket.accept()
print("{}已接入...".format(client_addr))
# 这个while循环是一个用户接入之后会一直收到服务器的服务直到用户断开,循环跳出
while True:
# 接收对方发送过来的数据
recv_msg = client_socket.recv(1024)
if recv_msg:
print("接收到来自{0}的信息:{1}".format(client_addr, recv_msg.decode('gbk')))
else:
break
# 发送一些数据回到客户端
client_socket.send("已收到啦!".encode('gbk'))
# 关闭为这个客户端服务的socket,连接下一个用户
client_socket.close()
# 关闭整个服务器
tcp_server_socket.close()
这样即使是有多个同时连接上,也需要等待上一个处理完成
3.4 tcp注意点
- tcp服务器一般情况下都需要绑定,否则客户端找不到这个服务器
- tcp客户端一般不绑定,因为是主动链接服务器,所以只要确定好服务器的ip、port等信息就好,本地客户端可以随机
- tcp服务器中通过listen可以将socket创建出来的主动套接字变为被动的,这是做tcp服务器时必须要做的
- 当客户端需要链接服务器时,就需要使用connect进行链接,udp是不需要链接的而是直接发送,但是tcp必须先链接,只有链接成功才能通信
- 当一个tcp客户端连接服务器时,服务器端会有1个新的套接字,这个套接字用来标记这个客户端,单独为这个客户端服务
- listen后的套接字是被动套接字,用来接收新的客户端的链接请求的,而accept返回的新套接字是标记这个新客户端的
- 关闭listen后的套接字意味着被动套接字关闭了,会导致新的客户端不能够链接服务器,但是之前已经链接成功的客户端正常通信。
- 关闭accept返回的套接字意味着这个客户端已经服务完毕
- 当客户端的套接字调用close后,服务器端会recv解堵塞,并且返回的长度为0,因此服务器可以通过返回数据的长度来区别客户端是否已经下线
3.5 TCP长连接和短连接
(1)TCP流程
TCP在真正的读写操作之前,server与client之间必须建立一个连接,
- 当读写操作完成后,双方不再需要这个连接时它们可以释放这个连接,
- 连接的建立通过三次握手,释放则需要四次握手,
- 所以说每个连接的建立都是需要资源消耗和时间消耗的。
TCP的整个过程:
更加具体的请移步:https://blog.csdn.net/wo05644660559/article/details/78020279
(2)长连接和短连接
TCP短连接
模拟一种TCP短连接的情况:
- client 向 server 发起连接请求
- server 接到请求,双方建立连接
- client 向 server 发送消息
- server 回应 client
- 一次读写完成,此时双方任何一个都可以发起 close 操作
在步骤5中,一般都是 client 先发起 close 操作。当然也不排除有特殊的情况。
从上面的描述看,短连接一般只会在 client/server 间传递一次读写操作
TCP长连接
模拟一种长连接的情况:
- client 向 server 发起连接
- server 接到请求,双方建立连接
- client 向 server 发送消息
- server 回应 client
- 一次读写完成,连接不关闭
- 后续读写操作...
- 长时间操作之后client发起关闭请求
(3)TCP长/短连接的优点和缺点
-
长连接可以省去较多的TCP建立和关闭的操作,减少浪费,节约时间。
对于频繁请求资源的客户来说,较适用长连接。
-
client与server之间的连接如果一直不关闭的话,会存在一个问题,
随着客户端连接越来越多,server早晚有扛不住的时候,这时候server端需要采取一些策略,
如关闭一些长时间没有读写事件发生的连接,这样可以避免一些恶意连接导致server端服务受损;
如果条件再允许就可以以客户端机器为颗粒度,限制每个客户端的最大长连接数,
这样可以完全避免某个蛋疼的客户端连累后端服务。
- 短连接对于服务器来说管理较为简单,存在的连接都是有用的连接,不需要额外的控制手段。
- 但如果客户请求频繁,将在TCP的建立和关闭操作上浪费时间和带宽。
(4)TCP长/短连接的应用场景
-
长连接多用于操作频繁,点对点的通讯,而且连接数不能太多情况。
每个TCP连接都需要三次握手,这需要时间,如果每个操作都是先连接,
再操作的话那么处理速度会降低很多,所以每个操作完后都不断开,
再次处理时直接发送数据包就OK了,不用建立TCP连接。
例如:数据库的连接用长连接,如果用短连接频繁的通信会造成socket错误,
而且频繁的socket 创建也是对资源的浪费。
-
而像WEB网站的http服务一般都用短链接,因为长连接对于服务端来说会耗费一定的资源,
而像WEB网站这么频繁的成千上万甚至上亿客户端的连接用短连接会更省一些资源,
如果用长连接,而且同时有成千上万的用户,如果每个用户都占用一个连接的话,
那可想而知吧。所以并发量大,但每个用户无需频繁操作情况下需用短连好。
3.6 wireshark抓包工具使用
请移步:https://blog.csdn.net/holandstone/article/details/47026213
3.7 TCP/IP协议
早期的计算机网络,都是由各厂商自己规定一套协议,IBM、Apple和Microsoft都有各自的网络协议,互不兼容
为了把全世界的所有不同类型的计算机都连接起来,就必须规定一套全球通用的协议,为了实现互联网这个目标,互联网协议族(Internet Protocol Suite)就是通用协议标准。
因为互联网协议包含了上百种协议标准,但是最重要的两个协议是TCP和IP协议,所以,大家把互联网的协议简称TCP/IP协议
常用的网络协议如下图所示:
网际层也称为:网络层
网络接口层也称为:链路层
另外一套标准: