|
| 1 | +# TCP 和 UDP |
| 2 | + |
| 3 | +## TCP 报文包 |
| 4 | + |
| 5 | + |
| 6 | + |
| 7 | +TCP报文由首部和数据两部分组成。首部一般由20-60 Byte 构成,长度可变。其中前20 Byte 格式固定,后40 Byte 为可选。 |
| 8 | + |
| 9 | +因为,TCP报文还得传给下层网络层,封装成IP包,而一个IP包最大长度为65535,同时IP包首部也包含最少20 Byte ,所以一个IP包或TCP包可以包含的数据部分最大长度为65535-20-20=65495 Byte 。 |
| 10 | + |
| 11 | +TCP报文中数据部分是可选的,即**TCP报文可以不包含数据**(同理IP包也可以不包含数据)。不含数据的TCP报文通常是一些确认和控制信息类的报文,如TCP建立连接时的三次握手和TCP终止时的四次挥手等。 |
| 12 | + |
| 13 | +- **Source Port**和 **Destination Port**: 分别占用16位,表示源端口号和目的端口号;用于区别主机中的不同进程,而IP地址是用来区分不同的主机的,源端口号和目的端口号配合上IP首部中的源IP地址和目的IP地址就能唯一的确定一个TCP连接; |
| 14 | + |
| 15 | +- **Sequence Number**: 用来标识从TCP发端向TCP收端发送的数据字节流,它表示在这个报文段中的的第一个数据字节在数据流中的序号;主要用来**解决网络报乱序的问题**; |
| 16 | + |
| 17 | +- **Acknowledgment Number**: 32位确认序列号包含发送确认的一端所期望收到的下一个序号,因此,确认序号应当是上次已成功收到数据字节序号加1。不过,只有当标志位中的ACK标志(下面介绍)为1时该确认序列号的字段才有效。**主要用来解决不丢包的问题**; |
| 18 | + |
| 19 | +- Data Offset: 给出首部中32 bit字的数目,需要这个值是因为任选字段的长度是可变的。这个字段占4bit(最多能表示15个32bit的的字,即4*15=60个字节的首部长度),因此TCP最多有60字节的首部。然而,没有任选字段,正常的长度是20字节; |
| 20 | + |
| 21 | +- TCP Flags: TCP首部中有6个标志比特,它们中的多个可同时被设置为1,主要是用于操控TCP的状态机的,依次为URG,ACK,PSH,RST,SYN,FIN。每个标志位的意思如下: |
| 22 | + |
| 23 | +- - URG:此标志表示TCP包的紧急指针域(后面马上就要说到)有效,用来保证TCP连接不被中断,并且督促中间层设备要尽快处理这些数据; |
| 24 | + - ACK:此标志表示应答域有效,就是说前面所说的TCP应答号将会包含在TCP数据包中;有两个取值:0和1,为1的时候表示应答域有效,反之为0; |
| 25 | + - PSH:这个标志位表示Push操作。所谓Push操作就是指在数据包到达接收端以后,立即传送给应用程序,而不是在缓冲区中排队; |
| 26 | + - RST:这个标志表示连接复位请求。用来复位那些产生错误的连接,也被用来拒绝错误和非法的数据包; |
| 27 | + - SYN:表示同步序号,用来**建立连接**。SYN标志位和ACK标志位搭配使用,当连接请求的时候,SYN=1,ACK=0;连接被响应的时候,SYN=1,ACK=1;这个标志的数据包经常被用来进行端口扫描。扫描者发送一个只有SYN的数据包,如果对方主机响应了一个数据包回来 ,就表明这台主机存在这个端口;但是由于这种扫描方式只是进行TCP三次握手的第一次握手,因此这种扫描的成功表示被扫描的机器不很安全,一台安全的主机将会强制要求一个连接严格的进行TCP的三次握手; |
| 28 | + - FIN: 表示发送端已经达到数据末尾,也就是说双方的数据传送完成,没有数据可以传送了,发送FIN标志位的TCP数据包后,连接将被断开。这个标志的数据包也经常被用于进行端口扫描。 |
| 29 | + |
| 30 | +- Window: 窗口大小,也就是有名的滑动窗口,用来进行流量控制; |
| 31 | + |
| 32 | +- CheckSum: 包含TCP首部和TCP数据段,这是一个强制性的字段,一定是由发送端计算和存储,由接收端进行验证。 |
| 33 | + |
| 34 | +- Urgent Pointer: 长度为16 ,指向数据中优先部分的最后一个字节,通知接收方紧急数据的长度,该字段在URG标志置位时有效。 |
| 35 | + |
| 36 | +- Options: 长度为0-40B(字节),必须以4B为单位变化,必要时可以填充0。通常包含:最长报文大小(MaximumSegment Size,MSS)、窗口扩大选项、时间戳选项、选择性确认(Selective ACKnowlegement,SACK)等。 |
| 37 | + |
| 38 | +## UDP 报文包 |
| 39 | + |
| 40 | + |
| 41 | + |
| 42 | +UDP数据报由首部和数据两部分组成,其中首部只有8 Byte。 |
| 43 | + |
| 44 | +- Source Port: 长度为16位,指明发送数据的进程。 |
| 45 | +- Destination Port:长度为16位,指明目的主机接收数据的进程。 |
| 46 | +- Length:长度为16位,该字段值为报头和数据两部分的总字节数。 |
| 47 | +- Checksum:长度为16位,UDP检验和作用于UDP报头和UDP数据的所有位。由发送端计算和存储,由接收端校验。 |
| 48 | +- 数据 |
| 49 | + |
| 50 | +## TCP 与 UDP 的区别 |
| 51 | +- TCP**面向连接**(如打电话要先拨号建立连接);UDP是**无连接的**,即发送数据之前不需要建立连接 |
| 52 | +- TCP提供可靠的服务。也就是说,通过TCP连接传送的数据,**无差错,不丢失,不重复**,且按序到达;UDP尽最大努力交付,即不保证可靠交付 |
| 53 | +- TCP面向字节流,实际上是TCP把数据看成一连串无结构的字节流;UDP是面向报文的,UDP没有拥塞控制,因此网络出现拥塞不会使源主机的发送速率降低(对实时应用很有用,如IP电话,实时视频会议等) |
| 54 | +- 每一条TCP连接只能是点到点的;UDP支持一对一,一对多,多对一和多对多的交互通信 |
| 55 | +- TCP首部开销20字节;UDP的首部开销小,只有8个字节 |
| 56 | +- TCP的逻辑通信信道是**全双工**的可靠信道,UDP则是不可靠信道 |
| 57 | + |
| 58 | +## 三次握手 |
| 59 | + |
| 60 | + |
| 61 | + |
| 62 | +第一次握手:主机A发送位码为syn=1,随机产生seq number=x的数据包到服务器,客户端进入`SYN_SEND`状态,等待服务器的确认;主机B由SYN=1知道,A要求建立联机; |
| 63 | + |
| 64 | +第二次握手:主机B收到请求后要确认联机信息,向A发送ack number(主机A的seq+1),syn=1,ack=1,随机产生seq=y的包,此时服务器进入`SYN_RECV`状态; |
| 65 | + |
| 66 | +第三次握手:主机A收到后检查ack number是否正确,即第一次发送的seq number+1,以及位码ack是否为1,若正确,主机A会再发送ack number(主机B的seq+1),ack=1,主机B收到后确认seq值与ack=1则连接建立成功。客户端和服务器端都进入`ESTABLISHED`状态,完成TCP三次握手。 |
| 67 | + |
| 68 | +### 为什么需要三次握手 |
| 69 | + |
| 70 | +防止了服务器端的一直等待而浪费资源。 |
| 71 | + |
| 72 | +## 四次分手 |
| 73 | + |
| 74 | + |
| 75 | + |
| 76 | +第一次挥手:主机1(可以使客户端,也可以是服务器端),设置`Sequence Number`和`Acknowledgment Number`,向主机2发送一个`FIN`报文段;此时,主机1进入`FIN_WAIT_1`状态;这表示主机1没有数据要发送给主机2了; |
| 77 | + |
| 78 | +第二次挥手:主机2收到了主机1发送的`FIN`报文段,向主机1回一个`ACK`报文段,`Acknowledgment Number`为`Sequence Number`加1;主机1进入`FIN_WAIT_2`状态;主机2告诉主机1,我也没 有数据要发送了,可以进行关闭连接了; |
| 79 | + |
| 80 | +第三次挥手:主机2向主机1发送`FIN`报文段,请求关闭连接,同时主机2进入`CLOSE_WAIT`状态; |
| 81 | + |
| 82 | +第四次挥手:主机1收到主机2发送的`FIN`报文段,向主机2发送`ACK`报文段,然后主机1进入`TIME_WAIT`状态;主机2收到主机1的`ACK`报文段以后,就关闭连接;此时,主机1等待2MSL后依然没有收到回复,则证明Server端已正常关闭,那好,主机1也可以关闭连接了。 |
| 83 | + |
| 84 | +### 状态机变化 |
| 85 | + |
| 86 | +- FIN_WAIT_1: 这个状态要好好解释一下,其实FIN_WAIT_1和FIN_WAIT_2状态的真正含义都是**表示等待对方的FIN报文**。而这两种状态的区别是:FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时,它想主动关闭连接,向对方发送了FIN报文,此时该SOCKET即进入到FIN_WAIT_1状态。而当对方回应ACK报文后,则进入到FIN_WAIT_2状态,当然在实际的正常情况下,无论对方何种情况下,都应该马上回应ACK报文,所以FIN_WAIT_1状态一般是比较难见到的,而FIN_WAIT_2状态还有时常常可以用netstat看到。(主动方) |
| 87 | +- FIN_WAIT_2:上面已经详细解释了这种状态,实际上FIN_WAIT_2状态下的SOCKET,表示半连接,也即有一方要求close连接,但另外还告诉对方,我暂时还有点数据需要传送给你(ACK信息),稍后再关闭连接。(主动方) |
| 88 | +- CLOSE_WAIT:这种状态的含义其实是表示在等待关闭。怎么理解呢?当对方close一个SOCKET后发送FIN报文给自己,你系统毫无疑问地会回应一个ACK报文给对方,此时则进入到CLOSE_WAIT状态。接下来呢,实际上你真正需要考虑的事情是察看你是否还有数据发送给对方,如果没有的话,那么你也就可以 close这个SOCKET,发送FIN报文给对方,也即关闭连接。所以你在CLOSE_WAIT状态下,需要完成的事情是等待你去关闭连接。(被动方) |
| 89 | +- LAST_ACK: 这个状态还是比较容易好理解的,它是被动关闭一方在发送FIN报文后,最后等待对方的ACK报文。当收到ACK报文后,也即可以进入到CLOSED可用状态了。(被动方) |
| 90 | +- TIME_WAIT: 表示收到了对方的FIN报文,并发送出了ACK报文,就等2MSL后即可回到CLOSED可用状态了。如果FIN*WAIT*1状态下,收到了对方同时带FIN标志和ACK标志的报文时,可以直接进入到TIME_WAIT状态,而无须经过FIN_WAIT_2状态。(主动方) |
| 91 | +- CLOSED: 表示连接中断。 |
| 92 | + |
| 93 | +### 为什么需要四次分手 |
| 94 | + |
| 95 | +那四次分手又是为何呢?TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议。TCP是全双工模式,这就意味着,当主机1发出FIN报文段时,只是表示主机1已经没有数据要发送了,主机1告诉主机2,它的数据已经全部发送完毕了;但是,这个时候主机1还是可以接受来自主机2的数据;当主机2返回ACK报文段时,表示它已经知道主机1没有数据发送了,但是主机2还是可以发送数据到主机1的;当主机2也发送了FIN报文段时,这个时候就表示主机2也没有数据要发送了,就会告诉主机1,我也没有数据要发送了,之后彼此就会愉快的中断这次TCP连接。 |
0 commit comments