计算机网络(四)--TCP基础知识讲解

TCP传输的数据单元是报文段，报文段分为首部、数据两部分

TCP首部

首部的前20字节是固定长度，后面的4n字节根据需要增加的选项

字段解释：图中标示单位为bit，不是byte

　　1、源端口、目的端口：占用2byte，实现分用功能（TCP通过端口把请求分发到应用层不同的应用程序）

　　2、序号：占用4byte，范围[0,2^32-1]，序号增加到最大，就会重新回到0，也就是使用的mod2^32运算

　　TCP面向字节流的，同一个TCP连接中传送的字节流中每个字节都是按照顺序编号，整个要传送的字节流的初始序号在连接建立的时候设置，首部

中的序号指的是本报文段所发送的数据的第一个字节的序号。

　　3、确认号ack：占用4byte，指的是希望收到对方的下一个报文段的首个字节的序号

　　4、数据偏移：占用4bit，指的是TCP报文段首部的长度，因为选项的长度不确定，所以数据偏移的存在是很有必要的，数据偏移的最大长度

60byte，所以选项的长度不超过40byte

　　5、保留：占6bit

　　6、紧急URG(URGent)：当URG=1时，紧急指针字段有效，应用程序告诉TCP发送端有紧急数据需要发送，于是TCP把紧急数据插入到本报文段数据

的最前面，后面的数据仍然是普通数据，需要和紧急指针配合使用

　　7、确认ACK：ACK=1生效，在连接建立之后发送的所有报文段ACK都要置为1

　　8、推送PSH：发送方把PSH置为1，并立即创建一个报文段发送出去，接收方收到PSH=1的报文段，就尽快的交付给应用程序，不需要等到整个接

收缓存填满之后再向上交付。但是很少使用

　　9、复位RST：当RST=1时，表明TCP连接出现严重差错，必须释放连接，然后重新建立连接，还可以用来拒绝一个非法的报文段或者拒绝打开一

个非法连接。RST也称为重置位或重建位

　　10、同步SYN：在连接建立时同步序号。

　　11、终止FIN：用来释放一个连接

　　12、窗口：占用2byte，指的是发送方的接收窗口，而不是发送窗口。

　　窗口值的作用就是：

　　　　从本报文段的首部确认号开始，接收方允许发送报文的数据量，之所以有这个限制，这是因此接收方的数据缓存是有限的。

　　窗口值作为接收方让发送方设置其发送窗口的依据。

　　13、检验和：占用2byte，通过加上伪首部，检验首部和数据

　　14、紧急指针：占用2byte，只有URG=1才有效，指的是紧急数据的大小，紧急数据末尾在报文段的位置，窗口为0的时候也可以发送紧急数据。

　　15、选项：长度可变，最大40byte

　　cwnd：发送端窗口(congestion window)

　　rwnd：接收端窗口(receiver window)

　　最大报文段长度MSS：实际指的是TCP报文段中数据字段的最大长度，MSS尽量大一点，只要在网络层传输不需要分片就行

可靠传输的工作原理

　　TCP发送的报文段交给IP层传输，网络层提供不可靠的服务，所以，TCP必须采用合适的措施使得两个运输层之间的通信变得可靠

理想的传输条件：

　　1).传输信道不产生差错

　　2).不管发送方发送数据的速度有多快，接收方总能来得及接收数据

A是发送方，B是接收方

这种理想情况下才不需要采取措施实现可靠传输，然后实际上不是这样的，需要可靠性传输协议

停止等待协议：

　　传输的数据单元称为分组，每发送一个分组就停止发送，知道得到对方的确认，然后再发送下一个分组

超时重传：

　　为每个发送的分组设置一个超时计数器，A只要经过一段时间没有收到确认，就认为刚才的分组丢失，重新发送刚才的分组

确认丢失：

　　确认丢失了，A没有收到，重新发送给B一个分组，B又收到重传的分组M1，要采用两个行动：

　　1).丢弃这个重复的分组

　　2).向A发送确认

确认迟到：

　　A收到重复的确认立马丢弃，B收到重复的分组，也要丢弃，并且重新确认分组

　　上述的可靠性传输协议就是自动重传请求(ARQ Automatic Repeat reQuest)，在不可靠的网络环境实现可靠的通信

总结：

　　重传的请求是自动进行的，接收方不需要主动要求发送方重传某个错误的分组

　　停止等待协议优点就是简单，但是信道利用率太低，为了提高利用率，发送方可以不使用等待停止协议，采用流水线传输，

就需要了解连续ARQ协议和滑动窗口协议

连续ARQ协议

　　位于发送窗口中的每个分组都可以按顺序连续发送出去，不需要等待对方的确认，这样信道的利用率就提高了

　　发送方：每收到一个确认，发送窗口向前滑动一个分组的位置

　　接收方：不必对收到每个分组逐个发送确认，而是在收到几个分组后，对按次序到达的最后一个分组发送确认，就表示：到这个分组为

止之前的所有分组都收到了，这就是累计确认

滑动窗口

　　以字节为单位，已经发送的数据，在没收到确认的时候，都要暂时保存，以便超时重传。后沿后面的部分都是已发送且收到确认。后沿只

能不动或者前移。前沿的前面部分是不允许发送的，可以前移、不动、后移（不建议）

例如：A收到B发来的确认报文段，如下图

　　发送窗口的序号表示允许发送的序号。窗口越大，发送方就可以在收到对方确认之前发送更多的数据，因此可以获得更高的传输效率。接收

方会把自己的接收窗口数值放到窗口字段中发给对方。所以，A的发送窗口一定不能大于B的接受窗口数值。除此之外，发送窗口还受到网络拥塞

程度的影响

　　现在假设A发送了序号4 - 13的数据，发送窗口位置不变，但发送窗口内有5个字节（红色部分4 - 8）是已发送但未收到确认，而前面5个字节

（9 - 13）允许发送但尚未发送

上图中，P1,P2,P3分别代表着：

　　P3-P1=A的发送窗口

　　P2-P1=已发送但未收到确认的字节数

　　P3-p2=允许发送但尚未发送的字节数，也称为可用窗口

B的接收窗口：

　　接收窗口大小为10，接受窗口4 - 13是允许接收的，B收到5和6的数据，但是4的数据没收到（丢失了，或者滞留在网络某节点），数据没按顺序

到达，B只能对按序到达的数据中的最高序号进行确认，因此B发送的确认报文段中确认号还是31（即期望收到的序号），而不能是5或6

　　假如，A最终把9-13也发送成功，P2和P3重合，可用窗口为0，B发送了确认，但是滞留在网络中，为了保证可靠传输，A只能认为B还没收到，超

时过后进行重传（超时计数器控制时间），之后重置计数器，直到收到B确认位置

发送/接收的缓存和窗口

　　图咱就不画了，应该能看懂，画图真的花时间的。如果实在看不懂，自己看书，在《计算机网络第七版》P223

　　发送方的应用程序把字节流写入TCP的发送缓存，接收方的应用程序从TCP的接收缓存中读取字节流

发送缓存：

　　1、应用程序传送给发送方TCP准备发送的数据

　　2、已发送但尚未收到确认的数据

发送窗口是发送缓存的一部分，已确认的数据从缓存中删除。发送方应用程序必须控制写入缓存的速率，否则没有空间存放

接收缓存：

　　1、用来存放按序达到的，但未被接收方应用程序读取的数据

　　2、为按序到达的数据

　　如果收到的分组检测出有误差，直接丢弃。如果接收方应用程序来不及读取收到的数据，接收缓存会被填满，接收窗口就为0了，反之，接收

窗口会变大，但不能超过接收缓存的大小。

注意点：

　　1、不按序到达的数据如何处理，无明确规定。通常先临时存放在接收窗口中，等到缺少的字节到达后，再按序交付上层的应用程序

　　2、TCP要求接收方有累计确认的功能，这样可以减少传输开销

　　3、TCP的通信是全双工通信，每一方都有自己的发送窗口和接收窗口，要搞清楚

超时重传时间的选择：我选择放弃，你们自己看吧。。。

选择确认SACK：

　　当收到的报文段没有差错，只是未按照序号，中间缺少一些序号的数据，通过SACK只传送缺少的数据

TCP的流量控制

　　点对点通信量的控制

1、利用滑动窗口实现流量控制

　　让发送方的发送速度不要太快，能让接收方来得及接收

　　ACK表示标志位，ack表示确认字段的值

　　利用滑动窗口机制很方便在TCP连接上实现对发送方的流量控制

PS：上面第二行，A发送序号101到200，应该是还能发送200字节，笔误了

　　在连接建立的时候，B告诉A（rwnd=400），发送方的cwnd不能超过接收方给出的rwnd的范围，TCP的窗口单位为字节，不是报文段

　　上面这个流程应该很好理解了。。。

　　上述流程存在一个问题：B向A发送rwnd=0的报文段后，B的接收缓存又有了新的空间，发送rwnd=400，但是丢失了，这时候A等待B发送非零

窗口的通知，B等待A发送数据，可能导致死锁。这个问题通过持续计数器解决

持续计数器工作原理：

　　只要收到零窗口报文段，就会启动，设置的时间到期后，发送一个探测报文段，对方收到后给出现在的窗口值，如果为零，重置时间，

不为零，打破死锁

2、TCP的传输效率

　　通过TCP中广泛使用的Nagle算法和解决糊涂窗口综合征的方式配合使用，最终达到：发送方不发送很小的报文段，接收方也不会有一点小的窗口

大小信息就通知对方

2、TCP的拥塞控制

拥塞：网络中某一资源的需求超过该资源所能提供的可用部分，性能就会变差，也就是对资源的需求 > 可用资源

1、一般原理：

　　防止过多的数据注入到网络，这样就可以使网络中的路由器或链路不至于过载，是一种全局性的过程

流量控制：

　　点对点通信量的控制，是抑制发送端发送数据的效率，以便接收端来得及接收

拥塞控制和流量控制最简单的对比：一台计算机传输数据和500台计算机传输数据（考虑的是整个网络的负载能力）的区别

出现网络拥塞的因素很多：

　　1).当某个节点缓存的容量太小，到达该节点的某些分组会被丢弃，简单的扩大缓存空间无法解决拥塞问题，可能导致网络的性能更差

　　2).处理机处理的效率太慢

　　在网络负载的增加，吞吐量的增加速率逐渐减少。为达到饱和，有一部分输入分组被丢失了。当网络进入拥塞时，吞吐量还会下降，设置降到

零，出现死锁

2、拥塞控制方法：

　　基于窗口的拥塞控制：发送方维护一个拥塞窗口的状态变量。大小取决于网络的拥塞程度，动态变化。发送方让发送窗口等于拥塞窗口

　　控制拥塞窗口的原则：如果网络没有发生拥塞，可以把拥塞窗口设置大一点，以便发送更多的分组，提高网络利用率，但是如果发生拥塞，

就是减少拥塞窗口的大小，减少注入到网络中的分组，以便缓解网络中的拥塞。

判断发生网络拥塞的依据就是出现超时，不考虑丢弃分组

3、TCP基于拥塞控制的算法有以下四种：

3.1).慢开始

　　从小到大逐渐增大发送窗口，也就是组件增加拥塞窗口的值，从cwnd初始为1开始启动，指数启动只有在TCP连接建立和网络出现超时时才

使用。每经过一个传输轮次，拥塞窗口 cwnd 就加倍。一个传输轮次所经历的时间其实就是往返时间RTT。不过“传输轮次”更加强调：把拥塞

窗口cwnd所允许发送的报文段都连续发送出去，并收到了对已发送的最后一个字节的确认。

　　另外，慢开始是指在TCP开始发送报文段时先设置cwnd=1，使得发送方在开始时只发送一个报文段（目的是试探一下网络的拥塞情况），然后

再逐渐增大cwnd。为了防止拥塞窗口cwnd增长过大引起网络拥塞，还需要设置一个慢开始门限ssthresh状态变量（如何设置ssthresh）。

慢开始门限ssthresh的用法如下：

　　当 cwnd < ssthresh 时，使用上述的慢开始算法。

　　当 cwnd > ssthresh 时，停止使用慢开始算法而改用拥塞避免算法。

　　当 cwnd = ssthresh 时，既可使用慢开始算法，也可使用拥塞控制避免算法。

3.2).拥塞避免

　　让拥塞窗口cwnd缓慢增大，每经过一个往返时间RTT就把cwnd+1，而不是加倍，线性规律缓慢增加，到达ssthresh后，为了避免拥塞开始尝试

线性增长

　　我用的画图工具几乎没法画折线图，只能直接截图了，大家凑活看吧

　　无论在慢开始阶段还是在拥塞避免阶段，只要发送方判断网络出现拥塞（超时），就要把慢开始门限ssthresh = cwnd/2（但不能小于2）。

同时设置cwnd = 1，执行慢开始算法。

　　个别报文段在网络中丢失，但实际上网络并没有发生拥塞。发送发收不到确认，就会产生超时，被误认为网络拥塞，这样就会产生问题。

为了解决这个问题使用快重传算法，可以让发送方尽早知道有个别报文段丢失

拥塞控制并不能完全避免拥塞

3.3).快重传

　　首先要求接收方每收到一个失序的报文段后就立即发出重复确认（为的是使发送方及早知道有报文段没有到达对方），发送方只要一连收到三

个重复确认就知道接收方丢包了，快速重传丢包的报文，而不必继续等待M3设置的重传计时器到期。TCP马上设置cwnd = 1。由于发送

方尽早重传未被确认的报文段，因此采用快重传后可以使整个网络吞吐量提高约20%。

　　如果发送方知道只是丢失个别报文段，不启动慢开始，而是使用快恢复算法

3.4).快恢复

特点：

　　直接从ssthresh线性增长。

与快重传配合使用，其过程有以下两个要点：

　　1、当发送方连续收到三个重复确认，就执行“乘法减小”算法，把慢启动门限ssthresh减半。这是为了预防网络发生拥塞。请注意：接下

去不执行慢开始算法。

　　2、由于发送方现在认为网络很可能没有发生拥塞，发送方调整ssthresh = cwnd/2，同时设置cwnd = ssthresh，然后开始执行拥塞

避免算法，使拥塞窗口缓慢地线性增大。

拥塞控制流程图：

发送方窗口的上限值 = Min [ rwnd, cwnd ]

当rwnd < cwnd 时，是接收方的接收能力限制发送方窗口的最大值。

当cwnd < rwnd 时，则是网络的拥塞限制发送方窗口的最大值。

也就是说，rwnd和cwnd中min，控制发送发发送数据的速率

TCP运输连接管理

TCP三次握手

　　为了确保数据能到达目标，TCP协议采用三次握手

　　用户发送HTTP request通过TCP connection连接服务器，这个连接可以一直保持着的，第一个HTTP完成三次握手，第二个请求就不需要进行

三次握手了

　　1、最开始两段TCP都是处于CLOSED，A主动打开连接，B被动打开连接

　　2、B的TCP服务器进程创建传输控制模块TCB，准备接收客户端的请求，处于LISTEN

　　3、A也创建TCB后

　　　　3.1).一次握手：A向B发送连接请求报文段，同步位SYN=1，选择一个初始序号seq=x。SYN报文段不能携带数据，但是消耗一个序号，然后处

于SYN-SENT状态

　　　　3.2).二次握手：B收到报文段，如果同意，发送确认报文段。SYN=ACK=1，确认号ack=x+1，为自己选择初始序号seq=y。这个报文段也不能

携带数据，也消耗一个序号，处于SYN-RCVD

　　　　3.3).三次握手：client收到Server的确认报文段，还要给Server返回确认报文段。ACK=1,ack=y+1,seq=x+1(ACK报文段可以携带数据，如果

不携带不消耗序号，所以，下一个数据报文段的序号还是x+1)，这时Client处于ESTABLISHED，Server收到Client的确认报文之后，也处于

ESTABLISHED

　　第三次的作用：防止已失效的连接请求报文突然又传到接收方，就以为这是一个新的连接请求，而发送方并不承认这个请求，就会浪费这个连接

SYN攻击

　　在三次握手的过程中，当server发送ACK+SYN包给client，client发送ACK给server，在server还没收到的时候，这时的TCP连接称为半连接，

收到之后才是establish状态

　　SYN攻击就是伪造大量的虚假IP地址，不断向server发送SYN包，server恢复确认，并且等待确认返回，由于源地址都是虚拟的，server不断

发送SYN+ACK直到超时，这些SYN包将占用未连接队列，导致正常的SYN请求因为队列满了而被丢弃，从而引起网络阻塞甚至系统瘫痪

　　这是一种典型的DDOS攻击，检测的方式：当server有大量半连接状态且源IP地址都是随机的，可以断定遭到SYN攻击了。

为什么不是两次握手？

　　如果client发送的报文段没有丢失，而是在某个网络节点被滞留，然后过了一段时间传递到server，这时已经是一段过期的报文段，server

同意建立连接，而client现在并没有发送请求，不会发送请求，这样就会浪费server的资源，所以采用三次握手就可以避免这种情况

四次挥手：断开连接

第一次挥手：

　　TCP发送一个FIN(结束，即使不携带数据，也要消耗一个序号)，用来关闭客户端到服务端的连接。此时A处于FIN-WAIT-1状态。u等于前

面已发送过的数据的最后一个字节的序号+1。然后B进入CLOSE-WAIT状态，TCP服务器通知应用程序，从A到B的连接就释放了，此时TCP连接处

于HALF-CLOSE状态，但是B到A的连接没有关闭（Client是A，Server是B），这时如果B发送报文，A还是要接收的

第二次挥手：

　　B返回一个ACK(确认位)，ack=u+1(FIN消耗一个序号)。v等于B之前已发送的数据的最后一个字节的序号+1。等待B发送连接释放报文段。

　　A收到之后处于FIN-WAIT-2

第三次挥手：

　　如果B不再向A发送数据，应用程序通知B释放连接，发送一个FIN=1,seq=w,ack=u+1到A，seq为w（因为HALF-CLOSE状态的B可能有发送一些数据

了），Server关闭Client的连接，B处于LAST-ACK。

第四次挥手：

　　A发送报文段到B，ACK=1,seq=u+1,ack=w+1。这时A处于TIME-WAIT状态。这时TCP连接还没有释放，经过2MSL(时间等待计时器设置的2MSL，MSL

是最长报文段寿命，建议设置2minute)后，A才进入CLOSED。之后才能创建新的连接。当A撤销TCB之后，结束这次TCP连接

为什么需要经过2MSL才进入CLOSED，原因：

　　1、为了保证A发送的最后一个ACK报文段能够达到B

　　2、防止已经失效的连接请求报文段出现在本连接中，这样可以使这次连接中产生的所有报文段从网络中消失

为什么是4次挥手呢，ACK和FIN不同时发送给client？

　　因为在关闭连接时，发送FIN给对方，只是表明我不想发送数据，但是我还是可以接收数据的，但是对方是否关闭发送数据通道，需要上层

应用层来决定，因此，ACK和FIN都是分开发送的

TCP的有效状态机

上图中，粗实线的箭头表示客户进程的正常变迁，虚线箭头表示服务器进程的正常变迁，细线箭头表示异常变迁。

什么是粘包、拆包？

　　TCP根据缓冲区的实际情况进行包的划分，业务上分为：

　　1、拆包：一个完整的包可能会被TCP分为多个包进行发送

　　2、粘包：多个小的包也可能被封装成一个大的包进行发送

粘包、拆包产生的原因？

　　1、应用程序写入的字节大小大于Socket发送缓冲区大小

　　2、进行MSS大小的TCP，MSS是最大报文段长度的缩写，是TCP报文段中的数据字段最大长度，MSS=TCP报文段长度-TCP首部长度

　　3、以太网的Payload大于MTU，进行IP分片，MTU是最大传输单元的缩写，以太网的MTU为1500字节

粘包、拆包解决策略

　　由于底层的TCP无法理解上层的业务数据，所以在底层是无法保证数据包不被拆分和重组的，这个问题只能通过上层的应用协议栈设计来解决，

根据业界的主流协议的解决方案，可以归纳如下：

　　消息定长，例如每个报文的大小固定为200字节，如果不够空位补空格

　　包尾增加回车换行符进行分割，例如FTP协议

　　将消息分为消息头和消息体，消息头中包含表示长度的字段，通常涉及思路为消息头的第一个字段使用int32来表示消息的总长度更复杂的应用

层协议

同步/异步/阻塞/非阻塞

同步阻塞：相当于一个线程在等待。

同步非阻塞：相当于一个线程在正常运行。

异步阻塞：相当于多个线程都在等待。

异步非阻塞：相当于多个线程都在正常运行。

IO分类：

BIO：同步阻塞IO

NIO：同步非阻塞IO jdk1.4

　　API相对复杂，需要熟悉多线程，内部存在bug，例如epoll bug，有可能selector空轮询造成100%CPU

AIO：异步非阻塞IO

内容参考：计算机网络（第七版）

秒客网