1 listen函数(http://man7.org/linux/man-pages/man2/listen.2.html)
int listen(int sockfd, int backlog);
该函数被服务端调用,指明了sockfd所指向的套接字是一个被动套接字,sockfd参数说明内核协议栈需要监听的套接字,backlog参数指定已完成tcp链接队列的容量。
2 tcp三次握手、未完成队列、已完成队列
服务端listen函数调用成功后会马上返回,与此同时系统内核开始监听参数sockfd所指定的套接字,等待客户端发起tcp握手信息。
如上图所示,首先客户端发起syn包时,服务端会回复syn-ack包,此时链接处于未完成状态。服务端内存中会创建一个状态为SYN_RCVD 的连接,放入未完成队列,这个队列的大小可通过/proc/sys/net/ipv4/tcp_max_syn_backlog设置。未完成队列中每个链接都维护有一个定时器,如果网络超时没有在时限内收到相应的ack,会重发syn-ack包,如果多次无效则停止,并从未完成队列中取消该连接。(次数在这里指定/proc/sys/net/ipv4/tcp_synack_retries )
如上图所示,当客户端收到服务端的syn-ack包后,会发出ack包进行确认,服务端接收ack确认,此时tcp三次握手完成。服务端中该链接的状态会变成ESTABLISHED,同时该链接会移交到内存的已完成队列中。这个队列的最大容量就是通过backlog参数指定的。该队列会随着越来越多的客户端与服务器完成tcp三次握手而增长。直到达到backlog指定的上限。如果已完成队列满了,系统收到新的ack包时,协议栈的行为取决于 /proc/sys/net/ipv4/tcp_abort_on_overflow的设置。如若为1,直接回rst包,结束链接,否则忽视ack包。
此时,服务端应用层一般可以使用accept函数(该函数是一个阻塞函数),从已完成队列中获取一个tcp链接并返回一个套接字的文件描述符,与此同时已完成队列会空出一个位置,从而内核协议栈又可以接受新的已完成三次握手的tcp链接。