【Linux 内核网络协议栈源码剖析】sendto 函数剖析

时间:2022-01-16 11:01:55

原文点击打开链接



前面介绍的函数基本上都是TCP协议的,如listen,connect,accept 等函数,这都是为可靠传输协议TCP定制的。对于另一个不可靠udp协议(通信系统其可靠性交由上层应用层负责),则主要由两个函数完成,sendto 和 recvfrom 函数。这里先介绍 sendto 函数。

说明:sendto 和 recvfrom 函数不限于udp协议,这里只是udp协议当中是采用这两个函数实现的,所以就放在udp协议中介绍。

对于 udp 协议的介绍和编程实现请参考下文:UDP 客户/服务器简单 Socket 程序

简要介绍下UDP数据报格式,相比TCP数据报格式,实在是简洁不少。

                                  【Linux 内核网络协议栈源码剖析】sendto 函数剖析

上面的各个字段含义一目了然(上面是16是表示该字段占16bit,udp头部占8字节),其中长度指的是此 UDP 数据报的长度(包括 UDP 数据报头部和 “数据” 部分)。

一、应用层——sendto 函数

#include <sys/socket.h>
ssize_t sendto(int sockfd, const void *buff, size_t nbytes, int flags,
const struct sockaddr *to, socklen_t *addrlen);
//若成功则返回写的字节数,出错则返回-1
/*参数解析
前面三个参数分别表示:套接字描述符,指向写出缓冲区的指针和写字节数。
to:指向一个含有数据报接收者的协议地址(如IP地址和端口号)的套接字地址结构,其大小由addrlen参数指定
*/

该函数的作用是:向指定端口发送给定地址中的指定大小数据(如客户端sockfd,向 to 指定的远端套接字发送buff 缓冲区内nbytes 个字节数据)

二、BSD Socket层——sock_sendto 函数

/*
*Send a datagram to a given address. We move the address into kernel
*space and check the user space data area is readable before invoking
*the protocol.
*/
//发送数据给指定的远端地址,主要用于UDP协议
//前面三个参数分别表示套接口描述字、指向缓冲区的指针和读写字节数
//addr指向一个含有数据包接收者的协议地址(含ip地址和端口号)的套接口地址结构
//其大小由addr_len参数指定
//该函数的作用就是向指定地址的远端发送数据包:将buff缓冲区中len大小的数据发送给addr指定的远端套接字
static int sock_sendto(int fd, void * buff, int len, unsigned flags,
struct sockaddr *addr, int addr_len)
{
struct socket *sock;
struct file *file;
char address[MAX_SOCK_ADDR];
int err;
//参数有效性检查
if (fd < 0 || fd >= NR_OPEN || ((file = current->files->fd[fd]) == NULL))
return(-EBADF);
//找到给定文件描述符对应的socket结构
if (!(sock = sockfd_lookup(fd, NULL)))
return(-ENOTSOCK);

if(len<0)
return -EINVAL;
//检查权限,buff中len个字节区域是否可读
err=verify_area(VERIFY_READ,buff,len);
if(err)
return err;
//从addr拷贝addr_len大小的数据到address
if((err=move_addr_to_kernel(addr,addr_len,address))<0)
return err;
//调用下层函数sendto,inet域为inet_sendto函数
return(sock->ops->sendto(sock, buff, len, (file->f_flags & O_NONBLOCK),
flags, (struct sockaddr *)address, addr_len));
}
三、INET Socket层——inet_sendto 函数

 //INET socket层
static int inet_sendto(struct socket *sock, void *ubuf, int size, int noblock,
unsigned flags, struct sockaddr *sin, int addr_len)
{
//得到socket对应的sock结构
struct sock *sk = (struct sock *) sock->data;
//判断该套接字的有效性,是否处于关闭状态(半关闭)
if (sk->shutdown & SEND_SHUTDOWN)
{
send_sig(SIGPIPE, current, 1);
return(-EPIPE);
}
if (sk->prot->sendto == NULL)
return(-EOPNOTSUPP);
if(sk->err)
return inet_error(sk);
/* We may need to bind the socket. */
//自动绑定一个本地端口号
if(inet_autobind(sk)!=0)
return -EAGAIN;
//调用下层传输层函数udp_sendto函数
return(sk->prot->sendto(sk, (unsigned char *) ubuf, size, noblock, flags,
(struct sockaddr_in *)sin, addr_len));
}

四、传输层

udp_sento 函数

static int udp_sendto(struct sock *sk, unsigned char *from, int len, int noblock,
unsigned flags, struct sockaddr_in *usin, int addr_len)
{
struct sockaddr_in sin;
int tmp;

/*
*Check the flags. We support no flags for UDP sending
*/
//udp除了MSG_DONTROUTE外,不支持任何其他标志位
if (flags&~MSG_DONTROUTE)
return(-EINVAL);
/*
*Get and verify the address.
*/
//对远端地址的合法性检查,由于不涉及网络数据传送,所以无法验证这个地址存在性

if (usin)
{
//如果明确指定远端地址,就直接检查该地址的有效性
if (addr_len < sizeof(sin)) //大小
return(-EINVAL);
memcpy(&sin,usin,sizeof(sin));
if (sin.sin_family && sin.sin_family != AF_INET) //本地地址有效性
return(-EINVAL);
if (sin.sin_port == 0) //端口号有效性
return(-EINVAL);
}
else
{
//如果没有明确指定远端地址,则检查之前是否调用了connect函数进行了地址绑定
if (sk->state != TCP_ESTABLISHED)
return(-EINVAL);
//如果进行了绑定,则将远端地址设置为这个绑定的地址
sin.sin_family = AF_INET;
sin.sin_port = sk->dummy_th.dest;
sin.sin_addr.s_addr = sk->daddr;
}

/*
*BSD socket semantics. You must set SO_BROADCAST to permit
*broadcasting of data.
*/
//处理尚未指定本地地址的情况
if(sin.sin_addr.s_addr==INADDR_ANY)
sin.sin_addr.s_addr=ip_my_addr();

//处理广播的情况
if(!sk->broadcast && ip_chk_addr(sin.sin_addr.s_addr)==IS_BROADCAST)
return -EACCES;/* Must turn broadcast on first */

sk->inuse = 1;//加锁

/* Send the packet. */
//转调用udp_send函数
tmp = udp_send(sk, &sin, from, len, flags);

/* The datagram has been sent off. Release the socket. */
//数据包以发送,释放该套接字,前面介绍到这个函数的两个功能
//取决于sk_dead字段是否设置
release_sock(sk);
return(tmp);
}

udp_send 函数
 //根据被调用出清楚参数情况
static int udp_send(struct sock *sk, struct sockaddr_in *sin,
unsigned char *from, int len, int rt)
{
struct sk_buff *skb;
struct device *dev;
struct udphdr *uh;
unsigned char *buff;
unsigned long saddr;
int size, tmp;
int ttl;

/*
*Allocate an sk_buff copy of the packet.
*/
//计算所需要分配的封装数据的缓冲区大小
size = sk->prot->max_header + len;
//分配指定大小的sk_buff 结构用于封装数据
skb = sock_alloc_send_skb(sk, size, 0, &tmp);


if (skb == NULL)
return tmp;

skb->sk = NULL;/* to avoid changing sk->saddr */
skb->free = 1;//发送完后数据包立即释放,udp不提供超时重传
skb->localroute = sk->localroute|(rt&MSG_DONTROUTE);//指定路由类型

/*
*Now build the IP and MAC header.
*/

buff = skb->data;//udp首部和有效负载
saddr = sk->saddr;//本地地址
dev = NULL;
ttl = sk->ip_ttl;
#ifdef CONFIG_IP_MULTICAST
//如果目的地址是多播,则设置TTL值为1,表示局限于本地网络,不可跨越路由器

if (MULTICAST(sin->sin_addr.s_addr))
ttl = sk->ip_mc_ttl;
#endif
//创建MAC首部和IP首部
tmp = sk->prot->build_header(skb, saddr, sin->sin_addr.s_addr,
&dev, IPPROTO_UDP, sk->opt, skb->mem_len,sk->ip_tos,ttl);

skb->sk=sk;//关联/* So memory is freed correctly */

/*
*Unable to put a header on the packet.
*/

if (tmp < 0 ) //创建失败
{
sk->prot->wfree(sk, skb->mem_addr, skb->mem_len);
return(tmp);
}

buff += tmp;//定位到udp首部位置
saddr = skb->saddr; /*dev->pa_addr;*/
//数据报sk_buff中挂载的数据部分长度:下面注释,len是有效数据负载长度
skb->len = tmp + sizeof(struct udphdr) + len;/* len + UDP + IP + MAC */
skb->dev = dev;//网络接口设备

/*
*Fill in the UDP header.
*/
//udp首部字段的初始化
uh = (struct udphdr *) buff;
uh->len = htons(len + sizeof(struct udphdr));//长度字段
uh->source = sk->dummy_th.source;//源端端口,sk中tcp首部字段
uh->dest = sin->sin_port;//目的端口
buff = (unsigned char *) (uh + 1);//定位到数据部分
//MAC header | IP Header | UDP Header | Data
//uh本身已经指向了udp首地址,uh+1,表示后移一个udp首部大小位置,定位到了数据负载

/*
*Copy the user data.
*/
//从from拷贝len大小的数据到buff,即把应用层中待发送的缓冲区的数据拷贝到数据包的数据负载中
//然后通过数据包整体打包发送出去。
//就好比货物搭上了货轮开往目的地,为啥不是火车呢,因为火车线路已经固定好了,只能这么走。
memcpy_fromfs(buff, from, len);

/*
*Set up the UDP checksum.
*/
//同tcp,这里进行udp校验和检查
udp_send_check(uh, saddr, sin->sin_addr.s_addr, skb->len - tmp, sk);

/*
*Send the datagram to the interface.
*/

udp_statistics.UdpOutDatagrams++;
//调用ip_queue_xmit函数将数据包发往网络层模块处理。以下处理就和TCP协议一样了,二者的差异只在于传输层
//该函数以及更下层数据传送前面已经介绍,
sk->prot->queue_xmit(sk, dev, skb, 1);
return(len);
}

关于ip_queue_xmit 函数的介绍以及更下层的数据传送,参见博文: 【Linux 内核网络协议栈源码剖析】数据包发送

可以看出,udp是一种无连接传输层协议,不像tcp那样需要服务器监听,也不必等待客户端与服务器建立连接后才能通信,效率优于tcp协议,但udp则不能保证数据传输的可靠性。
udp 的数据传输,实现并不像tcp那样要建立一条数据传输通道,而是直接创建套接字后,直接传送数据到给定的远端(提供远端地址),数据传送过程无超时重传和序列号校验工作,适用于数据传输的连续性比数据的完整性更重要的场合,允许数据在传输过程中有部分丢失,如IP电话、流媒体通信等。