UNIX网络编程——原始套接字的魔力【续】

时间:2023-03-09 00:43:25
UNIX网络编程——原始套接字的魔力【续】

如何从链路层直接发送数据帧

上一篇里面提到的是从链路层“收发”数据,该篇是从链路层发送数据帧。

上一节我们主要研究了如何从链路层直接接收数据帧,可以通过bind函数来将原始套接字绑定到本地一个接口上,然后该套接字就只接收从该接口收上来的对应的数据包。今天我们用原始套接字来手工实现链路层ARP报文的发送和接收,以便大家对原始套接字有更深刻的掌握和理解。

ARP全称为地址解析协议,是链路层广泛使用的一种寻址协议,完成32比特IP地址到48比特MAC地址的映射转换。在以太网中,当一台主机需要向另外一台主机发送消息时,它会首先在自己本地的ARP缓存表中根据目的主机的IP地址查找其对应的MAC地址,如果找到了则直接向其发送消息。如果未找到,它首先会在全网发送一个ARP广播查询,这个查询的消息会被以太网中所有主机接收到,然后每个主机就根据ARP查询报文中所指定的IP地址来检查该报文是不是发给自己的,如果不是则直接丢弃;只有被查询的目的主机才会对这个消息进行响应,然后将自己的MAC地址通告给发送者。

也就是说,链路层中是根据MAC地址来确定唯一一台主机。以太帧格式如下:

UNIX网络编程——原始套接字的魔力【续】

以太帧首部中2字节的帧类型字段指定了其上层所承载的具体协议,常见的有0x0800表示是IP报文、0x0806表示RARP协议、0x0806即为我们将要讨论的ARP协议。

  • 硬件类型: 1表示以太网。
  • 协议类型: 0x0800表示IP地址。和以太头部中帧类型字段相同。
  • 硬件地址长度和协议地址长度:对于以太网中的ARP协议而言,分别为6和4;
  •  操作码1表示ARP请求;2表示ARP应答;3表示RARP请求;4表示RARP应答。

我们这里只讨论硬件地址为以太网地址、协议地址为IP地址的情形,所以剩下四个字段就分别表示发送方的MAC和IP地址、接收方的MAC和IP地址了。

注意对于一个ARP请求报文来说,除了接收方硬件地址外,其他字段都要填充。当系统收到一个ARP请求时,会查询该请求报文中接收方的协议地址是否和自己的IP地址相等,如果相等,它就把自己的硬件地址和协议地址填充进去,将发送和接收方的地址互换,然后将操作码改为2,发送回去。

格外需要留心一点的就是,发送数据的时候需要自己组织整个以太网数据帧。和地址相关的结构体就不能再用前面的struct sockaddr_in{}了,而是struct sockaddr_ll{},如下:

struct sockaddr_ll{
unsigned short sll_family; /* 总是 AF_PACKET */
unsigned short sll_protocol; /* 物理层的协议 */
int sll_ifindex; /* 接口号 */
unsigned short sll_hatype; /* 报头类型 */
unsigned char sll_pkttype; /* 分组类型 */
unsigned char sll_halen; /* 地址长度 */
unsigned char sll_addr[8]; /* 物理层地址 */
};

下面看一个使用原始套接字发送ARP请求的例子:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <sys/socket.h>
#include <sys/ioctl.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <netinet/ip.h>
#include <netinet/if_ether.h>
#include <net/if_arp.h>
#include <netpacket/packet.h>
#include <net/if.h>
#include <net/ethernet.h> #define BUFLEN 42 int main(int argc,char** argv){
int skfd,n;
char buf[BUFLEN]={0};
struct ether_header *eth;
struct ether_arp *arp;
struct sockaddr_ll toaddr;
struct in_addr targetIP,srcIP;
struct ifreq ifr; unsigned char src_mac[ETH_ALEN]={0};
unsigned char dst_mac[ETH_ALEN]={0xff,0xff,0xff,0xff,0xff,0xff}; //全网广播ARP请求
if(3 != argc){
printf("Usage: %s netdevName dstIP\n",argv[0]);
exit(1);
} if(0>(skfd=socket(PF_PACKET,SOCK_RAW,htons(ETH_P_ALL)))){
perror("Create Error");
exit(1);
} bzero(&toaddr,sizeof(toaddr));
bzero(&ifr,sizeof(ifr));
strcpy(ifr.ifr_name,argv[1]); //获取接口索引
if(-1 == ioctl(skfd,SIOCGIFINDEX,&ifr)){
perror("get dev index error:");
exit(1);
}
toaddr.sll_ifindex = ifr.ifr_ifindex;
printf("interface Index:%d\n",ifr.ifr_ifindex);
//获取接口IP地址
if(-1 == ioctl(skfd,SIOCGIFADDR,&ifr)){
perror("get IP addr error:");
exit(1);
}
srcIP.s_addr = ((struct sockaddr_in*)&(ifr.ifr_addr))->sin_addr.s_addr;
printf("IP addr:%s\n",inet_ntoa(((struct sockaddr_in*)&(ifr.ifr_addr))->sin_addr)); //获取接口的MAC地址
if(-1 == ioctl(skfd,SIOCGIFHWADDR,&ifr)){
perror("get dev MAC addr error:");
exit(1);
} memcpy(src_mac,ifr.ifr_hwaddr.sa_data,ETH_ALEN);
printf("MAC :%02X-%02X-%02X-%02X-%02X-%02X\n",src_mac[0],src_mac[1],src_mac[2],src_mac[3],src_mac[4],src_mac[5]); //开始填充,构造以太头部
eth=(struct ether_header*)buf;
memcpy(eth->ether_dhost,dst_mac,ETH_ALEN); //目的硬件地址,这里是全网广播ARP请求 memcpy(eth->ether_shost,src_mac,ETH_ALEN); //源硬件地址
eth->ether_type = htons(ETHERTYPE_ARP); //帧类型:0x0800表示是IP报文、0x0806表示RARP协议、0x0806表示ARP协议 //手动开始填充用ARP报文首部
arp=(struct arphdr*)(buf+sizeof(struct ether_header));
arp->arp_hrd = htons(ARPHRD_ETHER); //硬件类型为以太,硬件类型: 1表示以太网。
arp->arp_pro = htons(ETHERTYPE_IP); //协议类型为IP, 协议类型: 0x0800表示IP地址。和以太头部中帧类型字段相同。 //硬件地址长度和IPV4地址长度分别是6字节和4字节
arp->arp_hln = ETH_ALEN; //硬件地址长度对于以太网中的ARP协议而言为6
arp->arp_pln = 4; //协议地址长度:对于以太网中的ARP协议而言为4 //操作码,这里我们发送ARP请求
arp->arp_op = htons(ARPOP_REQUEST); // 操作码:1表示ARP请求;2表示ARP应答;3表示RARP请求;4表示RARP应答。 //填充发送端的MAC和IP地址
memcpy(arp->arp_sha,src_mac,ETH_ALEN); //发送方的硬件地址即源硬件地址
memcpy(arp->arp_spa,&srcIP,4); //发送发协议地址 //填充目的端的IP地址,MAC地址不用管,对于一个ARP请求报文来说,除了接收方硬件地址外,其他字段都要填充。
inet_pton(AF_INET,argv[2],&targetIP);
memcpy(arp->arp_tpa,&targetIP,4);//接收方协议地址,即目的端的IP地址;在这里路由器的MAC地址未知,就没有填写。 toaddr.sll_family = PF_PACKET;
n=sendto(skfd,buf,BUFLEN,0,(struct sockaddr*)&toaddr,sizeof(toaddr)); close(skfd);
return 0;
}

结果如下:

UNIX网络编程——原始套接字的魔力【续】

UNIX网络编程——原始套接字的魔力【续】

可以看到,我向网关(192.168.2.1路由器的IP地址)发送一个ARP查询请求,报文中携带了网关的IP地址以及我本地主机的IP和MAC地址。网关收到该请求后,对我的这个报文进行了回应,将它的MAC地址在ARP应答报文中发给我了。

在这个示例程序中,我们完全自己手动构造了以太帧头部,并完成了整个ARP请求报文的填充,最后用sendto函数,将我们的数据通过eth0接口发送出去。这个程序的灵活性还在于支持多网卡,使用时只要指定网卡名称(如eth0或eth1),程序便会自动去获取指定接口相应的IP和MAC地址,然后用它们去填充ARP请求报文中对应的各字段。

在头文件<net/thernet.h>里,主要对以太帧首部进行了封装:

struct ether_header
{
u_int8_t ether_dhost[ETH_ALEN]; /* destination eth addr */
u_int8_t ether_shost[ETH_ALEN]; /* source ether addr */
u_int16_t ether_type; /* packet type ID field */
} __attribute__ ((__packed__));

在头文件<net/if_arp.h>中,对ARP首部进行了封装:

struct arphdr
{
unsigned short ar_hrd; /* format of hardware address */
unsigned short ar_pro; /* format of protocol address */
unsigned char ar_hln; /* length of hardware address */
unsigned char ar_pln; /* length of protocol address */
unsigned short ar_op; /* ARP opcode (command) */
}

而头文件<netinet/if_ether.h>里,又对ARP整个报文进行了封装:

struct ether_arp {
struct arphdr ea_hdr; /* fixed-size 8 bytes header */
u_int8_t arp_sha[ETH_ALEN]; /* sender hardware address */
u_int8_t arp_spa[4]; /* sender protocol address */
u_int8_t arp_tha[ETH_ALEN]; /* target hardware address */
u_int8_t arp_tpa[4]; /* target protocol address */
}; #define arp_hrd ea_hdr.ar_hrd
#define arp_pro ea_hdr.ar_pro
#define arp_hln ea_hdr.ar_hln
#define arp_pln ea_hdr.ar_pln
#define arp_op ea_hdr.ar_op

最后再看一个简单的接收ARP报文的小程序:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <sys/socket.h>
#include <sys/ioctl.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <netinet/ip.h>
#include <netinet/if_ether.h>
#include <net/if_arp.h>
#include <netpacket/packet.h>
#include <net/if.h>
#define BUFLEN 60 int main(int argc,char** argv){
int i,skfd,n;
char buf[ETH_FRAME_LEN]={0};
struct ethhdr *eth;
struct ether_arp *arp;
struct sockaddr_ll fromaddr;
struct ifreq ifr; unsigned char src_mac[ETH_ALEN]={0}; if(2 != argc){
printf("Usage: %s netdevName\n",argv[0]);
exit(1);
} //只接收发给本机的ARP报文
if(0>(skfd=socket(PF_PACKET,SOCK_RAW,htons(ETH_P_ARP)))){
perror("Create Error");
exit(1);
} bzero(&fromaddr,sizeof(fromaddr));
bzero(&ifr,sizeof(ifr));
strcpy(ifr.ifr_name,argv[1]); //获取接口索引
if(-1 == ioctl(skfd,SIOCGIFINDEX,&ifr)){
perror("get dev index error:");
exit(1);
}
fromaddr.sll_ifindex = ifr.ifr_ifindex;
printf("interface Index:%d\n",ifr.ifr_ifindex); //获取接口的MAC地址
if(-1 == ioctl(skfd,SIOCGIFHWADDR,&ifr)){
perror("get dev MAC addr error:");
exit(1);
} memcpy(src_mac,ifr.ifr_hwaddr.sa_data,ETH_ALEN);
printf("MAC :%02X-%02X-%02X-%02X-%02X-%02X\n",src_mac[0],src_mac[1],src_mac[2],src_mac[3],src_mac[4],src_mac[5]); fromaddr.sll_family = PF_PACKET;
fromaddr.sll_protocol=htons(ETH_P_ARP);
fromaddr.sll_hatype=ARPHRD_ETHER;
fromaddr.sll_pkttype=PACKET_HOST;
fromaddr.sll_halen=ETH_ALEN;
memcpy(fromaddr.sll_addr,src_mac,ETH_ALEN); bind(skfd,(struct sockaddr*)&fromaddr,sizeof(struct sockaddr)); while(1){
memset(buf,0,ETH_FRAME_LEN);
n=recvfrom(skfd,buf,ETH_FRAME_LEN,0,NULL,NULL);
eth=(struct ethhdr*)buf;
arp=(struct ether_arp*)(buf+14); printf("Dest MAC:");
for(i=0;i<ETH_ALEN;i++){
printf("%02X-",eth->h_dest[i]);
}
printf("Sender MAC:");
for(i=0;i<ETH_ALEN;i++){
printf("%02X-",eth->h_source[i]);
} printf("\n");
printf("Frame type:%0X\n",ntohs(eth->h_proto)); if(ntohs(arp->arp_op)==2){
printf("Get an ARP replay!\n");
}
}
close(skfd);
return 0;
}

该示例程序中,调用recvfrom之前我们调用了bind系统调用,目的是仅从指定的接口接收ARP报文(由socket函数的第三个参数“ETH_P_ARP”决定)。可以对比一下,该程序与博文“UNIX网络编程——原始套接字的魔力【下】”里介绍的抓包程序的区别。
                                  UNIX网络编程——原始套接字的魔力【续】
   UNIX网络编程——原始套接字的魔力【续】

       小结:通过这几个章节的热身,相信大家对网络编程中常见的一系列API函数socket、bind、listen、connect、sendto、recvfrom、close等的认识应该会有一个较高的突破。