TCP/IP OPTION字段

时间:2022-11-01 02:46:13

0x01 简介

TCP头部和IPV4头部除了固定的20字节外,都设置了 OPTION 字段用于存储自定义的数据,因为TCP头部和IPV4的报文长度字段均为4字节,所表示的最大值为15, 乘4,报文头部最大长度为60字节,因此Option字段最大长度为40字节,足够存储大量的报文控制信息。TCP和IPV4 OPTION的格式均为(标识字段 - 长度 - 数据)格式,一般采取4字节对齐存储。

目前 IP Option应用场景较少,且公网路由器对 IP Option的检查较为严格,一般都会直接丢弃带有 IP Option 的报文。TCP Option 的应用场景则较为广泛,常见的包括 TimeStamp(应用于时延测量), TCP_Window_Scalling(长肥网络下,TCP接收窗口需要足够大才能达到瓶颈带宽,此时需要 Window_Scaling 来表示一个更大的接收窗口),TCP_SACK(选择性确认,可以大幅提高TCP在丢包时的性能)等等,这些选项一般都会默认开启,路由器、端主机对这些选项的支持度也较高。本文主要介绍 TCP & IPV4 Option的处理逻辑,然后介绍一种通过 IP Option 字段在内网传输报文控制数据的方法。

0x02 TCP OPTION Linux实现

步骤1: 构造TCP Option,计算存储空间

Linux把TCP选项的处理逻辑分为了SYN报文的选项和普通报文的选项两个部分,在TCP报文构造函数 static int tcp_transmit_skb(struct sock *sk, struct sk_buff *skb, int clone_it, gfp_t gfp_mask) 中有下面这段逻辑

TCP/IP OPTION字段

  1. 如果报文为SYN报文,则调用 tcp_syn_options 函数处理握手期间的一些TCP Option,例如MSS协商,Window_Scaling等。
  2. 如果报文为非SYN报文,则调用 TCP_established_options 函数处理包括TimeStamp,SACK等选项的构造。
  3. 构造好的TCP选项并不是直接写入TCP头部,而是存储在 struct tcp_out_options 类型的结构体变量 opts 中。

步骤2:分配 TCP 头部需要的存储空间,包括20个字节的标准头部加上TCP Option的部分。

tcp_options_size 为TCP选项部分的总长度,tcp_transmit_skb 接下来在 skb_push 中为TCP头部分配存储空间。
TCP/IP OPTION字段

步骤3 : 向TCP头部写入构造好的TCP Option。

tcp_transmit_skb 接下来通过 tcp_options_write() 函数把构造好的TCP Option 从 opts 中读出并写入TCP报文首部

  TCP/IP OPTION字段

步骤4 : TCP Option 的构造逻辑完成,报文进入IP层的处理逻辑。

步骤5:TCP Option 的解析在 tcp_parse_options() 函数 中完成,协议栈在接收到TCP报文后,会调用该函数完成报文头部的OPTION字段的解析。


TCP/IP OPTION字段

0x03 IP OPTION Linux实现

IP Option的构造与TCP  Option类似。

步骤1:分配存储空间,在IP报文构造函数 ip_queue_xmit 中,有下面这一段逻辑,分配IP报文头部空间和OPTION字段的存储空间

      TCP/IP OPTION字段

步骤2 : 构造OPTION字段,具体逻辑在 ip_options_build 中,与 TCP Option的逻辑类似。

TCP/IP OPTION字段

步骤3: 解析, IP Option的解析在 ip_options_compile 中完成

TCP/IP OPTION字段

0x04 应用

在我们的应用场景下,例如向路由器通告一些信息等,报文除了传输数据外,还要传输一些控制信息,我们就是通过IP报头的OPTION字段来携带这些控制信息。一般情况下,带有TCP选项的报文,即使TCP选项是自定义的,公网路由器也不会轻易丢包,但公网路由器对IP选项的审查要严格的多,带有IP选项的报文。当报文从局域网转发到公网的时候,Linux网关可以在Qdisc中删除该选项,并转发到公网,Linux上发送一个带有自定义IP选项的报文也非常容易,不需要修改内核,只需要在用户态用 setsockopt() 调用便可以完成,下面是一个设置自定义IP 选项的Linux套接字客户端程序示例。

 #include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <netinet/ip.h> #define SERV_PORT 1234
#define SERV_IP "127.0.0.1"
#define MAXLINE 4096
#define MAXSIZE 40 #define IPOPT_TAG 0x21 //IP选项标志字段
#define IPOPT_LEN 8 //IP选项长度字段 int main(int argc,char *argv[])
{
int sockfd;
struct sockaddr_in servaddr; memset(&servaddr,,sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = inet_addr(SERV_IP);
servaddr.sin_port = htons(SERV_PORT); //构造自定义的TCP选项
unsigned char opt[MAXSIZE];
opt[] = IPOPT_TAG;
opt[] = IPOPT_LEN;
//写入选项数据
*(int *)(opt + ) = htonl(); if((sockfd = socket(AF_INET,SOCK_STREAM,)) <= ){
perror("socket error : ");
exit();
} if(connect(sockfd,(struct sockaddr *)&servaddr,sizeof(servaddr)) < ){
perror("connect error ");
exit();
} //设置套接字发送该选项
if(setsockopt(sockfd,IPPROTO_IP,IP_OPTIONS,(void *)opt,IPOPT_LEN) < ){
perror("setsockopt error ");
exit();
} char buff[MAXLINE]; while(fgets(buff,MAXLINE,stdin) != NULL){
if(write(sockfd,buff,strlen(buff)) < strlen(buff)){
perror("write error ");
exit();
}
} close(sockfd);
}

内核并没有检测 setsockopt() 的参数,直接将自定义的选项复制到了IP报文选项部分。

TCP/IP OPTION字段

我们可以通过 getsockopt() 函数可以直接读取自定义的IP OPTION。

TCP自定义选项的设置和读取相对于IP选项要麻烦一些,一般向TimeStamp,SACK等TCP选项并不需要用户去读取,因此也没有开放用户层访问的接口,直接通过 getsockopt() 函数无法读取自定义的TCP 选项,但我们可以通过修改内核 getsockopt() 来实现自定义TCP选项的读取,我们知道内核 getsockopt()  函数底层是由 do_ip_getsockopt 和 do_tcp_getsockopt 等协议相关的接口组成的, 在 do_tcp_getsockopt 接口内我们可以添加用户层访问自定义TCP选项的接口,然后便可以在用户层通过 getsockopt()  函数来访问自定义的 TCP 选项了。

0x05 总结

TCP Option字段对于提升TCP性能有较大意义,因此需要了解常见的TCP Option字段的含义、开启和关闭。IP Option字段一般来说不容易碰见,但在一些特殊的应用场景下,例如在局域网内捎带报文控制数据还是很有用处的。

0x06 参考

Linux  Kernel  4.12.13    https://elixir.bootlin.com/linux/v4.12.13/source