TCP/IP网络编程之套接字类型与协议设置

时间:2022-05-06 10:19:00

套接字与协议

如果相隔很远的两人要进行通话,必须先决定对话方式。如果一方使用电话,另一方也必须使用电话,而不是书信。可以说,电话就是两人对话的协议。协议是对话中使用的通信规则,扩展到计算机领域可整理为“计算机间对话必备通信规则”

TCP/IP网络编程之网络编程和套接字这一章中,我们已经介绍了如何创建套接字,但为了完全理解该函数,此处将继续展开讨论

#include <sys/socket.h>
int socket(int domain, int type, int protocol);

  

  • domain:套接字中使用的协议族(Protocol Family)信息
  • type:套接字数据传输类型信息
  • protocol:计算机间通信中使用的协议信息

协议族(Protocol Family)

套接字通信中的协议具有一些分类,通过socket函数的第一个参数传递套接字中使用的协议分类信息,此协议分类信息称为协议族,可分为如下几类:

表1-1   头文件sys/socket.h中声明的协议族
名称 协议族
PF_INET IPv4互联网协议族
PF_INET6 IPv6互联网协议族
PF_LOCAL 本地通信的Unix协议族
PF_PACKET 底层套接字的协议族
PF_IPX IPX Novell协议族

套接字类型(Type)

套接字类型指的是套接字的数据传输方式,通过socket函数的第二个参数传递,只有这样才能决定创建套接字的数据传输方式。这种说法可能有的人会疑惑,已通过第一个参数传递了协议族信息,还要决定数据的传输方式?问题就在于,决定了协议族并不能同时决定数据传输方式,换言之,socket函数第一个参数PF_INET协议族中也存在多种数据传输方式

下面介绍两种具有代表性的数据传输方式:

1.面向连接的套接字(SOCK_STREAM):向socket函数的第二个参数传递SOCK_STREAM,将创建面向连接的套接字,面向连接的套接字有这几个特点:

  • 传输过程中数据不会丢失
  • 按顺序传输数据
  • 传输的数据不存在数据边界

面向连接的套接字,较晚传输的数据不会比先传输的数据到达目标主机,保证了数据的按顺序传递。同时传输的数据不存在边界,是因为收发数据的套接字内部都有缓冲(buffer),简而言之就是字节数组。通过套接字传输的数据将保存到该数组。因为,收到数据并不意味着马上调用read函数。只要不超过数组容量,则有可能在数据填充满缓冲后通过一次read函数读取全部数据,也有可能分多次调用read函数进行读取。也就是说,在面向连接的套接字中,read函数和write函数的调用次数并无太大意义。所以说,面向连接的套接字不存在数据边界

之前讲过,为了接收数据,套接字内部有一个由字节数组构成的缓冲。如果这个缓冲被填满了数据会发生什么事情?之后传递的数据是否会丢失?

首先调用read函数从缓冲中读取部分数据,因此缓冲并不总是满的。但如果read函数读取的速度比接收数据的速度慢,则缓冲有可能被填满。此时套接字无法再接收数据,但即使这样也不会发生数据的丢失,因为传输端套接字停止传输。也就是说,面向连接的套接字会根据接收端的状态传输数据,如果传输出错还会提供重传服务。因此,面向连接的套接字除特殊情况外不会发生数据丢失

还有一点,套接字连接必须一一对应,也就是面向连接的套接字只能与另一个同样特性的套接字连接

2.面向消息的套接字(SOCK_DGRAM):向socket函数的第二个参数传递SOCK_DGRAM,将创建面向消息的套接字,面向消息的套接字有这几个特点:

  • 强调快速传输而非传输顺序
  • 传输的数据可能丢失也可能损毁
  • 传输的数据有数据边界
  • 限制每次传输的数据大小

面向消息的套接字就像快递,两个同一目的不同送货路线的快递不需要保证到达顺序,只需要尽可能快的到达目的地。这种方式存在损坏或丢失的风险,且包裹大小有一定的限制。因此,若要传递大量包裹,则需分批传送。另外分别发送两个数据包,接收者需要分两次接收。这种特性就是“传输的数据具有数据边界”

以上就是面向消息的套接字具有的特性,面向消息的套接字比面向连接的套接字具有更快的传输速度,但无法避免数据丢失或损毁。另外,每次传输的数据大小具有一定的限制,并存在数据边界。存在数据边界意味着接收数据的次数应和传输次数相同

协议的选择

下面讲解socket函数的第三个参数,该参数决定最终采用的协议。这里可能还会有人疑惑,前面已经通过socket函数的前两个参数传递了协议族信息和套接字数据的传输方式,这些信息还不足以决定采用的协议吗?为什么还需要第三个参数呢?

确实,前面两个参数即可创建所需套接字。所以大部分情况下可以向第三个参数传递0,除非遇到这种情况:同一协议族中存在多个数据传输方式相同的协议。数据传输方式相同,但协议不同。此时需要通过第三个参数具体指定协议信息

下面以前面讲解的内容为基础,构建向socket函数传递的参数。首先创建满足:IPv4协议族中面向连接的套接字。IPv4与网络地址系统相关,参数PF_INET指IPv4网络协议族,SOCK_STREAM是面向连接的数据传输,满足这两个条件的协议只有IPPROTO_TCP,因此可以如下调用socket函数创建套接字,这种套接字称为TCP套接字:

int tcp_socket = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);

  

SOCK_DGRAM指的是面向消息的数据传输方式,满足上述条件的协议只有IPPROTO_UDP。下面创建IPv4协议族中面向消息的套接字:

int udp_socket = socket(PF_INET, SOCK_DGRAM, IPPROTO_UDP);

  

面向连接的套接字:TCP套接字示例

这里,我们复用TCP/IP网络编程之网络编程和套接字这一章中的hello_server.c和hello_client.c,hello_server.c只需改名为tcp_server.c,无需在代码上做任何变化,而hello_client.c除了改名为tcp_client.c之外,还需要做一些变化,具体如下:

tcp_client.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char *argv[])
{
    int sock;
    struct sockaddr_in serv_addr;
    char message[30];
    int str_len;
    int idx = 0, read_len = 0;

    if (argc != 3)
    {
        printf("Usage: %s <IP> <port>\n", argv[0]);
        exit(1);
    }

    sock = socket(PF_INET, SOCK_STREAM, 0); //<1>
    if (sock == -1)
        error_handling("sock() error");

    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family = AF_INET;
    serv_addr.sin_addr.s_addr = inet_addr(argv[1]);
    serv_addr.sin_port = htons(atoi(argv[2]));

    if (connect(sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1) 
        error_handling("connect() error!");
    while (read_len = read(sock, &message[idx++], 1)) //<2>
    {
        if (read_len == -1)
            error_handling("read() error!");
        str_len += read_len; //<3>
    }
    if (str_len == -1)
        error_handling("read() error!");

    printf("Message from server: %s\n", message);
    printf("Function read call count:%d\n", str_len);
    close(sock);

    return 0;
}

void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

  

  • <1>:创建TCP套接字,若前两个参数传递PF_INET、SOCK_STREAM,则可以省略第三个参数IPPROTO_TCP
  • <2>:while循环反复调用read函数,每次读取一个字节。如果read返回0,则循环条件为假,跳出while循环
  • <3>:执行该语句时,变量read_len的始终为1,因<2>处每次读取一个字节,跳出while循环后,str_len中存有读取的总字节数

现在,我们把之前的hello_server.c改名为tcp_client.c,编译运行tcp_client.c,启动套接字服务器端

# mv hello_server.c tcp_server.c
# gcc tcp_server.c -o tcp_server
# ./tcp_server 8500

  

现在,我们对tcp_client.c进行编译运行

# ./tcp_client 127.0.0.1 8500
Message from server: Hello world!
Function read call count:13

  

从运行结果可以看出,服务器端发送了13字节的数据,客户端调用了13次read函数进行读取