Linux网络编程之套接字基础

时间:2021-08-22 10:08:17

1.套接字的基本结构

struct sockaddr

这个结构用来存储套接字地址。

数据定义:

struct sockaddr {

unsigned short sa_family; /* address族, AF_xxx */

char sa_data[14]; /* 14 bytes的协议地址 */

};

sa_family 一般来说,都是“AFINET”。

sa_data 包含了一些远程电脑的地址、端口和套接字的数目,它里面的数据是杂溶在一

切的。

为了处理struct sockaddr, 程序员建立了另外一个相似的结构 struct sockaddr_in:

struct sockaddr_in (“in” 代表 “Internet”)

struct sockaddr_in {

short int sin_family; /* Internet地址族 */

unsigned short int sin_port; /* 端口号 */

struct in_addr sin_addr; /* Internet地址 */

unsigned char sin_zero[8]; /* 添0(和struct sockaddr一样大小)*/

};

这个结构提供了方便的手段来访问socket address(struct sockaddr)结构中的每一个元

2.套接字字节转换程序的列表:

l htons()——“Host to Network Short”主机字节顺序转换为网络字节顺序(对无符号

短型进行操作4 bytes)

l htonl()——“Host to Network Long” 主机字节顺序转换为网络字节顺序(对无符

号长型进行操作8 bytes)

l ntohs()——“Network to Host Short “ 网络字节顺序转换为主机字节顺序(对无符

号短型进行操作4 bytes)

l ntohl()——“Network to Host Long “ 网络字节顺序转换为主机字节顺序(对无符

号长型进行操作8 bytes)

3. IP 地址转换

Linux 系统提供和很多用于转换IP 地址的函数.首先,假设你有一个struct sockaddr_in ina,并且你的IP 是166.111.69.52 ,你想把你的IP 存储到ina 中。你可以使用的函数: inet_addr() ,它能够把一个用数字和点表

示IP 地址的字符串转换成一个无符号长整型。你可以像下面这样使用它:

ina.sin_addr.s_addr = inet_addr(“166.111.69.52”);

注意:

l inet_addr() 返回的地址已经是网络字节顺序了,你没有必要再去调用htonl() 函数

反过来,如果你有一个struct in_addr 并且你想把它代表的IP 地址打印出来(按照数字.数字.数字.数字的格式),那么你可以使用函数inet_ntoa()(“ntoa”代表“Network to ASCII”),它会把struct in_addr 里面存储的网络地址以数字.数字.数字.数字的格式。

l inet_ntoa() 使用struct in_addr 作为一个参数,不是一个长整型值。

4.基本套接字调用

socket() 函数

取得套接字描述符

 socket 函数的定义是下面这样子的:

#include <sys/types.h>

#include <sys/socket.h>

int socket(int domain , int type , int protocol);

bind() 函数

bind()函数可以帮助你指定一个套接字使用的端口。

当你使用socket() 函数得到一个套接字描述符,你也许需要将socket 绑定上一个你的

机器上的端口。

l 当你需要进行端口监听 listen()操作,等待接受一个连入请求的时候,一般都需要

经过这一步。比如网络泥巴(MUD),Telnet a.b.c.d 4000。

l 如果你只是想进行连接一台服务器,也就是进行 connect() 操作的时候,这一步

并不是必须的。

bind()的系统调用声明如下:

#include <sys/types.h>

#include <sys/socket.h>

int bind (int sockfd , struct sockaddr *my_addr , int addrlen) ;

参数说明:

l sockfd 是由socket()函数返回的套接字描述符。

l my_addr 是一个指向struct sockaddr 的指针,包含有关你的地址的信息:名称、

端口和IP 地址。

l addrlen 可以设置为sizeof(struct sockaddr)。

connect()函数

让我们花一点时间来假设你是一个Telnet 应用程序。你的使用者命令你建立一个套接

字描述符。你遵从命令,调用了socket()。然后,使用者告诉你连接到“166.111.69.52”

的23 端口(标准的Telnet 端口)⋯⋯你应该怎么做呢?

你很幸运:Telnet 应用程序,你现在正在阅读的就是套接字的进行网络连接部分:

connect()。

connect() 函数的定义是这样的:

#include <sys/types.h>

#include <sys/socket.h>

int connect (int sockfd, struct sockaddr *serv_addr, int addrlen);

connect()的三个参数意义如下:

l sockfd :套接字文件描述符,由socket()函数返回的。

l serv_addr 是一个存储远程计算机的IP 地址和端口信息的结构。

l addrlen 应该是sizeof(struct sockaddr)。

listen() 函数

listen()函数是等待别人连接,进行系统侦听请求的函数。当有人连接你的时候,你有

两步需要做:通过listen()函数等待连接请求,然后使用accept()函数来处理。(accept()函数

在下面介绍)。

listen()函数调用是非常简单的。函数声明如下:

#include <sys/socket.h>

int listen(int sockfd, int backlog);

listen()函数的参数意义如下:

l sockfd 是一个套接字描述符,由socket()系统调用获得。

l backlog 是未经过处理的连接请求队列可以容纳的最大数目。

backlog 具体一些是什么意思呢?每一个连入请求都要进入一个连入请求队列,等待

listen 的程序调用accept()(accept()函数下面有介绍)函数来接受这个连接。当系统还没有

调用accept()函数的时候,如果有很多连接,那么本地能够等待的最大数目就是backlog 的

数值。你可以将其设成5 到10 之间的数值

accept()函数

函数accept()有一些难懂。当调用它的时候,大致过程是下面这样的:

l 有人从很远很远的地方尝试调用 connect()来连接你的机器上的某个端口(当然是

你已经在listen()的)。

l 他的连接将被 listen 加入等待队列等待accept()函数的调用(加入等待队列的最多

数目由调用listen()函数的第二个参数backlog 来决定)。

l 你调用 accept()函数,告诉他你准备连接。

l accept()函数将回返回一个新的套接字描述符,这个描述符就代表了这个连接!

好,这时候你有了两个套接字描述符,返回给你的那个就是和远程计算机的连接,而

第一个套接字描述符仍然在你的机器上原来的那个端口上listen()。

这时候你所得到的那个新的套接字描述符就可以进行send()操作和recv()操作了。

下面是accept()函数的声明:

#include <sys/socket.h>

int accept(int sockfd, void *addr, int *addrlen);

accept()函数的参数意义如下:

l sockfd 是正在listen() 的一个套接字描述符。

l addr 一般是一个指向struct sockaddr_in 结构的指针;里面存储着远程连接过来的

计算机的信息(比如远程计算机的IP 地址和端口)

send()、recv()函数

这两个函数是最基本的,通过有连接的套接字流进行通讯的函数。

send() 函数的声明:

#include <sys/types.h>

#include <sys/socket.h>

int send(int sockfd, const void *msg, int len, int flags);

send 的参数含义如下:

l sockfd 是代表你与远程程序连接的套接字描述符。

l msg 是一个指针,指向你想发送的信息的地址。

l len 是你想发送信息的长度。

l flags 发送标记。一般都设为0

函数recv()调用在许多方面都和send()很相似,下面是recv()函数的声明:

#include <sys/types.h>

#include <sys/socket.h>

int recv(int sockfd, void *buf, int len, unsigned int flags);

recv()的参数含义如下:

l sockfd 是你要读取数据的套接字描述符。

l buf 是一个指针,指向你能存储数据的内存缓存区域。

l len 是缓存区的最大尺寸。

l flags 是recv() 函数的一个标志,一般都为0 (具体的其他数值和含义请参考recv()

的man pages)。

recv() 返回它所真正收到的数据的长度

sendto() 和recvfrom() 函数

这两个函数是进行无连接的UDP 通讯时使用的。使用这两个函数,则数据会在没有

建立过任何连接的网络上传输。因为数据报套接字无法对远程主机进行连接,想想我们在

发送数据前需要知道些什么呢?

对了!是远程主机的IP 地址和端口!

下面是sendto()函数和recvfrom()函数的声明:

#include <sys/types.h>

#include <sys/socket.h>

int sendto(int sockfd, const void *msg, int len, unsigned int flags,

const struct sockaddr *to, int tolen);

和你所看到的一样,这个函数和send()函数基本一致。

l sockfd 是代表你与远程程序连接的套接字描述符。

l msg 是一个指针,指向你想发送的信息的地址。

l len 是你想发送信息的长度。

l flags 发送标记。一般都设为0。(你可以查看send 的man pages 来获得其他的参

数值并且明白各个参数所代表的含义)

l to 是一个指向struct sockaddr 结构的指针,里面包含了远程主机的IP 地址和端口

数据。

l tolen 只是指出了struct sockaddr 在内存中的大小sizeof(struct sockaddr)。

和send()一样,sendto()返回它所真正发送的字节数(当然也和send()一样,它所真正

发送的字节数可能小于你所给它的数据的字节数)。当它发生错误的时候,也是返回 –1 ,

同时全局变量errno 存储了错误代码。

同样的,recv()函数和recvfrom()函数也基本一致。

recvfrom()的声明为:

#include <sys/types.h>

- 156 - Linux网络编程

#include <sys/socket.h>

int recvfrom(int sockfd, void *buf, int len, unsigned int flags

struct sockaddr *from, int *fromlen);

其参数含义如下:

l sockfd 是你要读取数据的套接字描述符。

l buf 是一个指针,指向你能存储数据的内存缓存区域。

l len 是缓存区的最大尺寸。

l flags 是recv() 函数的一个标志,一般都为0 (具体的其他数值和含义请参考recv()

的man pages)。

l from 是一个本地指针,指向一个struct sockaddr 的结构(里面存有源IP 地址和端

口数).

l fromlen 是一个指向一个int 型数据的指针,它的大小应该是sizeof ( struct

sockaddr).当函数返回的时候,formlen 指向的数据是form 指向的struct sockaddr 的实际

大小.

recvfrom() 返回它接收到的字节数,如果发生了错误,它就返回-1

close()和shutdown()函数

程序进行网络传输完毕后,你需要关闭这个套接字描述符所表示的连接。实现这个非

常简单,只需要使用标准的关闭文件的函数:close()。

使用方法:

close(sockfd);

执行close()之后,套接字将不会在允许进行读操作和写操作。任何有关对套接字描述

符进行读和写的操作都会接收到一个错误。

如果你想对网络套接字的关闭进行进一步的操作的话,你可以使用函数shutdown()。

它允许你进行单向的关闭操作,或是全部禁止掉。

shutdown()的声明为:

#include <sys/socket.h>

int shutdown(int sockfd, int how);

它的参数含义如下:

l sockfd 是一个你所想关闭的套接字描述符.

l how 可以取下面的值。0 表示不允许以后数据的接收操;1 表示不允许以后数据

的发送操作;2 表示和close()一样,不允许以后的任何操作(包括接收,发送数据)

shutdown() 如果执行成功将返回0,如果在调用过程中发生了错误,它将返回–1,全

局变量errno 中存储了错误代码.

如果你在一个未连接的数据报套接字上使用shutdown() 函数(还记得可以对数据报套

接字UDP 进行connect()操作吗?),它将什么也不做.

setsockopt() 和getsockopt() 函数

Linux 所提供的socket 库含有一个错误(bug)。此错误表现为你不能为一个套接字重

新启用同一个端口号,即使在你正常关闭该套接字以后。例如,比方说,你编写一个服务

器在一个套接字上等待的程序.服务器打开套接字并在其上侦听是没有问题的。无论如何,

总有一些原因(不管是正常还是非正常的结束程序)使你的程序需要重新启动。然而重启

动后你就不能把它绑定在原来那个端口上了。从bind()系统调用返回的错误代码总是报告

说你试图连接的端口已经被别的进程所绑定。

问题就是Linux 内核在一个绑定套接字的进程结束后从不把端口标记为未用。在大多

数Linux/UNIX 系统中,端口可以被一个进程重复使用,甚至可以被其它进程使用。

在Linux 中绕开这个问题的办法是,当套接字已经打开但尚未有连接的时候用

setsockopt()系统调用在其上设定选项(options)。setsockopt() 调用设置选项而getsockopt()

从给定的套接字取得选项。

这里是这些调用的语法:

#include<sys/types.h>

#include<sys/socket.h>

int getsockopt(int sockfd, int level, int name, char *value, int *optlen);

int setsockopt(int sockfd, int level, int name, char *value, int *optlen);

下面是两个调用的参数说明:

l sockfd 必须是一个已打开的套接字。

l level 是函数所使用的协议标准(protocol level)(TCP/IP 协议使用IPPROTO_TCP,

套接字标准的选项实用SOL_SOCKET)。

l name 选项在套接字说明书中(man page)有详细说明。

l value 指向为getsockopt()函数所获取的值,setsockopt()函数所设置的值的地址。

l optlen 指针指向一个整数,该整数包含参数以字节计算的长度。

现在我们再回到Linux 的错误上来.当你打开一个套接字时必须同时用下面的代码段

来调用setsockopt()函数:

/* 设定参数数值 */

opt = 1; len = sizeof(opt);

/* 设置套接字属性 */

setsockopt(sockfd,SOL_SOCKET,SO_REUSEADDR,&opt,&len);

getpeername()函数

这个函数可以取得一个已经连接上的套接字的远程信息(比如IP 地址和端口),告诉

你在远程和你连接的究竟是谁.

它的声明为:

#include <sys/socket.h>

int getpeername(int sockfd, struct sockaddr *addr, int *addrlen);

下面是参数说明:

l sockfd 是你想取得远程信息的那个套接字描述符。

l addr 是一个指向struct sockaddr (或是struct sockaddr_in)的指针。

l addrlen 是一个指向int 的指针,应该赋于sizeof(struct sockaddr)的大小。

如果在函数执行过程中出现了错误,函数将返回 –1 ,并且错误代码储存在全局变量

errno 中。

当你拥有了远程连接用户的IP 地址,你就可以使用inet_ntoa() 或gethostbyaddr()来输

出信息或是做进一步的处理。

gethostname()函数

gethostname()函数可以取得本地主机的信息.它比getpeername()要容易使用一些。

它返回正在执行它的计算机的名字。返回的这个名字可以被gethostbyname()函数使用,

由此可以得到本地主机的IP 地址。

下面是它的声明:

#include <unistd.h>

int gethostname(char *hostname, size_t size);

参数说明如下:

l hostname 是一个指向字符数组的指针,当函数返回的时候,它里面的数据就是本

地的主机的名字.

l size 是hostname 指向的数组的长度.

函数如果成功执行,它返回0,如果出现错误,则返回–1,全局变量errno 中存储着错

误代码。