Linux网络与数据封装

欢迎关注博主 Mindtechnist 或加入【Linux C/C++/Python社区】一起探讨和分享Linux C/C++/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。

Linux网络与数据封装

1. 网络应用程序的设计模式

（1）C/S架构

（2）B/S架构

2. 协议

3. 网络分层模型

4. 协议格式——数据包的封装思想

（1）以太网帧格式

（2）IP段数据格式

（3）UDP数据包格式

（4）TCP数据报格式

（5）数据的封装过程

5. TCP/UDP传输层协议简介

（1）TCP协议

（2）UDP协议

6. DNS服务器

专栏：《Linux从小白到大神》《网络编程》

1. 网络应用程序的设计模式

（1）C/S架构

client/server架构，即客户端/服务器架构。

优点：协议选用比较灵活；可以缓存数据，比如说我们在打游戏时，在游戏过程中，实际上一些音效、图片都已经缓存下来了，想象一下，如果你玩LOL的时候，音效和动画需要去服务器实时下载，那么游戏会卡成什么样子。
缺点：对用户的安全构成威胁，因为客户端收集了哪些信息，这些信息用于什么工作我们都不知道；客户端开发工作量大，调试困难，需要考虑多线程和数据同步。
典型的C/S架构比如QQ微信，我们在使用QQ或者微信的时候都需要安装一个客户端软件，也就是说，需要安装客户端软件的都是基于C/S架构。

（2）B/S架构

browser/server架构，即浏览器/服务器架构。

优点：跨平台。浏览器不需要我们开发，我们只需要下载一个浏览器即可，并且可以在各个平台通过浏览器访问网站数据（手机、电脑等），那么既然是跨平台访问，在开发的时候就需要考虑跨平台开发语言，比如Java和QT等等，QT提供了统一的接口，只不过在不同平台下封装的API不同，有Windows、Linux等，但是可以通过同样的接口去调用。Java是运行在虚拟机上的，只要在不同平台安装Java虚拟机即可。
缺点：只能使用http或https去实现。比如说，我们在浏览器输入百度的域名http://www.baidu.com，这个域名对应一个IP，浏览器会根据解析出的IP向百度的服务器发送一个http请求。

对于两种架构，并没有好坏之分，它们的应用场景不同。比如说，大型游戏必须要通过客户端来运行，比如我们玩的LOL、DNF、CF都需要下载一个客户端。而小型游戏只要在web服务器运行就可以了，比如4399小游戏等。

2. 协议

协议就是指数据传输和数据解释的规则，典型的协议比如TCP/UDP协议、HTTP协议、FTP协议、IP协议、ARP协议等。

Linux网络与数据封装

发送数据和接收数据要遵守相同的协议，否则就无法正确解析。同时，发送数据的大小一般不要太大，因为这些数据是存放在栈上的，而栈空间的大小在Linux下默认只有8M。

3. 网络分层模型

① 七层OSI模型

物理层：双绞线、光纤
数据链路层：数据传输、错误检测
网络层：路由转发
传输层：提供端对端的接口
会话层：解除或建立节点之间的联系
表示层：数据格式化、代码转换、数据加密
应用层：文件传输、电子邮件、文件服务、虚拟终端

② TCP/IP四层模型

数据链路层
网络层
传输层
应用层

OSI七层模型	TCP/IP四层模型
应用层	应用层
表示层	应用层 - ftp http ssh telent
会话层	应用层
传输层	传输层 - TCP/UDP协议
网络层	网络层 - IP协议
数据链路层	数据链路层（网络接口层）- 以太网帧协议
物理层	数据链路层

作为程序员主要关注的是应用层协议（其它三层由操作系统完成），我们可以自己去定义一套应用层协议，实际上大公司都有自己的应用层协议。

Linux网络与数据封装

4. 协议格式——数据包的封装思想

（1）以太网帧格式

以太网帧是在数据链路层传输的数据格式，借助mac地址完成数据报的传递

Linux网络与数据封装

MAC地址就是网卡编号，我们使用ifconfig就可以看到，硬件地址HWaddr就是MAC地址，这个编号是全世界唯一的，Windows下ipconfig显示的物理地址就是MAC地址（Linux中用:间隔，Windows中用-间隔）

Linux网络与数据封装

以太网帧发送数据报的前提是知道MAC地址，否则就要通过ARP协议根据对方的IP（对方的IP我们肯定是知道的，不然的话我们怎么给他发数据）去获取对方的MAC地址，我们只需要关注类型，0800表示正常发送数据，0806表示要获取对方的MAC地址，至于报文数据的填充我们不需要知道，这是操作系统完成的（只有应用层协议的封装由用户完成），当我们发送0806类型的数据包，对方会回复一条ARP数据报，我们就可以获得对方的MAC地址（见下面ARP协议示意图）。也就是说，以太网帧是根据MAC地址发送数据的，并不是根据IP地址发送数据，IP地址是用来获取MAC地址的，获取到MAC地址后，再通过MAC地址发送数据。RARP协议就是通过MAC地址获取IP地址的。

ARP数据报的格式（ARP用于根据IP地址获取MAC地址）

Linux网络与数据封装

ARP协议的工作示意图如下

Linux网络与数据封装

比如说，我们在北京要向广州的人员发送数据，我们只知道对方的IP不知道MAC地址，那么是如何实现以太网帧发送的呢？首先北京的主机会向广州的主机发送一个ARP协议包，帧类型为0806，以太网源地址和发送端地址都是北京本地主机的MAC地址，发送端IP为北京本地主机的IP，目的IP为要发送到的广州主机的IP地址，以太网目的地址我们不知道就填充FF。广州主机接收到这个数据包之后，会回复一个ARP数据包，类型同样为0806，这其中就包含了广州主机的MAC地址，有了这个MAC地址就可以进行以太网帧的发送了。

（2）IP段数据格式

4位版本：ipv4、ipv6，当前主要是ipv4
8位生存时间(TTL)：最多经过多少跳，即路由
32位源IP地址：数据发送端地址
32位目的IP地址：数据接收端地址

Linux网络与数据封装

需要注意的是，IP协议和IP地址是两个不同的概念，不要混淆。

关于路由：每经过一个路由结点，TTL减一，为了防止无限跳导致垃圾数据包，这个操作是由路由器完成的，当TTL减为0，路由器就不会再转发这个数据包了，而是直接丢弃。假如要从中国通过其他国家，可能通过海底光纤一跳就到达了，所以完全不必担心256跳（2的8次方）不够用，并且路由会选择最短路径。

Linux网络与数据封装

（3）UDP数据包格式

Linux网络与数据封装

在UDP数据包中包含一个16位源端口号和一个16位目的端口号，端口号是用来标识进程的，每个进程对应位一一个PID。在网络环境中，IP可以定位网络中的一台主机，而port端口可以定位一台主机中的一个进程，格式一般为IP:Port，比如127.0.0.1:80。端口是16位的，端口最大值为65535(2的16次方减一)。

（4）TCP数据报格式

Linux网络与数据封装

这里有一个16位的滑动窗口，滑动窗口实际上是代表了存储空间的大小。比如说，A给B发送数据，A发送的速度快，而B处理数据的速度较慢，那么A发送的数据就要先存储起来，B就可以告诉A我的滑动窗口是多大，也就是我能缓存多少数据，A发送的数据就存储在这个缓存中，当缓存区满了后，A就不在发送了。滑动窗口就是做流量控制的，当B的缓存区满了，A就会阻塞，等到B处理了一部分数据后，A再发送数据。

在传输层是不需要封装IP地址的，这是因为传输层的数据包还要经过网络层的包装，而网络层的IP协议中已经封装了IP地址，所以传输层就不需要IP了，传输层主要是封装端口号，端口号用于标识源主机哪个进程传递给目标主机的哪个目标进程。

（5）数据的封装过程

Linux网络与数据封装

5. TCP/UDP传输层协议简介

（1）TCP协议

面向连接的安全的流式传输协议

连接的时候，自动进行三次握手
数据发送的时候，会进行数据确认，是否收到
数据丢失之后，会进行数据重传

Linux网络与数据封装

（2）UDP协议

面向无连接的不安全的报式传输

连接的时候不会握手，通过IP和PORT连接
数据发送出去之后就不再管了，即不在乎对方收没收到

Linux网络与数据封装

实际上，虽然UDP不会校验数据，也就是不安全的，但是实际上我们可以在应用层对数据做校验来实现UDP的安全传输，比如说QQ发消息就是使用的UDP协议，但是它在应用层自己定义了一套协议来保证安全传输，如果传输失败可以再次传输，而QQ密码校验和文件传输则是使用TCP传输。

6. DNS服务器

DNS服务器也叫做域名解析服务器，根据域名解析出IP地址，比如说在浏览器输入一个域名www.baidu.com，该域名将会通过DNS服务器解析得到IP地址。DNS根服务器在全世界总共有13台，其中美国10台，英国、瑞典、日本各有一台。如果其他国家不向中国提供域名解析服务，那么我们就无法上网了，所以中国现在主推IPv6，实现DNS根服务器的多国治理。

Linux网络与数据封装

秒客网

Linux网络与数据封装