CRC、反码求和校验原理分析

3月份开始从客户端转后台，算是幸运的进入全栈工程师的修炼阶段。这段时间一边是老项目的客户端加服务器两边的维护和交接，一边是新项目加加加班赶工，期间最长经历了连续工作三天只睡了四五个小时的煎熬，人生也算是完整了。。。写博客也算是又一次废了。。。

一边赶项目，一边看TCP／IP相关的书，本科学的网络知识一直都是一知半解，现在终于有机会深入研究一下了。

TCP/IP主要就是各种协议，各种接口。校验这个概念，一直都不陌生。之前在客户端用的最多的校验是MD5、CRC校验，在逻辑层网络协议，客户端文件等用的比较多。但是一直没有深究里面的原理。而网络传输用的就更多了，IP头、ICMP、TCP和UDP 都用了反码求和校验。

－－－－－－－－－－－－－－－－－－－－－－－－－分割线－－－－－－－－－－－－－－－－－－－－－－－－－－

CRC校验：

　　设原始信息字段K位，校验字段R位，码字（最终发送信息）长度（N＝K+R），则对于CRC码集中的任一码字，存在且仅存在一个R次多项式g(x)，使得

v(x) = a(x)g(x) = m(x) x^R + r(x)

　　其中m(x)是K次多项式，r(x)为R－1次校验多项式，v(x)为CRC码

　　也即二进制m（原始信息）左移R位，加上剩下的R位（余数），得到值v（最终发送信息），能被一个选定的二进制数g整除。发送端发送的信息，到接收端能被指定的数g整除，则信息是完整的。为了唯一性，g(x)一般会找一个特别的素数，因此有CRC16，CRC32，有相应的标准。

　　发送端：有m，g，R，需要求r，然后组合成最终信息v ＝ m*2^R+ r。

　　接收端：有v，g，计算v ％ g ＝＝ 0则正确。

　　那么r怎么求呢？一般概念介绍只说用m左移R位后除以g，余数就是r。

　　比如输入1001，校验多项式11001，采用多项式除法

　　10010000

　　11001

　　－－－－－－－－－－－－

　　01011000

　　 11001

　　－－－－－－－－－－－－

　　 0111100

　　　 11001

　　－－－－－－－－－－－－

　　　 001110

　　最终发送码为1001

　　可是 10010000％11001 ＝ 1110 只能说明m*2^R- r能够被g整除，那为什么m*2^R+ r也能被g整除呢？答案在除法方式上，这里用的除法是模2除。我们可以看到CRC校验在除法过程中用的是亦或操作，

0-0=0，1-0=1，0-1=1，1-1=0；

　　等式挪到右边

0+0=0，1+0=1，1+1=0，0+1=1；

　　可以发现加法和减法的真值表完全相同，因此模2加和模2减结果相同。所以我们将被除数加上r和减去r，最终得到的余数应该相同。于是余数r可以直接接到原始信息之后，得到最终的CRC码字。

反码求和校验：

　　反码求和的过程更简单一些，将原始信息每16bit取反，求和，结果存在检验和字段中，接收端同样对每个16bit进行二进制反码求和，接收方在计算中包含发送方存放的检验和，最终结果应该全为1.

　　为何全为1？我们简化4位模拟该过程。假设发送端有1001，取反后0110，最终发送10010110，接收端收到后开始校验，取反求和

0110 ＋ 1001＝1111

　　结果如预期所料。其实更重要的是，当遇到进位时的处理，反码求和最高位遇到进位时，最高位进位后放到低位继续求和。意味着对于四位的求和，超过1111则循环到1，这就是反码补码的时钟循环原理，1111是4位反码求和的最大数。一个数加上自己取反得到的数正是时钟轮盘上最大那个数。接收端由于包含了发送端计算的反码和。反码和取反＋反码和＝全1.

　　有了对这些原理的理解，相信自己也能实现CRC校验和反码求和校验算法了。具体的代码网上一大堆，这里就不贴了，仅看了代码，只会复制，不会重写。。。

CRC、反码求和校验 原理分析

CRC、反码求和校验原理分析