C语言打印数据的二进制格式-原理解析与编程实现

问题引出

C语言中，在需要用到16进制数据的时候，可以通过printf函数的%x格式打印数据的16进制形式。在某些位标记、位操作的场合，需要用到2进制格式的数据，但printf函数不能输出2进制格式，虽然可以通过使用itoa或_itoa的方法转为2进制的字符串打印，但显示的长度是不固定的，无法显示有效数位前面的0。

例如：现在需要打印数字258的2进制格式，且需要将32位全部显示出来，即想要得到结果00000000 00000000 00000001 00000010，而使用_itoa的方法和打印结果为：

int a = 258;	
char s[32];
_itoa(a, s, 2);
printf("a --> %s\n", s);

a --> 100000010

不是我们想要的格式！

数据存储原理探析

那要怎么办呢？自己写个小程序吧，思路如下：

首先弄清楚数据在计算机中是如何存储的，对应int型数字，在32或64位计算机中都占4个字节，而计算机中的数据存储是以字节(Byte)为单位，1个字节包含8个位(bit)，例如，数字258的16进制形式为0x00000102，2进制形式为：00000000 00000000 00000001 00000010，其在计算机内存中的存储方式如图所示：
在这里插入图片描述
右侧的16进制数是内存的地址，向上递增，方框里的二进制数是内存单元实际存储的字节内存，我们可以通过程序测试验证一下，因为unsigned char或char类型在系统是占用一个字节，因此可以定义该变量的指针，分别指向int的4个字节，打印其内存地址和实际存储的内存进行验证，代码如下：

int a = 258;
//使用unsigned char来验证int的每一个字节
unsigned char *p1 = (unsigned char*)&a;   //获取a的首地址
unsigned char *p2 = (unsigned char*)&a+1; //获取a的首地址的后一个字节地址
unsigned char *p3 = (unsigned char*)&a+2; //获取a的首地址的后两个字节地址
unsigned char *p4 = (unsigned char*)&a+3; //获取a的首地址的后三个字节地址
printf("[a] p1:%x, %d\r\n", p1, *p1); //打印p1的地址与存储的字节内容
printf("[a] p2:%x, %d\r\n", p2, *p2); //打印p2的地址与存储的字节内容
printf("[a] p3:%x, %d\r\n", p3, *p3); //打印p3的地址与存储的字节内容
printf("[a] p4:%x, %d\r\n", p4, *p4); //打印p4的地址与存储的字节内容

运行结果：

[a] p1:5216f804, 2
[a] p2:5216f805, 1
[a] p3:5216f806, 0
[a] p4:5216f807, 0

可以看出，随着地址的增加，存储的内存依次是2、1、0、0，对应数字258的从底到高的4个字节的值，另外每次运行程序，变量a的地址是自动分配的，所以每次的输出与上面示意图的地址是不同的，但都是4个连续增加的地址值。

另外补充一下，这是一种小端字节序的存储方法，即将一个数据的低字节存储在内存的低地址，或理解为先存储数据的低字节。与之对应的是大端字节序存储方式，即先存储数据的高位字节，类似与我们书写数字时从左到右先写高位数字一样。由于计算机先处理地位字节的效率比较高，因此计算机内部的数据处理均采用小端字节序，而为了方便人的阅读，除了计算机内部处理，其它场合是采用大端字节序的。可通过下面的示意图助记：
在这里插入图片描述

另外，需要区分一点，无论大端还小端字节序，在一个字节的内部的8位2进制数，都是按照人类的习惯从左到右存放，如00000010

在字节中也是按照这样存储的，不需要反过来。

C代码实现

分析了这么多，可以编写代码来输出一个数字的2进制格式形式了。具体的代码实现：

void printf_bin(int num)
{
	int i, j, k;
	unsigned char *p = (unsigned char*)&num + 3;//p先指向num后面第3个字节的地址，即num的最高位字节地址

	for (i = 0; i < 4; i++) //依次处理4个字节(32位）
	{
		j = *(p - i); //取每个字节的首地址，从高位字节到低位字节，即p p-1 p-2 p-3地址处
		for (int k = 7; k >= 0; k--) //处理每个字节的8个位，注意字节内部的二进制数是按照人的习惯存储！
		{
			if (j & (1 << k))//1左移k位，与单前的字节内容j进行或运算，如k=7时，00000000&10000000=0 ->该字节的最高位为0
				printf("1");
			else
				printf("0");
		}
		printf(" ");//每8位加个空格，方便查看
	}
	printf("\r\n");
}

数字258的实际运行效果：

00000000 00000000 00000001 00000010

对应unsigned char型的数字，如果只需要显示8位2进制数，可以对上述小程序简化：

void printf_bin_8(unsigned char num)
{
	int k;
	unsigned char *p = (unsigned char*)&num;

	for (int k = 7; k >= 0; k--) //处理8个位
	{
		if (*p & (1 << k))
			printf("1");
		else
			printf("0");
	}
	printf("\r\n");
}

数字12的运行效果

00001100

关于负数

上面测试的都是正数，当然，对于负数，也是可以显示的，因为负数在计算机中是以对应正数的补码来存储的，因而显示的2进制数也是补码形式，这里顺便再复习一下补码：

对于负数-9，对应的正数位9，9的原码，反码，补码如下：
在这里插入图片描述
这里只画出8位示意，int型数字实际是占32位，对应的高位全是0或1。

使用程序测试一下-9的2进制格式输出：

11111111 11111111 11111111 11110111

可以正确显示。

完整测试代码

下面是整个本文的整个测试程序：

#include <>
#include <>

void printf_bin(int num)
{
	int i, j, k;
	unsigned char *p = (unsigned char*)&num + 3;

	for (i = 0; i < 4; i++) //处理4个字节(32位）
	{
		j = *(p - i); //取每个字节的首地址
		for (int k = 7; k >= 0; k--) //处理每个字节的8个位
		{
			if (j & (1 << k))
				printf("1");
			else
				printf("0");
		}
		printf(" ");
	}
	printf("\r\n");
}

void printf_bin_8(unsigned char num)
{
	int k;
	unsigned char *p = (unsigned char*)&num;

	for (int k = 7; k >= 0; k--) //处理8个位
	{
		if (*p & (1 << k))
			printf("1");
		else
			printf("0");
	}
	printf("\r\n");
}

int main()
{
	int a = 258;
	int b = -9;
	printf("定义int a=%d, int b=%d\r\n", a, b);

	//使用unsigned char来验证int的每一个字节
	unsigned char *p1 = (unsigned char*)&a;  //获取a的首地址
	unsigned char *p2 = (unsigned char*)&a+1;//获取a的首地址的后一个字节地址
	unsigned char *p3 = (unsigned char*)&a+2;//获取a的首地址的后两个字节地址
	unsigned char *p4 = (unsigned char*)&a+3;//获取a的首地址的后三个字节地址
	printf("\r\n查看a的每个字节的地址与内容：\r\n");
	printf("[a] p1:%x, %d\r\n", p1, *p1);//打印p1的地址与存储的字节内容
	printf("[a] p2:%x, %d\r\n", p2, *p2);//打印p2的地址与存储的字节内容
	printf("[a] p3:%x, %d\r\n", p3, *p3);//打印p3的地址与存储的字节内容
	printf("[a] p4:%x, %d\r\n", p4, *p4);//打印p4的地址与存储的字节内容

	p1 = (unsigned char*)&b;
	p2 = (unsigned char*)&b + 1;
	p3 = (unsigned char*)&b + 2;
	p4 = (unsigned char*)&b + 3;
	printf("\r\n查看b的每个字节的地址与内容：\r\n");
	printf("[b] p1:%x, %d\r\n", p1, *p1);
	printf("[b] p2:%x, %d\r\n", p2, *p2);
	printf("[b] p3:%x, %d\r\n", p3, *p3);
	printf("[b] p4:%x, %d\r\n", p4, *p4);

	//自己的方法1
	printf("\r\na的2进制格式(显示32位)：\r\n");
	printf_bin(a);
	printf("\r\nb的2进制格式(显示32位)：\r\n");
	printf_bin(b);

	//自己的方法2
	unsigned char c = 12;
	printf("\r\n定义unsigned char c=%d\r\n", c);
	printf("c的2进制格式(显示8位)：\r\n");
	printf_bin_8(c);


	//调用函数的方法
	printf("\r\n使用_itoa函数显示2进制格式\r\n");
	char s[32];
	_itoa(a, s, 2);
	printf("a --> %s\n", s);
	_itoa(b, s, 2);
	printf("b --> %s\n", s);   
	_itoa(c, s, 2);
	printf("c --> %s\n", s);

	getchar();

	return 0;
}