????博客主页:醉竺
????本文专栏:《C语言深度解剖》
????欢迎关注:感谢大家的点赞评论+关注,祝您学有所成!
✨✨????????想要学习更多数据结构与算法点击专栏链接查看????????✨✨
1. 数据类型介绍
前面我们已经学习了基本的内置类型:
char //字符数据类型
short //短整型
int //整形
long //长整型
long long //更长的整形
float //单精度浮点数
double //双精度浮点数
//C语言有没有字符串类型?
以及他们所占存储空间的大小。
类型的意义:
1. 使用这个类型开辟内存空间的大小(大小决定了使用范围)。
2. 如何看待内存空间的视角。
1.1 类型的基本归类
整形家族:
char
unsigned char
signed char
short
unsigned short[int]
signed short[int]
int
unsigned int
signed int
long
unsigned long[int]
signed long[int]
字符在存储的时候存储的是ASCII码值,ASCII是整数,所以在归类的时候,字符属于整型家族 。
浮点数家族:
float
double
构造类型:(自定义类型)
> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union
一个数组,把数组名去掉,剩下的就是这个数组的类型, 元素个数不一样,代表类型也不一样。
eg. int a[10] 和 int a[11]是不同的类型,第一个数组类型是int [10],第二个数组类型是int [11]. 所以说数组也是自定义类型。
指针类型
int *pi;
char *pc;
float* pf;
void* pv;
C语言中所有“变量”的类型判断:把“变量”名去掉,剩下的就是该“变量”的类型。
空类型:
void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。
2. 整形在内存中的存储
我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的?
比如:
int a = 20;
int b = -10;
我们知道为 a 分配四个字节的空间。 那如何存储? 下来了解下面的概念:
2.1 原码、反码、补码
计算机中的整数有三种2进制表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位
正数的原、反、补码都相同。
负整数的三种表示方法各不相同。
原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码
将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码
反码+1就得到补码。
对于整形来说:数据存放内存中其实存放的是补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统 一处理;
同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
我们看看在内存中的存储:
我们可以看到对于a和b分别存储的是补码。
但是我们发现顺序有点不对劲。 这是又为什么?
2.2 大小端介绍
什么大端小端:
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。
低位:指的是低权值位!
什么是数据的低位高位?
例如:十进制数:1356
1是数据的高位:千位 ;6是数据的低位:个位
为什么有大端和小端:
百度2015年系统工程师笔试题:
请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)
有两种方法实现:
但是两种方法实现的本质是一样的:选择一个简单的数字(这里选择的是数字1),判断其第一个字节存储的是什么,如果是0就是大端存储模式,如果是1就代表是小端存储模式。
//代码1
#include <stdio.h>
int check_sys()
{
int i = 1;
return (*(char*)&i);
}
int main()
{
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
//代码2
int check_sys()
{
union
{
int i;
char c;
}un;
un.i = 1;
return un.c;
}
这里简单解释一下方法2为什么也可以实现,到后面深入学习到联合体的时候会进一步详细讲解,这里可以先掌握方法1.
定义一个联合体(union),联合体是一个特殊的数据类型,所有成员都从同一内存位置开始,所以同一时间只能存储其中一个成员的值。在这个联合体中,定义了两个成员:一个整数
int i;
和一个字符char c;
。将联合体
un
的整数成员i
赋值为1。由于int
类型通常大于char
类型,如果系统是32位的话,int
将占用4个字节,这样整数1在内存中的表示(在小端字节序系统中)通常会是01 00 00 00
。也就是说,最低有效字节(最小的地址)存储了值1,而其他字节存储0。由于联合体成员共享内存,
char c;
将访问整数i
第一个字节的内容。在小端系统中,由于1被存储在了最低位字节,char c
会读取到值1。在大端系统中,值1会被存储在最高位字节,而char c
会读取到0。函数返回
char c
的值。如果返回值为1,则系统为小端字节序。如果返回值为0,则系统为大端字节序。
2.3 练习(重难点)
- C语言中的整数类型可以分为两种:有符号和无符号。
- 有符号整数可以表示正数、负数和零, 而无符号整数仅能表示正数和零。
- 无符号整数确实采用直接的二进制表示,所有的位都用于表示值,没有符号位。无符号整数不使用原码、反码和补码的概念,因为这些都是有符号整数的表示方法。
- 在无符号整数中,所有的位,包括最高位,都是数值的一部分,没有一个位是用作符号位的。最高位的1或0并没有特殊的含义,它仅仅是数值的一部分,与其他位一样参与数值的表示。
- 使用%u格式控制符打印无符号整数时,会直接以其十进制值输出非负整数。
- 因此,使用%u打印无符号整数时,并不需要考虑原码、补码和反码的问题。以无符号形式打印的结果就是该无符号整数的真实值 。
a是char类型一个字节只能放8个比特位,所以截断了一些比特位,然后再整形提升。
下面程序输出什么?
有/无符号位数,是对存储在内存中数据的补码的一种看待(使用)方式!
同一个数字存储在内存中的二进制数字是一样的。
如果是以无符号位数的格式打印%u,那就把内存中数据的补码当成没有符号的数字使用(看待),直接打印出来这串二进制代表的十进制整数即可。
若是打印有符号位数%d,要把补码转换成原码所代表的十进制数字打印出来。
总之,存储内存中的数据是一样的,只不过以不同的方式来使用。
这段代码看似是想循环打印256次"hello world",但实际上,它会导致一个无限循环,并且会无限地打印"hello world"。原因在于变量i的类型是unsigned char。
在C语言中,unsigned char的取值范围通常是0到255。当i增加到255并执行i++后,按照期望,i会变成256。但是,由于unsigned char的取值上限是255,所以当i尝试增加到256时,它实际上会溢出并回绕到0(这是无符号整数溢出时的正常行为),导致for循环的条件i <= 255始终为真。
这里补充一下char类型的取值范围:
3. 浮点型在内存中的存储
常见的浮点数:
3.14159
1E10
浮点数家族包括: float、double、long double 类型。
浮点数表示的范围:float.h中定义
3.1 一个例子
浮点数存储的例子:
输出的结果是什么呢?