关于我、重生到500年前凭借C语言改变世界科技vlog.16——万字详解指针概念及技巧

时间:2024-11-08 21:02:42

文章目录

  • 1. sizeof 和 strlen
    • 1.1 sizeof
    • 1.2 strlen
  • 2. 数组和指针结合的试题深入解析
    • 2.1 一维数组
    • 2.2 字符数组
      • 代码1
      • 代码2
      • 代码3
      • 代码4
      • 代码5
      • 代码6
    • 2.3 二维数组
  • 3.指针运算的试题深入解析
    • 题1
    • 题2
    • 题3
    • 题4
    • 题5
    • 题6
    • 题7
  • 希望读者们多多三连支持
  • 小编会继续更新
  • 你们的鼓励就是我前进的动力!

本篇为指针系列的最后一篇,我们将在该篇 vlog 对指针的常见表达形式的概念及技巧进行深入的解析,通过该篇 vlog 可以让你以后在遇到指针时基本都能将代码转化为自己的语言去理解,建议先思考后再看解析,更有助于加深理解,希望能够为广大读者们在初学指针时排忧解惑 ????

1. sizeof 和 strlen

1.1 sizeof

在初学C语言时就提到过 sizeof 的概念,这也是个常用的关键字,想必已经大家已经烂熟于心
回顾提示:sizeof(类型)、sizeof 表达式

  1. sizeof 是操作符
  2. sizeof 计算操作数所占内存的大小,单位是字节
  3. 不关注内存中存放什么数据

这里不做过多赘述,忘记的可以去看我往期的文章回顾:

传送门:关于我、重生到500年前凭借C语言改变世界科技vlog.2——C语言数据类型和变量

1.2 strlen

前面在举指针的例子的时候,提到过 strlen ,是用来计算字符串长度的
在这里插入图片描述

传送门:strlen-C++参考

头文件为 #include <string.h> , strlen 是专门用于计算字符串长度的,strlen 从 str 这个参数的地址开始向后,统计 \0 之前的字符串个数,只要没遇到 \0 就不会停止,直到找到为止,所以可能存在越界查找的情况

通过一个例子就能明白:

#include <stdio.h>
int main()
{
 char arr1[3] = {'a', 'b', 'c'};
 char arr2[] = "abc";
 printf("%d\n", strlen(arr1));
 printf("%d\n", strlen(arr2));
 
 printf("%d\n", sizeof(arr1));
 printf("%d\n", sizeof(arr2));
 return 0;
}

运行代码后可以发现结果为 35,3,3,4
字符没有 \0 ,所以 strlen 找不到停止的标志,就会产生一个随机值

可以总结出以下几点:

  1. strlen是库函数,使用需要包含头文件 string.h
  2. srtlen是求字符串长度的,统计的是 \0 之前字符的个数
  3. 关注内存中是否有 \0 ,如果没有 \0 ,就会持续往后找,可能会越界

2. 数组和指针结合的试题深入解析

以下代码均在 x64 环境下运行,地址大小为 8 ,地址保持不变

2.1 一维数组

int a[] = {1,2,3,4};
1.printf("%zd\n",sizeof(a));
2.printf("%zd\n",sizeof(a+0));
3.printf("%zd\n",sizeof(*a));
4.printf("%zd\n",sizeof(a+1));
5.printf("%zd\n",sizeof(a[1]));
6.printf("%zd\n",sizeof(&a));
7.printf("%zd\n",sizeof(*&a));
8.printf("%zd\n",sizeof(&a+1));
9.printf("%zd\n",sizeof(&a[0]));
10.printf("%zd\n",sizeof(&a[0]+1));

解析:

  1. 16 数组名放在sizeof内部表示整个数组 ,单位是字节
  2. 8 这里 a 是数组名,表示首元素地址,加 0 后不变
  3. 4 这里 a 是数组名,表示首元素地址,解引用后就是首元素,即 a[0]
    所以*a – *(a + 0) – a[0]
  4. 8 这里 a + 1 是第二个元素的地址
  5. 4 第二个元素类型为 int
  6. 8 这里取整个数组的地址
  7. 16 这里的 * 和 & 抵消了,也就是 sizeof(a) ,访问整个数组
  8. 8 这里 &a + 1 跳过整个数组取地址
  9. 8 取第一个元素的地址
  10. 8 取第二个元素的地址

2.2 字符数组

代码1

char arr[] = {'a','b','c','d','e','f'};
1.printf("%zd\n", sizeof(arr));
2.printf("%zd\n", sizeof(arr+0));
3.printf("%zd\n", sizeof(*arr));
4.printf("%zd\n", sizeof(arr[1]));
5.printf("%zd\n", sizeof(&arr));
6.printf("%zd\n", sizeof(&arr+1));
7.printf("%zd\n", sizeof(&arr[0]+1));

解析:

  1. 6 数组名放在sizeof内部表示整个数组
  2. 8 这里 arr 是数组名,表示首元素地址,加 0 后不变
  3. 1 这里 arr 是数组名,表示首元素地址,解引用后就是首元素
  4. 1 表示第二个元素
  5. 8 这里取整个数组的地址
  6. 8 这里 &a + 1 跳过整个数组取地址
  7. 8 取第二个元素的地址

代码2

char arr[] = {'a','b','c','d','e','f'};
1.printf("%d\n", strlen(arr));
2.printf("%d\n", strlen(arr+0));
3.printf("%d\n", strlen(*arr));
4.printf("%d\n", strlen(arr[1]));
5.printf("%d\n", strlen(&arr));
6.printf("%d\n", strlen(&arr+1));
7.printf("%d\n", strlen(&arr[0]+1));

解析:

  1. 随机值 没有 \0
  2. 随机值 没有 \0
  3. 程序崩溃 访问首元素,即 ‘a’ = 97 ,会把 97 当成地址去访问
  4. 程序崩溃 访问第二个元素,即 ‘b’ = 98 ,会把 98 当成地址去访问
  5. 随机值 arr数组的地址,没有 \0
  6. 随机值 跳过整个数组取地址,没有 \0
  7. 随机值 取第二个元素的地址,没有 \0

代码3

char arr[] = "abcdef";
1.printf("%zd\n", sizeof(arr));
2.printf("%zd\n", sizeof(arr+0));
3.printf("%zd\n", sizeof(*arr));
4.printf("%zd\n", sizeof(arr[1]));
5.printf("%zd\n", sizeof(&arr));
6.printf("%zd\n", sizeof(&arr+1));
7.printf("%zd\n", sizeof(&arr[0]+1));

解析:

  1. 7 数组名放在sizeof内部表示整个数组
  2. 8 arr是首元素地址,加 0 后不变
  3. 1 访问首元素,即 a
  4. 1 访问第二个元素,即 b
  5. 8 这里是数组的地址,和首元素地址一样
  6. 8 跳过整个数组取地址
  7. 8 取第二个元素的地址

代码4

char arr[] = "abcdef";
1.printf("%d\n", strlen(arr));
2.printf("%d\n", strlen(arr+0));
3.printf("%d\n", strlen(*arr));
4.printf("%d\n", strlen(arr[1]));
5.printf("%d\n", strlen(&arr));
6.printf("%d\n", strlen(&arr+1));
7.printf("%d\n", strlen(&arr[0]+1));

解析:

  1. 6 arr是首元素地址,统计 \0 之前的字符长度
  2. 6 arr是首元素地址,统计 \0 之前的字符长度,加 0 后不变
  3. 程序崩溃 访问首元素,即 ‘a’ = 97 ,会把 97 当成地址去访问
  4. 程序崩溃 访问第二个元素,即 ‘b’ = 98 ,会把 98 当成地址去访问
  5. 6 &arr是数组的地址,即首元素地址,统计 \0 之前的字符长度
  6. 随机值 跳过整个数组取地址,没有 \0
  7. 5 取第二个元素的地址,统计 \0 之前的字符长度

代码5

char *p = "abcdef";
1.printf("%zd\n", sizeof(p));
2.printf("%zd\n", sizeof(p+1));
3.printf("%zd\n", sizeof(*p));
4.printf("%zd\n", sizeof(p[0]));
5.printf("%zd\n", sizeof(&p));
6.printf("%zd\n", sizeof(&p+1));
7.printf("%zd\n", sizeof(&p[0]+1));

解析:

  1. 8 p 是指针变量,计算的是指针变量的大小
  2. 8 p+1是第二个元素地址
  3. 1 p 的大小是 char* ,所以 *p 只能访问一个字节
  4. 1 p[0] – *(p + 0) – *p ,访问一个字节
  5. 8 指针变量 p 的地址
  6. 8 跳过 p 变量取后面的地址
  7. 8 取第二个元素的地址

代码6

char *p = "abcdef";
1.printf("%d\n", strlen(p));
2.printf("%d\n", strlen(p+1));
3.printf("%d\n", strlen(*p));
4.printf("%d\n", strlen(p[0]));
5.printf("%d\n", strlen(&p));
6.printf("%d\n", strlen(&p+1));
7.printf("%d\n", strlen(&p[0]+1));

解析:

  1. 6 p 是指针变量,存放字符串的地址,统计 \0 之前的字符长度
  2. 5 指向第二个元素的地址
  3. 程序崩溃 访问首元素,即 ‘a’ = 97 ,会把 97 当成地址去访问
  4. 程序崩溃 p[0] – *(p + 0) – *p,访问首元素,即 ‘a’ = 97 ,会把 97 当成地址去访问
  5. 随机值 取指针变量 p 的地址,没有 \0
  6. 随机值 跳过 p 变量取后面的地址,没有 \0
  7. 5 取第二个元素的地址,统计 \0 之前的字符长度

2.3 二维数组

int a[3][4] = {0};
1.printf("%zd\n",sizeof(a));
2.printf("%zd\n",sizeof(a[0][0]));
3.printf("%zd\n",sizeof(a[0]));
4.printf("%zd\n",sizeof(a[0]+1));
5.printf("%zd\n",sizeof(*(a[0]+1)));
6.printf("%zd\n",sizeof(a+1));
7.printf("%zd\n",sizeof(*(a+1)));
8.printf("%zd\n",sizeof(&a[0]+1));
9.printf("%zd\n",sizeof(*(&a[0]+1)));
10.printf("%zd\n",sizeof(*a));
11.printf("%zd\n",sizeof(a[3]));

解析:

  1. 48 数组名放在sizeof内部表示整个数组
  2. 4 第一行第一个元素
  3. 16 第一行数组名,计算第一行大小
  4. 8 a[0]+1则是将这个指针向后移动一个元素的位置
    所以 a[0] + 1 – &a[0][0] + 1 – &a[0][1]
  5. 4 第一行第二个元素
  6. 8 第二行的地址
  7. 16 解引用第二行
  8. 8 第二行的地址
  9. 16 第二行解引用
  10. 16 第一行解引用
  11. 16 第四行

3.指针运算的试题深入解析

题1

#include <stdio.h>
int main()
{
 int a[5] = { 1, 2, 3, 4, 5 };
 int *ptr = (int *)(&a + 1);
 printf( "%d,%d", *(a + 1), *(ptr - 1));
 return 0;
}
//程序的结果是什么?

解析:

输出 2,5
1.首先,&a 取的是整个数组a的地址,数组的地址和数组首元素的地址在数值上是相同的,但类型不同,数组首元素的地址类型是 int ,而数组的地址类型是 int ()[5](因为a是一个包含 5 个元素的数组)
2.然后,&a + 1 表示将指针向后移动一个数组的大小,由于数组 a 包含 5 个 int 类型的元素,每个int类型元素占 4 个字节,那么整个数组a在内存中所占字节数为 5×4 = 20字节,所以 &a + 1 实际上是指向了数组 a 所占内存空间之后的下一个位置
3.最后,(int *)(&a + 1) 将这个指向数组a之后位置的指针强制转换为 int * 类型的指针,也就是将其看作是指向一个int类型元素的指针,赋值给了ptr

*对于 (a + 1):
数组名a在大多数情况下会被隐式转换为指向数组首元素的指针,所以 a + 1 就是将指向首元素的指针向后移动一个元素的位置,*(a + 1) 则是获取这个移动后指针所指向的元素,也就是数组a的第二个元素,其值为 2

*对于 (ptr - 1):
ptr 是指向数组a所占内存空间之后的下一个位置,那么 ptr - 1 就是将这个指针向前移动一个元素的位置,*(ptr - 1) 就是获取这个移动后指针所指向的元素,也就是数组a的最后一个元素,其值为 5

题2

//在X86环境下
//假设结构体的⼤⼩是20个字节
//程序输出的结果是啥?
struct Test
{
 int Num;
 char *pcName;
 short sDate;
 char cha[2];
 short sBa[4];
}*p = (struct Test*)0x100000;
//定义了一个指向 Test 结构体的指针 p,并将其初始化为内存地址 0x100000
int main()
{
 printf("%p\n", p + 0x1);
 printf("%p\n", (unsigned long)p + 0x1);
 printf("%p\n", (unsigned int*)p + 0x1);
 return 0;
}

输出:0x100014,0x100001,0x100004

第一次输出:
将各成员所占字节数相加:4 + 4 + 2 + 2 + 8 = 20 字节
所以当 p + 0x1 时,指针会按照结构体大小移动,即从初始地址 0x100000 移动到 0x100000 + 20×1 = 0x100014,这里输出的结果应该是 0x100014

第二次输出:
这里将结构体指针 p 强制转换为 unsigned long 类型,然后进行加法运算,当把指针转换无符号长整型后,就不再按照结构体的大小进行指针移动的运算了,而是单纯的数值加法,因为 p 被初始化为 0x100000,将其视为无符号长整型并加上 0x1,得到的结果就0x100001,这里输出的结果应该是 0x100001

第三次输出:
这里将结构体指针 p 强制转换为 unsigned int* 类型的指针,然后进行加法运算,当 unsigned int* 类型的指针进行算术运算时,指针移动的步长是根据 unsigned int 类型的大小来确定的,在一般情况下,unsigned int 类型占 4 个字节,所以当 (unsigned int*)p + 0x1 时,指针会从初始地址 0x100000 移动到 0x100000 + 4×1 = 0x100004,这里输出的结果应该是 0x100004

题3

#include <stdio.h>
int main()
{
 int a[3][2] = { (0, 1), (2, 3), (4, 5) };
 int *p;
 p = a[0];
 printf( "%d", p[0]);
 return 0;
}

解析:

输出:1
a[0] 可以看作是指向二维数组 a 第一行,这里将 a[0] 赋值给指针 p,此时 p 就指向了数组 a 的第一行的第一个元素,也就是值为 1 的那个元素

题4

//假设环境是x86环境,程序输出的结果是啥?
#include <stdio.h>
int main()
{
 int a[5][5];
 int(*p)[4];
 p = a;
 printf( "%p,%d\n", &p[4][2] - &a[4][2], &p[4][2] - &a[4][2]);
 return 0;
}

解析:

输出:0xFFFFFFFC,-4

int(*p)[4], p = a 的图示
请添加图片描述

p[4][2] = ((p+4)+2)
所以地址减地址得到的是元素个数,又因为这里打印地址,所以以补码的形式打印

题5

#include <stdio.h>
int main()
{
 int aa[2][5] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
 int *ptr1 = (int *