【转载】关于static和extern的用法

时间:2022-09-16 16:00:44

一些基本概念:

1. 编译单元(模块):
在IDE开发工具大行其道的今天,对于编译的一些概念很多人已经不再清楚了,很多程序员最怕的就是处理连接错误(LINK ERROR), 因为它不像编译错误那样可以给出你程序错误的具体位置,你常常对这种错误感到懊恼,但是如果你经常使用gcc,makefile等工具在linux或者嵌 入式下做开发工作的话,那么你可能非常的理解编译与连接的区别!当在VC这样的开发工具上编写完代码,点击编译按钮准备生成exe文件时,VC其实做了两 步工作,第一步,将每个.cpp(.c)和相应.h文件编译成obj文件;第二步,将工程中所有的obj文件进行LINK生成最终的.exe文件,那么错 误就有可能在两个地方产生,一个是编译时的错误,这个主要是语法错误,另一个是连接错误,主要是重复定义变量等。我们所说的编译单元就是指在编译阶段生成 的每个obj文件,一个obj文件就是一个编译单元,也就是说一个cpp(.c)和它相应的.h文件共同组成了一个编译单元,一个工程由很多个编译单元组 成,每个obj文件里包含了变量存储的相对地址等 。

2. 声明与定义的区别
函数或变量在声明时,并没有给它实际的物理内存空间,它有时候可以保证你的程序编译通过, 但是当函数或变量定义的时候,它就在内存中有了实际的物理空间,如果你在编译模块中引用的外部变量没有在整个工程中任何一个地方定义的话, 那么即使它在编译时可以通过,在连接时也会报错,因为程序在内存中找不到这个变量!你也可以这样理解, 对同一个变量或函数的声明可以有多次,而定义只能有一次!

3. extern的作用
extern有两个作用,第一个,当它与"C"一起连用时,如: extern "C" void fun(int a, int b); 则告诉编译器在编译fun这个函数名时按着C的规则去翻译相应的函数名而不是C++的, C++的规则在翻译这个函数名时会把fun这个名字变得面目全非,可能是fun@aBc_int_int#%$也可能是别的,这要看编译器的"脾气"了 (不同的编译器采用的方法不一样),为什么这么做呢,因为C++支持函数的重载啊,在这里不去过多的论述这个问题,如果你有兴趣可以去网上搜索,相信你可 以得到满意的解释!
当extern不与"C"在一起修饰变量或函数时,如在头文件中: extern int g_Int; 它的作用就是声明函数或全局变量的作用范围的关键字,其声明的函数和变量可以在本模块或者其他模块中使用,记住它是一个声明不是定义!也就是说B模块(编译 单元)要是引用模块(编译单元)A中定义的全局变量或函数时,它只要包含A模块的头文件即可, 在编译阶段,模块B虽然找不到该函数或变量,但它不会报错,它会在连接时从模块A生成的目标代码中找到此函数。

如果你对以上几个概念已经非常明白的话,那么让我们一起来看以下几种全局变量/常量的使用区别:

1. 用extern修饰的全局变量
以上已经说了extern的作用,下面我们来举个例子,如:
在test1.h中有下列声明:
#ifndef TEST1H
#define TEST1H
extern char g_str[]; // 声明全局变量g_str
void fun1();
#endif
在test1.cpp中
#include "test1.h"

char g_str[] = "123456"; // 定义全局变量g_str

void fun1()
{
cout << g_str << endl;
}

以上是test1模块, 它的编译和连接都可以通过,如果我们还有test2模块也想使用g_str,只需要在原文件中引用就可以了
#include "test1.h"

void fun2()
{
cout << g_str << endl;
}
以上test1和test2可以同时编译连接通过,如果你感兴趣的话可以用ultraEdit打开test1.obj,你可以在里面着"123456"这 个字符串,但是你却不能在test2.obj里面找到,这是因为g_str是整个工程的全局变量,在内存中只存在一份, test2.obj这个编译单元不需要再有一份了,不然会在连接时报告重复定义这个错误!
有些人喜欢把全局变量的声明和定义放在一起,这样可以防止忘记了定义,如把上面test1.h改为
extern char g_str[] = "123456"; // 这个时候相当于没有extern
然后把test1.cpp中的g_str的定义去掉,这个时候再编译连接test1和test2两个模块时,会报连接错误,这是因为你把全局变量 g_str的定义放在了头文件之后,test1.cpp这个模块包含了test1.h所以定义了一次g_str,而 test2.cpp也包含了test1.h所以再一次定义了g_str, 这个时候连接器在连接test1和test2时发现两个g_str。如果你非要把g_str的定义放在test1.h中的话,那么就把test2的代码 中#include "test1.h"去掉 换成:
extern char g_str[];
void fun2()
{
cout << g_str << endl;
}
这个时候编译器就知道g_str是引自于外部的一个编译模块了,不会在本模块中再重复定义一个出来,但是我想说这样做非常糟糕,因为你由于无法在 test2.cpp中使用#include "test1.h", 那么test1.h中声明的其他函数你也无法使用了,除非也用都用extern修饰,这样的话你光声明的函数就要一大串,而且头文件的作用就是要给外部提 供接口使用的,所以 请记住, 只在头文件中做声明,真理总是这么简单。

2. 用static修饰的全局变量
首先,我要告诉你static与extern是一对“水火不容”的家伙,也就是说extern和static不能同时修饰一个变量;其次,static修 饰的全局变量声明与定义同时进行,也就是说当你在头文件中使用static声明了全局变量后,它也同时被定义了;最后,static修饰全局变量的作用域 只能是本身的编译单元,也就是说它的“全局”只对本编译单元有效,其他编译单元则看不到它,如:
test1.h:
#ifndef TEST1H
#define TEST1H
static char g_str[] = "123456";
void fun1();
#endif

test1.cpp:
#include "test1.h"

void fun1()
{
cout << g_str << endl;
}

test2.cpp
#include "test1.h"

void fun2()
{
cout << g_str << endl;
}

以上两个编译单元可以连接成功, 当你打开test1.obj时,你可以在它里面找到字符串"123456", 同时你也可以在test2.obj中找到它们,它们之所以可以连接成功而没有报重复定义的错误是因为虽然它们有相同的内容,但是存储的物理地址并不一样, 就像是两个不同变量赋了相同的值一样,而这两个变量分别作用于它们各自的编译单元。
也许你比较较真,自己偷偷的跟踪调试上面的代码,结果你发现两个编译单元(test1, test2)的g_str的内存地址相同,于是你下结论static修饰的变量也可以作用于其他模块,但是我要告诉你,那是你的编译器在欺骗你,大多数编 译器都对代码都有优化功能,以达到生成的目标程序更节省内存,执行效率更高,当编译器在连接各个编译单元的时候,它会把相同内容的内存只拷贝一份,比如上 面的"123456", 位于两个编译单元中的变量都是同样的内容,那么在连接的时候它在内存中就只会存在一份了, 如果你把上面的代码改成下面的样子,你马上就可以拆穿编译器的谎言:
test1.cpp:
#include "test1.h"

void fun1()
{
g_str[0] = 'a';
cout << g_str << endl;
}

test2.cpp
#include "test1.h"

void fun2()
{
cout << g_str << endl;
}

void main()
{
fun1(); // a23456
fun2(); // 123456
}

这个时候你在跟踪代码时,就会发现两个编译单元中的g_str地址并不相同,因为你在一处修改了它,所以编译器被强行的恢复内存的原貌,在内存中存在了两份拷贝给两个模块中的变量使用。

正是因为static有以上的特性,所以一般定义static全局变量时,都把它放在原文件中而不是头文件,这样就不会给其他模块造成不必要的信息污染,同样记住这个原则吧!

3 const修饰的全局常量(const总结的ms还不是很好,下次要是有好文章再转载!)

const修饰的全局常量用途很广,比如软件中的错误信息字符串都是用全局常量来定义的。const修饰的全局常量据有跟static相同的特性(有条件的,感谢sswv的提醒,const放在只读静态存储区),即它们只能作用于本编译模块中,但是const可以与extern连用来声明该常量可以作用于其他编译模块中, 如
extern const char g_str[];
然后在原文件中别忘了定义:
const char g_str[] = "123456";

所以当const单独使用时它就与static相同,(前提是都在描述全局变量,如果在函数内部就不一样)而当与extern一起合作的时候,它的特性就跟extern的一样了!所以对const我没有什么 可以过多的描述,我只是想提醒你,const char* g_str = "123456" 与 const char g_str[] = "123465"是不同的, 前面那个const 修饰的是char * 而不是g_str,它的g_str并不是常量,它被看做是一个定义了的全局变量(可以被其他编译单元使用), 所以如果你像让char *g_str遵守const的全局常量的规则,最好这么定义const char* const g_str="123456".

一、c程序存储空间布局

C程序一直由下列部分组成:

1)正文段——CPU执行的机器指令部分;一个程序只有一个副本;只读,防止程序由于意外事故而修改自身指令;

2)初始化数据段(数据段)——在程序中所有赋了初值的全局变量,存放在这里。

3)非初始化数据段(bss段)——在程序中没有初始化的全局变量;内核将此段初始化为0。

4)栈——增长方向:自顶向下增长;自动变量以及每次函数调用时所需要保存的信息(返回地址;环境信息)。

5)堆——动态存储分。

|-----------|

| |

|-----------|

| 栈 |

|-----------|

| | |

| /|/ |

| |

| |

| /|/ |

| | |

|-----------|

| 堆 |

|-----------|

| 未初始化 |

|-----------|

| 初始化 |

|-----------|

| 正文段 |

|-----------|

二、 面向过程程序设计中的static

1. 全局静态变量

在全局变量之前加上关键字static,全局变量就被定义成为一个全局静态变量。

1)内存中的位置:静态存储区(静态存储区在整个程序运行期间都存在)

2)初始化:未经初始化的全局静态变量会被程序自动初始化为0(自动对象的值是任意的,除非他被显示初始化)

3)作用域:全局静态变量在声明他的文件之外是不可见的。准确地讲从定义之处开始到文件结尾。

看下面关于作用域的程序:

//teststatic1.c

void display();

extern int n;

int main()

{

n = 20;

printf("%d/n",n);

display();

return 0;

}

//teststatic2.c

static int n; //定义全局静态变量,自动初始化为0,仅在本文件中可见

void display()

{

n++;

printf("%d/n",n);

}

文件分别编译通过,但link的时候teststatic1.c中的变量n找不到定义,产生错误。

定义全局静态变量的好处:

<1>不会被其他文件所访问,修改

<2>其他文件中可以使用相同名字的变量,不会发生冲突。

2. 局部静态变量

在局部变量之前加上关键字static,局部变量就被定义成为一个局部静态变量。

1)内存中的位置:静态存储区

2)初始化:未经初始化的全局静态变量会被程序自动初始化为0(自动对象的值是任意的,除非他被显示初始化)

3)作用域:作用域仍为局部作用域,当定义它的函数或者语句块结束的时候,作用域随之结束。

注:当static用来修饰局部变量的时候,它就改变了局部变量的存储位置,从原来的栈中存放改为静态存储区。但是局部静态变量在离开作用域之后,并没有被销毁,而是仍然驻留在内存当中,直到程序结束,只不过我们不能再对他进行访问。

当static用来修饰全局变量的时候,它就改变了全局变量的作用域(在声明他的文件之外是不可见的),但是没有改变它的存放位置,还是在静态存储区中。

3. 静态函数

在函数的返回类型前加上关键字static,函数就被定义成为静态函数。

函数的定义和声明默认情况下是extern的,但静态函数只是在声明他的文件当中可见,不能被其他文件所用。

例如:

//teststatic1.c

void display();

static void staticdis();

int main()

{

display();

staticdis();

renturn 0;

}

//teststatic2.c

void display()

{

staticdis();

printf("display() has been called /n");

}

static void staticdis()

{

printf("staticDis() has been called/n");

}

文件分别编译通过,但是连接的时候找不到函数staticdis()的定义,产生错误。

定义静态函数的好处:

<1> 其他文件中可以定义相同名字的函数,不会发生冲突

<2> 静态函数不能被其他文件所用。

存储说明符auto,register,extern,static,对应两种存储期:自动存储期和静态存储期。

auto和register对应自动存储期。具有自动存储期的变量在进入声明该变量的程序块时被建立,它在该程序块活动时存在,退出该程序块时撤销。

关键字extern和static用来说明具有静态存储期的变量和函数。用static声明的局部变量具有静态存储持续期(static storage duration),或静态范围(static extent)。虽然他的值在函数调用之间保持有效,但是其名字的可视性仍限制在其局部域内。静态局部对象在程序执行到该对象的声明处时被首次初始化。

由于static变量的以上特性,可实现一些特定功能。

1. 统计次数功能

声明函数的一个局部变量,并设为static类型,作为一个计数器,这样函数每次被调用的时候就可以进行计数。这是统计函数被调用次数的最好的办法,因为这个变量是和函数息息相关的,而函数可能在多个不同的地方被调用,所以从调用者的角度来统计比较困难。代码如下:

void count();

int main()

{

int i;

for (i = 1; i <= 3; i++)

count();

return 0;

}

void count()

{

static num = 0;

num++;

printf(" I have been called %d",num,"times/n");

}

输出结果为:

I have been called 1 times.

I have been called 2 times.

I have been called 3 times.

 

 

 

 

 

 

 

 

 

 

extern和static释析
注意:下文中提到的“变量”或“函数”均指的是“全局”的,同时也请大家务必注意声明和定义的措辞(实际上,我这么说是有错误的,因为函数就没有全局和局部之分,其实函数都是全局的,例如我们在A文件中定义了一个函数void fun(){},在B文件中直接就可以利用,[extern] void fun(); void main(){fun();})

extern g_A;//这是声明,而且是一个int型的声明
extern double g_A;//这是声明
extern double g_A=234.34;//这是声明+定义
extern用于声明变量时,如果不指出变量的类型,则默认为int,如果不是int的,必须显示指出变量的类型,否则出错。

extern实际上只对变量有用,对函数而言,只是个幌子(能够更加清晰明了的让我们知道也让编译器知道该函数可以用于“外交”),没有实质性的作用,以后记住了,看到extern和函数扯上关系,你理都不用理,直接把它拿掉就OK了。但是它还是有那么一点用的,既然“存在的就是合理的”,那么它必然有点用啦,利用它可以在程序中取代include “*.h”来声明函数,在一些复杂的项目中,我比较习惯在所有的函数声明前添加extern修饰。

本质上,我认为,函数可以将声明和定义分开,而变量就不行了,因此只能借助于extern来实现这一点,要是变量也能将声明和定义分开,或许extern根本就不该活在这个世上。

extern可以被写在变量/函数的声明/定义处,但是标准的用法应该只是将其写在声明处,写在定义处只不过为了再次强调或直观明了而已。

因此利用extern的威力,我们可以将变量的声明放在头文件中(因为谁都知道头文件就怕出现变量或函数的定义,一旦被多次包含就会出现重复定义,编译器不惧怕重复声明,但惧怕重复定义,你这么写“void zenmehui();void zenmehui();void zenmehui();void main(){zenmehui();}”肯定没问题,不信你自己试试看)。
=====================================================================
与extern相对的是static,大家都熟悉static代表静态的意思,却很少有人注意到它还有“内部”(即表示该变量只供本文件内部使用)的意思。不过可以肯定的是,只要是用static修饰的变量,都会被放在内存中的“静态存储区”来存储(我通常会把生成的可执行文件分成静态存储区、栈区、代码区、一份含有所有变量和函数的清单《清单中的每一项会指向对应的变量或函数存储的地方》)。
静态存储区一般会放置:全局变量(又分为纯粹全局的和被static修饰的仅供文件内部使用的两种)、static修饰的局部变量。
其实这些有关static的讨论都是基于C语言的,在C++中新增了类的概念,类里使用的static在概念和意义上都有别去传统的C语言,静态的成员变量被存储在类的静态存储区中,可以不必等待类实例化就使用,静态的成员函数表明该函数只能使用类中的静态成员变量和其他静态成员函数。

现在我希望大家今后不要再一看到static就把它完全等价于“静态”之意了,总结一下:
static修饰函数:
在修饰非成员函数时表示该函数不是全局函数,而仅供本文件使用;
在修饰成员函数时,表示该函数只能调用类的静态成员变量并且该方法可以不必经由实例化的类对象就能够应用;
static修饰变量:
修饰全局变量时,该变量只能供本文件内部使用;
修饰成员变量时,该变量成为类变量,存储在静态存储区中,不经过类实例就可以访问该变量;
修饰局部变量时,该变量在函数第一次被调用时初始化,并将其存放到静态存储区,函数退出后变量值保持不变,下一次进入函数时将跳过对它的初始化,它的生命周期直到程序退出。

最后,要说明的是,static变量在全局中只有一份,不会有多份拷贝。

 

 

 

 

 

 

 

 

 

 


extern 和static的使用方法,应该属于C语言的基础知识了。可是,在实际工作中,还是经常会在代码里看到关于这两个限定符使用的问题,总结一下,大致有两类:其一,对于模块中的变量或者函数,不了解到底加不加static 或者 extern修饰符;其二,在加限定符的时候,不知道正确的使用方法。因此,有必要旧话重提,说明一下。

简单的说,记住两句话即可,

1 Static表示:被修饰的变量或者函数不可以被本模块以外的其他任何模块使用;而extern恰恰相反,表示同意其被被本模块以外的其他模块使用;
2 当变量或者程序没有被static或者extern 修饰的时候,变量或者函数可以被其他模块使用。

这么说可能还是比较空洞,看程序吧。

假定有两个模块 A 和B, 模块B希望使用在模块A中定义的一些变量和函数,我们应该怎么做呢?

1 A不“表态”,B了解A的实现细节,自行取用.


//declaration of the variable and function

int index;

void UserFunction(void);



//implementation of the function
void UserFunction(void)
{
.....
//use the index

iRecord = index;
....

}



extern int index;
extern void UserFunction(void);

//operate on the 'index' and 'UserFunction()'
...
extern int index;
extern void UserFunction(void);

//operate on the 'index' and 'UserFunction()'
...


这里,index 和UserFunction 在模块A中声明的时候,A没有使用任何限定符,所以编译器理解,不做限制。所以,当模块B希望使用的时候,是允许的。但是,这不是一个很好的风格,有点不问自取的意思,不推荐。

2 A主动公开,B正常使用;


//declaration of the variable and function

extern int index;

extern void UserFunction(void);




#include "Moudle_A.c"

//initialize the variable
...

//implementation of the function
void UserFunction(void)
{
.....
//use the index

iRecord = index;
....

}




#include "Moudle_A.h"

//operate on the 'index' and 'UserFunction()'
...

这个例子中,模块A 提供了一个头文件,公开了index 和UserFunction的信息,明确的提供给其他模块。当模块B包含了模块A的头文件的时候,就可以使用index 和UserFunction了。模块A和B互相配合,B对A中变量和函数的使用,合理合法,推荐。

3 A主动保护,B无法使用;


//declaration of the variable and function

static int index;

static void UserFunction(void);

//initialize the variable
...

//implementation of the function
void UserFunction(void)
{
.....
//use the index

iRecord = index;
....

}


#include "Moudle_A.h"

extern int index;

extern void UserFunction(void);


//operate on the 'index' and 'UserFunction()'
...

这个例子中,模块A 用static 限定了index 和UserFunction的作用范围,明确表示了不希望他们被别的模块引用。此时,即使模块B了解index 和UserFunction在模块A中的具体信息,试图用extern声明,并且在自己的代码中引用的时候,也不会成功,编译出错。