编译原理：bss,data,text,rodata,堆,栈,常量段

section 结构
SECTIONS {
...
secname start BLOCK(align) (NOLOAD) : AT ( ldadr )
  { contents } >region :phdr =fill
...
}
secname:段名
contents:决定哪些内容存放在此段
start:本段的连接地址（实际运行地址）
AT(ldadr):存储地址（加载的地址）

//例子U-Boot.lds代码（根据上面的section的介绍，虽能大体看懂，但是还是有些许疑惑）
SECTIONS
{
    . = 0x00000000;      // ?????此处对应section结构中哪个标识，我觉得应该是存储地址吧？？但却没有 AT 标识
    . = ALIGN(4);        //此处应该是4字节对齐的意思,???? 但对应section结构中的哪个标志不是很明白
    .text      :            //此处应该是secname 段名
   {
         cpu/arm920t/start.o
        (.text)          //大括号，应该为contents段，指示该段存放的内容
        *(.text)
   }
   . = ALIGN(4);                    //以下类似
   .rodata : { *(.rodata) }
   . = ALIGN(4);
   .data : { *(.data) }
   . = ALIGN(4);
   .got : { *(.got) }
   . = .;

   __u_boot_cmd_start = .;
   .u_boot_cmd : { *(.u_boot_cmd) }
   __u_boot_cmd_end = .;

   . = ALIGN(4);
   __bss_start = .;
   .bss : { *(.bss) }
   _end = .;
}

问题1，二进制文件不包含BSS段，那把BSS段放在哪
答：修改有1000个全局变量，难道要BIN里要存1000个0吗？在链接脚本里把BSS段组织在一起，记下它的起始地址、结束地址，重定位后把这块内存清0即可

问题2：全局变量不初始化的话默认初始化为零，干嘛还要手动清零
答：因为它是在BSS段的

bss段：

BSS段（bsssegment）通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文BlockStarted by Symbol的简称。BSS段属于静态内存分配。

data段：

数据段（datasegment）通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

text段：

代码段（codesegment/textsegment）通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定，并且内存区域通常属于只读,某些架构也允许代码段为可写，即允许修改程序。在代码段中，也有可能包含一些只读的常数变量，例如字符串常量等。

rodata段：

存放C中的字符串和#define定义的常量

heap堆：

堆是用于存放进程运行中被动态分配的内存段，它的大小并不固定，可动态扩张或缩减。当进程调用malloc等函数分配内存时，新分配的内存就被动态添加到堆上（堆被扩张）；当利用free等函数释放内存时，被释放的内存从堆中被剔除（堆被缩减）

stack栈：

是用户存放程序临时创建的局部变量，也就是说我们函数括弧“{}”中定义的变量（但不包括static声明的变量，static意味着在数据段中存放变量）。除此以外，在函数被调用时，其参数也会被压入发起调用的进程栈中，并且待到调用结束后，函数的返回值也会被存放回栈中。由于栈的先进先出特点，所以栈特别方便用来保存/恢复调用现场。从这个意义上讲，我们可以把堆栈看成一个寄存、交换临时数据的内存区。

常量段：

常量段一般包含编译器产生的数据（与只读段包含用户定义的只读数据不同）。比如说由一个语句a=2+3编译器把2+3编译期就算出5，存成常量5在常量段中

一般情况下，一个程序本质上都是由 bss段、data段、text段三个组成的——本概念是当前的计算机程序设计中是很重要的一个基本概念。而且在嵌入式系统的设计中也非常重要，牵涉到嵌入式系统运行时的内存大小分配，存储单元占用空间大小的问题。

在采用段式内存管理的架构中（比如intel的80x86系统），bss段（Block Started by Symbol segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域，一般在初始化时bss 段部分将会清零（bss段属于静态内存分配，即程序一开始就将其清零了）。

比如，在C语言程序编译完成之后，已初始化的全局变量保存在.data 段中，未初始化的全局变量保存在.bss 段中。

l text和data段都在可执行文件中（在嵌入式系统里一般是固化在镜像文件中），由系统从可执行文件中加载；

l 而bss段不在可执行文件中，由系统初始化。

编译两个小程序如下：

程序1:

int ar[30000];
void main()
{

......

}

程序2:

int ar[300000] = {1, 2, 3, 4, 5, 6 };
void main()
{

......

}

发现程序2编译之后所得的.exe文件比程序1的要大得多。为什么？

区别很明显，一个位于.bss段，而另一个位于.data段，两者的区别在于：

l 全局的未初始化变量存在于.bss段中，具体体现为一个占位符；全局的已初始化变量存于.data段中；

l 而函数内的自动变量都在栈上分配空间。

l .bss是不占用.exe文件空间的，其内容由操作系统初始化（清零）；

l 而.data却需要占用，其内容由程序初始化，因此造成了上述情况。

注意：

l bss段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。

l data（已手动初始化的数据）段则为数据分配空间，数据保存在目标文件中。

l DATA段包含经过初始化的全局变量以及它们的值。

l BSS段的大小从可执行文件中得到，然后链接器得到这个大小的内存块，紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含DATA和BSS段的整个区段此时通常称为数据区。

原文链接：http://blog.csdn.net/OUYANG_LINUX007/article/details/7448814

=====================================================================================================

在ELF格式的可执行文件中，全局内存包括三种：bss、data和rodata。其它可执行文件格式与之类似。了解了这三种数据的特点，我们才能充分发挥它们的长处，达到速度与空间的最优化。

1、bss(Block Started by Symbol)

bss是指那些没有初始化的和初始化为0的全局变量和静态变量,bss类型的全局变量只占运行时的内存空间，而不占文件空间。

另外，大多数操作系统，在加载程序时，会把所有的bss全局变量全部清零，无需要你手工去清零。

但为保证程序的可移植性，手工把这些变量初始化为0也是一个好习惯。

2、data

与bss相比，data就容易明白多了，它的名字就暗示着里面存放着数据。当然，如果数据全是零，为了优化考虑，编译器把它当作bss处理。通俗的说，data指那些初始化过（非零）的非const的全局变量和静态变量。

由此可见，data类型的全局变量是即占文件空间，又占用运行时内存空间的。

3、rodata

rodata的意义同样明显，ro代表read only，即只读数据(const)。只读数据段，存放常量，字符常量，const常量，据说还存放调试信息。关于rodata类型的数据，要注意以下几点：

常量不一定就放在rodata里，有的立即数直接编码在指令里，存放在代码段(.text)中。

对于字符串常量，编译器会自动去掉重复的字符串，保证一个字符串在一个可执行文件(EXE/SO)中只存在一份拷贝。

rodata是在多个进程间是共享的，这可以提高空间利用率。

在有的嵌入式系统中，rodata放在ROM(如norflash)里，运行时直接读取ROM内存，无需要加载到RAM内存中。

在嵌入式linux系统中，通过一种叫作XIP（就地执行）的技术，也可以直接读取，而无需要加载到RAM内存中。

由此可见，把在运行过程中不会改变的数据设为rodata类型的，是有很多好处的：在多个进程间共享，可以大大提高空间利用率，甚至不占用RAM空间。同时由于rodata在只读的内存页面(page)中，是受保护的，任何试图对它的修改都会被及时发现，这可以帮助提高程序的稳定性。

4、text

通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定，并且内存区域通常属于只读, 某些架构也允许代码段为可写，即允许修改程序。在代码段中，也有可能包含一些只读的常数变量，例如字符串常量等。

5、变量与关键字

static关键字用途太多，以致于让新手模糊。不过，总结起来就有两种作用，改变生命期和限制作用域。如：

修饰inline函数：限制作用域

修饰普通函数：限制作用域

修饰局部变量：改变生命期

修饰全局变量：限制作用域

const 关键字倒是比较明了，用const修饰的变量放在rodata里，字符串默认就是常量。对const，注意以下几点就行了。

指针常量：指向的数据是常量。如 const char* p = “abc”; p指向的内容是常量，但p本身不是常量，你可以让p再指向”123”。

常量指针：指针本身是常量。如：char* const p = “abc”; p本身就是常量，你不能让p再指向”123”。

指针常量 + 常量指针：指针和指针指向的数据都是常量。const char* const p =”abc”; 两者都是常量，不能再修改。

violatile关键字通常用来修饰多线程共享的全局变量和IO内存。告诉编译器，不要把此类变量优化到寄存器中，每次都要老老实实的从内存中读取，因为它们随时都可能变化。这个关键字可能比较生僻，但千万不要忘了它，否则一个错误让你调试好几天也得不到一点线索。

秒客网

编译原理：bss,data,text,rodata,堆,栈,常量段

相关文章