bss段和数据段

原文:http://blog.csdn.net/qq429205464/article/details/7681326


可执行程序包括BSS段、数据段、代码段(也称文本段)。 BSS(Block Started by Symbol)通常是指用来存放程序中未初始化的全局变量和静态变量的一块内存区域。 注意和数据段的区别,BSS存放的是未初始化的全局变量和静态变量,数据段存放的是初始化后的全局变量和静态变量。 UNIX下可使用size命令查看可执行文件的段大小信息。如size a.out。

  在采用段式内存管理的架构中(比如intel的80x86系统),bss段(Block Started by Symbol segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域,一般在初始化时bss 段部分将会清零。bss段属于静态内存分配,即程序一开始就将其清零了。

比如,在C语言之类的程序编译完成之后,已初始化的全局变量保存在.data 段中,未初始化的全局变量保存在.bss 段中。
在《Programming ground up》里对.bss的解释为:There is another section called the .bss. This section is like the data section, except that it doesn’t take up space in the executable.
text和data段都在可执行文件中(在嵌入式系统里一般是固化在镜像文件中),由系统从可执行文件中加载;而bss段不在可执行文件中,由系统初始化。 http://blog.csdn.net/bobocheng1231/archive/2008/02/23/2115289.aspx 【例一】 用cl编译两个小程序如下: 程序1: int ar[30000]; void main() { ...... }  程序2: int ar[300000] = {1, 2, 3, 4, 5, 6 }; void main() { ...... }  发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/FAs编译选项来查看了一下其各自的.asm,发现在程序1.asm中ar的定义如下: _BSS SEGMENT ?ar@@3PAHA DD 0493e0H DUP (?) ; ar _BSS ENDS  而在程序2.asm中,ar被定义为: _DATA SEGMENT ?ar@@3PAHA DD 01H ; ar DD 02H DD 03H ORG $+1199988 _DATA ENDS  区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。 【例二】 编译如下程序(test.cpp): #include <stdio.h> #define LEN 1002000 int inbss[LEN]; float fA; int indata[LEN]={1,2,3,4,5,6,7,8,9}; double dbB = 100.0; const int cst = 100; int main(void) { int run[100] = {1,2,3,4,5,6,7,8,9}; for(int i=0; i<LEN; ++i) printf("%d ", inbss[i]); return 0; } 命令:cl /FA test.cpp 回车 (/FA:产生汇编代码) 产生的汇编代码(test.asm): TITLE test.cpp .386P include listing.inc if @Version gt 510 .model FLAT else _TEXT SEGMENT PARA USE32 PUBLIC 'CODE' _TEXT ENDS _DATA SEGMENT DWORD USE32 PUBLIC 'DATA' _DATA ENDS CONST SEGMENT DWORD USE32 PUBLIC 'CONST' CONST ENDS _BSS SEGMENT DWORD USE32 PUBLIC 'BSS' _BSS ENDS _TLS SEGMENT DWORD USE32 PUBLIC 'TLS' _TLS ENDS FLAT GROUP _DATA, CONST, _BSS ASSUME CS: FLAT, DS: FLAT, SS: FLAT endif PUBLIC ?inbss@@3PAHA ; inbss PUBLIC ?fA@@3MA ; fA PUBLIC ?indata@@3PAHA ; indata PUBLIC ?dbB@@3NA ; dbB _BSS SEGMENT ?inbss@@3PAHA DD 0f4a10H DUP (?) ; inbss ?fA@@3MA DD 01H DUP (?) ; fA _BSS ENDS _DATA SEGMENT ?indata@@3PAHA DD 01H ; indata DD 02H DD 03H DD 04H DD 05H DD 06H DD 07H DD 08H DD 09H ORG $+4007964 ?dbB@@3NA DQ 04059000000000000r ; 100 ; dbB _DATA ENDS PUBLIC _main EXTRN _printf:NEAR _DATA SEGMENT $SG537 DB '%d ', 00H _DATA ENDS _TEXT SEGMENT _run$ = -400 _i$ = -404 _main PROC NEAR ; File test.cpp ; Line 13 push ebp mov ebp, esp sub esp, 404 ; 00000194H push edi ; Line 14 mov DWORD PTR _run$[ebp], 1 mov DWORD PTR _run$[ebp+4], 2 mov DWORD PTR _run$[ebp+8], 3 mov DWORD PTR _run$[ebp+12], 4 mov DWORD PTR _run$[ebp+16], 5 mov DWORD PTR _run$[ebp+20], 6 mov DWORD PTR _run$[ebp+24], 7 mov DWORD PTR _run$[ebp+28], 8 mov DWORD PTR _run$[ebp+32], 9 mov ecx, 91 ; 0000005bH xor eax, eax lea edi, DWORD PTR _run$[ebp+36] rep stosd ; Line 15 mov DWORD PTR _i$[ebp], 0 jmp SHORT $L534 $L535: mov eax, DWORD PTR _i$[ebp] add eax, 1 mov DWORD PTR _i$[ebp], eax $L534: cmp DWORD PTR _i$[ebp], 1002000 ; 000f4a10H jge SHORT $L536 ; Line 16 mov ecx, DWORD PTR _i$[ebp] mov edx, DWORD PTR ?inbss@@3PAHA[ecx*4] push edx push OFFSET FLAT:$SG537 call _printf add esp, 8 jmp SHORT $L535 $L536: ; Line 17 xor eax, eax ; Line 18 pop edi mov esp, ebp pop ebp ret 0 _main ENDP _TEXT ENDS END ---------------------------------------- 通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段) 若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。 说明了: bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。 data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。 数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到 ,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。 http://www.w3china.org/blog/more.asp?name=FoxWolf&id=29997

相关文章
相关标签/搜索