STM32 大小端模式 与 堆栈及其增长方向分析

2019-07-21 02:30发布

wx3 (1).png
栈增长和大端/小端问题是和CPU相关的两个问题.

1,首先来看:栈(STACK)的问题.

函数的局部变量,都是存放在"栈"里面,栈的英文是:STACK.STACK的大小,我们可以在stm32的启动文件里面设置,以战舰stm32开发板为例,在startup_stm32f10x_hd.s里面,开头就有:

Stack_Size      EQU     0x00000800

表示栈大小是0X800,也就是2048字节.这样,CPU处理任务的时候,函数局部变量做多可占用的大小就是:2048字节,注意:是所有在处理的函数,包括函数嵌套,递归,等等,都是从这个"栈"里面,来分配的.
所以,如果一个函数的局部变量过多,比如在函数里面定义一个u8 buf[512],这一下就占了1/4的栈大小了,再在其他函数里面来搞两下,程序崩溃是很容易的事情,这时候,一般你会进入到hardfault....
这是初学者非常容易犯的一个错误.切记不要在函数里面放N多局部变量,尤其有大数组的时候!

对于栈区,一般栈顶,也就是MSP,在程序刚运行的时候,指向程序所占用内存的最高地址.比如附件里面的这个程序序,内存占用如下图:
图中,我们可以看到,程序总共占用内存:20+2348字节=2368=0X940
那么程序刚开始运行的时候:MSP=0X2000 0000+0X940=0X2000 0940.
事实上,也是如此,如图:
图中,MSP就是:0X2000 0940.
程序运行后,MSP就是从这个地址开始,往下给函数的局部变量分配地址.

再说说栈的增长方向,我们可以用如下代码测试:

//保存栈增长方向
//0,向下增长;1,向上增长.
static u8 stack_dir;

//查找栈增长方向,结果保存在stack_dir里面.
void find_stack_direction(void)
{
    static u8 *addr=NULL; //用于存放第一个dummy的地址。
    u8 dummy;               //用于获取栈地址
    if(addr==NULL)    //第一次进入
    {                         
        addr=&dummy;     //保存dummy的地址
        find_stack_direction ();  //递归
    }else                //第二次进入
 {  
        if(&dummy>addr)stack_dir=1; //第二次dummy的地址大于第一次dummy,那么说明栈增长方向是向上的.
        else stack_dir=0;           //第二次dummy的地址小于第一次dummy,那么说明栈增长方向是向下的. 
 }
}

这个代码不是我写的,网上抄来的,思路很巧妙,利用递归,判断两次分配给dummy的地址,来比较栈是向下生长,还是向上生长.
如果你在STM32测试这个函数,你会发现,STM32的栈,是向下生长的.事实上,一般CPU的栈增长方向,都是向下的.

2,再来说说,堆(HEAP)的问题.

全局变量,静态变量,以及内存管理所用的内存,都是属于"堆"区,英文名:"HEAP"
与栈区不同,堆区,则从内存区域的起始地址,开始分配给各个全局变量和静态变量.
堆的生长方向,都是向上的.在程序里面,所有的内存分为:堆+栈. 只是他们各自的起始地址和增长方向不同,他们没有一个固定的界限,所以一旦堆栈冲突,系统就到了崩溃的时候了.
同样,我们用附件里面的例程测试:


stack_dir的地址是0X20000004,也就是STM32的内存起始端的地址.
这里本来应该是从0X2000 0000开始分配的,但是,我仿真发现0X2000 0000总是存放:0X2000 0398,这个值,貌似是MSP,但是又不变化,还请高手帮忙解释下.
其他的,全局变量,则依次递增,地址肯定大于0X20000004,比如cpu_endian的地址就是0X20000005.
这就是STM32内部堆的分配规则.

3,再说说,大小端的问题.
大端模式:低位字节存在高地址上,高位字节存在低地址上
小端模式:高位字节存在高地址上,低位字节存在低地址上

STM32属于小端模式,简单的说,比如u32 temp=0X12345678;
假设temp地址在0X2000 0010.
那么在内存里面,存放就变成了:
地址              |            HEX         |
0X2000 0010  |  78   56   43  12  |

CPU到底是大端还是小端,可以通过如下代码测试:
//CPU大小端
//0,小端模式;1,大端模式.
static u8 cpu_endian;

//获取CPU大小端模式,结果保存在cpu_endian里面
void find_cpu_endian(void)
{
 int x=1;
 if(*(char*)&x==1)cpu_endian=0; //小端模式
 else cpu_endian=1;    //大端模式 
}
以上测试,在STM32上,你会得到cpu_endian=0,也就是小端模式.


3,最后说说,STM32内存的问题.
    还是以附件工程为例,在前面第一个图,程序总共占用内存:20+2348字节,这么多内存,到底是怎么得来的呢?
我们可以双击Project侧边栏的:Targt1,会弹出test.map,在这个里面,我们就可以清楚的知道这些内存到底是怎么来的了.在这个test.map最后,Image 部分有:
==============================================================================
Image component sizes
      Code (inc. data)   RO Data    RW Data    ZI Data      Debug   Object Name        172         10          0          4          0        995   delay.o//delay.c里面,fac_us和fac_ms,共占用4字节
       112         12          0          0          0        427   led.o
        72         26        304          0       2048        828   startup_stm32f10x_hd.o  //启动文件,里面定义了Stack_Size为0X800,所以这里是2048.
       712         52          0          0          0       2715   sys.o
       348        154          0          6          0     208720   test.o//test.c里面,stack_dir和cpu_endian 以及*addr  ,占用6字节.
       384         24          0          8        200       3050   usart.o//usart.c定义了一个串口接收数组buffer,占用200字节.     ----------------------------------------------------------------------
      1800        278        336         20       2248     216735   Object Totals //总共2248+20字节
         0          0         32          0          0          0   (incl. Generated)
         0          0          0          2          0          0   (incl. Padding)//2字节用于对其     ----------------------------------------------------------------------       Code (inc. data)   RO Data    RW Data    ZI Data      Debug   Library Member Name          8          0          0          0          0         68   __main.o
       104          0          0          0          0         84   __printf.o
        52          8          0          0          0          0   __scatter.o
        26          0          0          0          0          0   __scatter_copy.o
        28          0          0          0          0          0   __scatter_zi.o
        48          6          0          0          0         96   _printf_char_common.o
        36          4          0          0          0         80   _printf_char_file.o
        92          4         40          0          0         88   _printf_hex_int.o
       184          0          0          0          0         88   _printf_intcommon.o
         0          0          0          0          0          0   _printf_percent.o
         4          0          0          0          0          0   _printf_percent_end.o
         6          0          0          0          0          0   _printf_x.o
        12          0          0          0          0         72   exit.o
         8          0          0          0          0         68   ferror.o
         6          0          0          0          0        152   heapauxi.o
         2          0          0          0          0          0   libinit.o
         2          0          0          0          0          0   libinit2.o
         2          0          0          0          0          0   libshutdown.o
         2          0          0          0          0          0   libshutdown2.o
         8          4          0          0         96         68   libspace.o          //库文件(printf使用),占用了96字节
        24          4          0          0          0         84   noretval__2printf.o
         0          0          0          0          0          0   rtentry.o
        12          0          0          0          0          0   rtentry2.o
         6          0          0          0          0          0   rtentry4.o
         2          0          0          0          0          0   rtexit.o
        10          0          0          0          0          0   rtexit2.o
        74          0          0          0          0         80   sys_stackheap_outer.o
         2          0          0          0          0         68   use_no_semi.o
         2          0          0          0          0         68   use_no_semi_2.o
       450          8          0          0          0        236   faddsub_clz.o
       388         76          0          0          0         96   fdiv.o
        62          4          0          0          0         84   ffixu.o
        38          0          0          0          0         68   fflt_clz.o
       258          4          0          0          0         84   fmul.o
       140          4          0          0          0         84   fnaninf.o
        10          0          0          0          0         68   fretinf.o
         0          0          0          0          0          0   usenofp.o     ----------------------------------------------------------------------
      2118        126         42          0        100       1884   Library Totals  //调用的库用了100字节.
        10          0          2          0          4          0   (incl. Padding)   //用于对其多占用了4个字节     ----------------------------------------------------------------------       Code (inc. data)   RO Data    RW Data    ZI Data      Debug   Library Name        762         30         40          0         96       1164   c_w.l
      1346         96          0          0          0        720   fz_ws.l     ----------------------------------------------------------------------
      2118        126         42          0        100       1884   Library Totals     ---------------------------------------------------------------------- ==============================================================================
      Code (inc. data)   RO Data    RW Data    ZI Data      Debug         3918        404        378         20       2348     217111   Grand Totals
      3918        404        378         20       2348     217111   ELF Image Totals
      3918        404        378         20          0          0   ROM Totals ==============================================================================     Total RO  Size (Code + RO Data)                 4296 (   4.20kB)
    Total RW  Size (RW Data + ZI Data)              2368 (   2.31kB)   //总共占用:2248+20+100=2368.
    Total ROM Size (Code + RO Data + RW Data)       4316 (   4.21kB) ==============================================================================

通过这个文件,我们就可以分析整个内存,是怎么被占用的,具体到每个文件,占用多少.一目了然了.

4,最后,看看整个测试代码:
main.c代码如下,工程见附件.
#include "sys.h"
#include "usart.h"  
#include "delay.h" 
#include "led.h"
#include "beep.h"   
#include "key.h"   
//ALIENTEK战舰STM32开发板堆栈增长方向以及CPU大小端测试 //保存栈增长方向
//0,向下增长;1,向上增长.
static u8 stack_dir; //CPU大小端
//0,小端模式;1,大端模式.
static u8 cpu_endian;  
//查找栈增长方向,结果保存在stack_dir里面.
void find_stack_direction(void)
{
    static u8 *addr=NULL; //用于存放第一个dummy的地址。
    u8 dummy;               //用于获取栈地址
    if(addr==NULL)    //第一次进入
    {                         
        addr=&dummy;     //保存dummy的地址
        find_stack_direction ();  //递归
    }else                //第二次进入
 {  
        if(&dummy>addr)stack_dir=1; //第二次dummy的地址大于第一次dummy,那么说明栈增长方向是向上的.
        else stack_dir=0;           //第二次dummy的地址小于第一次dummy,那么说明栈增长方向是向下的. 
 }
}
//获取CPU大小端模式,结果保存在cpu_endian里面
void find_cpu_endian(void)
{
 int x=1;
 if(*(char*)&x==1)cpu_endian=0; //小端模式
 else cpu_endian=1;    //大端模式 
}
int main(void)
{   
 Stm32_Clock_Init(9); //系统时钟设置
 uart_init(72,9600);   //串口初始化为9600
 delay_init(72);       //延时初始化
 LED_Init();      //初始化与LED连接的硬件接口 
    printf("stack_dir:%x ",&stack_dir);
    printf("cpu_endian:%x ",&cpu_endian);
 
 find_stack_direction(); //获取栈增长方式
 find_cpu_endian();  //获取CPU大小端模式
  while(1)
 {
  if(stack_dir)printf("STACK DIRCTION:向上生长 ");
  else printf("STACK DIRCTION:向下生长 ");
  if(cpu_endian)printf("CPU ENDIAN:大端模式 ");
  else printf("CPU ENDIAN:小端模式 ");
  delay_ms(500);
  LED0=!LED0; 
 } 
}
测试结果如图:





 
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
49条回答
电子狼
1楼-- · 2019-07-21 19:45
回复【4楼】正点原子:
---------------------------------
我靠,分析的如此透彻,我都不敢看了,佩服
Julius007
2楼-- · 2019-07-21 22:21
非常棒的理解方式。
shihantu
3楼-- · 2019-07-21 23:47
 精彩回答 2  元偷偷看……
barryzxy
4楼-- · 2019-07-22 03:47
大端模式:高位字节存在高地址上,低位字节存在低地址上
小端模式:低位字节存在高地址上,高位字节存在低地址上 

这个定义是错误的写反了

http://baike.baidu.com/link?url=NvqoEub077HLSI62HipOCDo1jOyZRHIFi8S2L2AVLOzbeaXyRpSgDu_DCPJvdLMFHkiv2y-qqZ8vw-lT3J5zNa

xouou_53320
5楼-- · 2019-07-22 09:26
 精彩回答 2  元偷偷看……
shihantu
6楼-- · 2019-07-22 11:49
回复【楼主位】正点原子:
---------------------------------
全局变量,静态变量,以及内存管理所用的内存,都是属于"堆"区,英文名:"HEAP"
与栈区不同,堆区,则从内存区域的起始地址,开始分配给各个全局变量和静态变量.
堆的生长方向,都是向上的.在程序里面,所有的内存分为:堆+栈. 只是他们各自的起始地址和增长方向不同,他们没有一个固定的界限,所以一旦堆栈冲突,系统就到了崩溃的时候了.
同样,我们用附件里面的例程测试:

stack_dir的地址是0X20000004,也就是STM32的内存起始端的地址.
这里本来应该是从0X2000 0000开始分配的,但是,我仿真发现0X2000 0000总是存放:0X2000 0398,这个值,貌似是MSP,但是又不变化,还请高手帮忙解释下.
其他的,全局变量,则依次递增,地址肯定大于0X20000004,比如cpu_endian的地址就是0X20000005.
这就是STM32内部堆的分配规则.
-----------------------------------------------------------------------
这里可能被测试代码误导了,见6L的说明.

在<这个链接器>里,堆空间并不是在内存起始空间开始的.7L的介绍也不完整.

见例子里的<test.map>line:430...434,堆和栈的<标号>地址是同一个位置,但实际上是编译器把堆和栈放在一起.由于7L链接讨论的原因,默认没有任何机制可以检查栈是否溢出.如果栈溢出,首先会破坏堆,然后再破坏静态变量,最后突破静态变量就会进入非内存区,此时将触发数据访问错误.

但是,单单有上面的错误是不行的,比如很多例子,只要稍微减少栈的用量就<好像>不会进hardfault,但实际上静态变量还是可能出现局部破坏,这种错误很隐蔽,即使调试也只是发现变量无端被修改,但找不到被<哪段代码>修改了,即使使用<内存访问断点>,也只是查到进入某个函数的<汇编代码过程中>出现修改,这即使对有一定经验的人员来看也是很郁闷的.

当然,如果使用了堆空间,那问题会比较快发现,但也是<发现>而已.

广告:7L的链接是发现并可靠确认栈溢出的方法之一.

堆没有增长方向一说,它是由程序动态分配的,比如LZ的<内存管理示例>,就是自己创建一个自己管理的堆,或者是编译器自己不开源的堆管理器.

堆和栈都是用来放置<动态变量>的内存区域,它们都是先占一些内存,然后谁用就给谁,用完了还回来的机制.如7L所述,堆用于管理<全局动态变量>,由具体的代码管理,栈用于管理<局部动态变量>,有具体的汇编指令通过硬件分配.

静态变量和局部动态变量的分配顺序,本身并没有规范,只是链接器一般设计是顺序分配,用户也可以通过预编译字和分散加载文件调整分配顺序.堆的分配,依据堆管理算法而定,由于有碎片抑制等算法,可以认为是乱序分配.如pony279的例子,还可以在分配后动态调整.

一周热门 更多>