ARM体系 指定代码段地址问题的自我理解

2019-07-13 07:15发布

一直以来对ARM体系结构下    链接器指定代码段的原理与实现方式等搞不太清楚,网上查了很久好像也找不到相关问题,难道高手们都觉得这个问题太简单了?总之是没有找到答案。 近日翻看韦东山老师的《嵌入式Linux 应用开发完全手册》中SDRAM的例子,想了一天,并且试了一下,于是有了下面的一些拙见。 话不多少,直接上例子  汇编部分源码如下 @*************************************************************************
@ File:head.S
@ 功能:设置SDRAM,将程序复制到SDRAM,然后跳到SDRAM继续执行
@************************************************************************* .equ MEM_CTL_BASE, 0x48000000
.equ SDRAM_BASE, 0x30000000 .text
.global _start
_start:
bl disable_watch_dog @ 关闭WATCHDOG,否则CPU会不断重启
bl memsetup @ 设置存储控制器
bl copy_steppingstone_to_sdram @ 复制代码到SDRAM中
ldr pc, =on_sdram @ 跳到SDRAM中继续执行
on_sdram:
ldr sp, =0x34000000 @ 设置堆栈
bl main
halt_loop:
b halt_loop disable_watch_dog:
@ 往WATCHDOG寄存器写0即可
mov r1, #0x53000000
mov r2, #0x0
str r2, [r1]
mov pc, lr @ 返回 copy_steppingstone_to_sdram:
@ 将Steppingstone的4K数据全部复制到SDRAM中去
@ Steppingstone起始地址为0x00000000,SDRAM中起始地址为0x30000000 mov r1, #0
ldr r2, =SDRAM_BASE
mov r3, #4*1024
1:
ldr r4, [r1],#4 @ 从Steppingstone读取4字节的数据,并让源地址加4
str r4, [r2],#4 @ 将此4字节的数据复制到SDRAM中,并让目地地址加4
cmp r1, r3 @ 判断是否完成:源地址等于Steppingstone的未地址?
bne 1b @ 若没有复制完,继续
mov pc, lr @ 返回 memsetup:
@ 设置存储控制器以便使用SDRAM等外设 mov r1, #MEM_CTL_BASE @ 存储控制器的13个寄存器的开始地址
adrl r2, mem_cfg_val @ 这13个值的起始存储地址
add r3, r1, #52 @ 13*4 = 54
1:
ldr r4, [r2], #4 @ 读取设置值,并让r2加4
str r4, [r1], #4 @ 将此值写入寄存器,并让r1加4
cmp r1, r3 @ 判断是否设置完所有13个寄存器
bne 1b @ 若没有写成,继续
mov pc, lr @ 返回
.align 4
mem_cfg_val:
@ 存储控制器13个寄存器的设置值
.long 0x22011110 @ BWSCON
.long 0x00000700 @ BANKCON0
.long 0x00000700 @ BANKCON1
.long 0x00000700 @ BANKCON2
.long 0x00000700 @ BANKCON3
.long 0x00000700 @ BANKCON4
.long 0x00000700 @ BANKCON5
.long 0x00018005 @ BANKCON6
.long 0x00018005 @ BANKCON7
.long 0x008C07A3 @ REFRESH
.long 0x000000B1 @ BANKSIZE
.long 0x00000030 @ MRSRB6
.long 0x00000030 @ MRSRB7
此汇编代码的注释很清楚,简而言之便是从NANDFlash启动CPU后, 先初始化一些必要的硬件 如看门狗 SDRAM ,再把代码复制到SDRAM中(起始地址0x30000000),最后跳到SDRAM中运行。

sdram.bin : head.S leds.c
arm-linux-gcc -g -nostdlib -c -o head.o head.S
arm-linux-gcc -g -nostdlib -c -o leds.o leds.c
arm-linux-ld -Ttext 0x30000000 head.o leds.o -o sdram_elf
arm-linux-objcopy -O binary -S sdram_elf sdram.bin
arm-linux-objdump -D -m arm sdram_elf > sdram.dis
clean:
rm -f sdram.dis sdram.bin sdram_elf *.o
其中leds.c是后面执行的C语言部分,与本文内容关系不大。 由其中第4行可以看出  在此指定了代码段的地址为0x30000000。那是不是就是说我们的代码最开始就是从0x30000000开始运行的呢?为此我们查看此makefile第六行生成的 sdram_elf: file format elf32-littlearm
Disassembly of section .text: 30000000 <_start>:
30000000: eb000005 bl 3000001c
30000004: eb000010 bl 3000004c
30000008: eb000007 bl 3000002c
3000000c: e59ff090 ldr pc, [pc, #144] ; 300000a4 30000010 :
30000010: e3a0d30d mov sp, #872415232 ; 0x34000000
30000014: eb000033 bl 300000e8
30000018 :
30000018: eafffffe b 30000018 3000001c :
3000001c: e3a01453 mov r1, #1392508928 ; 0x53000000
30000020: e3a02000 mov r2, #0 ; 0x0
30000024: e5812000 str r2, [r1]
30000028: e1a0f00e mov pc, lr 3000002c :
3000002c: e3a01000 mov r1, #0 ; 0x0
30000030: e3a02203 mov r2, #805306368 ; 0x30000000
30000034: e3a03a01 mov r3, #4096 ; 0x1000
30000038: e4914004 ldr r4, [r1], #4
3000003c: e4824004 str r4, [r2], #4
30000040: e1510003 cmp r1, r3
30000044: 1afffffb bne 30000038
30000048: e1a0f00e mov pc, lr 3000004c :
3000004c: e3a01312 mov r1, #1207959552 ; 0x48000000
30000050: e28f2018 add r2, pc, #24 ; 0x18
30000054: e1a00000 nop (mov r0,r0)
30000058: e2813034 add r3, r1, #52 ; 0x34
3000005c: e4924004 ldr r4, [r2], #4
30000060: e4814004 str r4, [r1], #4
30000064: e1510003 cmp r1, r3
30000068: 1afffffb bne 3000005c
3000006c: e1a0f00e mov pc, lr 30000070 :
30000070: 22011110 .word 0x22011110
30000074: 00000700 .word 0x00000700
30000078: 00000700 .word 0x00000700
3000007c: 00000700 .word 0x00000700
30000080: 00000700 .word 0x00000700
30000084: 00000700 .word 0x00000700
30000088: 00000700 .word 0x00000700
3000008c: 00018005 .word 0x00018005
30000090: 00018005 .word 0x00018005
30000094: 008c07a3 .word 0x008c07a3
30000098: 000000b1 .word 0x000000b1
3000009c: 00000030 .word 0x00000030
300000a0: 00000030 .word 0x00000030
300000a4: 30000010 .word 0x30000010
300000a8: e1a00000 nop (mov r0,r0)
300000ac: e1a00000 nop (mov r0,r0) 300000b0 :
300000b0: e52db004 push {fp} ; (str fp, [sp, #-4]!)
300000b4: e28db000 add fp, sp, #0 ; 0x0
300000b8: e24dd00c sub sp, sp, #12 ; 0xc
300000bc: e50b0008 str r0, [fp, #-8]
300000c0: ea000002 b 300000d0
300000c4: e51b3008 ldr r3, [fp, #-8]
300000c8: e2433001 sub r3, r3, #1 ; 0x1
300000cc: e50b3008 str r3, [fp, #-8]
300000d0: e51b3008 ldr r3, [fp, #-8]
300000d4: e3530000 cmp r3, #0 ; 0x0
300000d8: 1afffff9 bne 300000c4
300000dc: e28bd000 add sp, fp, #0 ; 0x0
300000e0: e8bd0800 pop {fp}
300000e4: e12fff1e bx lr 300000e8
:
300000e8: e92d4800 push {fp, lr}
300000ec: e28db004 add fp, sp, #4 ; 0x4
300000f0: e24dd008 sub sp, sp, #8 ; 0x8
300000f4: e3a03000 mov r3, #0 ; 0x0
300000f8: e50b3008 str r3, [fp, #-8]
300000fc: e3a03456 mov r3, #1442840576 ; 0x56000000
30000100: e2833010 add r3, r3, #16 ; 0x10
30000104: e3a02b55 mov r2, #87040 ; 0x15400
30000108: e5832000 str r2, [r3]
3000010c: e3a00c75 mov r0, #29952 ; 0x7500
30000110: e2800030 add r0, r0, #48 ; 0x30
30000114: ebffffe5 bl 300000b0
30000118: e3a02456 mov r2, #1442840576 ; 0x56000000
3000011c: e2822014 add r2, r2, #20 ; 0x14
30000120: e51b3008 ldr r3, [fp, #-8]
30000124: e1a03283 lsl r3, r3, #5
30000128: e1e03003 mvn r3, r3
3000012c: e5823000 str r3, [r2]
30000130: e51b3008 ldr r3, [fp, #-8]
30000134: e2833001 add r3, r3, #1 ; 0x1
30000138: e50b3008 str r3, [fp, #-8]
3000013c: e51b3008 ldr r3, [fp, #-8]
30000140: e3530010 cmp r3, #16 ; 0x10
30000144: 1afffff0 bne 3000010c
30000148: e3a03000 mov r3, #0 ; 0x0
3000014c: e50b3008 str r3, [fp, #-8]
30000150: eaffffed b 3000010c
从代码中可以看出代码的地址的确是从0x30000000开始的。问题就来了,我们的NANDFlash地址不是从0x0开始的么?而且学过ARM的的人应该都知道,CPU上电之后都是从 地址0x0处开始取指令,而如今把代码段指定到0x30000000,CPU为什么还可以顺利启动并运行呢? 我的理解是,代码还是被下载到NANDFlash中,上电之后PC从0x0开始取指令,以上面的反汇编文件为例,以下开始的代码还是存在于地址0x0处
30000000: eb000005 bl 3000001c
30000004: eb000010 bl 3000004c
30000008: eb000007 bl 3000002c
3000000c: e59ff090 ldr pc, [pc, #144] ; 300000a4 注:第一列的3000xxxx可以不用看,因为执行的机器码是第二列的内容。
以第一行指令来说明以下  其机器码为0xeb00005 翻译成二进制文件便是 11101011000000000000000000000101 (说明一下 机器码的格式为 [31:28]为条件码  [27:24]位为0b1010时表示 b跳转指令  为0b1011时 表示bl跳转指令 [23:0]表示偏移地址) 【使用b或bl跳转时,吓一条指令的地址是这样计算的:将指令中24位带符号的不嘛扩展为32位(扩展其符号位),将此32位数左移两位;将得到的值加到pc寄存器中,记得到目标地址】---摘自 《嵌入式Linux 应用开发完全手册》P39 第一行指令 的24位带符号补码为0x000005,扩展为32位便是0x00000005 左移两位得到 0x00010100 其值为 0x14 ,PC的值是当前指令的下两条指令的地址0x00000008加上得到的0x00000014,即0x0000001c,即是关闭看门口那条指令。此处易犯的错误是  这行指令第3,4列的 bl 3000001c,注意!这不是说跳到 地址0x3000001c处,绝对地址应按刚才那个步骤计算。 接着在完成了      设置好堆栈之后  程序就应该顺理成章的要在sdram中运行了,这是通过直接向PC赋值实现的 start.S代码中 ldr pc, =on_sdram @ 跳到SDRAM中继续执行 可以看到,它是令 PC 的值等于 标号on_sdram所在的地址  那么这个地址是多少呢,由反汇编代码中可以看到,这个值应为0x30000010  即 PC=0x30000010,可以看出,这 个值在编译的时候就已经定下来了 。  若还不懂  请看下面: 上面代码对应的反汇编为 3000000c: e59ff090 ldr pc, [pc, #144] ; 300000a4 分析如下:即PC = PC+144所在地址的值,这个值等于多少呢? 当前PC = 0x0000000c + 2*4 = 0x00000014  0x14 + 144 = 0x000000a4,这个值在反汇编代码中对应 300000a4: 30000010 .word 0x30000010 即 这个地址上值为 0x30000010。 至此,CPU就可以运行拷贝至SDRAM中的后续代码了。