[转]关于U-BOOT中.balignl 16…

来源:互联网 发布:电力数据网 编辑:程序博客网 时间:2024/06/10 07:45

.balignl 16,0xdeadbeef
首先要弄明白.balignl的意思,这其实应该算是一个伪操作符,伪操作符的意思就是机器码里,并没有一个汇编指令与其对应,是由编译器来实现其功能的。
.balign是意思是:以当前地址为开始开始,找到第一次出现的以第一个参数为整数倍的地址,并将其作为结束地址,
在这个结束地址前面存储一个字节长度的数据,存储内容正是第二个参数。如果当前地址正好是第一个参数的倍数,则没有数据被写入到内存。
.balign 8,0xde这条指令的含义可以用下图表示:




图解:以当前地址为开始开始,找到第一次出现的以8为整数倍的地址,并将其作为结束地址,在这个结束地址前面存储一个字节长度的数据0xde。
如果当前地址正好是8的倍数,则没有数据被写入到内存。
以此类推,.balignw则表示第二个参数存入的内容长度为2字节:
   .balignw 4, 0x368d
因为现在填入的内容为2个字节,那就存在以下几种情况:
   1>当前地址没有偏移就满足了以4为倍数的地址
   2>当前地址偏移了1个字节就满足了以4为倍数的地址
   3>当前地址偏移了2个字节就满足了以4为倍数的地址
   4>当前地址编移了3个字节就满足了以4为倍数的地址
分析一下这四种情况:
   1>当没有偏移的时候,地址中间肯定没有办法填上信息
   2>当偏移1个字节的时候,地址中间空隙不够,所以填入的数值,是末定义,也就是说,填入什么值,不清楚
   3>当偏移2个字节的时候,地址中间的空隙正好填入0x368d两个字节的内容
   4>当偏移3个字节的时候,地址中间的空隙大于所要填的内容。此时填入的数值,是末定义,填入什么值,不清楚
以此类推,.balignl,这个指令用来填与一个字,即4个字节的长度
仔细分析一下就知道,对于.balignl 16,0xdeadbeef,如果想要0xdeadbeef一定填到当前地址后面某个部分,当前地址偏移量就必须为4字节,这样才能保证在任何情况下,偏移的地址所留的空隙刚好填入所要填的内容。

注意:0xdeadbeef是什么意思?
类似这样的值很多,像0xabababab,它们的作用就是为内存做标记,插在那里,就表示从这个位置往后的一段有特殊作用的内存,而这个位置往前,禁止访问。


看了上面转载的博文,算是有豁然开朗了,下面再转一篇博文,是对这条命令进行的验证,算是对上面自己理解的一个实践。

转自:http://www.liweifan.com/2012/01/11/assembly-embedded-system-balignl-arm/

 先将部分代码贴出,来自于uboot-2011.06目录下arch\arm\cpu\arm920t\start.S。

  1.   
  2.   
  3. #include    
  4. #include    
  5. #include    
  6.   
  7.   
  8.   
  9.   
  10. .globl _start  
  11. _start:   start_code  
  12.     ldr pc, _undefined_instruction  
  13.     ldr pc, _software_interrupt  
  14.     ldr pc, _prefetch_abort  
  15.     ldr pc, _data_abort  
  16.     ldr pc, _not_used  
  17.     ldr pc, _irq  
  18.     ldr pc, _fiq  
  19.   
  20. _undefined_instruction: .word undefined_instruction  
  21. _software_interrupt:    .word software_interrupt  
  22. _prefetch_abort:    .word prefetch_abort  
  23. _data_abort:        .word data_abort  
  24. _not_used:      .word not_used  
  25. _irq:           .word irq  
  26. _fiq:           .word fiq  
  27.   
  28.     .balignl 16,0xdeadbeef  

 

 

问题出在58行,.balignl 16,0xdeadbeef,查了以前的笔记得知这是一个伪指令,主要是字节对齐用的。对于某些处理器来说,所编写的代码不对齐并不会报错,但编译器为了优化,也可能会自动帮你对齐。但对于另外一些处理器的编译器来说,汇编代码里必须手动保持对齐,否则编译器会报错,arm处理器就是如此。本着精读的态度,上网查了一下资料,结果花掉了1下午的时间o(︶︿︶)o。。。

balignl有几个“近亲”,具体看下面截图:


四种功能基本相同,不同之处在于填充时的字节数。.align和.balign是1个字节1个字节的填充,.balignw是2个字节2个字节的填充,而.balignl一次填充4个字节。

我们以balignl为例说明,它的完整指令格式为: .balignl {alignment} {,fill} {,max}。

第一个参数alignment为一个正整数,对齐时要以alignment的值的整数倍为结束地址,以当前地址为起始地址,进行字节填充,比如当前地址为20,而alignment的值我们设定为16,那么字节填充自20开始,结束于20后第一个16的倍数地址处,即32处。

第二个参数fill即我们选定的,用来填充的数值。balignl模式下,最大为4字节,不够4字节系统会自动补够4字节,此参数可选,不标则采用默认值0。

第三个参数max也是可选项,默认值为alignment。若对齐时偏移量大于max,则不偏移。同上例,从16--32,偏移量为16,如果max我们设置为8,那么该偏移不进行。

为了能更容易理解,我们实际操作下。

将start.S拷贝至任意目录,保留58行前以及start_code段的代码(大约在117~124行),方便起见,我直接贴出裁剪后的代码:

  1.   
  2.   
  3. #include    
  4. #include    
  5. #include    
  6.   
  7.   
  8.   
  9.   
  10. .globl _start  
  11. _start:   start_code  
  12.     ldr pc, _undefined_instruction  
  13.     ldr pc, _software_interrupt  
  14.     ldr pc, _prefetch_abort  
  15.     ldr pc, _data_abort  
  16.     ldr pc, _not_used  
  17.     ldr pc, _irq  
  18.     ldr pc, _fiq  
  19.   
  20. _undefined_instruction: .word undefined_instruction  
  21. _software_interrupt:    .word software_interrupt  
  22. _prefetch_abort:    .word prefetch_abort  
  23. _data_abort:        .word data_abort  
  24. _not_used:      .word not_used  
  25. _irq:           .word irq  
  26. _fiq:           .word fiq  
  27.   
  28.     .balignl 16,0xdeadbeef  
  29.   
  30. start_code:   
  31.       
  32.     mrs r0, cpsr  
  33.     bic r0, r0, #0x1f  
  34.     orr r0, r0, #0xd3  
  35.     msr cpsr, r0  

 

OK,首先我们将58行屏蔽掉,然后在59行添加代码:

58:  @.balignl 16,0xdeadbeef

59:  .byte 0x11

保存后,用linux上的交叉编译器来编译下,看看什么效果:

eleven@eleven-desktop:~/workspace$ arm-linux-as start.S -o start.o

start.S: Assembler messages:

start.S:41: Error: misaligned branch destination

提示边界对齐出错,这说明arm编译器没有自动帮我们对齐。添加的 .byte 0x11只占用了1字节,导致其后的全部指令地址都没有对齐,而arm的指令要求32位对齐,不然无法寻址。所以41行处跳转去start_code时出现了问题,start_code此时的存储地址不是4字节的整数倍,当然无法寻址了。

要解决这个问题,这里我们就需要手动对齐了。在59行后添加如下代码:

.align 4,0x12

保存后再编译就顺利通过了。为了能更清楚知道它的作用,我们来看看反汇编代码:

  1. eleven@eleven-desktop:~/workspace$ arm-linux-objdump -d start.o  
  2.   
  3. start.o:     file format elf32-littlearm  
  4.   
  5. Disassembly of section .text:  
  6.   
  7. 00000000 <_start>:  
  8.    0:   ea00000e              40   
  9.    4:   e59ff014        ldr     pc, [pc, #20]   20 <_undefined_instruction>  
  10.    8:   e59ff014        ldr     pc, [pc, #20]   24 <_software_interrupt>  
  11.    c:   e59ff014        ldr     pc, [pc, #20]   28 <_prefetch_abort>  
  12.   10:   e59ff014        ldr     pc, [pc, #20]   2c <_data_abort>  
  13.   14:   e59ff014        ldr     pc, [pc, #20]   30 <_not_used>  
  14.   18:   e59ff014        ldr     pc, [pc, #20]   34 <_irq>  
  15.   1c:   e59ff014        ldr     pc, [pc, #20]   38 <_fiq>  
  16.   
  17. 00000020 <_undefined_instruction>:  
  18.   20:   00000000        .word   0x00000000  
  19.   
  20. 00000024 <_software_interrupt>:  
  21.   24:   00000000        .word   0x00000000  
  22.   
  23. 00000028 <_prefetch_abort>:  
  24.   28:   00000000        .word   0x00000000  
  25.   
  26. 0000002c <_data_abort>:  
  27.   2c:   00000000        .word   0x00000000  
  28.   
  29. 00000030 <_not_used>:  
  30.   30:   00000000        .word   0x00000000  
  31.   
  32. 00000034 <_irq>:  
  33.   34:   00000000        .word   0x00000000  
  34.   
  35. 00000038 <_fiq>:  
  36.   38:   00000000        .word   0x00000000  
  37.   3c:   121212ee        .word   0x121212ee  
  38.   
  39. 00000040  
  40.   40:   e10f0000        mrs     r0, CPSR  
  41.   44:   e3c0001f        bic     r0, r0, #31     0x1f  
  42.   48:   e38000d3        orr     r0, r0, #211    0xd3  
  43.   4c:   e129f000        msr     CPSR_fc, r0  

仔细看37行处,align4,0x12的作用体现出来了吧?为了能够4字节对齐,添加了0x121212共3字节,这样就保证了start_code开始处的地址为4字节的倍数。

接下来我们将刚刚添加的代码删除掉,恢复至start.S刚裁剪完后的状态(不要忘记将58行处的屏蔽去掉)。之后做如下改动(红色部分为改动部位):

  1. .globl _start      //不占用内存空间   
  2. _start:   start_code       //占用4字节   
  3.     ldr pc, _undefined_instruction     //占用4字节    
  4.     ldr pc, _software_interrupt      //占用4字节   
  5.     ldr pc, _prefetch_abort      //占用4字节   
  6.     ldr pc, _data_abort      //占用4字节   
  7.     ldr pc, _not_used      //占用4字节   
  8.     ldr pc, _irq      //占用4字节   
  9.    ldr pc, _fiq    //屏蔽掉了,这里不再占用内存     
  10.        
  11. _undefined_instruction: .word undefined_instruction      //占用4字节   
  12. _software_interrupt:    .word software_interrupt      //占用4字节   
  13. _prefetch_abort:    .word prefetch_abort      //占用4字节   
  14. _data_abort:        .word data_abort      //占用4字节   
  15. _not_used:      .word not_used      //占用4字节   
  16. _irq:           .word irq      //占用4字节   
  17. @_fiq:           .word fiq   //屏蔽掉了,这里同样不占用内存     
  18.        
  19.     .balignl 16,0xdeadbeef      

上面一共占用内存为 4字节x7 + 4字节x6 =52字节。离52最近的16的整数倍地址为64,中间差了12个字节,对齐时需要填充3次的0xdeadbeef,下面我们验证下,看推断对不对。

编译之后再进行反汇编,有如下显示:

  1. eleven@eleven-desktop:~/workspace$ arm-linux-objdump -d start.o  
  2.   
  3. start.o:     file format elf32-littlearm  
  4.   
  5. Disassembly of section .text:  
  6.   
  7. 00000000 <_start>:  
  8.    0:   ea00000e              40   
  9.    4:   e59ff010        ldr     pc, [pc, #16]   1c <_undefined_instruction>  
  10.    8:   e59ff010        ldr     pc, [pc, #16]   20 <_software_interrupt>  
  11.    c:   e59ff010        ldr     pc, [pc, #16]   24 <_prefetch_abort>  
  12.   10:   e59ff010        ldr     pc, [pc, #16]   28 <_data_abort>  
  13.   14:   e59ff010        ldr     pc, [pc, #16]   2c <_not_used>  
  14.   18:   e59ff010        ldr     pc, [pc, #16]   30 <_irq>  
  15.   
  16. 0000001c <_undefined_instruction>:  
  17.   1c:   00000000        .word   0x00000000  
  18.   
  19. 00000020 <_software_interrupt>:  
  20.   20:   00000000        .word   0x00000000  
  21.   
  22. 00000024 <_prefetch_abort>:  
  23.   24:   00000000        .word   0x00000000  
  24.   
  25. 00000028 <_data_abort>:  
  26.   28:   00000000        .word   0x00000000  
  27.   
  28. 0000002c <_not_used>:  
  29.   2c:   00000000        .word   0x00000000  
  30.   
  31. 00000030 <_irq>:  
  32.   30:   00000000        .word   0x00000000  
  33.   34:   deadbeef        .word   0xdeadbeef  
  34.   38:   deadbeef        .word   0xdeadbeef  
  35.   3c:   deadbeef        .word   0xdeadbeef  
  36.   
  37. 00000040  
  38.   40:   e10f0000        mrs     r0, CPSR  
  39.   44:   e3c0001f        bic     r0, r0, #31     0x1f  
  40.   48:   e38000d3        orr     r0, r0, #211    0xd3  
  41.   4c:   e129f000        msr     CPSR_fc, r0  

.balignl 16,0xdeadbeef的作用体现出来了,注意看红色部分,与我们的推断相吻合。


网上查阅,找到了两种答案:

1.类似这样的值很多,像0xabababab,它们的作用就是为内存做标记,插在那里,就表示从这个位置往后的一段有特殊作用的内存,而这个位置往前,禁止访问。

2.正如deadbeef一样,其实是作者故意搞笑,无任何实际意义。

0 0