嵌入式Linux&Java for ARM

嵌入式

嵌入式Linux&Java for ARM

2019-07-12 15:01发布生成海报

站内文章 / 嵌入式Linux

13256 0

首先需要了解一些概念：
浮点运算是指浮点数参与的运算，因为无法精确表示而进行近似或舍入。浮点运算就是实数运算，因为计算机只能存储整数，所以实数都是约数，这样浮点运算是很慢的而且会有误差。假如一台机器是32位的，32位都用来表示整数的话，那么对于无符号整数就是0到2^32-1，对于有符号的话就是-2^31到2^31-1。
浮点运算单元是专用于浮点运算的处理单元，以前的FPU是一种单独芯片，在486之后，英特尔把FPU集成在CPU之内。
VFP (Vector Floating Point)从ARMv5开始，就有可选的 VFP模块，当然如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以配置成不带VFP的模式供芯片厂商选择。VFP经过若干年的发展，有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16（只使用16个浮点寄存器，默认为32个）和VFPv3+NEON (如大多数的Cortex-A8芯片)。对于包含NEON的ARM芯片，NEON一般和VFP共用寄存器。

硬浮点Hard-float
编译器将代码直接编译成发射给硬件浮点协处理器（浮点运算单元FPU）去执行。FPU通常有一套额外的寄存器来完成浮点参数传递和运算。

软浮点 Soft-float
编译器把浮点运算转换成浮点运算的函数调用和库函数调用，没有FPU的指令调用，也没有浮点寄存器的参数传递。浮点参数的传递也是通过ARM寄存器或者堆栈完成。现在的Linux系统默认编译选择使用hard-float，即使系统没有任何浮点处理器单元，这就会产生非法指令和异常。因而一般的系统镜像都采用软浮点以兼容没有VFP的处理器。

armel和armhf ABI
在armel中，关于浮点数计算的约定有三种。以gcc为例，对应的-mfloat-abi参数值有三个：soft,softfp,hard。
soft是指所有浮点运算全部在软件层实现，效率当然不高，会存在不必要的浮点到整数、整数到浮点的转换，只适合于早期没有浮点计算单元的ARM处理器；softfp是目前armel的默认设置，它将浮点计算交给FPU处理，但函数参数的传递使用通用的整型寄存器而不是FPU寄存器；
hard则使用FPU浮点寄存器将函数参数传递给FPU处理。
需要注意的是，在兼容性上，soft与后两者是兼容的，但softfp和hard两种模式不兼容。默认情况下，armel使用softfp，因此将hard模式的armel单独作为一个abi，称之为armhf。而使用hard模式，在每次浮点相关函数调用时，平均能节省20个CPU周期。对ARM这样每个周期都很重要的体系结构来说，这样的提升无疑是巨大的。在完全不改变源码和配置的情况下，在一些应用程序上，使用armhf能得到20%——25%的性能提升。对一些严重依赖于浮点运算的程序，更是可以达到300%的性能提升。

Soft-float和hard-float的编译选项
kernel、rootfs和app编译的时候，指定的必须保持一致才行。
在CodeSourcery gcc的编译参数上，使用-mfloat-abi=name来指定浮点运算处理方式。-mfpu=name来指定浮点协处理的类型。可选类型如fpa，fpe2，fpe3，maverick，vfp，vfpv3，vfpv3-fp16，vfpv3-d16，vfpv3-d16-fp16，vfpv3xd，vfpv3xd-fp16，neon，neon-fp16，vfpv4，vfpv4-d16，fpv4-sp-d16，neon-vfpv4等。使用-mfloat-abi=hard (等价于-mhard-float) -mfpu=vfp来选择编译成硬浮点。使用-mfloat-abi=softfp就能兼容带VFP的硬件以及soft-float的软件实现，运行时的连接器ld.so会在执行浮点运算时对于运算单元的选择，是直接的硬件调用还是库函数调用，是执行/lib还是/lib/vfp下的libm。-mfloat-abi=soft （等价于-msoft-float）直接调用软浮点实现库。

armhf的开启需要硬件的支持，在Debian的wiki上要求ARMv7 CPU、Thumb-2指令集以及VFP3D16浮点处理器。
在gcc的编译参数上，使用-mfloat-abi=hard -mfpu=vfp即可。
在工具上，CodeSourcery最早支持hard模式。或者，也可已自己编译工具链。

ARM的Jazelle技术使Java加速得到比基于软件的Java虚拟机(JVM)高得多的性能，和同等的非Java加速核相比功耗降低80%。CPU功能上增加DSP指令集提供增强的16位和32位算术运算能力，提高了性能和灵活性。ARM微处理器的在较新的体系结构中支持两种指令集：ARM指令集和Thumb指令集。其中，ARM指令为32位的长度，Thumb指令为16位长度。Thumb指令集为ARM指令集的功能子集，但与等价的ARM代码相比较，可节省30%～40%以上的存储空间，同时具备32位代码的所有优点。

体系结构
1 CISC（Complex　Instruction　Set　Computer，复杂指令集计算机）
在CISC指令集的各种指令中，大约有20%的指令会被反复使用，占整个程序代码的80%。而余下的80%的指令却不经常使用，在程序设计中只占20%。
2 RISC（Reduced　Instruction　Set　Computer，精简指令集计算机）
RISC结构优先选取使用频最高的简单指令，避免复杂指令；将指令长度固定，指令格式和寻地方式种类减少；以控制逻辑为主，不用或少用微码控制等。

ARM和Intel处理器的第一个区别是，前者使用精简指令集（RISC），而后者使用复杂指令集（CISC)。

了解了以上那些概念，其实真正将Java虚拟机移植到arm上很简单，主要是出现一些问题就可能要参考上述那些概念了，可能要做一些小的修改。直接去Oracle官网下载arm版本的JDK，解压后拷贝到嵌入式Linux操作系统中，一般是eMMC或SD卡上。然后配置一下环境变量就可以了，可以在系统profile文件中进行配置，如果每次系统重启profile文件又变回原来的样子的话，可以在系统启动初始化脚本文件中进行设置。
export JAVA_HOME=/run/media/mmcblk0p1/jdk1.8.0_131
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH

参考链接：http://www.th7.cn/system/lin/201507/122029.shtml http://www.veryarm.com/872.html

嵌入式Linux&Java for ARM

Ta的文章更多 >>

热门文章

嵌入式Linux&Java for ARM

Ta的文章 更多 >>

热门文章

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

Ta的文章更多 >>