关于STM32操作IO口速度的问题

2019-08-11 19:09发布

1. 目前在项目中,由于对代码执行速度有较高的要求,在编写程序时,用了原子哥的模板SYSTEM文件夹,对此在操作IO的时候使用了PAout(1)操作,我看了这个操作是采用以下方式:
[mw_shl_code=c,true]#define BITBAND(addr, bitnum) ((addr & 0xF0000000)+0x2000000+((addr &0xFFFFF)<<5)+(bitnum<<2))
#define MEM_ADDR(addr)  *((volatile unsigned long  *)(addr))
#define BIT_ADDR(addr, bitnum)   MEM_ADDR(BITBAND(addr, bitnum))
//IO口地址映射
#define GPIOA_ODR_Addr    (GPIOA_BASE+20) //0x40020014[/mw_shl_code]
即采用了移位运算,也就是相当于这里用了运算符操作。
还有一种方式是采用HAL库函数的读写,直接调用函数:[mw_shl_code=c,true]HAL_GPIO_WritePin(GPIOA GPIO_LED1, GPIO_PIN_SET);[/mw_shl_code]
个人还是比较喜欢原子哥的位带操作。通俗易懂。但是对于操作速度,我我想知道这两种操作方式那种速度更快。
2.  还有一个疑问就是,对于STM32执行一条C语言语句的时间计算。就单纯的一条i++语句,该怎么计算,配置频率为180Mhz. 能不能直接像51单片机一样计算,用1/180Mhz = 0.0056us = 5.6ns * 12 = 67.2ns 这样计算?
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
3条回答
DreamWaterPro
1楼-- · 2019-08-12 00:13
一般来讲,操作寄存器都是要比库函数要快一些。使用库函数的时候,因为需要调用函数,要进行保护现场、PC装入等操作,退出函数的时候也要进行现场恢复、PC恢复的操作,占用了比较多的时间。
而使用寄存器的时候,虽然宏定义中也是有一大串加加减减移位逻辑与或非的操作,但最终这些都是常数,编译器在编译的时候会根据程序代码的实际情况把结果计算出来,写入在最终的程序中,实际执行的时候可能就只有一个逻辑与或非的操作和一个移位操作(个人猜测,没有具体查看过相关的汇编代码)。
应当说明编译器是可以设置优化等级的,在使用优化功能的时候,无论是依赖于库函数的程序还是依赖于寄存器的程序都会得到优化,能够在一定程度上加快代码的执行速度。

关于执行C语言语句的时间不好确定,不见得一条C语句就对应这一条汇编指令。而且同样都是i++这个指令,编译器编译的时候处理情况不一样,得出来的编译代码的执行速度也不一样。以M3内核为例:
情况一:变量i分配的内存单元在片内SRAM中。
    这个时候进行i++的操作,ARM核要依次完成:读变量i所在的内存单元的数据到CPU寄存器、执行自增一、将执行后的数值写入到变量i的内存单元散布,假设一步一个机器周期,这样i++就需要执行3个周期。
情况二:变量i分配的内存单元为某个寄存器。
    这个时候进行的i++操作很简单了,只需要对寄存器执行自增一的操作就可以了,相比上面的就只花费一个机器周期。

如果是别的C语句将会更为复杂,比如if语句、for、以及调用函数等,很有可能一条C语言指令要对应着10多条汇编指令,除非在调试模式下数对应的汇编指令的个数,否则单纯的C语言程序执行时间没法确定的。
xyl210xyl
2楼-- · 2019-08-12 00:29
 精彩回答 2  元偷偷看……
xiedonghui258
3楼-- · 2019-08-12 00:38
DreamWaterPro 发表于 2017-10-25 13:17
一般来讲,操作寄存器都是要比库函数要快一些。使用库函数的时候,因为需要调用函数,要进行保护现场、PC装 ...

感谢兄弟的详细解释说明,又学习了一波。。

一周热门 更多>