嵌入式linux调试:用gdbserver调试共享库

2019-07-13 07:08发布

gdbserver调试共享库   在开发嵌入式系统时,调试往往是一大难题。面试过不少嵌入式linux工程师,当问及调试手段时,他们的调试手段一般是两种:首先是在PC上的模拟环境中运行,若有问题,可以很方便的调试。其次,若在板子上运行时才出错,就用printf输出log信息,根据log信息定位错误。有少部分人用gdbserver调试板子上的程序,但问到如何在共享库里设置断点时,都说没有办法。   去年,Tinyx的一个内存越界BUG,花了我2天时间。gcc的一个浮点数BUG让我查了3天时间。这类BUGPC上根本重现不了,在板子上用printf要花费大量的时间才能把错误的范围缩小一点。后来想了想,与其花时间去加printf,还不如把gdbserver调试共享库的问题解决了,可以为以后的调试节省不少时间。   在网上找了半天资料,没有什么收获,看来只好自己动手研究。花了一个周末的时间去研究gdbserver的运行方式。办法是找到了,不过仍然有点麻烦,等有时间了,修改一下gdb的代码,把这个过程自动化了。   先调试运行gdbserver,对gdbserver有了一些感性认识,然后研究linux-low.c中的代码。原来,设置断点只是在对应的内存中写入断点指令(x86上为0xcc)。   gdbserver为什么不能在共享库中设置断点呢?设置断点只是写内存,调试时,所有的代码段都是可写的,在exe中可以设置断点,没有理由不让在共享库中设置啊。所以这应该与是否是共享库关系不大。   猜测可能是符号与地址对应关系有误,如果你的本意为function1设置断点,结果gdb搞错了,设置一个毫不相干的地方,可能永远都不会执行到那里,这个断点自然没什么效果。   如果是这样,有两种方法可以解决:要么手动计算符号的地址,再设置断点,当然这样太累。另外就让gdb自动对应起来。经过反得尝试,用下列方法可以在共享库中设置断点,虽然有点麻烦,还是可行的。   1.         准备工作,编写下面几个文件: test.c: #include   int test(int a, int b) {     int s = a + b;       printf("%d/n", s);       return s; }   main.c: #include   extern int test(int a, int b);   int main(int argc, char* argv[]) {     int s = test(10, 20);       return s; } Makefile: all: so main so:     gcc -g test.c -shared -o libtest.so main:     gcc -g main.c -L./ -ltest -o test.exe clean: rm -f *.exe *.so (为了便于演示,整个过程在PC上测试,后来证实在实验板上能够正常工作) 2.         编译并设置环境变量 make export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./   3.         运行gdbserver gdbserver localhost:2000 ./test.exe   4.         运行gdb客户端 gdb symbol-file test.exe target remote localhost:2000 b main c   5.         查看libtest.so的代码在内存中的位置。 (从gdbserver的输出或者用ps可以得到test.exe的进程ID,这里假设PID11547 cat /proc/11547/maps 输出: 00624000-0063e000 r-xp 00000000 03:01 718192     /lib/ld-2.3.5.so 0063e000-0063f000 r-xp 00019000 03:01 718192     /lib/ld-2.3.5.so 0063f000-00640000 rwxp 0001a000 03:01 718192     /lib/ld-2.3.5.so 00642000-00766000 r-xp 00000000 03:01 718193     /lib/libc-2.3.5.so 00766000-00768000 r-xp 00124000 03:01 718193     /lib/libc-2.3.5.so 00768000-0076a000 rwxp 00126000 03:01 718193     /lib/libc-2.3.5.so 0076a000-0076c000 rwxp 0076a000 00:00 0 00bbe000-00bbf000 r-xp 00bbe000 00:00 0 00fcc000-00fcd000 r-xp 00000000 03:01 1238761    /root/test/gdbservertest/libtest.so 00fcd000-00fce000 rwxp 00000000 03:01 1238761    /root/test/gdbservertest/libtest.so 08048000-08049000 r-xp 00000000 03:01 1238765    /root/test/gdbservertest/test.exe 08049000-0804a000 rw-p 00000000 03:01 1238765    /root/test/gdbservertest/test.exe b7f8a000-b7f8b000 rw-p b7f8a000 00:00 0 b7f99000-b7f9a000 rw-p b7f99000 00:00 0 bfd85000-bfd9a000 rw-p bfd85000 00:00 0          [stack]   由此可以知道:libtest.so的代码在00fcc000-00fcd000之间。   6.         查看libtest.so.text段在内存中的偏移位置: objdump -h libtest.so |grep .text 输出: 9 .text         00000130  00000450  00000450  00000450  2**4 即偏移位置为0x00000450 7.         回到gdb窗口,加载libtest.so的符号表。 add-symbol-file libtest.so 0x00fcc450 (这里0x00fcc450 = 0x00fcc000 + 0x00000450)   8.         在共享库的函数中设置断点。 b test   9.         继续调试,可以发现在共享库中设置的断点,能够正常工作。   这个方法仍然有点麻烦,写在这里算抛砖引玉吧,望大家不吝赐教,谢谢。