一、Valgrind简介

1.关于Valgrind:
Valgrind是一套Linux下,开放源代码(GPL V2)的仿真调试工具的集合。Valgrind由内核(core)以及基于内核的其他调试工具组成。
内核类似于一个框架(framework),它模拟了一个CPU环境,并提供服务给其他工具;而其他工具则类似于插件 (plug-in),
利用内核提供的服务完成各种特定的内存调试任务。
它不仅仅是一个内存泄露检查器。它只是包含了一个检查内存泄露的工具而已。这个工具恰恰是 Valgrind 中用处最小的一个组件。
无需改变 Valgrind 的调用方式,能得到比大多数人想象的要多得多的极具价值的信息。 Valgrind 会在程序奔溃之前找出潜在的错误;
它不仅告诉你错误在哪里,还会告诉你原因(英语). Valgrind 首先是一个未知行为 检测工具,其次他是一个函数和内存分析工具,
然后是一个数据竞争条件侦测工具, 它最后才是一个内存泄露检查工具。
valgrind很占内存, 网上看到valgrind使用的内存是监控程序的2倍。
要运行 Valgrind, 只需切换到程序所在的目录然后运行如下命令:
valgrind ./myProgram myProgramsFirstArg myProgramsSecondArg
将会同时看到程序的输出,以及由 Valgrind 生成的调试输出信息(那些 ‘==‘ 开头的行)。
如果程序在编译生成时带了 -g 选项(生成调试符号信息),Valgrind 将提供更多有帮助的信息(比方说执行代码的行号)。
所有Valgrind输出内容里 "HEAD SUMMARY" 行之后的内容是:内容泄露摘要。

2.Valgrind包括如下一些工具:
Memcheck。这是valgrind应用最广泛的工具,一个重量级的内存检查器,能够发现开发中绝大多数内存错误使用情况,
比如:使用未初始化的内存,使用已经释放了的内存,内存访问越界等。这也是本文将重点介绍的部分。
Callgrind。它主要用来检查程序中函数调用过程中出现的问题。
Cachegrind。它主要用来检查程序中缓存使用出现的问题。
Helgrind。它主要用来检查多线程程序中出现的竞争问题。
Massif。它主要用来检查程序中堆栈使用中出现的问题。
Extension。可以利用core提供的功能,自己编写特定的内存调试工具

3.Valgrind部分功能:
1) 误用未初始化的值
2) 操作你不该去碰的内存。读写从来没被分配出来的内存,被释放掉的内存;访问超过一块分配好的内存的边界的内存;栈上不能读写的内存。
3) 误用 std::memcpy 以及基于该函数构建的其他函数会导致你的源数组和目标数组地址重叠 
4) 无效的内存释放
5) 数据竞争: valgrind --tool=helgrind ./myProgram
6)内存泄露 valgrind --leak-check=full ./myProgram
7)用作函数和内存分析 valgrind --tool=callgrind  ./myProgram

4.Valgrind 使用:
用法: valgrind [options] prog-and-args [options]: 常用选项,适用于所有Valgrind工具
-tool= 最常用的选项。运行 valgrind中名为toolname的工具。默认memcheck。
h –help 显示帮助信息。
-version 显示valgrind内核的版本,每个工具都有各自的版本。
q –quiet 安静地运行,只打印错误信息。
v –verbose 更详细的信息, 增加错误数统计。
-trace-children=no|yes 跟踪子线程? [no]
-track-fds=no|yes 跟踪打开的文件描述?[no]
-time-stamp=no|yes 增加时间戳到LOG信息? [no]
-log-fd= 输出LOG到描述符文件 [2=stderr]
-log-file= 将输出的信息写入到filename.PID的文件里,PID是运行程序的进行ID
-log-file-exactly= 输出LOG信息到 file
-log-file-qualifier= 取得环境变量的值来做为输出信息的文件名。 [none]
-log-socket=ipaddr:port 输出LOG到socket ,ipaddr:port
LOG信息输出
-xml=yes 将信息以xml格式输出,只有memcheck可用
-num-callers= show callers in stack traces [12]
-error-limit=no|yes 如果太多错误,则停止显示新错误? [yes]
-error-exitcode= 如果发现错误则返回错误代码 [0=disable]
-db-attach=no|yes 当出现错误,valgrind会自动启动调试器gdb。[no]
-db-command= 启动调试器的命令行选项[gdb -nw %f %p]
适用于Memcheck工具的相关选项:
-leak-check=no|summary|full 要求对leak给出详细信息? [summary]
-leak-resolution=low|med|high how much bt merging in leak check [low]
-show-reachable=no|yes show reachable blocks in leak check? [no]

5.Valgrind 使用举例: 下面是一段有问题的C程序代码test.c


  1. #include <stdlib.h>
  2. void f(void)
  3. {
  4.    int* x = malloc(10 * sizeof(int));
  5.    x[10] = 0;     //问题1: 数组下标越界
  6. } //问题2: 内存没有释放


  7. int main(void)
  8. {
  9.    f();
  10.    return 0;
  11.  }

1) 编译程序test.c
gcc -Wall test.c -g -o test
2) 使用Valgrind检查程序BUG
valgrind --tool=memcheck --leak-check=full ./test

6.Memcheck 能够检测出内存问题,关键在于其建立了两个全局表。
(1)Valid-Value 表:
对于进程的整个地址空间中的每一个字节(byte),都有与之对应的 8 个 bits;对于 CPU 的每个寄存器,也有一个与之对应的 bit向量。
这些 bits 负责记录该字节或者寄存器值是否具有有效的、已初始化的值。
(2)Valid-Address表:
对于进程整个地址空间中的每一个字节(byte),还有与之对应的 1 个 bit,负责记录该地址是否能够被读写。
7.检测原理:

一个典型的Linux C程序内存空间由如下几部分组成:
代码段(.text)        这里存放的是CPU要执行的指令。代码段是可共享的,相同的代码在内存中只会有一个拷贝,同时这个段是只读的,防止程序由于错误而修改自身的指令。
初始化数据段(.data)  这里存放的是程序中需要明确赋初始值的变量,例如位于所有函数之外的全局变量:int val="100"。
  需要强调的是,以上两段都是位于程序的可执行文件中,内核在调用exec函数启动该程序时从源程序文件中读入。
未初始化数据段(.bss) 位于这一段中的数据,内核在执行该程序前,将其初始化为0或者null。例如出现在任何函数之外的全局变量:int sum;
堆(Heap)       这个段用于在程序中进行动态内存申请,例如经常用到的malloc,new系列函数就是从这个段中申请内存。
栈(Stack)            函数中的局部变量以及在函数调用过程中产生的临时变量都保存在此段中。
原理:
当要读写内存中某个字节时,首先检查这个字节对应的 A bit。如果该A bit显示该位置是无效位置,memcheck 则报告读写错误。
内核(core)类似于一个虚拟的 CPU 环境,这样当内存中的某个字节被加载到真实的 CPU 中时,该字节对应的 V bit 也被加载到虚拟的 CPU 环境中。
一旦寄存器中的值,被用来产生内存地址,或者该值能够影响程序输出,则 memcheck 会检查对应的V bits,如果该值尚未初始化,则会报告使用未初始化内存错误。

二、Valgrind的安装和移植
第一种安装方式:
1. autoconf
# wget http://ftp.gnu.org/gnu/autoconf/autoconf-2.69.tar.gz 
# tar -zxvf autoconf-2.69.tar.gz 
# cd autoconf-2.69
# ./configure
# make; make install
2. automake
# wget http://ftp.gnu.org/gnu/automake/automake-1.14.tar.gz
# tar -zxvf automake-1.14.tar.gz 
# cd automake-1.14
# ./bootstrap.sh
# ./configure
# make; make install
3. valgrind
# wget http://valgrind.org/downloads/valgrind-3.11.0.tar.bz2
# tar -jxvf valgrind-3.11.0.tar.bz2
# cd valgrind-3.11.0
# ./autogen.sh
4. 修改configure脚本 armv7*)  改为 armv7* | arm ) 
5. prefix后面的值特别关键,这个后面的目录就是开发板上面的目录,一定对应上才可以
#./configure --host=arm-linux CC=arm-hisiv200-linux-gcc CPP=arm-hisiv200-linux-cpp CXX=arm-hisiv200-linux-g++ --prefix=/mnt/valgrind
6. 编译
# make
7. 安装
# sudo make install
//这里说明一下,其实前两个步骤可以不执行直接执行3,但是在执行脚本autogen.sh的时候会出现错误,具体原因如下:
 /*在Linux上构建一个程序,该程序的开发版本是使用“autogen.sh”脚本进行的。当我运行它来创建配置脚本时,却发生了下面的错误:
Can't exec "aclocal": No such file or directory at /usr/share/autoconf/Autom4te/FileUtils.pm line 326.
autoreconf: failed to run aclocal: No such file or directory
(开发版本常常是通过autogen.sh使用程序源代码生成的,构建过程包括验证程序功能和生成配置脚本。
autogen.sh脚本依赖于autoreconf来调用autoconf,automake,aclocal和其它相关工具。)
丢失的aclocal是automake包的一部分,因此,要修复该错误,请安装以下包。
在Debian,Ubuntu或Linux Mint上:
$ sudo apt-get install automake
在CentOS,Fedora或RHEL上:
$ sudo yum install automake
 */
第二种安装方式:
1. valgrind
# wget http://valgrind.org/downloads/valgrind-3.11.0.tar.bz2
# tar -jxvf valgrind-3.11.0.tar.bz2
# cd valgrind-3.11.0
# apt-get install automake
#./autogen.sh
2. 修改configure,armv7*) 改成 armv7*|arm)
3. 执行configure
#./configure --host=arm-linux CC=arm-hisiv200-linux-gcc CPP=arm-hisiv200-linux-cpp CXX=arm-hisiv200-linux-g++ --prefix=/mnt/valgrind
4. 编译安装
#make
#sudo make install
//注意:--prefix=/mnt指定的目录要与开发板上放置的目录一致,
//不然运行valgrind时可能会出现“valgrind: failed to start tool 'memcheck' for platform 'arm-Linux': No such file or directory”错误。


/***************下面是移植:***************/


安装完成之后会在/mnt/下发现一个valgrind文件夹


1. 打包:(du -m FileName.tar 看一下大小,应该90M左右,太小就错啦) 
#tar czvf file.tar valgrind
#sz FileName.tar
//选择F盘下product文件夹下载到widows


2. 设置好tftp


3. 启动板子后quit


#quit
#cd /mnt


4. tftp方式将FileName.tar上传到板子的mnt里(先配置ip)
#ifconfig eth0 172.16.6.121 netmask 255.255.255.0;route add default gw 172.16.6.1
#tftp -g -r file.tar 172.16.6.120


5. 解包:
#tar zxvf file.tar


6. 测试一下好用不
(试着valgrind ls -l来检测是否正常工作)
#cd valgrind/bin
#./valgrind --help


7. 出现如下信息则证明完美运行:
usage: valgrind [options] prog-and-args


  tool-selection option, with default in [ ]:
    --tool=             use the Valgrind tool named [memcheck]
(下面还有一堆...)
#./valgrind ls -l   //测试一下ls命令是否有问题



# ./valgrind ls -l
==1298== Memcheck, a memory error detector
==1298== Copyright (C) 2002-2013, and GNU GPL'd, by Julian Seward et al.
==1298== Using Valgrind-3.9.0 and LibVEX; rerun with -h for copyright info
==1298== Command: ls -l
==1298== 


valgrind:  Fatal error at startup: a function redirection
valgrind:  which is mandatory for this platform-tool combination
valgrind:  cannot be set up.  Details of the redirection are:
valgrind:  
valgrind:  A must-be-redirected function
valgrind:  whose name matches the pattern:      memcpy
valgrind:  in an object with soname matching:   ld-linux.so.3
valgrind:  was not found whilst processing
valgrind:  symbols from the object with soname: ld-linux.so.3
valgrind:  
valgrind:  Possible fixes: (1, short term): install glibc's debuginfo
valgrind:  package on this machine.  (2, longer term): ask the packagers
valgrind:  for your Linux distribution to please in future ship a non-
valgrind:  stripped ld.so (or whatever the dynamic linker .so is called)
valgrind:  that exports the above-named function using the standard
valgrind:  calling conventions for this platform.  The package you need
valgrind:  to install for fix (1) is called
valgrind:  
valgrind:    On Debian, Ubuntu:                 libc6-dbg
valgrind:    On SuSE, openSuSE, Fedora, RHEL:   glibc-debuginfo
valgrind:  
valgrind:  Cannot continue -- exiting now.  Sorry.


//上面出现了问题,说明大概是说我的glibc是个strip后的版本,需要下载debug版,debug版的名字是libc6-dbg。


//这里如果在Ubuntu或者服务器上运行
//    执行:
# sudo apt-get install libc6-dbg  、
//就可以解决问题了
//但是,我们是在arm上运行的,这就不行了,还要下载debug版库,debug版的名字还是libc6-dbg。
//思前想后,找好几个解决方案,最后把sdk的lib库换了一下,(之前的lib库是被strip的)果然,完美运行


/***再次执行valgrind ls -l,输出:*****/
==14378== Memcheck, a memory error detector  
==14378== Copyright (C) 2002-2011, and GNU GPL'd, by Julian Seward et al.  
==14378== Using Valgrind-3.7.0 and LibVEX; rerun with -h for copyright info  
==14378== Command: ls -l  
==14378==  
total 108  
drwxr-xr-x   2 root root  4096 2012-07-13 03:26 bin  
drwxr-xr-x   3 root root  4096 2012-07-13 07:36 boot  
drwxr-xr-x   2 root root  4096 2012-07-13 07:06 cdrom  
drwxr-xr-x  17 root root  3620 2012-07-24 03:00 dev  
drwxr-xr-x 128 root root 12288 2012-07-24 03:06 etc  
drwxr-xr-x   3 root root  4096 2012-07-13 08:16 home  
lrwxrwxrwx   1 root root    33 2012-07-13 07:07 initrd.img -> boot/initrd.img-2.6.32-38-generic  
drwxr-xr-x  16 root root 12288 2012-07-13 03:23 lib  
drwxr-xr-x   2 root root  4096 2012-07-13 03:24 lib32  
lrwxrwxrwx   1 root root     4 2012-07-13 07:03 lib64 -> /lib  
drwx------   2 root root 16384 2012-07-13 07:03 lost+found  
drwxr-xr-x   4 root root  4096 2012-07-13 02:13 media  
drwxr-xr-x   2 root root  4096 2012-02-03 04:21 mnt  
drwxr-xr-x   2 root root  4096 2012-07-13 07:03 opt  
dr-xr-xr-x 182 root root     0 2012-07-24 02:58 proc  
drwx------   8 root root  4096 2012-07-24 21:25 root  
drwxr-xr-x   2 root root  4096 2012-07-16 01:21 sbin  
drwxr-xr-x   2 root root  4096 2009-12-05 17:25 selinux  
drwxr-xr-x   2 root root  4096 2012-07-13 07:03 srv  
drwxr-xr-x  13 root root     0 2012-07-24 02:58 sys  
drwxrwxrwx   2 root root  4096 2012-07-16 01:39 tftpboot  
drwxrwxrwt  14 root root  4096 2012-07-24 21:31 tmp  
drwxr-xr-x  11 root root  4096 2012-07-13 03:23 usr  
drwxr-xr-x  15 root root  4096 2012-07-13 07:31 var  
lrwxrwxrwx   1 root root    30 2012-07-13 07:07 vmlinuz -> boot/vmlinuz-2.6.32-38-generic  
drwxrwxrwx   6 root root  4096 2012-07-24 03:02 work  
==14378==  
==14378== HEAP SUMMARY:  
==14378==     in use at exit: 20,081 bytes in 58 blocks  
==14378==   total heap usage: 1,798 allocs, 1,740 frees, 164,568 bytes allocated  
==14378==  
==14378== LEAK SUMMARY:  
==14378==    definitely lost: 240 bytes in 3 blocks  
==14378==    indirectly lost: 480 bytes in 20 blocks  
==14378==      possibly lost: 0 bytes in 0 blocks  
==14378==    still reachable: 19,361 bytes in 35 blocks  
==14378==         suppressed: 0 bytes in 0 blocks  
==14378== Rerun with --leak-check=full to see details of leaked memory  
==14378==  
==14378== For counts of detected and suppressed errors, rerun with: -v  
==14378== ERROR SUMMARY: 0 errors from 0 contexts (suppressed: 2 from 2)  


//看来ls这个命令是没有任何内存问题的。。。

#cd /mnt/valgrind/bin
#./valgrind --tool=memcheck --leak-check=full  /usr/local/bin/producttest
//成功跑起来测试程序代码
software/HiSTBLinuxV100R003C00SPC060/pub/rootfs/lib
//这个lib库拷贝进板子lib库,替换掉被strip的。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐