首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 系统运维 >

在Ubuntu10.10下升级内核到2.6.36使用systemtap

2012-08-15 
在Ubuntu10.10上升级内核到2.6.36使用systemtap???? 一直在linux平台上做开发工作已经几年了,但对linux内

在Ubuntu10.10上升级内核到2.6.36使用systemtap

???? 一直在linux平台上做开发工作已经几年了,但对linux内核都没有认真研究过,个人对linux的了解都停留在系统api的使用层面,对linux的底层设计了解甚少。在身边的同事,不凡有熟悉linux内核的高手,在他们的耳濡目染下,也激发了自己研究linux内核的激情,所以在自己的小黑上装上了vmware和Ubuntu10.10。 下面我将分享一下个人在搭建环境和学习linux内核的一些初步准备工作。

?

??????? 我学习linux内核分成两个方面,理论学习和实践。理论学习主要偏重理论书籍的阅读,短时间内,我囫囵吞枣的扫描了如下的介绍linux内核的书籍,《linux内核完全注释》,《linux内核修炼之道》,《linux内核设计与实现》第二版,《深入理解linux内核》第三版,《独辟蹊径品内核--LINUX内核源代码导读》,还有一本与内核关系不是太大,《程序员的自我修养—链接、装载与库》,这些书真的挺理论的,看完了,脑子居然没有留下多少东西,唯一留下的就是感觉liunx内核好深奥,真NB。这肯定不是我想要的学习效果,我需要的是在学习理论的同时,不断地实践,尽量多的理解自己感兴趣的一些技术设计细节。虽然看这些理论书籍比较枯燥,但通过读这些书籍,我宏观上了解了linux内核的架构,知道了内核的学习方法,避免在实践时走弯路。个人对文件系统和网络系统比较感兴趣,但经历有限,只会深入研究其中一个系统,兼顾整个内核系统其它模块的学习。我的案头摆着几本以后要重点学习的书籍,《深入理解linux内核》第三版, 《深入理解linux架构》,《内核网络栈源代码情景分析》,希望这些理论书籍能提升自己对linux内核的了解。

?

??????? 下面谈谈我在内核学习中的一些初期实践工作,碰到不少问题,但还是耐心的一个个解决了。首先去http://www.kernel.org/ 下载了最新的linux内核2.6.36, 让后就开始风风火火的准备看代码了,真的是初生牛犊不怕虎,啃了两天代码,也没有看明白一个小模块,看来盲目的学习不起作用,还是得补习点理论知识,于是借来几本理论书籍开始啃,在理论学习过程中,了解了x86的架构,汇编相关知识,内存管理,进程调度,文件系统等初步知识,似乎理解得更多一点了,前期学习的理论知识应该准备得差不多了,应该开始详细分析一些感兴趣的代码了。万事开头难,还得从搭建学习环境开始。

?

??????? 一番准备后,在小黑上装上了vmware,并装上了Ubuntu10.10, 但Ubuntu10.10自带的内核是2.6.35.22,我的学习目标是2.6.36, 所以首先是要升级内核。编译内核前对编译选项做了一些简单裁剪配置,主要打开了一些用于调试的开关。然后就是一番漫长的等待编译过程,最后make install。重启,选择2.6.36内核启动,oops,启动不成功,哪里出问题了?重新进入原来的2.6.35内核启动系统,查看/boot/目录,有initrd.img-2.6.35-22-generic这个image,但却没有initrd.img-2.6.36这个image,难道vmware需要内核支持ramdisk才能启动?我查看了编译内核的配置,“

Initial RAM filesystem and RAM disk (initramfs/initrd) support”这个选项也选上了,那为什么编译的时候没有生成initrd.img-2.6.36这个image呢?经过一番研究,没找到原因,但发现用make-kpkg可以编译出这个image,于是安装make-kpkg 。

sudo apt-get install make-kpkg 。

???? 然后进入linux源代码的文件夹运行:

make -kpkg --initrd binary-arch

?

经过一段时间后,在源代码的上层目录生成了三个deb的安装文件。

linux-headers-2.6.36_2.6.36-10.00.Custom_i386.deblinux-image-2.6.36_2.6.36-10.00.Custom_i386.deblinux-image-2.6.36-dbg_2.6.36-10.00.Custom_i386.deb

?

分别安装这个三个包:

?

sudo dpkg -i l inux-headers-2.6.36_2.6.36-10.00.Custom_i386.debsudo dpkg -i l inux-image-2.6.36_2.6.36-10.00.Custom_i386.debsudo dpkg -i linux-image-2.6.36-dbg_2.6.36-10.00.Custom_i386.deb 
?

??????? 安装完成后重启系统,选择2.6.36内核进入系统,啊,成功启动,兴奋一把。尝试运行系统一些命令,似乎也正常。升级内核该告一个段落了吧,好戏还在后头。

?

?????? Systemtap是学习内核一个必不可少的工具,它不仅可以侦测内核空间的相关信息,还可以侦测用户空间的信息,是研究内核源代码,调试系统性能的一个必备工具。在Ubuntu下如何安装Systemtap请参考:

http://sourceware.org/systemtap/wiki/SystemtapOnUbuntu

???????

??????? 运行sudo apt-get install systemtap安装Systemtap。由于在升级内核的时候已经安装了相应的debug信息,

至此内核追踪已经可以执行,但module的信息还需要多做些工作。

sudo apt-get install elfutilsfor file in `find /usr/lib/debug -name '*.ko' -print`do      buildid=`eu-readelf -n $file| grep Build.ID: | awk '{print $3}'`      dir=`echo $buildid | cut -c1-2`      fn=`echo $buildid | cut -c3-`      mkdir -p /usr/lib/debug/.build-id/$dir      ln -s $file /usr/lib/debug/.build-id/$dir/$fn      ln -s $file /usr/lib/debug/.build-id/$dir/${fn}.debugDone

?

到这里应该能运行stap执行hello Word的程序了吧,先试运行一个简单的

sudo stap -ve 'probe begin { log("hello world") exit() }'

?

运行出错了,error:‘param_ops_int64_t’undeclared here (not in a function)

这是什么情况,先不管,再试运行一个脚本

sudo stap -c df -e 'probe syscall.* { if (target()==pid()) log(name." ".argstr) }'

?

????????? 任然遇到上面的错误,在网上搜了一番,原来这是Systemtap对2.6.36内核支持不好,有这个bug,Systemtap官方网站说这个bug已经修复,使用最新的Systemtap就好了。于是下面的网站下载最新的Systemtap的源代码,编译安装。

http://sources.redhat.com/systemtap/ftp/snapshots/

?

然后运行hello Word脚本,

?

Pass 1: parsed user script and 75 library script(s) using 16300virt/12368res/1628shr kb, in 920usr/3670sys/4627real ms.Pass 2: analyzed script: 1 probe(s), 2 function(s), 0 embed(s), 0 global(s) using 16564virt/12892res/1688shr kb, in 170usr/260sys/526real ms.Pass 3: translated to C into "/tmp/stapa7GBqo/stap_5d4a1f5ec0c40981d6d84405569c6127_669.c" using 16564virt/13116res/1896shr kb, in 150usr/130sys/277real ms.Pass 4: compiled C into "stap_5d4a1f5ec0c40981d6d84405569c6127_669.ko" in 8880usr/18060sys/27864real ms.Pass 5: starting run.hello worldPass 5: run completed in 60usr/2650sys/2871real ms.

?

?

试运行一下能否侦测系统函数的调用堆栈,这个功能在看源代码的时候用得着,脚本如下:

?

#!/usr/bin/stapprobe kernel.function("do_timer").return {    print_backtrace();    printf("\n");    exit();}
?

运行输出如下:

?

Returning from:  0xc0155e60 : do_timer+0x0/0x30 [kernel]Returning to  :  0xc017574d : tick_do_update_jiffies64+0xed/0x170 [kernel]0xc017597c : tick_sched_timer+0xbc/0xd0 [kernel]0xc0169a0a : __run_hrtimer+0x7a/0x1c0 [kernel]0xc0169df0 : hrtimer_interrupt+0x130/0x2a0 [kernel]0xc05d08e6 : smp_apic_timer_interrupt+0x56/0x8a [kernel]0xc05ca5d9 : apic_timer_interrupt+0x31/0x38 [kernel]0xc012ab4a : native_safe_halt+0xa/0x10 [kernel] (inexact)0xc0109e93 : default_idle+0x53/0xb0 [kernel] (inexact)0xc0101e4a : cpu_idle+0x8a/0xf0 [kernel] (inexact)0xc05c4242 : start_secondary+0x1ec/0x1f2 [kernel] (inexact)
?

?????????? 不错,Systemtap对内核的侦测功能应该运行正常了,下面我们来尝试一下Systemtap对用户空间的侦测功能,在开发过程中,我们也不时用Systemtap来侦测函数的调用堆栈,调用频率,性能如何等等。先写个简单的程序test.c试试看。

#include <stdlib.h>#include <stdio.h>void func(){    int i = 0;    int count = 0;    for (i = 0; i < 1000000; ++i)    {        ++count;    }}int main(int argc, char** argv){    func();    return 0;}
?

????????? 编译gcc -g? test.c -o test,用户程序要使用Systemtap需要在编译时加-g选项。写个简单的脚本calltime.stp来测试“func”的执行时间。

?

#!/usr/bin/stapglobal tmglobal call_timeprobe begin {    printf(":\)\n");}probe process("./test").function("func") {    tm = gettimeofday_ns();}probe process("./test").function("func").return {    call_time <<< (gettimeofday_ns() - tm);    printf("func call_time: %d\n", @avg(call_time));}probe end {    if (@count(call_time) > 0) {        printf("func call_time: %d\n", @avg(call_time));    }}
?

????????? 运行sudo ./calltime.stp, 运行出错了,SystemTap不支持process("./test")的用户空间的调试的方法,在网上搜罗一番,原来是Systemtap对用户空间的调试需要utrace支持,utrace只是在redhat系统做了支持,Ubuntu系统中默认不支持,内核也是默认不支持utrace。问题找到了,先给内核打上utrace的补丁,到如下网站下载utrace对2.6.36内核的补丁。

http://people.redhat.com/roland/utrace/

补丁的顺序如下:

  >cd /src/linux2 .6.36  >patch – p1 <tracehook.patch  >patch – p1 <utrace.patch  >patch – p1 <utrace-ptrace.patch 
?

?

?????????? 打好补丁之后,重新编译内核,注意需要选中 utrace 选项 “General setup”-->“Infrastructure for tracing and debugginguser processes ”。然后就是按照上面的步骤重新升级内核,内核升级完成后,先运行

sudo ./calltime.stp
?

等待出现“:)”,然后运行./test

结果是这样的

?

:)func call_time: 10291909
?

至此,终于配置好了,可以在系统中作更多的测试学习了。

热点排行