首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

find中的-print0跟xargs中-0的奥妙

2013-03-13 
find中的-print0和xargs中-0的奥妙默认情况下, find 每输出一个文件名, 后面都会接着输出一个换行符 (\n

find中的-print0和xargs中-0的奥妙

默认情况下, find 每输出一个文件名, 后面都会接着输出一个换行符 ('\n'), 因此我们看到的 find 的输出都是一行一行的:

-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; ls -l
total 0
-rw-r--r-- 1 root root 0 2010-08-02 18:09 file1.log
-rw-r--r-- 1 root root 0 2010-08-02 18:09 file2.log
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log'
./file2.log
./file1.log
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; bye


比如我想把所有的 .log 文件删掉, 可以这样配合 xargs 一起用:

-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log'
./file2.log
./file1.log
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log' | xargs rm
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log'
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; bye


嗯, 不错, find+xargs 真的很强大. 然而:

-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; ls -l
total 0
-rw-r--r-- 1 root root 0 2010-08-02 18:12 file 1.log
-rw-r--r-- 1 root root 0 2010-08-02 18:12 file 2.log
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log'
./file 1.log
./file 2.log
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log' | xargs rm
rm: cannot remove `./file': No such file or directory
rm: cannot remove `1.log': No such file or directory
rm: cannot remove `./file': No such file or directory
rm: cannot remove `2.log': No such file or directory
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; bye


原因其实很简单, xargs 默认是以空白字符 (空格, TAB, 换行符) 来分割记录的, 因此文件名?./file 1.log?被解释成了两个记录?./file?和?1.log, 不幸的是 rm 找不到这两个文件.

为了解决此类问题, 聪明的人想出了一个办法, 让 find 在打印出一个文件名之后接着输出一个 NULL 字符 ('\0') 而不是换行符, 然后再告诉 xargs 也用 NULL 字符来作为记录的分隔符. 这就是 find 的?-print0?和 xargs 的?-0?的来历吧.

-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; ls -l
total 0
-rw-r--r-- 1 root root 0 2010-08-02 18:12 file 1.log
-rw-r--r-- 1 root root 0 2010-08-02 18:12 file 2.log
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log' -print0 | hd
? ?? ?? ???0??1??2??3? ?4??5??6??7? ?8??9??A??B? ?C??D??E??F??|0123456789ABCDEF|
--------+--+--+--+--+---+--+--+--+---+--+--+--+---+--+--+--+--+----------------|
00000000: 2e 2f 66 69??6c 65 20 31??2e 6c 6f 67??00?2e 2f 66??|./file 1.log../f|
00000010: 69 6c 65 20??32 2e 6c 6f??67?00? ?? ?? ?? ?? ?? ?? ?|ile 2.log.? ?? ?|
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log' -print0 | xargs -0 rm
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; find -name '*.log'
-(dearvoid@LinuxEden:Forum)-(~/tmp/find)-
[bash-4.1.5]?; bye


你可能要问了, 为什么要选?'\0'?而不是其他字符做分隔符呢? 这个也容易理解: 一般的编程语言中都用?'\0'?来作为字符串的结束标志, 文件的路径名中不可能包含?'\0'?字符.

?

热点排行