麦子学院 2017-03-23 17:25
Linux学习之find与grep命令详解
回复:0 查看:1860
· find
命令
· find
命令的一般形式
· find
命令的常用选项及实例
· find
与
xargs
· grep
命令
· grep
命令的一般形式
· grep
正则表达式元字符集
(
基本集
)
· grep
命令的常用选项及实例
1、find命令
find
命令是一个无处不在命令,是
linux
中最有用的命令之一。
find
命令用于:在一个目录
(
及子目录
)
中搜索文件,你可以指定一些匹配条件,如按文件名、文件类型、用户甚至是时间戳查找文件。下面就通过实例来体验下
find
命令的强大。
1.1、find命令的一般形式
man
文档中给出的
find
命令的一般形式为:
find [-H] [-L] [-P] [-D debugopts] [-Olevel] [path…] [expression]
其实[-H] [-L] [-P] [-D debugopts] [-Olevel]
这几个选项并不常用
(
至少在我的日常工作中,没有用到过
)
,上面的
find
命令的常用形式可以简化为:
find [path…] [expression]
· path
:
find
命令所查找的目录路径。例如用
.
来表示当前目录,用
/
来表示系统根目录
· expression
:
expression
可以分为
——“-options [-print -exec -ok …]”
· -options
,指定
find
命令的常用选项,下节详细介绍
· -print
,
find
命令将匹配的文件输出到标准输出
· -exec
,
find
命令对匹配的文件执行该参数所给出的
shell
命令。相应命令的形式为
’command’ { } ;
,注意
{ }
和
;
之间的空格
find ./ -size 0 -exec rm {} ;
删除文件大小为零的文件
(
还可以以这样做:
rm -i find ./ -size 0
或
find ./ -size 0 | xargs rm -f &)
为了用ls -l
命令列出所匹配到的文件,可以把
ls -l
命令放在
find
命令的
-exec
选项中:
find . -type f -exec ls -l { } ;
在/logs
目录中查找更改时间在
5
日以前的文件并删除它们:
find /logs -type f -mtime +5 -exec rm { } ;
· -ok
,和
-exec
的作用相同,只不过以一种更为安全的模式来执行该参数所给出的
shell
命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。
find . -name “*.conf” -mtime +5 -ok rm { } ;
在当前目录中查找所有文件名以
.LOG
结尾、更改时间在
5
日以上的文件,并删除它们,只不过在删除之前先给出提示
也有人这样总结find
命令的结构:
find start_directory test
options
criteria_to_match
action_to_perform_on_results
1.2、find命令的常用选项及实例
· -name
按照文件名查找文件。
find /dir -name filename
在
/dir
目录及其子目录下面查找名字为
filename
的文件
find . -name “*.c”
在当前目录及其子目录
(
用
“.”
表示
)
中查找任何扩展名为
“c”
的文件
· -perm
按照文件权限来查找文件。
find . -perm 755 –print
在当前目录下查找文件权限位为
755
的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件
· -prune
使用这一选项可以使find
命令不在当前指定的目录中查找,如果同时使用
-depth
选项,那么
-prune
将被
find
命令忽略。
find /apps -path “/apps/bin” -prune -o –print
在
/apps
目录下查找文件,但不希望在
/apps/bin
目录下查找
find /usr/sam -path “/usr/sam/dir1” -prune -o –print
在
/usr/sam
目录下查找不在
dir1
子目录之内的所有文件
· -user
按照文件属主来查找文件。
find ~ -user sam –print
在
$HOME
目录中查找文件属主为
sam
的文件
· -group
按照文件所属的组来查找文件。
find /apps -group gem –print
在
/apps
目录下查找属于
gem
用户组的文件
· -mtime -n +n
按照文件的更改时间来查找文件, – n
表示文件更改时间距现在
n
天以内,
+ n
表示文件更改时间距现在
n
天以前。
find / -mtime -5 –print
在系统根目录下查找更改时间在
5
日以内的文件
find /var/adm -mtime +3 –print
在
/var/adm
目录下查找更改时间在
3
日以前的文件
· -nogroup
查找无有效所属组的文件,即该文件所属的组在/etc/groups
中不存在。
find / –nogroup -print
· -nouser
查找无有效属主的文件,即该文件的属主在/etc/passwd
中不存在。
find /home -nouser –print
· -newer file1 ! file2
查找更改时间比文件file1
新但比文件
file2
旧的文件。
· -type
查找某一类型的文件,诸如:
b –
块设备文件。
d –
目录。
c –
字符设备文件。
p –
管道文件。
l –
符号链接文件。
f –
普通文件。
find /etc -type d –print
在
/etc
目录下查找所有的目录
find . ! -type d –print
在当前目录下查找除目录以外的所有类型的文件
find /etc -type l –print
在
/etc
目录下查找所有的符号链接文件
· -size n
:
[c]
查找文件长度为
n
块的文件,带有
c
时表示文件长度以字节计。
find . -size +1000000c –print
在当前目录下查找文件长度大于
1 M
字节的文件
find /home/apache -size 100c –print
在
/home/apache
目录下查找文件长度恰好为
100
字节的文件
find . -size +10 –print
在当前目录下查找长度超过
10
块的文件
(
一块等于
512
字节
)
· -depth
:在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。
find / -name “CON.FILE” -depth –print
它将首先匹配所有的文件然后再进入子目录中查找
· -mount
:在查找文件时不跨越文件系统
mount
点。
find . -name “*.XC” -mount –print
从当前目录开始查找位于本文件系统中文件名以
XC
结尾的文件
(
不进入其他文件系统
)
· -follow
:如果
find
命令遇到符号链接文件,就跟踪至链接所指向的文件。
1.3、find与xargs
在使用find
命令的
-exec
选项处理匹配到的文件时,
find
命令将所有匹配到的文件一起传递给
exec
执行。但有些系统对能够传递给
exec
的命令长度有限制,这样在
find
命令运行几分钟之后,就会出现溢出错误。错误信息通常是
“
参数列太长
”
或
“
参数列溢出
”
。这就是
xargs
命令的用处所在,特别是与
find
命令一起使用。
find
命令把匹配到的文件传递给
xargs
命令,而
xargs
命令每次只获取一部分文件而不是全部,不像
-exec
选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。
在有些系统中,使用-exec
选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行
;
这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高
;
而使用xargs
命令则只有一个进程。另外,在使用
xargs
命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。
来看看xargs
命令是如何同
find
命令一起使用的,并给出一些例子。
find . -type f -print | xargs file
查找系统中的每一个普通文件,然后使用
xargs
命令来测试它们分别属于哪类文件
find / -name “core” -print | xargs echo “” >/tmp/core.log
在整个系统中查找内存信息转储文件
(core dump)
,然后把结果保存到
/tmp/core.log
文件中:
find . -type f -print | xargs grep “hostname”
用
grep
命令在所有的普通文件中搜索
hostname
这个词
find ./ -mtime +3 -print|xargs rm -f –r
删除
3
天以前的所有东西
(find . -ctime +3 -exec rm -rf {} ;)
find ./ -size 0 | xargs rm -f &
删除文件大小为零的文件
find
命令配合使用
exec
和
xargs
可以使用户对所匹配到的文件执行几乎所有的命令。
2、grep命令
grep (global search regular expression(RE) and print out the line,
全面搜索正则表达式并把行打印出来
)
是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
2.1、grep命令的一般选项及实例
grep [
OPTIONS] PATTERN [
FILE…]
grep [
OPTIONS] [-e PATTERN | -f
FILE] [
FILE…]
grep
命令用于搜索由
Pattern
参数指定的模式,并将每个匹配的行写入标准输出中。这些模式是具有限定的正则表达式,它们使用
ed
或
egrep
命令样式。如果在
File
参数中指定了多个名称,
grep
命令将显示包含匹配行的文件的名称。对
shell
有特殊含义的字符
($, *, [, |, ^, (, ), )
出现在
Pattern
参数中时必须带双引号。
如果 Pattern
参数不是简单字符串,通常必须用单引号将整个模式括起来。在诸如
[a-z],
之类的表达式中,
-(
减号
)cml
可根据当前正在整理的序列来指定一个范围。整理序列可以定义等价的类以供在字符范围中使用。如果未指定任何文件,
grep
会假定为标准输入。
2.2、grep正则表达式元字符集(基本集)
^
锚定行的开始 如:
’^grep’
匹配所有以
grep
开头的行。
$
锚定行的结束 如:
’grep$’
匹配所有以
grep
结尾的行。
.
匹配一个非换行符的字符 如:
’gr.p’
匹配
gr
后接一个任意字符,然后是
p
。
*
匹配零个或多个先前字符 如:
’ *grep’
匹配所有一个或多个空格后紧跟
grep
的行。
.*
一起用代表任意字符。
[]
匹配一个指定范围内的字符,如
'[Gg]rep’
匹配
Grep
和
grep
。
[^]
匹配一个不在指定范围内的字符,如:
'[^A-FH-Z]rep’
匹配不包含
A-F
和
H-Z
的一个字母开头,紧跟
rep
的行。
(..)
标记匹配字符,如:
'(love)’
,
love
被标记为
1
。
>
锚定单词的结束,如
’grep>’
匹配包含以
grep
结尾的单词的行。
x{m}
连续重复字符
x
,
m
次,如:
’o{5}’
匹配包含连续
5
个
o
的行。
x{m,}
连续重复字符
x,
至少
m
次,如:
’o{5,}’
匹配至少连续有
5
个
o
的行。
x{m,n}
连续重复字符
x
,至少
m
次,不多于
n
次,如:
’o{5,10}’
匹配连续
5–10
个
o
的行。
w
匹配一个文字和数字字符,也就是
[A-Za-z0-9]
,如:
’Gw*p’
匹配以
G
后跟零个或多个文字或数字字符,然后是
p
。
W w
的反置形式,匹配一个非单词字符,如点号句号等。
W*
则可匹配多个。
b
单词锁定符,如
: ‘bgrepb’
只匹配
grep
,即只能是
grep
这个单词,两边均为空格。
2.3、grep命令的常用选项及实例
-?
同时显示匹配行上下的?
行,如:
grep -2 pattern filename
同时显示匹配行的上下
2
行。
-b
,
–byte-offset
打印匹配行前面打印该行所在的块号码。
-c,–count
只打印匹配的行数,不显示匹配的内容。
-f File
,
–file=File
从文件中提取模板。空文件中包含0
个模板,所以什么都不匹配。
-h
,
–no-filename
当搜索多个文件时,不显示匹配文件名前缀。
-i
,
–ignore-case
忽略大小写差别。
-q
,
–quiet
取消显示,只返回退出状态。0
则表示找到了匹配的行。
-l
,
–files-with-matches
打印匹配模板的文件清单。
-L
,
–files-without-match
打印不匹配模板的文件清单。
-n
,
–line-number
在匹配的行前面打印行号。
-s
,
–silent
不显示关于不存在或者无法读取文件的错误信息。
-v
,
–revert-match
反检索,只显示不匹配的行。
-w
,
–word-regexp
如果被引用,就把表达式做为一个单词搜索。
-V
,
–version
显示软件版本信息。
=====
ls -l | grep ‘^a’
通过管道过滤
ls -l
输出的内容,只显示以
a
开头的行。
grep ‘test’ d*
显示所有以
d
开头的文件中包含
test
的行。
grep ‘test’ aa bb cc
显示在
aa
,
bb
,
cc
文件中匹配
test
的行。
grep ‘[a-z]’ aa
显示所有包含每个字符串至少有
5
个连续小写字符的字符串的行。
grep ‘w(es)t.*’ aa
如果
west
被匹配,则
es
就被存储到内存中,并标记为
1
,然后搜索任意个字符
(.*)
,这些字符后面紧跟着另外一个
es()
,找到就显示该行。如果用
egrep
或
grep -E
,就不用
””
号进行转义,直接写成
’w(es)t.*’
就可以了。
grep -i pattern files
:不区分大小写地搜索。默认情况区分大小写
grep -l pattern files
:只列出匹配的文件名,
grep -L pattern files
:列出不匹配的文件名,
grep -w pattern files
:只匹配整个单词,而不是字符串的一部分
(
如匹配
‘magic’
,而不是
‘magical’)
,
grep -C number pattern files
:匹配的上下文分别显示
[number]
行,
grep pattern1 | pattern2 files
:显示匹配
pattern1
或
pattern2
的行,
grep pattern1 files | grep pattern2
:显示既匹配
pattern1
又匹配
pattern2
的行。
来源:iyunv