linux find命令使用教程

发布时间:2023-01-16 14:21:11 作者:yexindonglai@163.com 阅读(789)

简介

find是用来在文件系统上查找复合条件的文件

find命令有非常强大的灵活性,可以指定丰富的搜索条件(如文件权限属主属组文件类型日期大小等)来定位系统中的文件和目录,同时还支持对对搜索的结果进行命令操作

命令格式
  1. find [paths(查找路径)] [expression(查找条件)] [actions(处理动作)]
  • paths:find命令接受一个或多个路径(paths)作为搜索范围,并在该路径下递归搜索。即检索完指定目录后,还会对该目录下的子目录进行检索,直至检索完所有层级下文件

  • expression :默认情况下(不带任何搜索条件),find命令会返回指定目录下的 所有文件 ,所以通常通过特定的 expression 对结果进行筛选

  • action :find默认命令的 action 是 print ,将所有检索结果打印至标准输出,可以通过自定义 action ,让 find 命令对搜索到的结果执行特定的操作

1、搜索条件参数说明 expression

搜索条件 expression 说明
-name 通过文件名称查找,区分大小写,支持使用glob 通配符 * ? [] [^]
-iname 通过文件名称查找,不区分字母大小写
-path 匹配某个文件或目录的完整路径,而不仅仅是匹配文件名
-type 通过文件类型查找
-size 根据文件大小来查找
-mtime 根据时间戳查找,以”天”为单位,修改时间(Modification time):最后一次文件内容有过更改的时间点
-atime 根据时间戳查找,以”天”为单位,访问时间(Access time):最后一次文件有被读取过的时间点
-ctime 根据时间戳查找,以”天”为单位,变更时间(Change time):最后一次文件有被变更过的时间点(如内容被修改,或权限等 metadata 被修改)
-mmin 根据时间戳查找,以”分钟”为单位,修改时间(Modification time):最后一次文件内容有过更改的时间点
-amin 根据时间戳查找,以”分钟”为单位,访问时间(Access time):最后一次文件有被读取过的时间点
-cmin 根据时间戳查找,以”分钟”为单位,变更时间(Change time):最后一次文件有被变更过的时间点(如内容被修改,或权限等 metadata 被修改)
-user 查找属主为指定用户的文件
-group 查找指定属组的文件
-uid 查找属主为指定uid号的文件
-gid 查找属组为指定gid号的文件
-nouser 查找没有属主的文件
-nogroup 查找没有属组的文件
-perm 根据权限查找

2、处理动作参数说明 actions

处理动作 actions 说明
-print 默认的处理动作,显示至屏幕
-ls 输出查询结果文件的详细信息,类似于对查找到的文件执行 “ls -l”命令
-delete 删除查找到的文件
-fls 查找到的所有文件的长格式信息保存至指定文件中
-ok 对查找到的每个文件执行由command指定的命令,对于每个文件执行命令之前,都会交互式要求用户确认
-exec 对查找到的每个文件执行由command指定的命令

3、举个栗子

3.1、根据文件名查询 -name

  1. # 查找 /usr 目录下所有文件名以 .txt 结尾的文件
  2. find /usr -name '*.txt'
  3. # 查找 /usr 目录下所有文件名以 1 结尾的文件
  4. find /usr -name '1*'
  5. # 查找 /usr 目录下所有文件名包含 txt 的文件
  6. find /usr -name '*txt*'
  7. #查找 /usr 目录下所有文件名刚好为 4 个字符的文件
  8. find /usr -name '????'
  9. #查找 /usr 下所有文件名以 .txt 结尾的文件或目录,且该文件的父目录必须是 src
  10. find /usr -path '*/src/*.txt'

3.2、根据文件类型查询 -type

  1. -type 类型
  2. f:普通文件
  3. d:目录文件
  4. l:符号链接文件
  5. s:套接字文件
  6. b:块设备文件
  7. c:字符设备文件
  8. p:管道文件
  9. # 检索 /usr 下所有文件名以 python 开头的目录
  10. find /usr -type d -name 'python*'

3.3、根据文件大小来查找 -size

命令格式

  1. -size [+|-] #Unit

参数说明

  1. #Unit常用单位:K M G
  2. #+ 或 - 符号表示大于或小于当前条件
  3. #Unit : (#-1,#]
  4. -#Unit : [0,#-1] : 小于指定大小文件
  5. +#Unix : (#,) : 大于指定大小文件

栗子

  1. # 查找大于100M的文件
  2. find / -size +100M
  3. # 查找小于100M的文件
  4. find / -size -100M

3.4、根据时间戳查找 -*time、-*min

  1. Linux 系统中,与文件相关联的时间参数有以下三种:
  2. 修改时间(Modification time):最后一次文件内容有过更改的时间点
  3. 访问时间(Access time):最后一次文件有被读取过的时间点
  4. 变更时间(Change time):最后一次文件有被变更过的时间点(如内容被修改,或权限等 metadata 被修改)
  5. 与此对应的是 find 命令中的 -mtime,-atime -ctime 三个选项
  6. "天"为单位
  7. -atime [+|-]#
  8. #: [#,#+1) : 这里的#表示#天之前的“一天之内”被访问过的文件
  9. +#: [#+1,OO]: 列出在#天之前(不包含#天本身)被访问过的文件
  10. -#: [0,#) : 列出在#天之内(包含#天本身)被访问过的文件
  11. -mtime [+|-]
  12. -ctime [+|-]
  13. "分钟"为单位
  14. -amin
  15. -mmin
  16. -cmin
  17. # 查找两天之前的一天内被访问的文件(距离现在的前48 ~ 72 小时之间)
  18. find -atime 2
  19. # 查找距离此时2天内被访问的文件(距离现在前48小时之内)
  20. find -atime -2
  21. # 两天之前,不包括两天之前的一天的被访问的文件(离此时72小时之前)
  22. find -atime +2

3.5、根据文件的所属权查询

  1. -user username :查找属主为指定用户的文件
  2. -group groupname :查找指定属组的文件
  3. -uid userid:查找属主为指定uid号的文件
  4. -gid groupid 查找属组为指定gid号的文件
  5. -nouser :查找没有属主的文件
  6. -nogroup : 查找没有属组的文件
  7. # 查找/var目录下属主为root,且属组为mail的所有文件或目录、
  8. find /var -user root -a -group mail

3.6 根据权限查找 -perm

  1. -perm [+|-] Mode
  2. Mode : 精确权限匹配
  3. +Mode :任何一类(u,g,o)对象的权限中只要有一位匹配即可
  4. -Mode :完全包含此mode时才可以匹配,每一类对象都必须同时拥有为其指定的权限标准
  5. # 查找在/tmp目录下权限是755的文件
  6. find /tmp -perm 755
  7. # 表示必须所有类别用户都满足有写权限
  8. find /tmp -perm -222
  9. # 表示只要有一类用户(属主,属组,其他)的匹配写权限就行
  10. find /tmp -perm +222

3.7、逻辑组合

  1. -a
  2. -o
  3. -not
  4. !A -a !B = !(A -o B)
  5. !A -o !B = !(A -a B)
  6. # 查找/etc目录下最近一周内其内容修改过,且属主不为root,也不是hadoop的文件或目录
  7. find /etc -mtime -7 -not \( -user root -o -user hadoop \)
  8. # 查找5分钟内或50分钟前被修改 ,并且 类型为文件的 所有文件
  9. find / '(' -mmin -5 -o -mtime +50 ')' -a -type f

4、处理动作 actions

4.1、常用处理动作

动作说明

  1. -print :默认的处理动作,显示至屏幕
  2. -ls :类似于对查找到的文件执行 "ls -l"命令
  3. -delete :删除查找到的文件
  4. -fls /path/to/somefile :查找到的所有文件的长格式信息保存至指定文件中
  5. # 其中的大括号{}作为检索到的文件的 占位符 ,用于引用查找到的文件名称自身
  6. # 而分号( ;)作为命令结束的标志, 需要转义 , 也可以用 + 号表示
  7. # -exec command {} \; 等同于 -exec command {} +
  8. -ok command {} \;
  9. 对查找到的每个文件执行由command指定的命令
  10. 对于每个文件执行命令之前,都会交互式要求用户确认
  11. -exec command {} \;
  12. 对查找到的每个文件执行由command指定的命令

栗子

  1. # 浏览所有 1G 以上大小的文件的详细信息
  2. find / -type file -size +1G -ls
  3. # 删除 home 目录下所有的空目录:
  4. find ~ -type d -empty -delete
  5. # 删除/var下空文件
  6. find /var -size 0 -type f -exec rm -rf {} \;
  7. # 屏蔽查询结果
  8. find ./ -iname 1.TXT 1>/dev/null
  9. # 屏蔽错误信息
  10. find ./ -iname 1.TXT 2>/dev/null

4.2、删除大量文件 -delete

  1. # 删除海量文件,rm会很慢甚至卡死
  2. # 一般用 find 或 rsync 来删除大量文件
  3. # rsync 速度快于 find
  4. # 可以用 time 测试速度
  5. #time find ./ -type f -delete
  6. find ./ -type f -delete
  7. # test time find ./ -type f -exec rm {} \;
  8. find ./ -type f -exec rm {} \;
  9. # 使用rsync进行删除
  10. # 首先建立空文件夹blanktest
  11. # time rsync -a --delete blanktest/ test/
  12. rsync -a --delete blanktest/ test/

关键字linux