Полезные советы. Утилита find

Сергей Супрунов


Источник: журнал «Системный администратор», 02.2007.
http://www.samag.ru/art/02.2007/02.2007_02.html

§  Не стесняйтесь искать

Поиск файлов – частая операция, если только вы не обладаете феноменальной памятью или не поддерживаете все вверенные вам файлы в строгом порядке. Да и вряд ли память вам поможет, если нужно будет найти системный файл, фигурирующий в сообщении об ошибке какой-нибудь службы.

Эта небольшая подборка советов посвящена утилите find – наиболее эффективному (но почему-то пугающему новичков) средству поиска и «массовой обработки» файлов. Начну с нескольких простых примеров.

find ./ -name "milter-spa*"

Эта команда выведет список файлов, имена которых соответствуют указанному шаблону, размещённых начиная с текущего каталога и вглубь до победного конца. Обратите внимание на несколько нестандартный порядок параметров вызова – сначала указывается начальный каталог поиска, а затем – опции.

Если вы запустите эту команду от имени непривилегированного пользователя в системном каталоге, то наверняка получите массу сообщений типа:

find: ./backup/pgsql: Permission denied

Избавиться от них поможет следующий приём:

find ./ -name "milter-spa*" 2>/dev/null

То есть сообщения об ошибках (2 – это дескриптор потока STDERR) мы просто выкидываем, оставляя лишь нормальный вывод STDOUT.

find /home/serg/samag -mindepth 2 -maxdepth 2

А это будет список всех файлов, находящихся в указанном каталоге непосредственно в его подкаталогах первого уровня. То есть будут найдены файлы samag/jail/jail-wu и samag/python/test-map.py, но не samag/meta.tgz (т.к. не в подкаталоге) и не samag/sendmailx/bin/smx (т.к. в подкаталоге второго уровня вложенности). Зачем это может понадобиться практически – затрудняюсь сказать, но, как видите, можно делать и такое.

§  Приводите в исполнение немедленно

Find – это не столько средство поиска, сколько инструмент для обхода файловой иерархии. Вывод на экран имён найденных файлов – лишь частный случай (это действие можно указать и явно с помощью опции -print). В целом же вы можете также удалять файлы, соответствующие критериям поиска или даже применять к ним любую произвольную команду. В этом и заключается мощь утилиты find.

find test -nouser -delete

Этой командой мы одним махом удалим все файлы в каталоге test, не имеющие владельца (т.е. UID которых не фигурируют в базе учётных записей). Понятно, что таким образом можно удалить и всё, найденное по критерию -name или любому другому. Будьте осторожны!

find ./ -name "*.py" -exec cat {} \;

А так можно вывести на экран содержимое всех скриптов на Python (если точнее, то файлов, имеющих расширение .py). Обратите внимание на непонятную конструкцию «{}» – в процессе выполнения она будет заменена результатом поиска, т.е. cat получит в качестве параметров список соответствующих файлов. Точка с запятой в конце тоже обязательна – это указание для find, что опция exec закончилась. Чтобы «;» не интерпретировалась оболочкой, не забывайте его экранировать.

§  Не забывайте о времени

При необходимости всегда можно воспользоваться богатым набором опций для поиска файлов на основании их временных атрибутов (времени модификации, доступа и т. д.).

find ./ -atime +90d -size +20 -exec tar cjf old.tbz2 {} \;

Этой страшной конструкцией мы упакуем в архив все файлы больше 10 килобайт (20 блоков по 512 байт; в GNU-версии утилиты можно указывать размер и непосредственно в кило/мега/гигабайтах), к которым никто не обращался более трёх месяцев.

find . -type f -newerac Qwert

Будет выведен список регулярных файлов, обращение к которым выполнялось позже того, как был модифицирован файл Qwert (подробности по -newerXY см. на странице справки). Одним из применений этого может быть поиск файлов, которые используются некоторой программой – создаём (скажем, по команде touch) файл-метку, запускаем программу и смотрим, к каким файлам было обращение после создания метки.

§  Ищите и найдёте

Критерии поиска могут быть самыми разнообразными – по типу файла (каталог, символическая ссылка, регулярный файл и т. д.), по владельцу и группе (опции -user и -group), по выставленным на файле флагам и правам доступа (-flags и -perm соответственно). Для поиска без учёта регистра символов используйте -iname, в более сложных случаях к вашим услугам опция -regex. Можно даже учитывать тип файловой системы (например, при выполнении какого-то действия не принимать во внимание файлы, доступные через NFS).

Утилита find обладает развитым языком составления выражений, когда различные критерии поиска можно группировать с использованием логических операций (разбор оставлю вам в качестве упражнения):

find ./ -iname 'qwe*' -and -size +20 -or -name 'Qwert'

Показанным выше возможности find не исчерпываются – это всего лишь несколько примеров из возможных. Не поленитесь прочитать справку (man find), особенно обращая внимания на приведённые там примеры. И жить в консоли сразу станет проще, жить станет веселей.