Как найти дубликаты файлов (сначала по размеру, затем по хешу MD5)

find -not -empty -type f -printf "%-30s'\t\"%h/%f\"\n" | sort -rn -t$'\t' | uniq -w30 -D | cut -f 2 -d $'\t' | xargs md5sum | sort | uniq -w32 --all-repeated=separate


Команда find ищет все непустые файлы в текущем каталоге и его подкаталогах. Результат передается через конвейер (pipe) командам sort, uniq, cut, xargs и еще раз sort. Сначала файлы сравниваются по размеру, затем вычисляется хеш MD5 для дубликатов и выводятся вместе с соответствующими путями к файлам. Это полезно для поиска одинаковых файлов и определения, какой из них можно удалить или заменить. Альтернативы: можно использовать утилиты, такие как fdupes или rdfind, которые предоставляют более простые способы поиска и удаления дубликатов файлов.Команда find ищет непустые файлы в текущем и подкаталогах, передавая результат через конвейер для последующей обработки. Сначала файлы сравниваются по размеру (-printf "%-30s..."), затем по хешу MD5 (xargs md5sum). Результаты сортируются и уникальные дубликаты выводятся с их путями. Это позволяет найти и удалить одинаковые файлы, экономя место на диске. Альтернативы: fdupes и rdfind — утилиты для поиска и удаления дубликатов файлов.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *