Как удалить дубликаты строк из неотсортированного файла на основе одного столбца

perl -ane 'print unless $x{$F[0]}++' infile > outfile


Эта команда perl используется для удаления дубликатов строк из неотсортированного файла, основываясь на значении первого столбца каждой строки. Команда открывает файл «infile» и записывает уникальные строки (т.е. строки, у которых значение в первом столбце встречается только один раз) в файл «outfile». Аргумент «-ane» позволяет разделять входной файл пробелами и сохранять каждое слово в элементе массива «F», а также автоматически пропускать пустые строки. Альтернативные подходы к удалению дубликатов строк включают использование команд awk или sort с опцией «-u».

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *