Назад | Перейти на главную страницу

Фильтр полей с пробелом из файла csv в командной строке

CSV-файл с несколькими записями разделяется |.

field1|field2|field3|field4|field5

Я хочу проверить, является ли поле 3 пустым или содержит только символы "пробела". Если он пуст или пробел, должна отображаться вся строка.

$ echo "1|2||4" | awk  -F'|' '$3 ~ /^[ \t]*$/   {print $0}'

1|2||4

$ echo "1|2|  |4" | awk  -F'|' '$3 ~ /^[ \t]*$/   {print $0}'

1|2|  |4

$ echo "1|2|  3|4" | awk  -F'|' '$3 ~ /^[ \t]*$/   {print $0}'

Вы также можете использовать команду cut, чтобы вытащить третье поле, а затем проверить значение:

$ echo "field1|field2|field3|field4|field5" | cut -d '|' -f 3
field3

Моя случайная попытка использования grep было бы:

grep -E '^[^|]*\|[^|]*\| *[^| ]+ *\|' file

Я не уверен насчет unix, но в Linux вы хотели бы использовать команду sed.

sed 's / || / \ n / g' сделает так, что если есть пустые поля, он добавит новую строку. не уверен, как заставить его проверять только 3-е поле. sed 's / | | / \ n / g 'должно работать только для пробелов.

Используя Perl:

perl -F'\|' -lane 'print if $F[2] !~ /\S/' file

-a включает режим автоматического разделения, который разбивает поля на массив @F
-F'\|' устанавливает разделитель полей на |
$F[2] это 3-е поле
!~ /\S/ тесты на непробельные символы (или пустые)