Назад | Перейти на главную страницу

Uniq по двум столбцам с двумя условиями

у меня есть таблица со столбцами. В первом столбце у меня есть время, когда пользователь вошел в систему, во втором столбце у меня есть имя пользователя.

13:15:39  fxs1cia1qulm1lk  
13:15:39  fxs1cia1qulm1lk  
13:15:39  fxs1cia1qulm1lk  
13:15:42  faaaa2aa11111  
13:15:49  terd1sfsd11fsdf  
13:15:49  terd1sfsd11fsdf  
13:15:49  terd1sfsd11fsdf  
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab   
13:19:19  fxs1ce1iulmla   
13:19:19  fxs1ce1iulmla  
13:19:19  fxs1ce1iulmla   
13:20:42  faaa2a0a1111

Итак, что мне делать. Я должен сделать одно и то же с этими двумя столбцами, Andm, если время входа пользователя и имя пользователя совпадают, я должен сказать, что этот пользователь входил в систему более 3 раз. Я написал короткий сценарий:

log_file=/root/log
temp_file=/root/temp
temp_file2=/root/temp2

cat /dev/null > $temp_file
cat /dev/null > $temp_file2
cat /dev/null > $result_file

cat $log_file | awk '{print $1}' | tail -n 20 > $temp_file
cat $log_file | awk '{print $5}' | tail -n 20 > $temp_file2

for i in `uniq -c $temp_file | awk '{print $1}'`; do
for y in `uniq -c $temp_file2 | awk '{print $2}'`; do
if [ $i -gt 3 ] && [ $y -gt 3 ]; then
s=`uniq -c $temp_file2 | awk '$1 == '$i`
echo "The user $s has logged more than 3 times"
fi
done
done

Пожалуйста, проверьте, как вы относитесь, этот скрипт правильный? Потому что после вывода моего скрипта в эхо у меня есть это:

The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times

Но я хочу получить такой вывод:

The user       4 21erdsf123sdfsdf has logged more than 3 times
The user       4 abcasbbabadab  has logged more than 3 times

И это все. Где у меня ошибка? Пожалуйста помоги.

Вы можете сделать это очень просто с помощью awk

awk '{ users[$2]++ }
END {
     for (user in users)
       if (users[user] > 1)
         printf "%s logged in %d times\n", user, users[user]
    }' < /root.log

Эта программа просматривает root.log, создавая ассоциативный массив (также известный как хэш) со счетчиками каждого пользователя, а затем печатает те, которые больше единицы.

Итак, единственная проблема в том, что он печатает один и тот же вывод несколько раз? Почему бы просто не пропустить через uniq? Сделать дамп в другой временный файл, а затем запустить на нем uniq?

Если вы спрашиваете не об этом, у меня есть несколько наблюдений:

работа с данными, разделенными строками в bash / sh, обычно вызывает больше проблем, чем того стоит. Если решение не является очевидным, выберите язык сценариев, на котором вам не придется постоянно возиться с IFS. (Если вы не знаете, что такое IFS var, я действительно рекомендую держаться подальше от bash / sh для данных, разделенных строками.)
поскольку вы уже используете awk, держу пари, вы можете сделать все это как сценарий awk.
Поскольку строки, которые вас интересуют, идентичны, вы можете сделать sort logfile | uniq -c.
Вы не сортируете свой файл до uniq, поэтому uniq не будет работать, если одинаковые строки не находятся рядом друг с другом. Например, если Боб и Джо входят в систему одновременно и их записи в журнале чередуются.
всегда есть grep -c
прочтите команду сортировки, особенно -d, -n, -k и -t

ОБНОВИТЬ

Вы просите совета по написанию сценариев оболочки или ищете практический ответ на вопрос, как мне узнать, кто в настоящее время вошел в 3 или более сеансов?

совет по написанию сценариев:

я точно уверен $s содержит всю строку 4 21erdsf123sdfsdf <newline> 4 abcasbbabadab включая новую строку. Я не могу понять почему.
Почему вы делаете awk '{print $5}'? Я попытался скопировать данные из вашего примера и пропустить его через awk '{print $5}' и у меня куча новых строк и больше ничего.
Вы смотрели содержимое $temp_file и $temp_file2 чтобы убедиться, что они соответствуют вашим ожиданиям?
В tail -n 20 говорит мне, что вам нужны только «недавние» записи, и вам все равно, насколько они недавние. Это правда?
В cat /dev/null > $file линии избыточны, просто уберите их.
Заменить cat $logfile с участием sort $logfile
Сделайте отступ на петлях

По сути, этот сценарий не будет делать то, что вы хотите, и я не могу сказать, как вы планировали его работать, поэтому не могу дать более конкретных советов. Сожалею.

практичный

используйте awk-скрипт @ greg-tarsa (извините, Грег, сердечно, я знаю, что это за ссылка, а не имя пользователя, в котором есть пробел)
вы говорите о текущих логинах в unix box? Вы пробовали who команда? НАПРИМЕР who | awk '{ print $1}' | sort | uniq -c | sort -d -r или last команда?
найдите ответ на свой общий вопрос (как мне узнать, кто / входил в систему слишком много раз) вместо более конкретного вопроса, который блокирует решение, которое вы уже пытаетесь реализовать (Uniq по двум столбцам с двумя условиями) . Если вам больше интересно попрактиковаться в написании сценариев оболочки, задайте свой вопрос так, чтобы это было сказано.