У меня есть стандартный файл журнала ошибок apache. Я хотел бы узнать, какие URL-адреса вызывают ошибку 404, поскольку я переместил этот сайт и хочу найти плохие ссылки. Может ли кто-нибудь порекомендовать фрагмент bash, который будет анализировать этот журнал с помощью awk или чего-то еще, чтобы показать мне популярные 404?
Я знаю, что для этого есть продвинутые программы. Я просто ищу что-нибудь простое.
Это должно сделать это:
grep ' 404 ' /var/log/apache2/access.log | cut -d ' ' -f 7 |sort |uniq -c |sort -n
Ответ awk:
awk '$9 == 404{urls[$7]++}END{for (url in urls) print urls[url] "\t" url}' access_log | sort -n
Это просто для удовольствия, так как это, вероятно, намного медленнее, чем решение womble