Недавно был взломан веб-сайт Wordpress, и он отправил URL-адреса в Google в формате http://www.example.com/?ck=some-pharma-related-string
Кажется, что это немного отличается от "Pharma Hacks", о которых подробно сообщается, тем, что они используют реальные пути, а не просто строку запроса в базовом URL. В любом случае, теперь, когда Google проиндексировал сайт, он по-прежнему считает, что эти URL-адреса действительны, потому что Wordpress игнорирует строку запроса и просто обслуживает домашнюю страницу, как если бы строки запроса там не было. Таким образом, Google будет продолжать считать эти URL действительными. То, что я хотел бы сделать, в основном заставить apache обслуживать ответ 404, если он видит "? Ck =" в URL-адресе, чтобы Google удалил их из своего списка. Я уверен, что мог бы внести некоторые изменения в файлы wordpress, но я стараюсь избегать взлома кода WordPress для достижения этой цели.
А пока что я сделал еще несколько вещей: