Страницы моего сайта превысили лимит страниц для системы пользовательского поиска Google, поэтому многие результаты не могут быть найдены при поиске по сайту.
Я читал о Lucene, Nutch, Solr и т. Д., И мне интересно, будут ли у меня требования для их запуска на одном сервере, на котором также работает сайт (на nginx) и наш сервер mysql. У нас 2 гига ОЗУ.
Буду признателен за любые предложения по переходу на новый поиск по сайту.
Сколько страниц у вас должно быть превышено лимит пользовательского поиска Google (просто интересно)?
Я рекомендую использовать Сфинкс, Lucene могла проиндексировать до нескольких тысяч элементов, но помимо этого он был непригоден для использования, поиск был невыносимо медленным, а восстановление индекса заняло бы часы.
У нас есть Sphinx, работающий на облачном сервере Rackspace с 1 ГБ ОЗУ вместе с остальными службами, необходимыми для работы сайта (Apache, PHP, MySQL, Memcached и т. Д.), И он отлично работает.
Веб-сайт, на котором в настоящее время работает Sphinx, содержит> 70 000 статей, поиск завершается очень быстро, и он может полностью восстановить свой индекс за ~ 11 секунд. Я выбрал Sphinx, основываясь на рекомендациях других разработчиков и зная, что несколько крупных сайтов полагаются на него в своих поисковых системах (Neowin будучи одним из них).