Назад | Перейти на главную страницу

Построение поиска в интрасети

На работе у нас есть много информации, скопированной на разных сайтах - вики, документации по продуктам, системе продажи билетов и т. Д. - многие из которых требуют аутентификации.

Я очень заинтересован в том, чтобы иметь единый способ поиска во всех наших различных хранилищах, и в свободное время смотрел Nutch, Grub, Django + Haystack и т. Д. Ни одно из них не является полным решением, как Google Mini или Google Search Appliance. .

Создал ли кто-нибудь базовую поисковую машину в интранете из смеси этих инструментов? У вас есть рекомендации, как это сделать? Мне нравится Django, и Haystack кажется довольно популярным поисковым решением для него, но мне нужно подключить к нему краулер, который может поддерживать сканирование аутентифицированных сайтов.

Скорость от Vivisimo отличный товар, но дорогой.

Взгляни на Lucene от Apache Foundation. Также взгляните на их Питаться от на странице wiki, возможно, вы даже найдете проект, уже использующий lucene.