У меня есть файловый сервер на основе Samba с большим количеством гигабайт данных, в основном документов Word, Excel, OpenOffice и PDF.
Я установил простой веб-интерфейс поиска (Apache, PHP, mlocate), который просто использует пути к файлам + mtime. Для этого это работает, но было бы здорово, если бы все документы были проиндексированы Apache Solr, поскольку, по всем оценкам, это невероятно быстро и может справиться со всеми этими различными типами документов.
Но это файловый сервер, а не веб-сайт, поэтому мне нужно что-то, чтобы сканировать все файлы, а также сканировать и повторно индексировать обновленные; люди не отправляют документы «POST», они просто нажимают «Сохранить».
Есть ли какой-нибудь проект, который этим занимается?
Проверять, выписываться inotify. Он будет мгновенно уведомлять вас о событиях файловой системы.
Я не уверен, что это то, чего хочет спрашивающий, но другие, которые ищут веб-интерфейс для mlocate, взгляните на это: