Назад | Перейти на главную страницу

Простое решение с открытым исходным кодом для хранения PDF-документов и поиска на основе поиска

Я сотрудничаю с очень небольшой компанией по управлению жилыми домами, у которой есть много документов, которые я хочу оцифровать в формате PDF и разместить в Интернете для доступа всех жителей. Многие люди не обладают техническими знаниями, поэтому важно что-то простое в использовании.

У меня есть навыки создания серверного решения на основе LAMP, хотя и не требующего значительных затрат на покупку или обслуживание, следовательно, с открытым исходным кодом, желательно с небольшим объемом памяти. Однако все, на что я смотрел до сих пор (например, Alfresco, KnowledgeTree и LogicalDOC), кажется серьезным излишеством и сложным как с точки зрения настройки, так и для пользователей.

Я думал о чем-то вроде AjaxExplorer, который, кажется, делает просмотр файлов частью того, что я хочу сделать превосходно. Что касается полнотекстового поиска, есть ли продукт, который будет работать с AjaxExplorer, или что-то еще, что может работать вместе с ним, что люди рекомендовали бы как относительно простой в настройке инструмент для индексации и последующего поиска в репозитории документов?

Было бы приемлемо иметь отдельные области интерфейса для просмотра дерева файлов и простого поиска по имени файла / метаданным и полнотекстового поиска, если, как я подозреваю, нет подходящего интегрированного решения.

Я использовал MNOGOsearch для индексации кучи файлов PDF. Он выполняет полнотекстовый поиск PDF-файлов и многих других типов документов. Вы также можете найти интерфейс поиска довольно знакомым.

Версии * nix лицензированы GNU.

http://www.mnogosearch.org/

Лично я бы просто использовал обычный дистрибутив Apache (без PHP), а затем добавил бы фильтр для обслуживания только документов .pdf:

Есть много разных способов сделать это. Например, эта директива, которую вы помещаете в свой узел «Каталог» в файле httpd.conf:

<Directory "C:/Apache2.2/htdocs">
    Options Indexes Includes MultiViews
    IndexOptions +ScanHTMLTitles -IconsAreLinks FancyIndexing FoldersFirst NameWidth=*
    AddIcon (IMG,/webicons/image3.gif) .gif .png .jpeg .jpg .xbm .PNG .JPG .GIF .tiff .bmp
    AddIcon (IMG,/webicons/compressed.gif) .7z .zip .cab .tar .jar .mdb .ldf .mdf .CAB
    AddIcon (IMG,/webicons/binary.gif) .exe .msi .rdp .pcf .dia .class .ks .keystore .scc
    AddIcon (IMG,/webicons/a.gif) .txt .log .properties .doc .xls .xml .ts .msg .dat .sql .csv .pem .sh .py .tlp .java .der .csr .key .crt .bat .cmd .inf
    AddIcon (IMG,/webicons/link.gif) .lnk .htm .url .URL
    AddIcon (IMG,/webicons/pdf.gif) .pdf
    AddIcon /webicons/folder.png ^^DIRECTORY^^
    #ForceType application/octet-stream
    ....
    ....

Затем введите: http://domain.com/pdf/blah.pdf

Если вам действительно нужна функция поиска, вы можете установить PHP и использовать Поиск плоских файлов PHP .

ownCloud это решение с открытым исходным кодом для хранения файлов, которые могут работать в LAMP. Оно имеет очень чистый интерфейс, и хотя у него есть другие функции (календарь, контакты, музыка, изображения), все они могут быть легко выведены из строя. По состоянию на версия 3 он имеет встроенную программу просмотра PDF. По состоянию на версия 5, у него есть полнотекстовый поиск PDF на базе Lucene.