Мой работодатель требует, чтобы вся электронная корреспонденция в организации индексировалась по соображениям соблюдения нормативных требований. Наш почтовый сервер не управляется нами и не имеет этой функции. Каждая рабочая станция имеет собственное почтовое программное обеспечение. Как мне, помимо поиска нового почтового провайдера, индексировать электронную почту в основном в режиме реального времени?
Честно говоря, индексирование данных любого вида из разных мест в разных форматах - это верный путь к катастрофе. Вам было бы лучше настроить свой собственный внутренний почтовый сервер, переключиться на поставщика, который предлагает функции индексирования, или добавить прокси-сервер электронной почты - в значительной степени ваши лучшие варианты. У всех трех предложений есть свои плюсы и минусы.
Если это законное требование бизнеса ... ваш босс заплатит за это. Если у вас небольшой ИТ-отдел ... позвольте кому-то другому поработать за вас. (читается как «пусть office365, google или другая подобная компания будет вашим провайдером электронной почты»). Попытка сделать это самостоятельно без специального человека для этой задачи в конечном итоге приведет к тому, что вы будете выглядеть так, будто не знаете, что делаете. ... и, вероятно, в какой-то момент тебя уволят.
Я думаю, что вы, возможно, ищете услугу или устройство, такое как Архиватор сообщений Barracuda. Я использую версию устройства, и она индексирует всю почту по мере ее отправки / получения.
Самый простой и понятный способ сделать это - подключиться к интернет-шлюзу вашей организации, прослушивать соединения с почтовым сервером и выполнять захват пакетов для всех входящих и исходящих электронных писем. Сохраните захваченные пакеты в какой-то базе данных noSQL.
Есть несколько проектов с открытым исходным кодом, которые могут это сделать (на ум приходит Молох), но вам, возможно, придется проявить немного творчества, если почтовый сервер использует SSL.