Итак, я только что закончил встречу между ИТ-отделом, архивистом библиотеки и факультетом журналистики университета, где я работаю. Одна из вещей, которые возникли в связи с новыми средствами массовой информации, которые будут использоваться в нашей газете в кампусе, - это твиттер. Поскольку это официальная публикация, ее следует заархивировать.
Кто-нибудь знает об инструменте, который архивирует все твиты из учетной записи, а также прямые сообщения и @ ответы на эту учетную запись?
Возможно, мы решим, что это выходит за рамки архивирования, но пока я должен разобраться в этом.
На самом деле я бы использовал Лаконика если вы хотите контролировать то, что ведется в микроблогах. Живую реализацию можно увидеть на Identi.ca.
Фактически всего лишь клон твиттера, но хотя бы ты все под контролем.
Эта ссылка может оказаться вам полезной: Архивирование данных Twitter с помощью Python
Один из вариантов - использовать API поиска, подписаться на канал ATOM и просто заархивировать его. вот пример запроса, который вы можете использовать для поиска термина «библиотека».
Затем вот пример использования службы временной шкалы пользователя для получения всех сообщений конкретного пользователя.
Выполните поиск по запросу «tweetbackup», и вы найдете сайт, предлагающий эту услугу. (Пока не могу публиковать ссылки, иначе я бы сделал это. :))
Я согласен с Server Horror. Один из отличных способов сделать это - настроить сервер Laconica и использовать его для отправки в свою учетную запись Twitter. Ваши статусы будут навсегда заархивированы на ваших серверах, и вы можете извлечь их несколькими способами.
Саймон Уиллисон недавно опубликовал небольшой симпатичный скрипт Python для архивирования твитов: См. http://github.com/simonw/mytweets/tree/master