Мы используем GlusterFS для предоставления распределенной файловой системы на 2 веб-серверах, которые используют общий каталог мультимедиа и кеш. Итак, я создал 2 тома gluster (media и var) и смонтировал их в / var / www / site / media и / var / www / site / var /.
На каждом сервере работают сервер и клиент gluster, так что у нас есть некоторая избыточность и возможность репликации данных. Том var пишется и читается очень тяжело.
Проблема, с которой мы сталкиваемся, заключается в том, что монтирования случайным образом ломаются, и когда вы выполняете команду ls -lah для каталога, она отображается как d ???????. Чтобы решить эту проблему, все, что нам нужно сделать, это размонтировать каталог и снова подключить его.
Я просмотрел файлы журнала glusterfs и вижу, когда монтирование исчезло
[2013-05-02 11:32:02.105021] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-1: remote operation failed: No such file or directory
[2013-05-02 11:32:02.105270] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-0: remote operation failed: No such file or directory
[2013-05-02 11:32:02.105299] W [fuse-bridge.c:911:fuse_unlink_cbk] 0-glusterfs-fuse: 11806336: UNLINK() /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-0915740$
[2013-05-02 11:32:02.378497] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-0: remote operation failed: No such file or directory
[2013-05-02 11:32:02.378625] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-1: remote operation failed: No such file or directory
Мы хотели бы знать, что вызывает эти проблемы, и решить их, чтобы предотвратить такие перебои в обслуживании.
Если вам потребуется дополнительная информация, не стесняйтесь спрашивать, и я предоставлю все, что могу.
Запрошенная дополнительная информация приведена ниже, два сервера идентичны:
Ubuntu 12.04.2
Linux VDED-XXX-XXX 3.2.0-39-generic # 62-Ubuntu SMP Чт 28 февраля 00:28:53 UTC 2013 x86_64 x86_64 x86_64 GNU / Linux
glusterfs 3.2.5 построен 31 января 2012 г. 07:39:59
Серверы VMWare ESX
Ошибки из журналов Brick во время сбоя / отключения / проблемы:
журнал кирпичей сайта-медиа:
[2013-05-02 11:32:00.849296] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 9109306: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574183930-box.jpg (0) ==> -1 (No such file or directory)
[2013-05-02 11:32:02.86607] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 9109345: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574098692.jpg (0) ==> -1 (No such file or directory)
[2013-05-02 11:32:02.105131] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 12553441: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574097992-box.jpg (0) ==> -1 (No such file or directory)
[2013-05-02 11:32:02.485694] W [inode.c:1044:inode_path] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(server_resolve+0xf8) [0x7f4534639418] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(server_resolve_inode+0x70) [0x7f4534639290] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(resolve_loc_touchup+0x105) [0x7f4534638425]))) 0-/var/gluster/wwrd-media/inode: no dentry for non-root inode 184269351: 11a65ece-7b4b-4364-a28c-63df686f5648
журнал site-var, похоже, не содержит ошибок
Смотрим журналы. Это определенно похоже на состояние гонки, поскольку в эту папку идет интенсивная запись. В версии 3.2. * Для них было зарегистрировано несколько ошибок. Я предлагаю вам перейти на версию 3.3.1, которая полностью поддерживается вашей ОС. Исправлено множество ошибок и проблем с производительностью. Вы также можете выполнить обновление с вашей версии.