Мы — долго запрягаем, быстро ездим, и сильно тормозим.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
www.lissyara.su
—> статьи
—> FreeBSD
|
Как Вы уже увидели на рисунке, имеется сегмент локальной сети 192.168.224.0 и кроссовер 192.168.24.0. IP серверов, смотрящие в локальный сегмент 192.168.224.12 и 192.168.224.14. И самое интересное то, что Вы заметили виртуальный IP 192.168.224.13.
Что это такое? Это интересное решение, которое будет решать проблему общего IP для нескольких серверов посредством CARP…
1. Настройка виртуального IP.
Для включение CARP нам понадобится пересобрать наше ядро с псевдо-дивайзом carp:
kernel config
|
И выставить нужные опции sysctl:
|
А также поправить конфиг sysctl.conf:
|
И всё это нужно сделать на обеих машинах!
Теперь рисуем два скрипта - по одному для каждой машины,например для первой cl0, и кладём по адресу со следующим названием:
/usr/local/etc/rc.d/ucarp.up.sh
|
А для второй машины cl1 с таким же название и по такому же пути рисуем вот такой скрипт:
|
Поясняю только то, что Вам придётся изменить:
password – это секретное слово вроде пароля (можете вставить своё)
192.168.224.13 – это наш виртуальный ip (который будет переходить от одной машины к другой, как переходящее знамя, во время аварии ведущей машины посредством протокола arp)
Больше Вам ничего не придётся менять, но могу пояснить, что carp0 это псевдо-дивайc, advskew – это приоритеты...
Выставляем правильные права доступа на оба скрипта:
|
Теперь можно либо запустить эти скрипты, либо сделать перезагрузку, и мы увидим следующее, выполнив команду ifconfig:
|
На обеих машинах единственное различие то, что на ведущей MASTER пометка, а на ведомой BECKUP, если мы MASTER отправим в перезагрузку или выключим вообще, то BACKUP автоматически через секунду станет MASTER! И когда бывший MASTER вновь загрузится, то он уже будет BECKUP! Можете проверить, работает ли это, к примеру, по ssh подключиться к своему виртуальному IP (в моём случае 192.168.224.13), а затем отправить MASTER в перезагрузку и вновь подключиться к этому IP, то мы уже должны будем подключиться ко второй машине, которая только что была BECKUP.
2. Настройка репликации данных посредством HAST.
Рисуем два одинаковых конфига /etc/hast.conf на обеих машинах следующего вида:
|
Поясняю:
сlfox – это вымышленное мною слово, можете подставить любое своё (что-то вроде названия ресурса)
cl0 и cl1 – это hostname первой и второй машины (разумеется, у Вас свои имена)
local /dev/ad6 – это и есть путь к дополнительному харду, который я выбрал в роли ресурса для репликации.
remote – здесь мы указываем IP-адрес противоположной машины (для обмена трафика репликации мы будем использовать кроссовер).
Теперь делаем на обеих машинах вот такие нехитрые манипуляции:
|
Где clfox, как мы уже договорились, имя ресурса.
Затем добавляем необходимые строки в rc.conf:
|
И запускаем демона:
|
Выполнив команду на обеих машинах:
|
Мы увидим следующее:
|
Всё должно быть идентичное на обеих машинах, кроме строки "remoteaddr:" на каждой машине будет указан противоположный адрес.
Теперь раздадим роли, пока вручную, чтобы проверить и задействовать файловую систему.
На той машине, где carp – дивайзы MASTER, мы присвоим роль primary, то есть ведущий!
Для этого сделаем:
|
И увидим:
|
А на ведомой машине назначим роль secondary:
|
И увидим примерно следующее:
|
Главное, чтобы на ведущем сервере строка "status:" стала в режим "complete", если не стала, то нужно разобраться в чём дело, иначе дальше двигаться нельзя!!!
3. ZFS в роли файловой системы.
Итак, теперь у нас появился девайз на primary машине:
|
Я выбрал ZFS - с ней проще хотя бы по той причине, что не придётся пользоваться чеколкой fsck, и ZFS более гибок в настройках в дальнейшем!
Создаём точку монтирования на обеих машинах:
|
Вы можете свою точку создать со своим названием - таким же именем назвать не принципиально!
Создадим пул на ведущей машине:
|
Проверяем:
|
Если пул появился, можно добавить на своё усмотрение дополнительные опции или разбить на дата-сетинги или ещё что-либо сделать с ZFS, к примеру я добавил пару опций:
|
Это контрольные суммы.
И:
|
Это тоже не помешает в моём случае.
Теоретически репликация уже работает, если мы проверим командой:
|
И увидим, что параметр status будет complete!
Можно даже не испытывать, отправив MASTER в перезагрузку, а secondary поставить в primary, затем сделать на новоиспечённом MASTERE
|
Всё это можно сделать из любопытства, но если статус complete! тогда я уверен, что проблем нет, и не стоит тратить время!
4. Автоматизируем наш кластер.
Для того, чтобы заставить это всё хозяйство работать автоматически, я много размышлял: вначале я думал написать свой скрипт, но потом я понял, что нужно учесть много НО, а времени в обрез… Готовый вариант в инете мне не понравился - он вообще кривой до ужаса. Поэтому я сделал оптимально-минимальную свою сборную солянку. За основу был взят демон из портов ucarp, скрипты из /usr/share/examples/hast/ плюс свои корректировки. И вот, что получилось (правда я нашёл минимум два существенных бага, о них расскажу далее…)
Обновляем порты, а затем идём по пути:
|
И устанавливаем порт, зависимостей он за собой не тянет, в чём его и прелесть, в отличии от Heartbeat!
|
Далее...
Создаём директорию на обеих машинах:
|
Заливаем сюда 4 конфига, которые можно скачать прямо отсюда и поправить строки под себя:
|
В файле ucarp_up.sh нужно поправить следующие строки:
|
И аналогично правим файл ucarp_down.sh:
|
Это мы проделываем на обеих машинах и придаём нужные права файлам:
|
Добавляем строки в rc.conf, на обеих машинах:
На cl0:
|
На cl1:
|
Теперь можно запускать демонов. Начинать нужно с primary или можно перезагрузиться, но лучше стартовать с той машины, которая была в последний раз primary!
|
Или
|
Примечания!
- Может быть такое, что при старте статус будет не complete, тогда на secondary нужно сделать вот такие манипуляции:
|
Таким образом, мы заставим включиться в дело и начать синхронизацию ведомого ресурса!
Очень важно не перезагружать ни одну из машин до тех пор, пока не пройдёт синхронизация, свидетельство этого будет на машине primary в поле dirty: стоять показатель 0 bytes, если же был какой-то диссонанс и мы вернули на путь истинный нашего secondary, то будет синхронизация и в поле dirty: будет обратный отсчёт байт!
- Ещё важно с какой машины стартовать, нужно всегда стартовать с primary, то есть та машина, которая была в последний раз primary, это на случай, если обе машины были остановлены в случае падения primary! Secondary автоматически станет primary и всё будет без проблем работать! Или если secondary упадёт и вновь поднимется, то это тоже всё безболезненно, опасность лишь в том, что если обе машины упали и потом их пришлось запустить, тогда придётся выяснять, кто был последним primary. Они могут стать обе primary, что нужно проконтролировать, и если такое случилось, посмотреть в ручную, где новее информация. Машину с последней информацией оставить в primary, а вторую перевести в secondary командой:
|
И, разумеется, удостовериться, что статус complete, если нет, то смотреть первый пункт примечаний!
Заключение:
Данная система очень удобна и надёжна, если не считать 2 серьёзных недостатка. Возможно, в будущем я напишу скрипт, который даст возможность максимальной автономии при минимальном вмешательстве администратора! Но там, где действительно требуется cluster, такая связка оправдывает себя. Я испытал такие службы, как apache,
squid, openvpn, mpd5, postfix, и даже samba - в целом работает пока надёжно, между машинами было пару переключений и они уже по несколько раз менялись ролями, а юзверы при этом ничего не заметили!
Возможно, Вы сможете развить эту тему намного дальше и глубже, будет интересно обменяться опытом!
Спасибо за внимание! :-)
размещено: 2011-02-16,
последнее обновление: 2011-03-10,
автор: fox
alik1c, 2011-02-19 в 12:56:30
Пробовал как-то CARP, но дальше развить все это времени не хватало. Думаю, статья заслуживает высокой оценки, молодец.
Как раз завтра начну почту таким методом дублировать.
ждем продолжения.
Максим, 2011-02-19 в 13:20:02
Юзаю CARP - отличная штука, а вот с синхронизацией всегда во что-то упирался. Спасибо Вам за статью - идея очень интересная, думаю попробовать синхронизироваться таким же образом
Насчет выяснения "какой сервер был последним в primary", первое что пришло в голову - решение влоб: поставьте по крону раз в 5-10 сек запись в файлик инфы "время-статус(например с ifconfig)", сервер вряд ли нагрузит, а вот определить легко будет.
Возможно если подумать, найдется решение по-элегантней :)
Удачи
hangover, 2011-02-19 в 13:24:29
Статья хорошая, спасибо, пригодится. Но от количества восклицательных знаков рябит в глазах, уж извините за граммарнацизьм.
dvg_lab, 2011-02-20 в 11:48:08
самое главное - синхронизация сессий, допустим в том же apache, если чел заливает файло и в этот момент мастер падает, что произойдет? Файло придется заливать поновой, ведь про текущую сессию апача на мастере, апач на слейве понятия не имеет.
На днях сам буду реализовать нечто подобное в связке с tomcat + apache mod_jk или nginx в качестве балансера.
fox, 2011-02-20 в 14:43:14
о какой сессии речь идёт?
ponyol, 2011-02-21 в 10:42:37
Статья замечательная, как раз собирался что-то в этом духе реализовать. Теперь есть прекрасное решение, спасибо. Только вот не очень понял зачем нужен ad6 и как туда синхронизируются данные с другого винта. Можно в статье немного об этом подробнее?
fox, 2011-02-21 в 12:47:35
Для удобства ad6 два идентичных винта находятся постоянно в реплекации, а уже средствами ZFS точки монтируем куда надо...
ponyol, 2011-02-21 в 13:01:32
ага, понятно... т.е. /usr и /var монтируем на этот винт )
fox, 2011-02-21 в 15:19:52
Ну /usr и /var это грубо... К примеру если речь об apach то можно точку монтирования /usr/local/www на этот винт...
Аналогично с почтой или ещё чем то подобным... Смысл ненужной репликации, для максимальной скорости синхронизации нужно подвергать репликации только полезную информацию!
Dominator, 2011-02-22 в 19:49:32
Автор молодец! Меня бы не хватило на такую усидчивость.
ш, 2011-03-04 в 11:04:33
Про carp, автору, нужно читать и читать.
Кол-во грамматических ошибок зашкаливает. И если писать английские слова по русски, то не: "дивайзом", а: "дивайсом", не: "два апачя", но: "два апача" ну и т.д.
valeria, 2011-03-04 в 17:05:04
Уважаемый ш!
"По русски" пишется "по-русски", а девайс - это девайс, то, что Вы заметили (апачя и девайз) - это опечатки из-за желания как можно быстрее познакомить общественность с прогрессивной и мегаактуальной статьей. Разве Вас не тронула глубина мысли и широта взглядов автора?! Что конкретного Вы можете сказать именно о работе кластеров?! А для изучения carp советую посмотреть прилагаемую в статье ссылку! Успехов!
fox, 2011-03-04 в 19:16:26
Уважаемый!
Не "дивайсом" а "девайсом", а в моём случае з перепутать с «с» это в полнее правда подобно, так что перед тем как других поправлять учи сам язык!
Конструктивно Вы не чего не сказали а для тех нужд вполне достаточно описания о carp! И есть ссылка на оригинальный манн так что вперёд дерзайте!
Спасибо Валерии за рассудительность!
ш, 2011-03-04 в 21:28:57
пункт а:
rc.conf|grep
cloned_interfaces="carp0"
ifconfig_carp0="vhid 1 pass password 192.168.2.1/24 advskew 100"
+два дивайса только дурочек мог запихать
если уж давать ссылки на маны, то можно и без статей обойтись, нового тут ничего нет.
пункт б:
"опечаток" столько, что опен офис плачет горючими слезами, спелчекер в руки, ага. и, да, за намеки на кривость произношения слов поблагодарили бы, а не выпячивали пивной живот.
fox, 2011-03-04 в 22:24:47
Во первых: два девайса это обдуманный шаг, ты испытай вначале эту схему и первую и вторую, и про экспериментируй создай аварийную ситуацию!
Во вторых: ссылки это необходимый дополнительный материал для развития темы!
И тут не кто не говорит, что что то новее будет это опыт автора, и его право а для большей отчётности по данному вопросу читать внимательно тот факт, что статья написана для того что бы не забыть а не для развода троллей!
И в третьих: я пиво не пью, так что судишь ты парень по себе!
Тролить пиши на форум и с фактами а не с зыбкими доводами…
И в заключение: Сам дурак!
valeria, 2011-03-05 в 0:13:21
Мальчики! Не ругайтесь!
Вам, уважаемый ш, наверное, просто завидно, что не Вы написали такую статью! Подскажите, где можно познакомиться с Вашим творчеством.
gx, 2011-03-05 в 20:51:06
закомитили статью про HAST в handbook:
http://www.freebsd.org/doc/en_US.ISO8859-1/books/handbook/disks-hast.html
konstantine, 2011-03-09 в 7:18:20
Вопрос уважаемому fox. Скажите, а зачем на каждой машине подымать два CARP ифа с одинаковыи IPами и с разными advskew ???? Мож моя фантазия скудна, но я понять никак не могу этого и тем более не додумался бы до токого....
fox, 2011-03-10 в 4:29:20
Пофиксел очипятку, с CARP...
ALPHA, 2011-04-14 в 17:19:29
konstantine advskew нужен для рекламации, и интервал соответственно тут должен быть разным, То что fox указал на интерфейсе CARP "advskew 0 " нормально, ибо в мане сказано
advskew interval
Specifies the skew to add to the base advertisement interval to
make one host advertise slower than another host. It is speci-
fied in 1/256 of seconds. The acceptable values are 1 to 254.
The default value is 0.
То есть fox просто написал дефолтное значение, так почему же вы не смогли додуматься konstantine?
Mox, 2011-08-25 в 11:13:08
Аффтар, не вводи людей в заблуждение. uCARP в таком конфиге нафиг не нужен. Он вообще сам по себе может юзаться.
Вместо этого нужен carp(4)+devd(8). Такая связка описана в хендбуке в секции HAST. Статья уже устарела, можно сказать.
Mox, 2011-08-25 в 11:15:03
Да и ядро для carp(4) пересобирать не надо, оно грузится модулем.
fox, 2011-08-29 в 13:34:09
Кончай тролить, я тут не маны пишу а описываю как было решена та или иная проблема и решение работа-способное. И ядро пересобрать или подгружать модуль это тоже дело каждого! А вот что ты добиваешься? Хочешь показать как надо с твоей точки зрения, пиши рядом свою статью мы почитаем, оценим…
Или тебе сыкотно?
Mox, 2011-08-29 в 15:12:40
Сколько пены у рта) Ну раз уж мы на личности уже перешли...
"работа-способное" - как в школе учились? И кстати, давно закончили? Вообще, тон и способ изложения мыслей, как бы, подсказывает.
А по делу:
Я разве не конструктив пишу? И где троллинг?
fox, 2011-08-29 в 16:36:29
Ты о своей пене?)
Это тебе что то неймётся я выше всё сказал. И тема закрыта!
ziggi, 2011-11-24 в 11:42:21
>Я выбрал ZFS - с ней проще хотя бы по той причине, что не придётся пользоваться чеколкой fsck, и ZFS более гибок в настройках в дальнейшем!
В freebsd 9 можно (и нужно :) включить журналирование метаинформации
tunefs -j enable /dev/ufs/some_label
И fsck будет пролетать пулей (время прооверки на порядок меньше). Все-таки иногда ufs бывает предпочтительней.
щщи! Это поля для ввода комментариев к статье, а не для вопросов. Сюда пишите найденные баги, или какие-то фичи :)
Для вопросов есть форум!
Abr, 2012-01-17 в 9:23:51
Плюс статьи в том, что сразу находится Гуглем.
Еще один плюс - приложены готовые скрипты для ucarp.
Однако все описаное не содержит новизны.
Еще весной 2010 года В.А. Лохтуров из Бауманки в своих лекциях рассказывал о том же, но для FreeBSD 7.X, в которой не было HAST, а репликация дисков на двух разных машинах производилась через GEOM-овские ggatec и ggated. В 8.х появился HAST и стало чуток проще это настраивать, используя готовые скрипты HAST-a.
Из недостатков метода следует отметить неоправданное сочетание родного CARP и юзерландовского UCARP - один из них здесь излишен. Более того. Для подключения CARP требуется пересборка ядра, а UCARP заработает и без пересборки ядра и выполнит те же функции.
Вдействительности, нативный CARP имеет то приеимущество, что выполняется на уровне ядра и за счет этого корректно работает с pfsync, чего лишен ucarp.
Но, поскольку о настройке pfsync здесь ничего нет, то мы и получаем ненужное нагромождение.
Смысл же наличия pfsyns (желательно на отдельных фейсах, соединенных напрямую) в том, что когда правильно сделан pfsync, при внезапном останове мастера сессии сохраняются. В свою очередь, это значит, что ползателю, заливающему большой файл в тот момент, когда произошла смена ролей машин, при наличии pfsync-a не придется устанавливать ноую сессию.
Автору: молодец, хорошая работа. Но обилие восклицательных знаков в тексте вызывает желание язвить и придираться. Так что извиняйте...
Еще один, 2012-07-17 в 17:10:32
2Abr
Ну кто, кто вам сказал, что для родного carp(4) надо ядро пересобирать?! Модули вдруг стали некомильфо?
jb, 2012-10-19 в 11:28:19
Юзать ядерный карп для решения этой задачи? Омг.
Махуяр Интриганович, 2013-02-05 в 10:27:56
s/BECKUP/BACKUP/
поправьте
Этот информационный блок появился по той простой причине,
что многие считают нормальным, брать чужую информацию не уведомляя автора
(что не так страшно), и не оставляя линк на оригинал и автора — что более существенно.
Я не против распространения информации — только за. Только условие простое — извольте
подписывать автора, и оставлять линк на оригинальную страницу в виде прямой, активной, нескриптовой,
незакрытой от индексирования, и не запрещенной для следования роботов ссылки.
Если соизволите поставить автора в известность — то вообще почёт вам и уважение.
© lissyara 2006-10-24 08:47 MSK
Комментарии пользователей [30 шт.]