Проблемы с электропитанием вообще не новость и не проблема – это обыденность любого администратора. ИБП, генераторы питания и т.п. – понятные технологические решения класса MUST HAVE. Однако статистика показывает неутешительные данные – вероятность сбоя питания в течение часа после первой аварии составляет 50%. Что это значит? А это значит, что нагрузка во второй раз переключается на ИБП с пустыми батареями. А это значит… ну вы понимаете!!!
Таким образом, в стратегию плана катастрофоустойчивости DRP нужно вводить средства автоматического реагирования не только на сам факт выключения питания, но и на % снижения заряда батарей. Эксперты компании ВИЗАРД поделились основными моментами такого плана:
1. Все пользователи, отвечающие за системы, оповещаются автоматически при проблемах с питанием.
2. Последовательность связей и выключение должно быть зафиксировано документально. Также необходимо создать скрипты в системах управления (желательно с привязкой к параметрам батарей).
3. Обязательное разделение и маркирование нагрузки. Немаркированные виртуальные машины, серверы и прочее оборудование выключается автоматически сразу при переходе на батареи.
4. Системы общего назначения, тестовые зоны замораживаются и выключаются при 80% батареи.
5. Среды разработки сворачиваются и выключаются на 60%.
6. Системы резервирования завершают операции по резервированию на 50%.
7. Резервные кластерные узлы выключатся на 30%.
8. Ключевая нагрузка последовательно выключается на 20%.
Порядок включения не совсем обратный. Кроме ключевых систем желательно не включать тестовую среду, разработку и немаркированную нагрузку до 100% зарядки батарей.
Будьте осторожны с массовым включением рабочих мест. Большинство компьютеров генерируют в первые несколько минут пиковую нагрузку. Лучше производить запуск партиями (отделами, этажами, блоками).