Меню

Эволюция системы мониторинга центра обработки данных в продуктивной среде

Заказчик: Ведущая продуктовая розничная компания в России

Обеспечение непрерывного функционирования IT-инфраструктуры розничной сети, представленной во всех регионах России – ответственная задача, требующая серьезной подготовки и значительных инвестиций. Любые изменения, вносимые в аппаратную инфраструктуру и программное обеспечение, должны гарантировать непрерывность предоставляемых локально ИТ сервисов.

У заказчика на момент начала проекта уже было развернуто значительное число центров обработки данных, территориально распределённых по различным регионам России. Дополнительно функционирует головной ЦОД, на котором может резервироваться выполнение задач локальных ЦОДов. Бурный рост бизнес-активности привел и к значительному росту количества используемого оборудования. Если в 2004 году использовалось 6 стоек и до 50 узлов, то к 2008 году число стоек выросло до 50 (525 узлов), а к         2015 году уже было развернуто свыше 50 стоек с более чем 4025 узлами.

Ключевыми особенностями используемого решения является обеспечение отказо- и катастрофоустойчивости. Для обеспечения резервирования используется схема N+1. При переходе в аварийный режим критичные сервисы обеспечиваются за счет головного ЦОД.

Обслуживание клиентов является основой бизнеса любого ритейлера, остановка касс в магазине или задержки с приемкой или отгрузкой товаров приводят к потерям.  Зависимость бизнес-задач от ИТ сервисов увеличивается по мере роста бизнеса, увеличение количества удаленных площадок увеличивает сложность администрирования и управления. Ключевым требованием бизнеса становится уменьшение затрат на сопровождение и владение ИТ.

Целью нашего заказчика является обеспечение простоты обслуживания и масштабирования систем небольшим штатом инженеров со стандартным уровнем подготовки. Для реализации поставленной цели был разработан жесткий шаблон архитектуры локального ЦОД.

Помимо уменьшения затрат на сопровождение и владение инфраструктурой, заказчик хотел сохранить предыдущие вложения. При этом, по результатам предварительного анализа, количество контролируемых устройств и параметров функционирования оборудования должно было увеличиться на порядок. Управление обновленной инфраструктурой осуществляется централизованно, при этом сохраняются наработанные регламенты, привычные политики и конфигурации системы мониторинга окружающей среды и устройств электропитания.

Дополнительным требованием заказчика было выполнение работ в продуктивной среде, без остановки технологических и бизнес-процессов. Работы по миграции и отладке систем осуществлялись специалистами нашей компании. На завершающей стадии проекта мы обеспечили обучение и сертификацию инженерной группы заказчика.

Проект выполнялся в несколько этапов.  Анализ существующей архитектуры ИТ и аудит имеющейся системы мониторинга показал, что заказчик уже использует технологии виртуализации и консолидации серверов. Также заказчик располагает штатом квалифицированных системных администраторов. В IT-инфраструктуре заказчика уже применяется StruXureWare DataCenter Expert Virtual Machine (DCE), но возможности имеющихся серверов ограничены.

В качестве решения был предложен переход от «железного» к виртуальному DCE, миграция лицензий, конфигураций и политик, а также увеличение парка контролируемых узлов.

Этапы проекта
1. Развертывание DCE в виртуальной среде заказчика. Специалистами Компании «ВИЗАРД» было осуществлено развертывание и первоначальное администрирование системы, настройка шаблонов, политик, установок и бизнес-логики в соответствии с имеющимся серверным оборудованием. В дальнейшем новому серверу было передано управление начального пула узлов. Инженерная группы заказчика прошла обучение в технологическом центре Schneider Electric.

  1. Переход управления от ранее используемого аппаратного DCE новому виртуальному серверу, передача управления устройствами, не вошедшими в первый пул, новому DCE. В процессе передачи была осуществлена миграция имеющихся на нем лицензий (устройств) на новый сервер. Этап завершен опытно-промышленной эксплуатацией развернутой системы.
    3. После завершения стадии опытно-промышленной эксплуатации старый аппаратный сервер был исключен из инфраструктуры заказчика.

Проект миграции на виртуальную DCE был выполнен в продуктивной среде, без остановки технологических и бизнес-процессов. В результате внедрения нового решения были уменьшены затраты на сопровождение и владение IT-инфраструктурой, при сохранении инвестиций «в железо». Количество контролируемых устройств и параметров работы оборудования существенно возросло.