Энергоэффективность ЦОДов

Сегодня мы продолжаем цикл статей в рамках подготовки к мероприятию «Поиск точек роста и бизнес-эффективности за счет ИТ решений HPE и AMD».

Сергей Екатериничев, директор департамента технической поддержки АО "Компания "ВИЗАРД"
Александр Трошин, менеджер по развитию HPE-AMD бизнеса в Центральной и Восточной Европе

Вторая тема связана с тем, как можно повысить отдачу каждого элемента в ЦОДе, как правильно находить, анализировать и снижать холостые нагрузки. Раскрыть данную тему мы попросили Александра Трошина, менеджера по развитию HPE-AMD бизнеса в Центральной и Восточной Европе.

Даже в период пандемии нагрузка в ЦОДах непрерывно растет. Все больше процессов автоматизируются для возможности автоматизации задач, где ранее требовалось взаимодействие людей. И задачи, ранее недоступные, становятся необходимой частью ИТ, например массовый дистанционный замер температуры или распознавание брака на конвейере. Однако инженерная инфраструктура ЦОДов очень дорогая и негибкая. Как HPE сейчас подходит к решению данных задач?

        • Сегодня наиболее ресурсоемкие задачи связаны с искусственным интеллектом, там, где используется большой объем оперативной памяти, графические ускорители и топовые процессоры.
        • Для решения данной задачи HPE фокусируется на снижении потребления не только в процессорах и памяти, а целиком в платформе, включая специализированные утилиты мониторинга и управления – например, облачная аналитическая платформа InfoSight или система управления ИТ-инфраструктурой HPE OneView. Кроме того, HPE контролирует цепочку поставки компонентов и качество их производства, работу всего стека (Silicon Root of Trust).
        • Также снижению расходов помогает подход разделения затрат в канале – ИТ, как услуга.
HPE Apollo 6500 Gen10 Plus

Если говорить о самых энергоемких задачах, которые сейчас решаются в бизнесе, то следует выделить следующие:

        • Расширение использования графических адаптеров для ИИ и МО. Для этого HPE разработало линейку серверов Apollo 6500 поколения 10+. Суть платформы не только в большом количестве разъемов под графику до 16 адаптеров (AMD и NVIDIA), но и оптимизированные каналы связи внутри сервера и между платформами.
        • Конфигурации серверов могут быть различными (по количеству процессов, ядер), что позволяет оптимально рассчитать и энергоэффективность и количество лицензий.
        • Вторая задача – это конвертация в «инсайты» огромного объема бизнес информации. Для этого в портфеле HPE есть платформа Apollo 2000 поколения 10+. Это шасси до 4 серверов. Это позволяет значительно повысить плотность серверов и вычислений в целом на стойку.
        • Отдельный фокус в платформе был сделан на бесперебойности работы северов в момент обслуживания.
        • Apollo 2000 применятся под задачи в следующих отраслях:
          • Финансы,
          • Промышленное производство,
          • Нефтегазовая отрасль,
          • Биологические науки.

При выборе архитектуры, когда энергопотребление и охлаждение критичны, заказчику следует обратить внимание на следующие параметры:

        • Для начала надо понять будущие нагрузки, а также желаемую модель потребления ресурсов. Конечно, идеально с помощью тестов иметь оптимальную загруженность систем, расписание рабочих задач, которые на них выполняются, чтобы впоследствии оптимизировать количество ресурсов. Но такой вариант чаще всего просто недоступен. Тогда можно опираться на рекомендации специалистов, референтные архитектуры, которые опубликованы в публичных источниках, таких как SPECpower.
        • Также, естественно, обязательно стоит обратить внимание на новые технологии по энергоэффективности и производительности компонентов как систем в целом, так и в разрезе поколений. К примеру, процессоры AMD третьего поколения имеют большое количество мировых рекордов энергоэффективности.
        • И в тоже самое время можно подойти к выбору с точки зрения результатов производительности на 1 ватт или, к примеру, стоимости вычислений с плавающей точкой или вычислений целых чисел. Также важны и показатели производительности на ядро.

Важнейшими задачами являются мониторинг и управление. HPE предлагает целый спектр решений, помогающий сочетать производительность и энергоэффективность систем. HPE фокусируется не только на сфере электротехники, но также сфере искусственного интеллекта и других программных продуктов. Вот несколько примеров:

        • Утилита Workload Profile MatchIng позволяет выставить автоматические настройки BIOS под конкретную задачу.
        • InfoSight – это самое продвинутое решение на рынке в сфере искусственного интеллекта для ИТ оборудования. Она предоставляет предиктивную аналитику на базе глобальной базы данных инсталляций различных платформ HPE уже на протяжении большого количества лет и проактивное выявление проблем, анализ утилизации инфраструктурных ресурсов и ресурсов виртуализации в том числе.
        • Управлению пулом ресурсов сможет помочь утилита HPE OneView. Это программно-определяемая аналитика, включающая унифицированные шаблоны развёртывания и другие возможности.
        • Таким образом, грамотная комбинация решений поможет не просто получить хорошую или лучшую энергоэффективность, но и не потерять в тоже самое время производительность, а также облегчить трудоёмкий процесс постоянного мониторинга.
Облачная аналитическая платформа HPE InfoSight

HPE в сфере энергоэффективности показал замечательные результаты на базе процессоров AMD:

        • На уровне платформы, о которых я уже упомянул – это Apollo 2000 поколения 10+. Данная система на базе процессоров AMD EPYC также установила несколько мировых рекордов по энергоэффективности (SPECpower), включая лучшие результаты для 4 узлов на системах Linux и Windows. А также в целом как лучшее 4 узловое решение.
        • В дополнение к экологическим преимуществам этой цели, наши рекордные по энергоэффективности серверные процессоры AMD EPYC помогут снизить энергопотребление и выбросы парниковых газов (GHG) при широком спектре рабочих нагрузок и могут потребовать меньшего количества серверов. Например, для обеспечения производительности в 10 000 единиц SPEC Integer при использовании 2P серверов на базе AMD EPYC 7763 по сравнению с 2P серверами на базе Intel Xeon Platinum 8380 может потребоваться на 33% меньше серверов, занимающих на 50% меньше места и на 42% меньше энергии, при этом общая стоимость владения (TCO) за 3 года снижается на 36%.
        • Новый суперкомпьютер Adastra, разработанный HPE для Национального вычислительного центра для высшего образования Франции (CINES), создал двойной вызов: массовое переключение пользователей на GPU с повышением производительности и одновременно преодоление проблемы потребления электроэнергии. «Головокружительный 21-кратный скачок в вычислительной мощности по сравнению с нынешней машиной, в то время как потребление электроэнергии растет только в 1,5 раза для “зеленых” HPC», – сказал Борис Динтранс, директор CINES.
        • Суперкомпьютер, который компания HPE разрабатывает для продвижения научных исследований в суперкомпьютерном центре Pawsey в Австралии, получит в 30 раз больше вычислительной мощности и в 10 раз больше энергоэффективности благодаря передовым решениям на базе суперкомпьютера HPE Cray EX с будущими процессорами AMD EPYC™ и GPU AMD Instinct™.

Мы рекомендуем каждому заказчику попробовать новые решения HPE на базе новейших процессоров AMD EPYC в сочетании с утилитами быстрого развертывания, управления и аналитики и оценить их эффективность, а также поделиться с нами результатами.

Более подробную информацию о возможностях применения новейших технологий вы сможете узнать на нашем мероприятии «Поиск точек роста и бизнес-эффективности за счет ИТ решений HPE и AMD».