Меню
Экстремальные вычисления в бизнесе
Сегодня мы хотели бы поговорить о подходах к решению экстремальных задач в бизнесе. И в нашу студию мы пригласили Александра Старыгина, директора департамента подготовки технических решений HPE в России.
Сергей Екатериничев: – Александр, добрый день!
Александр Старыгин: – Добрый день, Сергей!
Сергей Екатериничев: – Спасибо, что нашли время для интервью. Подскажите, насколько, по Вашему мнению, выросли вычислительные мощности, потребляемые бизнесом в целом?
Александр Старыгин: – Мы же с Вами помним – да и все помнят – что в начале пандемии существовали диаметрально противоположные прогнозы. Одни говорили: «Ну теперь всё рухнет вообще сразу», другие говорили: «Нет, что вы, сейчас IT как раз наоборот – взлетит, потому что все ушли». Но жизнь оказалась многообразнее и сложнее. То есть, в принципе, объем рынка в долларах примерно такой же – рост 1-2%, что почти в пределах погрешности подсчета. Просто в рублях он где-то в районе 14-15%, что объясняется, главным образом, курсом рубля. А вот мощности, про которые мы с вами говорим – они другие. Они действительно стали более производительные и более емкие. И причин здесь две. Первая причина – это, в общем-то, развитие технологий. Сегодня за те же деньги, что и три-пять лет назад, можно купить значительно более производительные системы. А вторая причина – это курс на гибридное IT. То есть, понимаете, стало размываться понятие своего корпоративного IT: вот у нас есть серверная, ЦОД, и вот это вот наше – сейчас это все не совсем так. Сейчас какая-то часть корпоративного IT где-то в облаке, какая-то часть корпоративного IT на границе сети, и сказать, где моё – не так уж просто. В силу этого, мощности растут, но они растут за счет технологий и за счет такой гибридизации.
Сергей Екатериничев: – Какие отрасли сегодня являются ключевыми потребителями таких мощностей?
Александр Старыгин: – Знаете, с отраслями, пожалуй, всё еще интереснее. Сегодня границы между отраслями несколько размываются. Ну пример какой-нибудь там – торговля. Мы же все понимаем: вот есть товары, вот есть залы или есть интернет – вот они торгуют, меняют товары на деньги. И вдруг некоторая торговая точка, или торговая сеть заводит цифровой кошелек. То есть она берет у нас, у потребителей, деньги, их где-то складывает, и потом, когда мы оплачиваем товары – это не обычная транзакция, а это транзакция вот из этих денег, которые у них уже есть. То есть, по сути дела, она берет на себя часть функций – ну, конечно, не опер-день банковский – но часть функций оттуда присутствует. А дальше больше: эти деньги не могут же там просто так лежать, они должны куда-то инвестироваться, и так далее, и так далее. И это касается не только розничной торговли – это касается, например, сервис-провайдеров. Казалось бы, предоставляют доступ в интернет, например – но вот выясняется, что сервис-провайдеры, по разным оценкам – разное количество процентов, но где-то 20-25% своего дохода – получают от игр. Люди заходят в разного рода Варкрафты, Танки – это же целая индустрия. Но они же не могу просто так смотреть на это – как там кто-то разрабатывает – они должны стимулировать это, они должны туда вкладываться, и это сращивание… про Сбер, к примеру, я вообще не говорю – Сбер это уже давно, словами господина Грефа, IT-компания… и так далее, и это везде. То есть, происходит некоторое взаимопроникновение индустрий. Конечно, это не значит, что теперь и металлурги, и банки, и всё вообще… но основные требования вот этих мощностей происходит тогда, когда какая-то отрасль начинает расширяться, начинает внедрять некоторые процессы, некоторые функции, которые до этого не внедряли..
Сергей Екатериничев: – Если говорить о вычислителях, какие новинки заказчикам доступны сейчас в портфеле HPE? Чем они примечательны?
Александр Старыгин: – Новинок достаточно много. Вот это время, когда была пандемия, она коснулась и лабораторий, в частности – они были заперты, и это способствовало творческому некоторому росту. И произошло, действительно, довольно много обновлений. Произошло обновление, касающееся нашей серверной линейки. И обычно оно, конечно, связано с появлением новых процессоров, но не только: сервер – это же не только процессор, это целая экосистема. И в новом поколении – Gen10Plus – там, например, огромное внимание было уделено подсистеме ввода-вывода. У нас полностью сменилась линейка контроллеров, и сейчас у нас самые быстрые контроллеры в мире. У нас функции безопасности достаточно серьезно изменились, и много-много чего еще. У нас идея промышленного искусственного интеллекта, которая пришла из систем хранения, где огромное количество датчиков посылают телеметрию в облако, и она там анализируется – это оказался очень эффективный подход, просто очень. И сейчас эта технология пришла в compute. Сейчас каждый сервер может информировать о том, какая там температура, как нагружены контроллеры, память, процессоры, давать какие-то рекомендации. Отдельная серия изменений – блок изменений – посвящены безопасности. У нас на последнем крупном мероприятии WorldWide класса – конференции Discover – было объявлено о проекте Aurora, который посвящен теме сквозной безопасности, то есть безопасности как на уровне firmware, безопасности на уровне организации поставок, безопасности на уровне операционной системы, приложений – и этих изменений на самом деле достаточно много.
Сергей Екатериничев: – Для вычисления информацию нужно еще собрать. Что Hewlett Packard Enterprise предлагает для захвата и хранения огромных массивов неструктурированной информации?
Александр Старыгин: – Когда-то – кстати, не так давно – считалось, что есть два основных критерия, по которым выбирается дисковый массив: это его производительность (сколько он выдаёт IOPS), а второй – это его емкость, насколько он расширяется. Вот сейчас это не то чтобы совсем не так, но, наряду с критериями скорости, производительности, емкости появились другие критерии – то есть умения, например, собрать данные, возможность их эффективно перемещать между разными сайтами. Ну вот, например, есть некоторая система искусственного интеллекта, и если туда передать все собранные данные (на время, которую можно арендовать, она, в общем, не так уж дорого стоит и арендовать ее на несколько дней) она может провести корреляции у разных событий, проанализировать данные и выдать информацию чрезвычайно полезную для бизнеса. И вот у вас есть массивы, они очень производительные и очень емкие, но собрать эту информацию, разбросанную по десяткам филиалов, по разным сайтам – не так просто. И вот умение собирать информацию, возможность перемещать данные, создавать объектные системы хранения – вот это стало одним из таких вот мейнстримов развития современных систем хранения.
Сергей Екатериничев: – А что касается передачи информации – какие новинки нам уже доступны в рамках сетевой инфраструктуры Hewlett Packard Enterprise?
Александр Старыгин: – У нас сетевой инфраструктурой занимается специальное подразделение Aruba, которое тоже, кстати, очень успешно развивается. И, начавшись с беспроводных решений, сейчас это и решения для центров обработки данных, и много других разных решений, охватывающих все вопросы передачи данных. Из тех последних решений, которые мне бы запомнились, я бы назвал, пожалуй, такое: программно-определяемую сеть. У нас появилось программное обеспечение, которое называется Aruba Fabric Composer. Это такое программное обеспечение, которое позволяет объединить набор отдельных коммутаторов в некоторую единую технологию, топологию единую, и управлять этим значительно более просто. Вот это первое такое, что хотел бы отметить. Второе решение – это Aruba Edge Services Platform. Это некая система, в центре которой также находится вопрос сетевой безопасности, это один факт. И второй факт – она также изначально использует системы искусственного интеллекта, которые позволяют заметить все отклонения в настройках, которые случайно или целенаправленно могли быть внесены системным администратором или какими-то другими внешними силами. И вот на эти два решения я бы посоветовал обратить особое внимание.
Сергей Екатериничев: – Экстремальные вычисления требуют применения сложного оборудования. Как драматически ускорить решение технические проблемы как с новым оборудованием, так и на стыках решений всего комплекса?
Александр Старыгин: – Ну тут, вообще говоря, путь достаточно хорошо известен, и опять же он связан с неким промышленным искусственным интеллектом. Здесь его задача – это сквозной анализ всего стека ИТ инфраструктуры. Например, статистика показывает, что у вас замедлился ввод-вывод, замедлилось обращение к системе хранения. Это же система хранения – нужно срочно покупать новые диски, модернизировать контролеры. Но статистика говорит, что 50% таких проблем лежат вне СХД. Ну например: почему может быть медленный доступ серверов к данным? А вот, например, у сервера не хватает оперативной памяти, и он все время осуществляет свопинг на диске. И как результат – замедление, и дисковый массив здесь вообще не причем. И поэтому сквозной анализ такой инфраструктуры на основе систем искусственного интеллекта – это как раз один из таких очень важных – если не сказать основных – путей для решения проблем, которые возникают в самом оборудовании именно на стыках систем.
Сергей Екатериничев: – При вычислениях на таких скоростях сильно возрастает стоимость ошибки. Как Hewlett Packard Enterprise обеспечивает непрерывность вычислений на экстремальных нагрузках?
Александр Старыгин: – На мой взгляд, средство обеспечения непрерывности функционирования ИТ инфраструктуры – это одна из наиболее, если просто не сказать наиболее, развитая область ИТ. Просто уже с незапамятных времен этот вопрос, естественно, волновал и находился в центре внимания как разработчиков, так и производителей вообще, начиная от того, что отказ вентилятора не приводит к отказу сервера, ни на одном сервере вообще уже, наверное, в мире. То же самое касается источников питания, контроль четности, и так далее. Потом стали обращать внимание на внешние катастрофы: если вдруг недоступен сайт, то переход на другой сайт, и это просто одна из самых развитых областей. Но все не стоит на месте, и сегодня стоит вопрос о том, например, что вот виртуальная машина: нужно перенести ее не только с этого сервера, не только с этого диска, а вот на другой сайт. А это нужно сделать за секунды, а еще лучше миллисекунды. А теперь вот контейнеры: и как переносить контейнер? И вот это все развивается очень быстро, очень стремительно, и не стоит на месте. Вот из таких наших новинок в этой области я бы сказал, что мы, кстати, в июле 2021 года, буквально несколько месяцев назад, приобрели компанию Zetra, которая специализируется именно на такого класса решениях, связанных с контейнерными системами именно для обеспечения непрерывности бизнеса.
Сергей Екатериничев: – К сожалению, оборудование не может работать вечно, даже у самого лучшего случаются сбои и поломки. Как реализуется самовосстановление вычислительных систем? Какие решения применяются, чтобы избежать деградации производительности при обслуживании и ремонте?
Александр Старыгин: – Мы уже несколько лет – даже, наверное, лет пять – продвигаем концепцию автономного ЦОДа. И нам представляется, что это абсолютно естественная эволюция системы обслуживания и управления ЦОДом. Ну как раньше осуществлялось: самый простой способ сбора данных – вот собираются данные от всего и записываются в некоторые журналы, в некоторые логи. Если что-то случилось, то можно логи проанализировать и выяснить, где там что случилось потом. Но это совсем уж древний способ, я сомневаюсь, что еще остались какие-то компании, где он используется. Дальше происходит следующий этап: реактивные оповещения. Вот что-то случилось и там заморгали красные лампочки, завыли сирены, системные администраторы получили кучу всякой информации, и вот пошло и закрутилось. Но значительно более эффективно и сейчас так пользуются – рискну сказать, что 90-95 процентов заказчиков – это проактивное решение проблем. Это уведомление о том, что что-то может произойти: вот, знаете, слишком много однобитных ошибок в памяти. Нет, они все исправляются и все работает, но лучше это заменить. Или там вот что-то этот процессор стал перегреваться. Нет, он еще не достиг той критической температуры, и так далее. То есть можно проактивно решать проблемы до того, как что-то наступило. Это следующий этап. И потом уже – это автоматическое управление изменениями. Это выявление каких-то узких мест. И, в общем, перенастройка: она может быть автоматическая, может быть полуавтоматическая, может быть и рекомендации для того, чтобы эти узкие места расшить или не допустить. Ну а дальше уже один шаг до реализации автономного ЦОДа – то есть такого ЦОДа, который не требует или требует в самой минимальной степени ручного вмешательства и обслуживания, и это обслуживание сводится к тому, что вот всё проанализировали и сказали: вот это надо заменить. Собственно, это очень важный подход, и те наши заказчики, которые вот по этому пути проходили, они в общем то чувствовали себя значительно лучше во время всей вот этой вот пандемии.
Сергей Екатериничев: – У Вас очень интересный и развернутый ответ. Александр, спасибо большое за интервью!
Александр Старыгин: – Всегда рад помочь. Всегда рад с удовольствием. Спасибо вам за внимание!
Сергей Екатериничев: – Увидимся на нашем мероприятии. До свидания!
Кулинарная студия CulinaryOn, Новинский бульвар, д. 31, ТДЦ ВЭБ.РФ, 2 этаж
Начало 23 сентября 2021 г. в 15:00