HPC на острие прогресса (II часть)

Логотип компании
HPC на острие прогресса (II часть)
Основные трудности компаний, желающих работать с HPC-технологиями, обусловлены низким уровнем компетенций и нехваткой человеческих ресурсов для интеграции и обслуживания подобных систем...

(Продолжение/ Начало в IT News №8/2019)

Препятствия на пути

При запуске HPC-проектов любого уровня естественно возникают проблемы. С чем приходится сталкиваться компаниям, которые только начинают работать с HPC, и тем, кто имеет с ними дело давно?

Олег Коновалов (ГК ЛАНИТ) основную проблему HPC-технологий видит в том, что они немного дороже, чем классические, да и специалистов такого профиля в России пока не так много. Например, он наблюдал запуск нескольких проектов, инициированных только потому, что это «модно и современно», хотя по факту они там были совершенно не нужны.

По мнению же Михаила Орленко (Dell Technologies), главная сложность при реализации HPC-проектов заключается в необходимости обладать соответствующими знаниями, чтобы правильно выбрать архитектуру и прикладное ПО для расчетов. Впрочем, архитекторы крупных вендоров всегда готовы поделиться опытом и помочь заказчику приобрести именно то решение, которое справится с поставленными им задачами, уложившись в отведенный бюджет.

Андрей Солуковцев (IBM) делает акцент на том, что HPC-технологии, в отличие, скажем, от мейнфреймов, это не бизнес-проекты, а исследовательские программы, направленные на перспективу, как правило, нескольких лет. Поэтому необходимо особенно тщательно подходить к их обоснованию.

Андрей Солуковцев (IBM):

Андрей Солуковцев (IBM):

«Постоянная недозагрузка мощностей будет прямым свидетельством неэффективности проекта – пожалуй, даже большим, нежели в случае периодической нехватки мощностей».

Вячеслав Елагин (HPE) согласен, что проблемы есть как у тех, кто уже работает с HPC, так и у новичков. Основной момент у первых – бюджет. Как только НРС-решение приобретается для коммерческого использования, оно очень быстро становится загруженным: то, что ранее делалось за одно время, теперь делается быстрее и пользователи за рабочий день завершают большее число заданий, получая при этом большее разрешение, точность, размерность и т. д. Таким образом, выбирается вся доступная вычислительная мощность. Основная же проблема на старте – острая нехватка в России профильных специалистов. Здесь вопрос бюджета отходит на второй план: два-четыре узла уже стоят не так дорого, если, конечно, это не специализированные узлы для машинного обучения, поясняет г-н Елагин.

   

Вячеслав Елагин (HPE):

Вячеслав Елагин (HPE):

«Еще большая проблема на старте – найти у себя возможности для применения НРС. Во многих случаях они есть, просто пока скрыты от менеджмента».

Андрей Сысоев (Lenovo) подтверждает, что основные трудности компаний, желающих работать с HPC-технологиями, обусловлены низким уровнем компетенций и нехваткой человеческих ресурсов для интеграции и обслуживания подобных систем. Не менее значима финансовая сторона вопроса, ведь помимо аппаратной составляющей необходимо приобретать коммерческое ПО. Open Source не всегда возможно использовать ввиду, опять же, нехватки соответствующих специалистов. Кроме того, далеко не все организации готовы к долгим простоям в случае негативных сценариев, заключает г-н Сысоев.

Александр Голышко («Техносерв») к общему букету проблем добавляет еще один фактор, определяющий дальнейшее развитие отрасли: физически HPC-система должна размещаться в отдельном зале и потреблять разумное количество электроэнергии – тем же ЦОДам, например, требуются сотни мегаватт. Технические требования к HPC в постоянной динамике: сегодня идет борьба за экзафлопсные вычисления, но уже пошли разговоры о зеттафлопсных. Помимо «супержелеза», необходимо соответствующее ПО, позволяющее максимально использовать вычислительные ресурсы. Современному заказчику важно не просто уметь решать задачи, а решать их быстрее и лучше, чем это получалось на HPC предыдущего поколения. А значит, всё должно быть самое лучшее – от процессоров до сетей. Еще желательно иметь максимально гибкую систему сервисного обслуживания. «Кроме того, надо иметь в виду, что решения на базе кластеров как относительно дешевого инженерного компромисса сталкиваются с непреодолимым ограничением роста производительности при распараллеливании вычислений (закон Джина Амдала): если задача разделяется на несколько частей, суммарное время ее выполнения на параллельной системе не может быть меньше времени выполнения самого длинного фрагмента», – добавляет г-н Голышко.

Сергей Платонов (RAIDIX) поясняет, что в HPC применяется ряд технологий, с которыми плохо знакомы специалисты традиционного enterprise-сектора, в связи с чем пополняется круг проблем: 1) очень высокая стоимость начальных затрат; 2) отсутствие специалистов и хорошей пользовательской документации; 3) нехватка интеграторов, способных осуществлять качественные HPC-проекты.

Евгений Лагунцов (Cisco) подчеркивает, что запуск HPC-проекта – это в большинстве случаев сложная комплексная работа, в которой практически всегда встречается немало трудностей, как технических, так и организационных, и с течением времени их становится только больше. С учетом растущего многообразия архитектур и подходов к построению вычислительных комплексов серьезной задачей станет вопрос интеграции в единую систему отдельных компонентов – вычислительных, сетевых, хранения, системных, прикладных, управляющих, и если раньше роль интегратора часто мог взять на себя производитель оборудования, то сейчас из-за комплексности, вариативности и «мультивендорности» решений, а также специфики ПО все чаще этим занимаются специализированные компании с технологической и отраслевой экспертизой. Немаловажные аспекты – физическое размещение, а также энергопотребление и теплоотвод: в связи с энерговооруженностью современных вычислительных систем для многих крупных проектов это часто становится узким местом. Ну и самое главное – важно не только построить и запустить вычислительную систему, необходимо, чтобы она эффективно решала задачи, ради которых инициировалась, и обеспечивала возврат инвестиций, заключает г-н Лагунцов.

Евгений Лагунцов (Cisco):

Евгений Лагунцов (Cisco):

«Главная задача – понять, какие проблемы и какими средствами планируется решать, на какие готовые программные системы и компоненты можно ориентироваться, какой объем самостоятельной разработки потребуется».

Роман Гоц (Atos) констатирует, что в последние годы в связи с качественным ростом HPC-технологий и их доступностью наиболее частым вопросом является наличие ЦОДа для размещения HPC кластера. Как следствие, компактность вычислителя, его экономичность и такой показатель, как энергоэффективность, выходят на передний план. Касаемо технологий, здесь всё больше идет специализация, например, ЦПУ, применяемых для каждой конкретной задачи. В частности, Atos с этого года в своих HPC-решениях, помимо традиционных продуктов Intel и NVIDIA, предлагает технологии AMD и Marvell.

Андрей Шапошников («Инфосистемы Джет») видит основные проблемы, во-первых, в отсутствии экспертизы в штате как по созданию и эксплуатации инфраструктуры, так и по использованию технологий для решения бизнес-задач; во-вторых, в недостатке специалистов на рынке; и в-третьих, в отсутствии «коробочного» инфраструктурного решения для HPC, не требующего индивидуального комплексного подхода к конфигурированию и поддержке.

 

Облачный аспект

Как развивается рынок облачных HPC-услуг в России и мире? Востребованы ли такие услуги у российских заказчиков?

Олег Коновалов (ГК ЛАНИТ) уверен, что эта часть рынка развивается за счет предложений от облачных провайдеров и производителей оборудования. Спрос не столь велик, как на классический IaaS, но он есть.

Михаил Орленко (Dell Technologies):

Михаил Орленко (Dell Technologies):

«На мой взгляд, для России это очень перспективное направление развития бизнеса сервис-провайдеров: очевидно, что далеко не всем организациям ресурсы вычислительного кластера требуются 365 дней в году, в то время как обычно для HPC-систем требуется специфическая инфраструктура».

Как отмечает Михаил Орленко (Dell Technologies), согласно отзывам западных коллег, в Европе и США облачные HPC-услуги – это активно растущий бизнес, во многих ситуациях их применение станет наиболее оптимальным способом оптимизации расходов на ИТ.

У облачных HPC-услуг прекрасный потенциал роста, считает Андрей Солуковцев (IBM). Объединение суперкомпьютеров в сети с доступом через облако, с одной стороны, решит проблему нехватки мощностей для решения общей задачи, а с другой – позволит эффективно перераспределять вычислительные нагрузки и масштабировать инфраструктуру, обеспечивая единый подход к управлению и информационной защите. Главное, чтобы пропускная способность сети была соответствующей. Отличным примером коллективной вычислительной работы на уровне не то чтобы суперкомпьютеров, а обычных потребительских устройств г-н Солуковцев называет благотворительный проект IBM World Community Grid, объединяющий в сеть компьютеры, смартфоны и планшеты сотен тысяч волонтеров со всего мира, позволяя ученым использовать их ресурсы на решение социально важных задач, в частности в сферах экологии и здравоохранения.

Вячеслав Елагин (HPE) напоминает, что облачные НРС-услуги в мире оказывают уже несколько лет разные провайдеры. К слову, сама HPE запустила пакет HPC-aaS по такой модели в числе первых. «Мы продолжаем развивать это направление за счет различных вариантов потребления по требованию, но в России продаж наших облачных НРС-услуг пока нет по ряду причин, обусловленных такими традиционными ограничениями, как ИБ и большие объемы передаваемых в обе стороны данных, – рассказывает г-н Елагин. – Сюда же можно добавить высокую стартовую стоимость: цену оборудования и лицензий на ПО – прикладное, оркестрации, биллинга, а также инженерной инфраструктуры и самих инженеров. Наконец, еще одно “отягчающее” обстоятельство – технический прогресс: оборудование в НРС-сегменте меняется очень часто, и нужно быстро бежать, чтобы оставаться на месте, предлагая все самое свежее, чтобы быть конкурентоспособным.

Речь идет о возврате инвестиций и прибыли провайдера, уточняет г-н Елагин. Тем не менее в России такие услуги уже оказываются – частные НРС-облака развернуты внутри крупных компаний. Есть и небольшие публичные облака. А кроме того, заметен пласт небольших компаний, для которых вследствие описанных выше ограничений HPC-aaS может стать трамплином для дальнейшего развития. Да и те, кому дополнительные мощности нужны до момента покупки комплекта модернизации для существующего или нового кластера, нуждаются в подобных услугах. Словом, интерес у российского рынка налицо и, возможно, очень скоро мы услышим анонсы в этом сегменте, резюмирует г-н Елагин.

Андрей Сысоев (Lenovo) отмечает, что уже сейчас облачные платформы довольно востребованы и многие владельцы кластеров предоставляют HPC-услуги по модели SaaS. Однако стоит учитывать, что не каждая компания может позволить себе передавать данные в облако, подчеркивает он.

Александр Голышко («Техносерв»):

Александр Голышко («Техносерв»):

«Поставщикам облачных сервисов необходимо убедиться, что они обладают достаточным уровнем навыков и понимают, для каких рабочих нагрузок клиента подойдет модель HPCaaS (HPC как услуга)».

Александр Голышко («Техносерв») отмечает несколько способов выхода на рынок, включая гибридную облачную инфраструктуру для увеличения емкости, дифференциацию на основе сетевой инфраструктуры или географического местоположения и HPC по модели «ПО как услуга». Логично, что на смену экзотическим архитектурам HPC, основанным на специально масштабированных процессорных ядрах и сетях межсоединений с общей памятью, приходят стандартизированные кластеры по требованию. Эти новые облачные ресурсы – по сути, вычисления масштаба ЦОДа, где все узлы однородны и автономны, а главный выигрыш – экономия на совокупной стоимости владения и эффективности энергопотребления, что выгодно заказчикам, в том числе российским, убежден г-н Голышко, однако надо внимательно относиться к деталям, например возможностям разработчиков систем и HPC-приложений в части масштабирования, функциональности и т. д.

Сергей Платонов (RAIDIX) называет облака спасением для компаний, начинающих использовать HPC для развития своего бизнеса. «Лидирует на этом рынке Amazon, и я вижу множество крупнейших заказчиков среди потребителей его сервисов, – говорит он. – Но в то же время создаются новые проблемы, связанные с требованиями регуляторов по соблюдению конфиденциальности данных».

Подчеркивая популярность HPC как услуги на западных рынках, Роман Гоц (Atos) приводит пример такой известной международной корпорации, как Atos. Более того, один крупный европейский автопроизводитель, имеющий дочерние предприятия в России, рассматривал вариант расширенного использования такого рода услуг в нашей стране. Однако российская специфика держать большие и критичные вычисления поближе к себе отразилась и здесь: локальный заказчик будет сам покупать в ЦОД оборудование для себя. Аналогичная картина и с остальными привычными рынку HPC-проектами. Вместе с тем промышленные и научные организации активно экспериментируют с услугами в области МО/ИИ, поскольку это не требует, как правило, работы с персональными данными.

Андрей Шапошников («Инфосистемы Джет») утверждает, что подобные услуги востребованы у отечественных заказчиков: например, для научных и учебных организаций уже созданы и развиваются общие центры высокопроизводительных вычислений. Вслед за ними и коммерческие структуры начинают задумываться о создании суперкомпьютерных центров для решения своих задач по обработке больших данных, использованию технологий машинного обучения и т. п. Очевидно, при этом необходимо реализовывать сервисный (имеется в виду облачный) подход к предоставлению услуг пользователям. Сложность только в том, что пока нет доступной коммерческой технологии, позволяющей быстро и просто разворачивать такого рода центры, сокрушается г-н Шапошников.

(Окончание следует)

Смотреть все статьи по теме "Большие данные (Big data)"

Опубликовано 30.09.2019

Похожие статьи