Какой инфраструктуры для искусственного интеллекта не хватает в России?

Логотип компании
Какой инфраструктуры для искусственного интеллекта не хватает в России?

Изображение создано нейросетью

Готова ли Россия к массовому внедрению ИИ, какими ресурсами для этого располагает, каких не хватает? Какой помощи рынок ждет от государства, объединят ли Сбер и «Яндекс» вычислительные мощности как будет развиваться инфраструктура для ИИ и чего ждать от экономики данных — обо всем спикеры ведущих участников рынка говорили на круглом столе IT-World.

Мероприятие проходило на платформе SaluteJazz.

Санкции — не помеха

По данным из официальных источников, за последний год объем рынка ИИ в России достиг 650 млрд рублей, увеличившись на 18%. Но как рынку удается сохранять столь положительную динамику? Ведь сами мы нужных инфраструктурных компонентов производим в объемах явно недостаточных, а получить их от ведущих глобальных игроков теперь можно только по каналам параллельного импорта.

В отечественном сегменте инфраструктуры для ИИ основные деньги связаны с продажей ПО, а не с аппаратной частью, говорят спикеры. В РФ всегда было достаточно талантливых программистов, которые не только умели писать код и правильно использовать его, но и создавать уникальные программные продукты. Сегодня выпускники российских вузов занимают первые места в олимпиадах по программированию разных уровней, и это одни из лучших в мире специалистов по ИИ.

С началом пандемии COVID-19 отечественный сегмент ИИ стал развиваться стремительно. Многие его игроки разработали решения в области анализа картинок, модели компьютерного зрения, бесплотного транспорта и т. д. В каждом сегменте этой индустрии уже есть сложившиеся лидеры, есть зарекомендовавшие себя игроки, которым удалось завоевать определенную долю рынка с каким-либо прорывным решением.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 1
Максим ВЯЗНИКОВ, генеральный директор компании Intelion Cloud:
«Многие айтишники уехали из России. Но это одновременно открывает и новые интересные возможности. Теперь у нас во всех этих странах есть свои люди. И российским компаниям, не знакомым с менталитетами и культурными кодами других стран, теперь должно быть проще выходить на те рынки, где уже работают специалисты — выходцы из РФ».

Правда, с аппаратной частью у нас в РФ пока еще все не так радужно, как с программной. Несмотря на санкции и запреты, до 90% решений в области «железа» составляют решения на базе процессоров Nvidia. Но ряд российских компаний разрабатывает или уже разработал свои линейки серверов, которые вошли в реестр отечественной вычислительной техники Минпромторга. Еще несколько участников рынка — в их числе называют НТЦ «Модуль» и IVA Technologies — ведут работы по созданию карт для обучения моделей ИИ. И если случится так, что геополитические события примут совсем нежелательный оборот, у нас все-таки будут свои альтернативные, полностью отечественные инфраструктурные решения.

И хотя отечественные чипы и процессоры пока еще нельзя сравнить по производительности и иным важным характеристикам с передовыми решениями глобальных лидеров, они способны очень хорошо показать себя в промышленной автоматизации, в системах видеоаналитики и СКУД, в системах решения «Безопасный город» и т. д.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 2
Илья ЛЕВЧУК, директор департамента инфраструктурных ПАК, Fplus:
«С точки зрения железа идет поэтапное развитие. 90% использования — это все-таки решение на базе Nvidia. Сейчас мы с коллегами начинаем смотреть в сторону создания реестровых серверов. У кого-то они уже есть, у кого-то в разработке, чтобы использовать различные GPU-карты. Отдельно есть пару игроков, такие как НТЦ «Модуль» и IVA Technology, которые пытаются делать карточки для инференса ИИ — для обучения моделей. Мы их точно так же тестируем, адаптируем, запускаем совместные реестровые сервера на данных картах, чтобы в случае потенциальных угроз или геополитических непредсказуемых историй иметь альтернативу».

В таких условиях, конечно же, России очень сложно занять конкурентные позиции на глобальном рынке. Но, несмотря на санкционные запреты, которые касаются и ввоза чипов западных производителей, отечественные игроки не так сильно увеличили свои затраты. Для ввоза аппаратной части по-прежнему задействованы каналы импорта, в том числе и параллельного. При этом, как говорят игроки отечественного сегмента вычислительной техники, затраты на инфраструктурную часть возросли не так уж и сильно. И сегодня можно воспользоваться разными возможностями и каналами и для импорта чипов ведущих западных производителей чипов, и продуктов Huawei, очень хорошо себя зарекомендовавших и в инференсе ИИ, и в иных сферах применения.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 3
Александр ФИЛЬЧЕНКОВ, директор департамента серверных и сетевых систем компании «Гравитон»:
«Мы в компании создаем тестовый стенд с продуктами различных вендоров из КНР, для производства которых используются не только открытые исходные коды, но и запатентованная технология — архитектура CUDA от NVIDIA, хотя она и считается проприетарной. Этот стенд будет доступен всем желающим».

Когда подсчитывают объем и рост отечественного рынка ИИ, аналитики имеют в виду, вероятнее всего, совокупную стоимость владения, результаты применения моделей ИИ. Отсюда — и значительный объем рынка, и показатели роста почти на 20%.

Вычислительные ресурсы: на чем нам обучать ИИ

России вполне хватит своих ресурсов и вычислительных мощностей и для того, чтобы обучать модели ИИ, и для того, чтобы развивать эту технологию. К примеру, у нас есть свои собственные суперкомпьютеры — такое могут позволить себе очень немногие страны мира. В 2022 году Россия заняла 8-е место в глобальном рейтинге стран с самыми мощными суперкомпьютерами, а по данным на ноябрь 2024 года, поднялась на 6-е место. В одном только МГУ имеется несколько мощнейших супервычислителей — «Ломоносов», «Ломоносов-2» и «МГУ-270». Последний ориентирован именно на работу с ИИ — он обладает мощностью 400 петафлопс, не имеет аналогов среди подобных систем в университетах мира и является вторым или третьим по мощности среди всех действующих суперкомпьютеров. В списке российских суперкомпьютеров — «Червоненкис», «Галушкин», «Ляпунов», «Кристофари», «Кристофари Neo», GROM. Свои супервычислители есть у «Росатома» и Курчатовского института.

Важная проблема заключается в их неоптимальном и неэффективном использовании.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 4
Илья СМИРНОВ, руководитель направления машинного обучения и искусственного интеллекта, ГК «Юзтех»:
«Вычислительные мощности суперкомпьютеров МГУ просто гигантские. Но загруженность этих вычислителей далеко не 100%-ная. Например, студенты используют их с сентября по декабрь, когда идет курс, все остальное время они фактически простаивают».

Еще одна проблема, которую упомянули спикеры, связана с недостаточным финансированием со стороны государства. В РФ создано и функционирует шесть центров компетенций в области ИИ — на базе МФТИ, Университета ИТМО, ВШЭ, Сколковского института науки и технологий, Университета «Иннополис» и Института системного программирования им. В. П. Иванникова. При этом, для сравнения, в Китае и в США над разработкой решений в сфере ИИ работают сотни вузов, которые финансируются государством, как говорят спикеры, гораздо шире.

Кстати, нельзя исключать и такого развития событий, что создание инфраструктуры для ИИ государство возьмет в свои руки и примет решение о формировании единой государственной ИИ-платформы. Например, на одном из недавних заседаний ИТ-комитета Госдумы министр цифрового развития Максут Шадаев заявил, что к 2030 году вычислительные мощности отечественной инфраструктуры для ИИ должны быть расширены до 1 экзафлопса, и обеспечить это смогут два ведущих игрока — Сбер и «Яндекс». Ждать ли нам объединения ИИ-мощностей этих компаний и не превратятся ли они в монополистов рынка?

В то, что Сбер и «Яндекс» смогут объединить свои вычислительные мощности и договориться об их совместном использовании, не верит большинство спикеров. Конкуренция между этими двумя гигантами, разные бизнес-модели, по-разному выстроенные и уже устоявшиеся бизнес-процессы при решении одной и той же задачи, разные цели использования супервычислителей — поменять все это очень трудоемко, а не учитывать этих моментов нельзя. Если только руководство страны действительно не примет такое решение на уровне законодательства, и обеим компаниям не останется ничего иного, как его выполнять, так или иначе.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 5
Андрей НИКИТИН, начальник отдела цифрового моделирования, компания IBS:
«В нашей стране сильна политическая воля. Если будет выдано такое поручение сверху, подобное объединение может возникнуть. Насколько оно будет эффективным — это уже другой вопрос».

Вспомнили спикеры и о другой государственной инициативе — о создании кластеров суперкомпьютеров, объединенных в единую сеть. И этот проект даже начал реализовываться. Осенью 2021 года об объединении своих суперкомпьютеров в единую сеть объявили Санкт-Петербургский политехнический университет, Межведомственный суперкомпьютерный центр РАН и Объединенный институт ядерных исследований. А не далее как весной текущего года Игорь Каляев, академик РАН и сопредседатель научных направлений Национального центра физики и математики, заявил в СМИ, что российские суперкомпьютеры было бы неплохо соединить в единую Национальную суперкомпьютерную инфраструктуру и что такая мера поможет догнать Запад в этом направлении развития вычислительной техники. Пока неизвестно, насколько такая инициатива реализуема.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 6
Александр БОРИСОВ, руководитель направления Data Science, компания Ramax Group:
«Здесь большой потенциал для развития ИИ на уровне государства. Если создать каналы связи, поставить ПО, которое реализует федеративное машинное обучение, сделать какой-то шеринг ресурсов для инференса, то все уже существующие установленные системы будут использоваться более эффективно. И тогда действительно мы сможем говорить про совокупную мощность в 1 экзафлопс».

Но круглый стол тем и хорош, что дает спикерам площадку для самых разных мнений.

Вероятность того, что «Яндекс», Сбер и другие известные операторы больших языковых моделей (LLM) могут при определенных условиях их объединить либо они могут сами объединиться, я оцениваю как достаточно высокую, говорит Дмитрий Басистый (Rubytech). Почему бы не создать российский искусственный интеллект, большую государственную языковую модель, которую возможно сделать на базе лидеров этой индустрии или же назначить их операторами этой модели, рисует спикер футуристическую картину.

Нейросети не справляются?

К нейросетям, генерирующим картинки, у пользователей пока много претензий. Искажение изображений рук, лишние пальцы или руки, по форме смахивающие на лапки динозавра – почему-то у нейросетей именно руки вызывают такое «отторжение». Лишние челюсти, неправильно изображенные зубы, перекошенные лица, обрезанные головы, плохая прорисовка деталей. Сложная человеческая анатомия плохо дается нейросетям. А еще — проблемы с генерацией изображений людей европеоидной расы.

Проблема, на первый взгляд, кажется смешной. Но только на первый. Почему же она возникает в России, которая богата талантливыми, иногда и уникальными разработчиками, которые многие вещи делают, что называется, с нуля?

Читайте также
Дистрибьюция как отдельный вид бизнеса имеет тенденцию к вымиранию. Но пока она востребована для некоторых вендоров и партнеров, бизнес будет существовать. Важно, чтобы дистрибьюторы придумывали нечто новое и ценное для вендоров и партнеров. Современный дистрибьютор становится похожим на швейцарский перочинный нож, где есть инструменты для решения задач партнеров и конечных заказчиков, для увеличения воронки продаж и повышения уровня успешности проектов. В этом разбирался IT-World.

У многих нейросетей, как минимум отечественных, действительно есть проблемы с генерацией изображения человека. И дело тут не в плохой работе разработчиков, говорят спикеры. Во многом эта проблема связана с обучающей выборкой. Дело в том, что датасеты, на которых обучаются российские нейросети, по большей части импортные, общедоступные. У нас в России персонализированных датасетов нет. В общедоступном материале для обучения нейросетей присутствуют люди разных рас, а изображения некоторых рас сейчас доминируют — вероятно, следуя за общественной повесткой ряда стран (например, Black Lives Matter).

И вторая проблема — нехватка мощностей для обучения с нуля больших генеративных моделей ИИ. Они требуют не только большего времени на обучение, но и очень больших «железных» ресурсов — а в этой части Россия не может конкурировать на мировом рынке.

Чего опасается бизнес?

В России, сообщают эксперты рынка, почти 52% компаний не готовы к внедрению ИИ. Они говорят, во-первых, о том, что это дорого, а во-вторых, боятся, что им придется перестраивать всю свою ИТ-инфраструктуру, которая к этому не готова. При этом 20% участников рынка вообще не собираются внедрять ИИ в свои инфраструктуры. Насколько опасения участников бизнес-сообщества обоснованы?

Вопрос о том, нужен ли нам в России ИИ или не нужен, уже не стоит, говорят спикеры. Вопрос в том, где и как его применять.

ИИ так давно и прочно вошел в нашу повседневную реальность, что мы привыкли к его удобству и скорости. Почти все мы, чаще или реже, пользуемся различными онлайн-переводчиками, распознавателями текста и картинок.

Банки в рамках кредитного конвейера с помощью ИИ проверяют платежеспособность и надежность потенциального заемщика, будь то частное лицо или компания. И если раньше процесс кредитного скоринга занимал недели, то теперь — считаные секунды.

Более сложный вопрос — обеспечение безопасности. Даже если мы не знаем всех моделей и уровней угроз, благодаря построенным ИИ датасетам многих из них удается избежать.

Илья ЛЕВЧУК, (Fplus):
«Мы все понимаем, что, учитывая текущую ситуацию, это технология двойного назначения. Например, лучше пусть на поле военных действий погибнет какой-нибудь самоуправляемый гаджет с ИИ, чем отдаст свою жизнь человек».

Рекомендательные системы на основе искусственного зрения. Еще лет пять назад такого невозможно было представить. А сегодня они внедряются даже в обычных поликлиниках. ИИ гораздо быстрее просматривает результаты обследований — например, рентгеновские снимки, более точно и безошибочно определяет потенциальные угрозы здоровью и помогает профессионалу принимать более взвешенное решение.

Работа с юридическими аспектами документов, с генерацией текста, бухгалтерскими и кадровыми операциями, составлением различных прогнозов — очень много всего, чего мы в повседневной жизни уже и не замечаем.

Опасения бизнеса связаны скорее с бюджетами и с уровнем доверия. Неточность в принятии определенных решений может привести к немалым расходам и даже к банкротству.

Максим ВЯЗНИКОВ (Intelion Cloud):
«Если российская компания нанимает ML-разработчика, использует датасеты, обученные на объектах из США и ЕС, и внедряет решение на отечественном рынке, очевидно, результат будет не самым блестящим. При этом на рынке еще не выработаны стандарты качества, сложно найти специалиста, который знает, что и как делать правильно».

Проблема в том, где и как сегодня на отечественном рынке найти подрядчика, который уже зарекомендовал себя в роли опытного внедренца ИИ-технологий? У кого уже есть портфель успешных кейсов?

Еще один вопрос — в поиске решения, экономический эффект от внедрения которого виден, ощутим, который можно посчитать.

Крупные российские промышленные предприятия — например, горнодобывающие, металлургические, нефтяные — создают свои собственные отделы Data Science, строят свои дата-центры, свои системы видеонаблюдения на производстве. Такие компании создают вертикально-интегрированные ИИ-решения и могут выпускать их на рынок для других компаний отрасли.

Активно внедряет и использует технологию финансовый сектор. К примеру, у Сбера сегодня более 250 работающих моделей ИИ для разных задач. Сейчас практически не осталось банка, где бы ни применялось автоматизированное решение. Вся крупная промышленность, в основном металлургия, нефтяной сектор, внедряет и использует системы компьютерного зрения. При внедрении данной технологии риски минимальны, технология при этом эффективно работает, дает отличные бизнес-эффекты и хорошую окупаемость.

Но чтобы технологии ИИ были массово доступны для малого и среднего бизнеса, нужна определенная стандартизация продуктов. В мелкий бизнес проникновение технологии происходит, когда она зарекомендует себя как «коробочное» решение.

Читайте также
Как отсутствие стандартизации и закрытые API влияют на интеграцию продуктов из разных экосистем? Как влияет на рынок существование множества одинаковых ИТ-решений? Что необходимо для создания более открытой и кооперативной среды? Разбирался IT-World.

Можно ли использовать генеративные модели для бизнеса? Такие уже есть, и некоторые из них могут себе позволить работать и с мелким, и даже с микробизнесом. Тема стоимости инференса сейчас очень важна для того, чтобы генеративные модели ИИ показывали какой-то эффект в бизнесе, продолжает Александр БОРИСОВ (Ramax Group). В пример спикер привел подход Китая, который внедряет SmalM и дообучает эти модели на отраслевых задачах, в результате они показывают качество, сравнимое с большими моделями при стоимости инференса на порядок меньше, а также производит специальные чипы с архитектурой, которые более приспособлена для обучения нейросетей. К примеру, Google выпускает такие процессоры, но исключительно для внутреннего использования.

Подход создания инфраструктуры под задачи представляется спикеру гораздо более эффективным, чем практикуемое сегодня в РФ использование видеокарт для обучения нейросетей. Это можно сравнить с процессом забивания гвоздей микроскопом.

Экономика данных: как будем жить?

Мнения спикеров о том, что ожидает отечественный рынок ИИ-инфраструктуры в ближайшие годы, разделились. Кто-то смотрит в будущее с оптимизмом, считая, что отечественный производитель сможет показать себя достойно и воспроизвести на внутреннем рынке полную линейку всего того, что производит глобальный рынок, начинает от проектирования микросхем и заканчивая производством тех же самых видеокарт.

Илья ЛЕВЧУК (Fplus) категорически не согласен с тем, что отечественный рынок инфраструктуры не развивается. Производители научились делать очень многое и за последние два года сделали очень большие шаги для обеспечения технологического суверенитета. В коммерческой доступности пока нет процессоров и нет текстолита больше 8 слоев с определенным качеством, говорит спикер. Все остальное для построения инфраструктуры уже есть. И Россия вполне способна оставаться в тройке лидеров на мировом рынке.

Кто-то из спикеров настроен более пессимистично, полагая, что создать полностью независимое производство комплектующих для инфраструктуры в условиях фрагментации глобального рынка не удастся, да и не нужно.

Какой инфраструктуры для искусственного интеллекта не хватает в России?. Рис. 7
Дмитрий БАСИСТЫЙ (Rubytech):
«Современный мир глобализован, однако последние три года в среде политологов стали раздаваться возгласы, что про глобализм надо забыть, я все-таки думаю, что нужно участвовать в глобальном разделении, заняв какую-то нишу, а не пытаться обеспечить себя полностью. Скорее мы будем потребителями достижений глобальной технологической мысли, и неважно, какими путями они будут попадать на наш рынок».

Кстати, сам термин «экономика данных» видится спикерам несколько «синтетическим». Понятие «бигдата», которым рынок оперировал последние два-три года, потихоньку уходит из профессионального оборота, и его заменяют большие (и не очень) языковые модели.

Обсуждая экономику данных, стоит говорить о некой общей тенденции. Если в нашей реальности данные уже управляют нами, нашими организациями, пора задуматься о какой-то концептуально новой модели деятельности предприятий, о датацентричной модели, работающей на основе правильных, выверенных, точных данных. В совокупности эти модели и дадут то, что можно назвать экономикой данных.

Но, отметили спикеры, современные ЦОДостроители пока еще не готовы к тому, чтобы создавать специализированные решения под ИИ в достаточно большом объеме.

Дмитрий Басистый (Rubytech) отмечает, что опыт создания ЦОДов мощностью 50, 60 и даже 70 МВт имеется, и его можно реализовать. «Но когда речь идет о том, что нам необходимо строить ЦОДы в 10, 100, 200, 300 МВт для размещения систем ИИ, это может стать большой проблемой и большой инженерной задачей. В этом я вижу определенный вызов. Вряд ли наша отечественная промышленность начнет выпускать соответствующие инженерные системы, системы охлаждения, системы распределения питания и так далее. Скорее, наши инженеры для строительства таких мегаконтрструкций научатся использовать то, что им доступно по параллельному импорту».

Тема, выбранная для обсуждения на круглом столе, действительно актуальна. Спикеры не раз вступали в диалоги и дискуссии между собой, делились опытом. Мы в IT-World уверены, что еще не раз соберем и проведем встречи с участниками рынка в разных форматах, где будем обсуждать самые острые и интересные вопросы.

Опубликовано 27.11.2024

Похожие статьи