Какой инфраструктуры для искусственного интеллекта не хватает в России?
Мероприятие проходило на платформе SaluteJazz.
Санкции — не помеха
По данным из официальных источников, за последний год объем рынка ИИ в России достиг 650 млрд рублей, увеличившись на 18%. Но как рынку удается сохранять столь положительную динамику? Ведь сами мы нужных инфраструктурных компонентов производим в объемах явно недостаточных, а получить их от ведущих глобальных игроков теперь можно только по каналам параллельного импорта.
В отечественном сегменте инфраструктуры для ИИ основные деньги связаны с продажей ПО, а не с аппаратной частью, говорят спикеры. В РФ всегда было достаточно талантливых программистов, которые не только умели писать код и правильно использовать его, но и создавать уникальные программные продукты. Сегодня выпускники российских вузов занимают первые места в олимпиадах по программированию разных уровней, и это одни из лучших в мире специалистов по ИИ.
С началом пандемии COVID-19 отечественный сегмент ИИ стал развиваться стремительно. Многие его игроки разработали решения в области анализа картинок, модели компьютерного зрения, бесплотного транспорта и т. д. В каждом сегменте этой индустрии уже есть сложившиеся лидеры, есть зарекомендовавшие себя игроки, которым удалось завоевать определенную долю рынка с каким-либо прорывным решением.
Правда, с аппаратной частью у нас в РФ пока еще все не так радужно, как с программной. Несмотря на санкции и запреты, до 90% решений в области «железа» составляют решения на базе процессоров Nvidia. Но ряд российских компаний разрабатывает или уже разработал свои линейки серверов, которые вошли в реестр отечественной вычислительной техники Минпромторга. Еще несколько участников рынка — в их числе называют НТЦ «Модуль» и IVA Technologies — ведут работы по созданию карт для обучения моделей ИИ. И если случится так, что геополитические события примут совсем нежелательный оборот, у нас все-таки будут свои альтернативные, полностью отечественные инфраструктурные решения.
И хотя отечественные чипы и процессоры пока еще нельзя сравнить по производительности и иным важным характеристикам с передовыми решениями глобальных лидеров, они способны очень хорошо показать себя в промышленной автоматизации, в системах видеоаналитики и СКУД, в системах решения «Безопасный город» и т. д.
В таких условиях, конечно же, России очень сложно занять конкурентные позиции на глобальном рынке. Но, несмотря на санкционные запреты, которые касаются и ввоза чипов западных производителей, отечественные игроки не так сильно увеличили свои затраты. Для ввоза аппаратной части по-прежнему задействованы каналы импорта, в том числе и параллельного. При этом, как говорят игроки отечественного сегмента вычислительной техники, затраты на инфраструктурную часть возросли не так уж и сильно. И сегодня можно воспользоваться разными возможностями и каналами и для импорта чипов ведущих западных производителей чипов, и продуктов Huawei, очень хорошо себя зарекомендовавших и в инференсе ИИ, и в иных сферах применения.
Когда подсчитывают объем и рост отечественного рынка ИИ, аналитики имеют в виду, вероятнее всего, совокупную стоимость владения, результаты применения моделей ИИ. Отсюда — и значительный объем рынка, и показатели роста почти на 20%.
Вычислительные ресурсы: на чем нам обучать ИИ
России вполне хватит своих ресурсов и вычислительных мощностей и для того, чтобы обучать модели ИИ, и для того, чтобы развивать эту технологию. К примеру, у нас есть свои собственные суперкомпьютеры — такое могут позволить себе очень немногие страны мира. В 2022 году Россия заняла 8-е место в глобальном рейтинге стран с самыми мощными суперкомпьютерами, а по данным на ноябрь 2024 года, поднялась на 6-е место. В одном только МГУ имеется несколько мощнейших супервычислителей — «Ломоносов», «Ломоносов-2» и «МГУ-270». Последний ориентирован именно на работу с ИИ — он обладает мощностью 400 петафлопс, не имеет аналогов среди подобных систем в университетах мира и является вторым или третьим по мощности среди всех действующих суперкомпьютеров. В списке российских суперкомпьютеров — «Червоненкис», «Галушкин», «Ляпунов», «Кристофари», «Кристофари Neo», GROM. Свои супервычислители есть у «Росатома» и Курчатовского института.
Важная проблема заключается в их неоптимальном и неэффективном использовании.
Еще одна проблема, которую упомянули спикеры, связана с недостаточным финансированием со стороны государства. В РФ создано и функционирует шесть центров компетенций в области ИИ — на базе МФТИ, Университета ИТМО, ВШЭ, Сколковского института науки и технологий, Университета «Иннополис» и Института системного программирования им. В. П. Иванникова. При этом, для сравнения, в Китае и в США над разработкой решений в сфере ИИ работают сотни вузов, которые финансируются государством, как говорят спикеры, гораздо шире.
Кстати, нельзя исключать и такого развития событий, что создание инфраструктуры для ИИ государство возьмет в свои руки и примет решение о формировании единой государственной ИИ-платформы. Например, на одном из недавних заседаний ИТ-комитета Госдумы министр цифрового развития Максут Шадаев заявил, что к 2030 году вычислительные мощности отечественной инфраструктуры для ИИ должны быть расширены до 1 экзафлопса, и обеспечить это смогут два ведущих игрока — Сбер и «Яндекс». Ждать ли нам объединения ИИ-мощностей этих компаний и не превратятся ли они в монополистов рынка?
В то, что Сбер и «Яндекс» смогут объединить свои вычислительные мощности и договориться об их совместном использовании, не верит большинство спикеров. Конкуренция между этими двумя гигантами, разные бизнес-модели, по-разному выстроенные и уже устоявшиеся бизнес-процессы при решении одной и той же задачи, разные цели использования супервычислителей — поменять все это очень трудоемко, а не учитывать этих моментов нельзя. Если только руководство страны действительно не примет такое решение на уровне законодательства, и обеим компаниям не останется ничего иного, как его выполнять, так или иначе.
Вспомнили спикеры и о другой государственной инициативе — о создании кластеров суперкомпьютеров, объединенных в единую сеть. И этот проект даже начал реализовываться. Осенью 2021 года об объединении своих суперкомпьютеров в единую сеть объявили Санкт-Петербургский политехнический университет, Межведомственный суперкомпьютерный центр РАН и Объединенный институт ядерных исследований. А не далее как весной текущего года Игорь Каляев, академик РАН и сопредседатель научных направлений Национального центра физики и математики, заявил в СМИ, что российские суперкомпьютеры было бы неплохо соединить в единую Национальную суперкомпьютерную инфраструктуру и что такая мера поможет догнать Запад в этом направлении развития вычислительной техники. Пока неизвестно, насколько такая инициатива реализуема.
Но круглый стол тем и хорош, что дает спикерам площадку для самых разных мнений.
Вероятность того, что «Яндекс», Сбер и другие известные операторы больших языковых моделей (LLM) могут при определенных условиях их объединить либо они могут сами объединиться, я оцениваю как достаточно высокую, говорит Дмитрий Басистый (Rubytech). Почему бы не создать российский искусственный интеллект, большую государственную языковую модель, которую возможно сделать на базе лидеров этой индустрии или же назначить их операторами этой модели, рисует спикер футуристическую картину.
Нейросети не справляются?
К нейросетям, генерирующим картинки, у пользователей пока много претензий. Искажение изображений рук, лишние пальцы или руки, по форме смахивающие на лапки динозавра – почему-то у нейросетей именно руки вызывают такое «отторжение». Лишние челюсти, неправильно изображенные зубы, перекошенные лица, обрезанные головы, плохая прорисовка деталей. Сложная человеческая анатомия плохо дается нейросетям. А еще — проблемы с генерацией изображений людей европеоидной расы.
Проблема, на первый взгляд, кажется смешной. Но только на первый. Почему же она возникает в России, которая богата талантливыми, иногда и уникальными разработчиками, которые многие вещи делают, что называется, с нуля?
У многих нейросетей, как минимум отечественных, действительно есть проблемы с генерацией изображения человека. И дело тут не в плохой работе разработчиков, говорят спикеры. Во многом эта проблема связана с обучающей выборкой. Дело в том, что датасеты, на которых обучаются российские нейросети, по большей части импортные, общедоступные. У нас в России персонализированных датасетов нет. В общедоступном материале для обучения нейросетей присутствуют люди разных рас, а изображения некоторых рас сейчас доминируют — вероятно, следуя за общественной повесткой ряда стран (например, Black Lives Matter).
И вторая проблема — нехватка мощностей для обучения с нуля больших генеративных моделей ИИ. Они требуют не только большего времени на обучение, но и очень больших «железных» ресурсов — а в этой части Россия не может конкурировать на мировом рынке.
Чего опасается бизнес?
В России, сообщают эксперты рынка, почти 52% компаний не готовы к внедрению ИИ. Они говорят, во-первых, о том, что это дорого, а во-вторых, боятся, что им придется перестраивать всю свою ИТ-инфраструктуру, которая к этому не готова. При этом 20% участников рынка вообще не собираются внедрять ИИ в свои инфраструктуры. Насколько опасения участников бизнес-сообщества обоснованы?
Вопрос о том, нужен ли нам в России ИИ или не нужен, уже не стоит, говорят спикеры. Вопрос в том, где и как его применять.
ИИ так давно и прочно вошел в нашу повседневную реальность, что мы привыкли к его удобству и скорости. Почти все мы, чаще или реже, пользуемся различными онлайн-переводчиками, распознавателями текста и картинок.
Банки в рамках кредитного конвейера с помощью ИИ проверяют платежеспособность и надежность потенциального заемщика, будь то частное лицо или компания. И если раньше процесс кредитного скоринга занимал недели, то теперь — считаные секунды.
Более сложный вопрос — обеспечение безопасности. Даже если мы не знаем всех моделей и уровней угроз, благодаря построенным ИИ датасетам многих из них удается избежать.
Рекомендательные системы на основе искусственного зрения. Еще лет пять назад такого невозможно было представить. А сегодня они внедряются даже в обычных поликлиниках. ИИ гораздо быстрее просматривает результаты обследований — например, рентгеновские снимки, более точно и безошибочно определяет потенциальные угрозы здоровью и помогает профессионалу принимать более взвешенное решение.
Работа с юридическими аспектами документов, с генерацией текста, бухгалтерскими и кадровыми операциями, составлением различных прогнозов — очень много всего, чего мы в повседневной жизни уже и не замечаем.
Опасения бизнеса связаны скорее с бюджетами и с уровнем доверия. Неточность в принятии определенных решений может привести к немалым расходам и даже к банкротству.
Проблема в том, где и как сегодня на отечественном рынке найти подрядчика, который уже зарекомендовал себя в роли опытного внедренца ИИ-технологий? У кого уже есть портфель успешных кейсов?
Еще один вопрос — в поиске решения, экономический эффект от внедрения которого виден, ощутим, который можно посчитать.
Крупные российские промышленные предприятия — например, горнодобывающие, металлургические, нефтяные — создают свои собственные отделы Data Science, строят свои дата-центры, свои системы видеонаблюдения на производстве. Такие компании создают вертикально-интегрированные ИИ-решения и могут выпускать их на рынок для других компаний отрасли.
Активно внедряет и использует технологию финансовый сектор. К примеру, у Сбера сегодня более 250 работающих моделей ИИ для разных задач. Сейчас практически не осталось банка, где бы ни применялось автоматизированное решение. Вся крупная промышленность, в основном металлургия, нефтяной сектор, внедряет и использует системы компьютерного зрения. При внедрении данной технологии риски минимальны, технология при этом эффективно работает, дает отличные бизнес-эффекты и хорошую окупаемость.
Но чтобы технологии ИИ были массово доступны для малого и среднего бизнеса, нужна определенная стандартизация продуктов. В мелкий бизнес проникновение технологии происходит, когда она зарекомендует себя как «коробочное» решение.
Можно ли использовать генеративные модели для бизнеса? Такие уже есть, и некоторые из них могут себе позволить работать и с мелким, и даже с микробизнесом. Тема стоимости инференса сейчас очень важна для того, чтобы генеративные модели ИИ показывали какой-то эффект в бизнесе, продолжает Александр БОРИСОВ (Ramax Group). В пример спикер привел подход Китая, который внедряет SmalM и дообучает эти модели на отраслевых задачах, в результате они показывают качество, сравнимое с большими моделями при стоимости инференса на порядок меньше, а также производит специальные чипы с архитектурой, которые более приспособлена для обучения нейросетей. К примеру, Google выпускает такие процессоры, но исключительно для внутреннего использования.
Подход создания инфраструктуры под задачи представляется спикеру гораздо более эффективным, чем практикуемое сегодня в РФ использование видеокарт для обучения нейросетей. Это можно сравнить с процессом забивания гвоздей микроскопом.
Экономика данных: как будем жить?
Мнения спикеров о том, что ожидает отечественный рынок ИИ-инфраструктуры в ближайшие годы, разделились. Кто-то смотрит в будущее с оптимизмом, считая, что отечественный производитель сможет показать себя достойно и воспроизвести на внутреннем рынке полную линейку всего того, что производит глобальный рынок, начинает от проектирования микросхем и заканчивая производством тех же самых видеокарт.
Илья ЛЕВЧУК (Fplus) категорически не согласен с тем, что отечественный рынок инфраструктуры не развивается. Производители научились делать очень многое и за последние два года сделали очень большие шаги для обеспечения технологического суверенитета. В коммерческой доступности пока нет процессоров и нет текстолита больше 8 слоев с определенным качеством, говорит спикер. Все остальное для построения инфраструктуры уже есть. И Россия вполне способна оставаться в тройке лидеров на мировом рынке.
Кто-то из спикеров настроен более пессимистично, полагая, что создать полностью независимое производство комплектующих для инфраструктуры в условиях фрагментации глобального рынка не удастся, да и не нужно.
Кстати, сам термин «экономика данных» видится спикерам несколько «синтетическим». Понятие «бигдата», которым рынок оперировал последние два-три года, потихоньку уходит из профессионального оборота, и его заменяют большие (и не очень) языковые модели.
Обсуждая экономику данных, стоит говорить о некой общей тенденции. Если в нашей реальности данные уже управляют нами, нашими организациями, пора задуматься о какой-то концептуально новой модели деятельности предприятий, о датацентричной модели, работающей на основе правильных, выверенных, точных данных. В совокупности эти модели и дадут то, что можно назвать экономикой данных.
Но, отметили спикеры, современные ЦОДостроители пока еще не готовы к тому, чтобы создавать специализированные решения под ИИ в достаточно большом объеме.
Дмитрий Басистый (Rubytech) отмечает, что опыт создания ЦОДов мощностью 50, 60 и даже 70 МВт имеется, и его можно реализовать. «Но когда речь идет о том, что нам необходимо строить ЦОДы в 10, 100, 200, 300 МВт для размещения систем ИИ, это может стать большой проблемой и большой инженерной задачей. В этом я вижу определенный вызов. Вряд ли наша отечественная промышленность начнет выпускать соответствующие инженерные системы, системы охлаждения, системы распределения питания и так далее. Скорее, наши инженеры для строительства таких мегаконтрструкций научатся использовать то, что им доступно по параллельному импорту».
Тема, выбранная для обсуждения на круглом столе, действительно актуальна. Спикеры не раз вступали в диалоги и дискуссии между собой, делились опытом. Мы в IT-World уверены, что еще не раз соберем и проведем встречи с участниками рынка в разных форматах, где будем обсуждать самые острые и интересные вопросы.
Опубликовано 27.11.2024