Российский ПАК для Big Data готов заменить решения западных разработчиков

Логотип компании
Российский ПАК для Big Data готов заменить решения западных разработчиков
В единый реестр отечественного софта для ЭВМ и БД, который ведет Минцифры России, включен первый программно-аппаратный комплекс (ПАК) российского производителя «Скала-Р», предназначенный для обработки больших данных. Полных аналогов решениям под названиями «Машина больших данных Скала-Р МБД.Х» и «Машина баз данных Скала-Р МБД.П» на российском рынке пока нет.

По оценке Fortune Business Insights, глобальный рынок больших данных ежегодно растет на 13,4%. В 2022 г. его объем составлял $271,83 млрд, а к 2029 г., как ожидается, он вырастет до $655,53 млрд.

По данным IDG, обнародованным еще в 2014 г., средний бюджет компании на технологии Big Data составлял $8 млн.

По мнению аналитиков MarketsandMarkets, в 2021 г. расходы компаний и государственных учреждений на работы с инструментами Big Data во всем мире достигли $162,6 млрд.

96% компаний крупного и среднего бизнеса, как показали итоги исследования LaunchSquad, анализируют собранные данные для повышения прибыли.

В 2022 г., подсчитали эксперты, объем всех данных, накопленных человечеством, составил примерно 97 зеттабайт (Збайт), а к 2025 г. он практически удвоится. Большинство этих данных обрабатывает свыше 7 000 крупных дата-центров., и около 800 из них построены на базе специальной архитектуры, которая позволяет обрабатывать миллионы терабайт информации и, при необходимости, значительно увеличить объемы обрабатываемых данных без сколь-нибудь значительных изменений в работе центра.

 

В России в 2021 г., подсчитали аналитики Ассоциации больших данных (АБД), рынок Big Data составлял 170 млрд руб. К концу 2024 г. консолидация действий бизнеса и государства сможет обеспечить рост этого сегмента на 90%, до 319 млрд руб.

Как следует из отчета IDC и Hitachi Vantara за 2019 г., 55,4% крупных российских компаний (с числом сотрудников от 500 человек) инвестировали в аналитику больших данных. У 35% участников опроса на такие решения приходилось, в среднем, 5–10% всего ИТ-бюджета, и еще у 35% респондентов они превышали 10%.

Во всем мире основными заказчиками программно-аппаратных комплексов, подобных ПАК от «Скала-Р», выступают компании-представители крупного бизнеса и государственные структуры. К тому же, российские государственные компании и ведомства при организации закупок ПО и его использовании в критической инфраструктуре ориентируются именно на продукты из реестра российского ПО.

Как сообщают информированные источники, ПАК разработки «Скала-Р» должен стать успешной заменой аналогичным решениям от вендоров Oracle, Teradata и Amazon. Последние вошли в список крупнейших разработчиков решений в сфере Big Data, составленный MarketsandMarkets по итогам 2021 г.

Amazon, одна из ведущих платформ электронной коммерции, управляет огромным объемом собираемых на регулярной основе данных. К примеру, число ежемесячных просмотров приложения и web-сайта компании превысило 2,45 млрд. По данным Statista, к концу 2021 г. у Amazon насчитывалось 9,5 млн продавцов, из них свыше 2,5 млн активных (у активного продавца есть хотя бы один товар, выставленный на продажу на сайте). Управление таким массивом данных компания осуществляет с помощью технологии Amazon AWS Redshift – облачного сервиса для хранения данных петабайтного масштаба, входящего в состав Amazon Web Services (AWS). Последний предоставляют возможность хранения и анализа баз данных, выполнения сложных вычислительных операций, доступ к специализированному ПО и другие возможности.

По данным аналитической компании Canalys, мировые расходы на облачные технологии в первом полугодии 2021 г. составили около $90 млрд. Из них на долю AWS пришлось 32%.

Однако в марте 2022 г. Amazon официально объявил о том, что больше не принимает новых клиентов облачных сервисов из России и Белоруссии. А в июне 2023 г. облачный сервис Amazon вошел в число 12-ти иностранных провайдеров хостинга, которым Роскомнадзор предписал «приземление» на российском рынке в соответствии с Федеральным законом № 236-ФЗ. Теперь для того, чтобы работать на рынке РФ, компании нужно полноценное российское представительство, зарегистрировать личный кабинет на сайте Роскомнадзора и разместить на своем ресурсе электронную форму для обратной связи с российскими гражданами и организациями. В противном случае компанию ожидают штрафные санкции - от 1/15 до 1/10 годовой выручки за первое нарушение и от 10% до 20% выручки – за повторное.

Программно-аппаратный комплекс (ПАК) для сбора и организации больших данных Oracle Big Data Appliance от Oracle была официально представлена мировому сообществу 3 октября 2011 г., а в продажу поступила в январе 2012 г. Oracle Big Data Appliance представляет собой оптимизированный комплекс, объединяющий аппаратное и программные продукты, в том числе Cloudera’s Distribution с Apache Hadoop и Cloudera Manager, а также дистрибутив среды программирования R с открытым исходным кодом. Работает под управлением операционной системы Oracle Linux.

По данным из открытых источников и сведениям экспертов рынка, компания Oracle выступила вендором порядка в 10-ти российских проектах по внедрению технологии Big Data, в том числе и по развертыванию в ИТ-инфраструктуре заказчиков решения Big Data Appliance. Такие проекты реализованы, в частности, в Банке Открытие (ФК Открытие), ВТБ24, CaixaBank, Альфа-Банк Россия, компании Wargaming (издатель и разработчик компьютерных игр) и ИТ-компании ФОРС Дистрибуция. В числе крупнейших государственно-корпоративных заказчиков продукции Oracle были ВТБ, Сбербанк, «Газпром информ», «Аэрофлот», «Транснефть».

Однако в марте 2022 г. Oracle Corporation сообщила о прекращении всех операций в России, как по продаже ПО и услуг, так и по возможности использовать облачные решения.

Teradata - технологическая компания из США, специализирующаяся на разработке ПАКов для обработки баз данных и аналитики данных, а также на стратегическом ИТ-консалтинге. В линейке продуктов для Big Data - Teradata Data Warehouse Appliance (DWA), платформа Teradata Aster Discovery Platform и аналитическое ПО.

По данным из открытых источников, в России решения Teradata были имплементированы в ИТ-инфраструктуре Федеральной налоговой службы (ФНС), банка «ВТБ24», Сбербанка и Ситибанка.

В I квартале 2022 г. Teradata официально объявила о прекращении своего бизнеса в России. Такое решение, как ожидалось, уже по итогам 2022 г. обернется для компании убытками в размере $50 млн.

По мере выхода с рынка ряда зарубежных производителей, указывает на своем официальном сайте Скала-Р, востребованность российских ПАК, как решений, способных с минимальными операционными затратами и рисками обеспечить дальнейшее развитие ИТ, кратно возросла. Так, уже сегодня на базе Машин баз данных МБД.П реализуются проекты перехода с высокопроизводительных платформ Oracle Exadata.

Как правило, поставщики не раскрывают информацию о стоимости решений для работы с большими данными, объясняя это отсутствием стандартных цен, уникальностью проектов и задач каждой компании. О стоимости ПАК от «Скала-Р» также информации пока нет.

Как комментировал в СМИ Антон Заяц, директор по развитию бизнеса SAS в России и СНГ, на стоимость таких проектов влияет отраслевая специфика заказчика, выбранная конфигурация и способ развертывания решения. Конечная цена также зависит от количества пользователей, способа резервирования и модели используемого сервера.

Опубликовано 02.09.2023

Похожие статьи