Как развивать ИТ-инфраструктуру для больших данных?

Рынок аналитики данных в мире будет расти ежегодно на 30% вплоть до 2030 года. Как российским компаниям не упустить возможности, которые дает этот инструмент в условиях технологических ограничений?

Данные превращаются в реальные деньги: 96% средних и крупных компаний из разных стран смогли увеличить прибыль благодаря проектам в области аналитики. И это при том, что они использовали не все имеющиеся данные: 78% топ-менеджеров отметили, что объемы данных растут слишком быстро — специалисты не успевают их обрабатывать. А более трети опрошенных (34%) считают, что существующая ИТ-инфраструктура не позволяет их компании выжимать из данных максимум.

В России схожие тенденции дополняются локальными особенностями. Как минимум четверть российских компаний применяют технологии сбора, обработки и анализа больших данных. Наиболее активно это делают представители финансового сектора — примерно половина из них использует аналитику для борьбы с мошенничеством, оценки кредитоспособности и управления активами.

Растущее количество данных и проектов в области аналитики требует развития ИТ-инфраструктуры, и в первую очередь расширения вычислительных мощностей. Проблем с покупкой серверного оборудования нет. Компании могут выбрать оборудование российского производства или продукты иностранных вендоров, ввозимые по альтернативным схемам — но без поддержки производителя. Сложность в другом: с уходом западных вендоров ПО обострилась ситуация с выбором софта для бизнеса, а это в свою очередь привело и к более жесткому отбору оборудования.

Сейчас некоторые компании ищут альтернативы — программные продукты российского происхождения. Организации с сильным ИТ-направлением разрабатывают собственные решения. Тем не менее многие продолжают пользоваться зарубежным ПО. Переход на новый софт является более болезненным и затратным для организаций, чем замена оборудования.

Как выбрать сервер?

Учитывая этот контекст, нужно подходить к расширению аппаратного обеспечения для работы с большими данными. В свою очередь, выделю четыре параметра, которые надо учитывать при выборе серверного оборудования.

Первый — стоимость за терабайт, то есть количество накопителей в рамках каждого узла или сервера. Однако больше не означает лучше. Чтобы система была сбалансирована, важно подобрать правильную комбинацию процессора, оперативной памяти и дисков (системы ввода/вывода).

Второй — качество оборудования. Это поможет избежать брака, процент которого на рынке сейчас довольно высок, или отказов во время эксплуатации. Из-за некачественного оборудования увеличивается количество сбоев и, соответственно, затраты на ремонт. При этом стоимость простоя для некоторых видов бизнеса — ретейла, банков, телеком-операторов — может быть очень высокой. По оценке IDC, компании из Fortune 1000 теряют во время сбоев $1 млн в час.

Третий параметр — обслуживаемость. Нужно оценить, насколько конкретный сервер или СХД удобен и прост в обслуживании: как происходит замена вышедших из строя компонент, их добавление или перенастройка оборудования.

Четвертый и, пожалуй, самый главный критерий — совместимость и поддерживаемость «железа» и ПО. Здесь речь идет о правильном подборе сущностей и конфигураций аппаратного обеспечения для необходимого софта исходя из целевой нагрузки и назначения системы в целом. Разработчики и аналитики используют широкий набор программных продуктов, в основном Open Source. Это своеобразный конструктор, состоящий из разных модулей, которые отвечают за хранение, вычисление, управление, оркестрацию, безопасность и разграничение доступа, обработку данных и т. д. Здесь могут быть сотни отдельных продуктов или пакетов, между которыми необходимо обеспечивать совместимость и взаимодействие. И для всей этой экосистемы важно правильно подобрать вычислительные ресурсы.

Требования к мощности

Выбор серверов зависит от конкретного ПО и его архитектуры, но, как правило, для работы с аналитическими системами нужна высокая производительность.

Насколько важна мощность каждой единицы оборудования? Если возможно горизонтальное масштабирование систем, можно выбрать стандартные серверы и не придираться к их производительности. Однако для некоторых программных продуктов такая организация вычислительных ресурсов менее предпочтительна. Тогда стоит тщательнее оценить возможности оборудования.

Мощные серверы необходимы для работы искусственного интеллекта, высокопроизводительных вычислений (HPC), систем моделирования и прогнозирования. Помимо этого, они нужны, когда нагрузка плохо распределяется на разные вычислительные узлы. Например, когда важно обеспечить быстрое взаимодействие процессор-память. Этого требуют многие СУБД, платформы in-memory-вычислений, иногда — машинное обучение.

Высокие требования к производительности серверов бывают и у Legacy-систем, логику работы которых закладывали еще в 70-80-х годах. Многие современные продукты имеют возможность распараллеливать вычисления, тем самым позволяя использовать больше отдельных вычислительных узлов.

Основным недостатком распараллеливания является интерконнект между узлами, который выступает «узким горлышком» для работы систем. При использовании нескольких вычислительных узлов необходима более сложная архитектура построения решений для обработки и анализа данных, что затрудняет управление этим процессом.

Когда важна скорость обработки больших объемов информации, можно использовать серверы с графическими процессорами (GPU). Например, иногда их выбирают для подготовки данных и тренировки моделей машинного обучения. Однако эффективность GPU в большой степени зависит от возможностей ПО, которое его утилизирует. Ранее вместе с оборудованием можно было получить специализированные программные продукты для работы с ним. Сейчас доступ к этим инструментам ограничен и, как следствие, спрос на серверы с GPU сузился.

Облако или on-premise

Альтернативой собственной инфраструктуре может стать использование облачных сервисов для хранения и обработки больших данных. Например, некоторые провайдеры предоставляют соответствующие инструменты в качестве PaaS (платформа как сервис).

Хранение больших объемов информации в облаке, на первый взгляд, выгоднее экономически. Однако возможность использовать облачные ресурсы для этих целей зависит от того, насколько тесно данные интегрированы с другими продуктивными системами компании. Возникают вопросы взаимодействия облака и систем on-premise, скорости каналов, а самое главное — информационной безопасности.

В исследовании ‘Thales Cloud Security 2022’, говорится, что 45% компаний, хранящих данные в облаках, сталкивались с утечками или другими рисками безопасности. При этом 51% респондентов заявили, что управлять конфиденциальностью и защитой данных в облаке сложнее, чем локально.

Кроме того, хранение в облаке не избавляет от необходимости резервного копирования данных — это нужно учитывать при расчете расходов на облачную инфраструктуру. И всегда помните о риске смены облачного провайдера: перевести сложную архитектуру с большим объемом данных на новую платформу — непростая и трудоемкая операция.

* * *

Потребность бизнеса в обработке и анализе больших данных растет, а ждать возвращения ИТ-ландшафта к состоянию до 2022 года не приходится. При этом в России, несмотря на технологические ограничения, есть возможности для построения эффективной инфраструктуры для работы с данными. Качество программных и аппаратных продуктов российского производства растет — вместе с этим увеличивается количество компаний, выбирающих импортонезависимые решения для своих задач, включая проекты в области аналитики больших данных.

Журнал IT Expert [№ 09/2023] Подписка на журналы

Опубликовано 20.09.2023

Об авторах

Алексей Коваленя

Технический директор DатаРу

IT-инфраструктура Бизнес-аналитика (BI)Серверы Big Data Облачный сервис

Предыдущая
Выбираем интернет-эквайринг: на что обращать внимание?

Следующая
Российские платформы виртуализации: из чего выбирать?

Новостная лента

Главное за неделю

Нажимая на кнопку, я принимаю условия соглашения.

Соглашение об использовании сайта

Внимательно прочитайте настоящее Соглашение, прежде чем начать пользоваться Сайтом. Вы обязаны соблюдать условия настоящего Соглашения, заходя на Сайт и используя сервисы, предлагаемые на Сайте. В случае, если Вы не согласны с условиями Соглашения, Вы не можете пользоваться Сайтом или использовать любые сервисы, предлагаемые на Сайте, а также посещать страницы, размещенные в доменной зоне Сайта. Начало использования Сайта означает надлежащее заключение настоящего Соглашения и Ваше полное согласие со всеми его условиями.

1. Термины и определения

1.1. Компания - Общество с ограниченной ответственностью «ИТ Медиа» (ООО «ИТ Медиа»).

1.2. Пользователь - лицо, получающее доступ к сервисам и информации, размещенным на Сайте.

1.3. Сайт – веб-сайт Компании, размещенный в сети Интернет по адресу https://www.it-world.ru.

1.4. Соглашение - настоящее Соглашение между Пользователем и Компанией, устанавливающее правила использования Сайта, включая графические изображения, элементы дизайна и средства индивидуализации, текстовую информацию и документацию, программы для ЭВМ и файлы для скачивания, любые иные произведения, объекты и материалы Сайта, а также условия и правила размещения Пользователем информации и материалов в соответствующих открытых разделах Сайта.

2. Общие положения и условия

2.1. Любые материалы, файлы и сервисы, содержащиеся на Сайте, не могут быть воспроизведены в какой-либо форме, каким-либо способом, полностью или частично без предварительного письменного разрешения Компании, за исключением случаев, указанных в настоящем Соглашении. При воспроизведении Пользователем материалов Сайта ссылка на Сайт обязательна, при этом текст указанной ссылки не должен содержать ложную, вводящую в заблуждение, уничижительную или оскорбительную информацию. Перевод, переработка (модификация), любое изменение материалов Сайта, а также любые иные действия, в том числе удаление, изменение малозаметной информации и сведений об авторских правах и правообладателях, не допускается.

2.2. Действующая редакция настоящего Соглашения размещена в сети Интернет на Сайте по адресу: https://www.it-world.ru/about/agreement.php. Компания вправе в любое время в одностороннем порядке изменять условия настоящего Соглашения. Такие изменения вступают в силу по истечении 2 (двух) дней с момента размещения новой версии Соглашения в сети Интернет на Сайте. При несогласии Пользователя с внесенными изменениями он обязан удалить все имеющиеся у него материалы Сайта, после чего прекратить использование материалов и сервисов Сайта. Ваше регулярное посещение данного Сайта считается вашим убедительным принятием измененного соглашения, поэтому Вы обязаны регулярно просматривать настоящее Соглашение и дополнительные условия или уведомления, размещенные на Сайте.

3. Обязательства Пользователя

3.1. Пользователь обязуется не предпринимать действий, которые могут рассматриваться как нарушающие российское законодательство или нормы международного права, в том числе в сфере интеллектуальной собственности, авторских и/или смежных правах, а также любых действий, которые приводят или могут привести к нарушению нормальной работы Сайта и сервисов Сайта.

3.2. Любые средства индивидуализации, в том числе товарные знаки и знаки обслуживания, а равно логотипы и эмблемы, содержащиеся на страницах Сайта, являются интеллектуальной собственностью их правообладателей. Пользователю Сайта запрещено воспроизводить или иным способом использовать указанные средства индивидуализации и/или их элементы без предварительного письменного разрешения соответствующих правообладателей.

3.3. Компания стремится обеспечить, однако не контролирует и не гарантирует конфиденциальность и охрану любой информации, размещенной на Сайте или полученной с Сайта. Компания принимает разумные меры в целях недопущения несанкционированного разглашения размещенной Пользователем на Сайте информации третьим лицам, однако не несет ответственность в случае, если такое разглашение было допущено. В этой связи, передача информации на Сайт означает согласие Пользователя на любое воспроизведение, распространение, раскрытие и иное использование такой информации. Размещая информацию и материалы, включая, фотографии и изображения, Пользователь также гарантирует, что обладает всеми правами и полномочиями, необходимыми для этого, с учетом условий настоящего Соглашения и что такое размещение не нарушает охраняемые законом права и интересы третьих лиц, международные договоры и действующее законодательство Российской Федерации.

3.4. Пользователь самостоятельно несет ответственность за любую информацию и материалы, размещенные им на Сайте. Компания не инициирует размещение указанной информации, не выбирает получателей информации, не влияет на содержание и целостность размещаемой информации, а также в момент размещения Пользователем информации на Сайте не знает и не может знать, нарушает ли такое размещение действующее законодательство Российской Федерации, однако Компания вправе отслеживать, просматривать и/или удалять любую информацию и материалы, размещенные Пользователем на Сайте. При размещении любой информации и материалов Пользователь не становится соавтором Сайта и отказывается от каких-либо претензий на такое авторство в будущем. Компания не выплачивает Пользователю авторского или любого иного вознаграждения, как в период, так и по истечении срока действия настоящего Соглашения.

3.5. В случае предъявления третьими лицами претензий Компании, связанных с нарушением Пользователем условий настоящего Соглашения, а равно с размещенной Пользователем информацией на Сайте, указанный Пользователь обязуется самостоятельно урегулировать такие претензии, а также возместить Компании все понесенные убытки и потери, включая возмещение штрафов, судебных расходов, издержек и компенсаций.

3.6. Компания не несет ответственности за посещение Пользователем, а также любое использование им внешних ресурсов (сайтов третьих лиц), ссылки на которые могут содержаться на Сайте. Компания не несет ответственности за точность, надежность, достоверность и безопасность любой информации, материалов, рекомендаций и сервисов, размещенных на внешних ресурсах. Использование внешних ресурсов осуществляется Пользователем добровольно, исключительно по собственному усмотрению и на свой риск.

3.7. Компания стремится к обеспечению достоверности информации, размещенной на Сайте, однако не несет ответственности за любые неточности и/или недостоверность информации, а равно сбои в работе предоставляемых через Сайт сервисов. Пользователь согласен с тем, что Компания не несет ответственность и не имеет прямых или косвенных обязательств перед Пользователем в связи с любыми возможными или возникшими потерями, или убытками, связанными с любым содержанием Сайта, интеллектуальной собственностью, товарами или услугами, доступными на нем или полученными через внешние сайты или ресурсы либо иные ожидания Пользователя, которые возникли в связи с использованием размещенной на Сайте информации или ссылки на внешние ресурсы. Ни при каких условиях, включая, но не ограничиваясь невнимательностью или небрежностью Пользователя, Компания не несет ответственности за любой ущерб (прямой или косвенный, случайный или закономерный), включая, но не ограничиваясь потерей данных или прибылей, связанной с использованием или невозможностью использования Сайта, информации, файлов или материалов на нем, даже если Компания или ее представители были предупреждены о возможности такой потери. В случае, если использование Сайта приведёт к необходимости дополнительного обслуживания, исправления или ремонта любого оборудования, а равно восстановления данных, все связанные с этим затраты оплачиваются Пользователем самостоятельно.

3.8. Вся представленная на Сайте информация предоставляется «как есть», без каких-либо гарантий, явных или подразумеваемых. Компания полностью, в той мере, в какой это разрешено законом, отказывается от какой-либо ответственности, явной или подразумеваемой, включая, но не ограничиваясь неявными гарантиями пригодности к использованию, а также гарантиями законности любой информации, продукта или услуги, полученной или приобретенной с помощью этого Сайта.

3.9. Пользователь согласен, что все материалы и сервисы Сайта или любая их часть могут сопровождаться рекламой. Пользователь согласен с тем, что Компания не несет какой-либо ответственности и не имеет каких-либо обязательств в связи с такой рекламой.

4. Условия обработки и использования персональных данных. Принимая условия настоящего Соглашения Пользователь выражает свое согласие на:

4.1. Предоставление своих персональных данных, включающих имя, номера контактных телефонов; адреса электронной почты; место работы и занимаемая должность; пользовательские данные (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) своей волей и в своем интересе.

4.2. Цель обработки персональных данных:

предоставление Пользователю услуг Сайта;
направление уведомлений, касающихся услуг Сайта;
подготовка и направление ответов на запросы Пользователя;
выполнение регулярной информационной рассылки;
направление информации о продуктах и услугах Компании, а также рекламно-информационных сообщений, касающихся продукции и услуг Компании и ее партнеров.

4.3. Перечень действий с персональными данными, на которые Пользователь выражает свое согласие:

сбор, систематизация, накопление, хранение, уточнение (обновление, изменение), использование, обезличивание, передача третьим лицам для указанных выше целей, а также осуществление любых иных действий, предусмотренных действующим законодательством РФ как неавтоматизированными, так и автоматизированными способами.

4.4. Компания обязуется принимать все необходимые меры для защиты персональных данных Пользователя от неправомерного доступа или раскрытия.

4.5. Настоящее согласие действует до момента его отзыва Пользователем путем направления соответствующего уведомления заказным письмо с уведомлением на адрес Компании.

5. Прочие положения

5.1. Использование материалов и сервисов Сайта, а равно размещение на нем материалов Пользователя, регулируется нормами действующего законодательства Российской Федерации. Все возможные споры, вытекающие из настоящего Соглашения или связанные с ним, подлежат разрешению в соответствии с действующим законодательством Российской Федерации по месту нахождения Компании.

5.2. Признание судом какого-либо положения Соглашения недействительным или не подлежащим принудительному исполнению не влечет недействительности иных положений Соглашения.

5.4. Бездействие со стороны Компании в случае нарушения кем-либо из Пользователей положений Соглашения не лишает Компанию права предпринять соответствующие действия в защиту своих интересов и защиту авторских прав на охраняемые в соответствии с законодательством материалы Сайта позднее.

Пользователь подтверждает, что ознакомлен со всеми пунктами настоящего Соглашения и безоговорочно принимает их.

По всем вопросам, связанным с нарушением авторских прав Компании, незаконного использования материалов Сайта или размещением ложной, вводящей в заблуждение информации о Компании, просим обращаться по  следующим контактным данным:

ООО «ИТ Медиа» ИНН 7802426999, КПП 781301001,
Санкт-Петербург, ул Большая монетная, 16 / К. 30 литера А, пом. 14-Н №30