Управление данными: памятка по принципам проектирования
Перед компаниями, ставящими целью выстроить полноценную систему защиты и управления данными, неизбежно встает вопрос: каковы принципы проектирования таких решений? На самом высоком уровне их два: программно-определяемая (или конфигурируемая) платформа (Software-Defined Platform) и многомерные устройства (Multi-Dimensional Appliances). Давайте разберемся в обоих.
Программно-определяемая платформа
Надежное решение для управления данными требует значительной гибкости – только тогда оно обеспечит широкий спектр возможностей. Наиболее эффективный путь достижения цели – через программно-определяемую платформу на основе API. Здесь следует учитывать несколько основных принципов.
Во-первых, формфактор. Несмотря на то, что данная платформа может поставляться как интегрированное специализированное устройство (appliance), аналогичные возможности можно получить только с программным обеспечением, установленным на программно-определяемой аппаратной платформе, развертываемой локально или в облаке.
Во-вторых, сервисы данных, которые применяются вне формфактора. Это также относится к способности Software-Defined Platform предоставлять гибкие сервисы работы с данными. Единая программно-определяемая платформа реализует полный набор возможностей защиты данных путем архивирования, долгосрочного хранения и резервного копирования/восстановления, аварийного восстановления и обеспечения непрерывности бизнеса, охватывающих весь спектр параметров RTO/RPO.
В-третьих, восстановление. Крайне важно иметь возможность восстановить данные локально или в облаке. А восстановить их в случае атаки вирусов-вымогателей с помощью безопасных решений с полной изоляцией – просто бесценно!
В четвертых, триада: эффективность, безопасность, целостность. Решение должно поддерживать такие методы сокращения объема данных, как сжатие и дедупликация, и при этом гарантировать их безопасность посредством шифрования, а целостность – с помощью архитектуры, снижающей риски их уязвимости.
В-пятых, сценарии управления данными. Программно-определяемая платформа поддерживает широкий спектр подходов – от создания быстро формируемых облегченных копий для разработки/тестирования, аналитики и т. д. до различных сценариев соответствия нормативным требованиям, включая HIPAA, SEC и GDPR.
В-шестых, гибкая архитектура. Решение спроектировано с использованием гибкой и масштабируемой, основанной на сервисах и обеспечивающей поддержку полного спектра рабочих нагрузок архитектуре – от традиционных корпоративных приложений до современных нативных облачных приложений.
Эволюция защиты данных
В-седьмых, методы доступа. Платформа поддерживает полное восстановление данных, восстановление, ориентированное на приложения, и доступ через API для интеграции решений независимых разработчиков. Архитектура API предоставляет полную функциональность платформы через опубликованные, стабильные и хорошо документированные интерфейсы прикладного программирования (API).
В-восьмых, модель потребления. Платформа предоставляет возможность задействовать средства и функции либо в качестве платформы, управляемой конечным пользователем, либо как предложение SaaS, которым управляет провайдер.
И наконец, последнее – автоматизация. Платформа использует встроенные методы искусственного интеллекта и/или машинного обучения для автоматизации часто выполняемых рабочих процессов, размещения данных на правильном уровне и типе носителя, обнаружения и устранения проблем системы и безопасности, обеспечения доступа по каналам NLP и т. д.
Многомерные устройства
В этой сфере необходимо учитывать не менее широкий ряд факторов.
Масштабируемость. Устройство должно иметь возможность масштабирования «на месте», а также горизонтального и вертикального масштабирования. То есть начинать можно с небольшой емкости и затем наращивать – либо увеличивая количество дисков или флэш-накопителей, либо с помощью лицензирования в том же формфакторе. Для вертикального масштабирования используются дополнительные дисковые или флэш-накопители. Можно также вводить дополнительные единицы емкости.
Выбор носителей. Тип хранилища может быть традиционным носителем с вращающимся диском, а система – целиком строиться на флэш- (all-flash) или иных типах накопителей, таких как Non-Volatile Memory express (NVMe) и Storage Class Memory (SCM) следующего поколения. Традиционный сценарий резервного копирования предусматривает использование жестких дисков (возможно, с небольшим объемом флэш-памяти), а в качестве альтернативы применяются высокопроизводительные носители с флэш-памятью (оптимальны для разработки/тестирования и аналитики).
Возможность развертывания. Одну ту же конфигурацию устройства можно развернуть локально в интегрированном формфакторе или в чисто программном виде на системе стандартного типа. Но можно и в облаке – как чисто программное решение для записи в объектное хранилище либо как решение по модели SaaS.
Сценарии использования. Многомерное устройство предназначено для поддержки полного спектра сценариев – от традиционных, с высокой пропускной способностью (архивирование, долговременное хранение, резервное копирование, восстановление) до ориентированных на производительность (репликация, аварийное восстановление, разработка/тестирование, аналитика).
В этой статье я поделюсь практическими наработками из опыта своей компании по организации эффективной коммуникации при создании ПО на заказ.
Функции безопасности и целостность. Устройство поддерживает функции шифрования «на месте» и в процессе передачи данных, а также управления ключами. Кроме того, стабильность и целостность данных обеспечиваются благодаря архитектуре, минимизирующей риски их уязвимости.
Возможности управления. Помимо традиционных методов и встроенных средств управления системой, можно использовать портал на основе SaaS. Кроме того, платформа предоставляет богатые API-интерфейсы для интеграции сторонних решений и рабочих процессов для конечных пользователей.
Отказоустойчивость. Устройство автоматически обнаруживает сбои компонентов и систем, вторжения и аномалии в системе безопасности и, помимо предупреждения администратора, пытается устранить их с помощью самовосстанавливающейся архитектуры либо блокирует подозрительную активность и наборы данных.
Высокая доступность и бесперебойная работа (non-disruptive operations, NDO) обеспечиваются за счет избыточности на уровне компонентов и эвристического прогностического ПО, которое проактивно обнаруживает и устраняет неисправности. Кроме того, обеспечивается возможность бесперебойного обновления различного программного и микропрограммного обеспечения в системе с минимальным вмешательством оператора.
Поиск и аналитика. Спектр этих функций тоже богат: интеллектуальный поиск на уровне виртуальной машины, файлов внутри виртуальной машины и даже содержимого этих файлов, подробная картина характера хранимых данных по типу файлов, времени их создания, актуальности контента.
Эффективность. Достичь эффективности можно с помощью сокращения объема данных, например путем дедупликации и сжатия, что снижает требования к полосе пропускания при передаче по проводным каналам. А благодаря поддержке облачных вычислений, например, при поиске набора данных, хранящихся в облаке, устройство отображает только каталог и выборочно загружает файлы, что существенно снижает издержки при работе с виртуальным хранилищем.
Производительность. Многомерное устройство поддерживает широкий диапазон характеристик производительности, RPO и скорости изменений, а также достаточное количество потоков и скорости приема (вплоть до нулевого показателя RPO, то есть без потери данных) при быстро меняющейся рабочей нагрузке.
* * *
Модернизация парка ИТ должна быть приоритетом для всех компаний, поскольку от этого во многом зависит будущее их бизнеса. Эффективная защита, умелое управление и грамотная аналитика данных могут в итоге определять, кто победит, а кто останется в арьергарде гонки скоростей. Приведенные нами принципы проектирования помогут вам в выборе оптимального решения для управления данными вашей компании.
Опубликовано 05.09.2019