Data Management: управляем грамотно
Проблема консолидации данных из различных источников, которые создавались в разное время, выбор единой платформы Data Managemen, минимизация рисков и ошибок — все это волнует заказчиков, независимо от размера компании и сферы деятельности. Данные есть у всех, а вот работать с ними умеют далеко не все. Кто-то жалуется на отсутствие соответствующих инструментов, кто-то сетует на сложность процесса. Словом, проблем немало, и рекомендации профессионалов, работающих на этом рынке, могли бы оказаться очень полезными. Мы поговорили с экспертами о практических аспектах Data Management.
Обработка и показ
«Основные проблемы в Data Management — это отсутствие достаточной квалификации сотрудников, обеспечение безопасности, перенос данных и производительность используемых приложений. Одна из типичных сложностей управления данными на предприятии — множество подходов и систем управления, даже в рамках одного предприятия. Например, когда в компании есть несколько автоматизированных систем, внедренных в разное время разными людьми, каждый из которых по-своему видел, как это всё должно действовать. В рамках небольшой компании это решается довольно быстро — нужно лишь выбрать новую единую систему и начать работу заново. На крупных предприятиях такой процесс должен проходить постепенно, с применением перекрестной проверки данных между системами», — объясняет Александр Иванников, директор по развитию компании mClouds.ru.
«За последние годы в современных компаниях существенно возросло количество и сложность информационных потоков между различными системами. Это приводит к многочисленным коллизиям и несоответствиям в данных и отсутствию ассоциативной модели, позволяющей отслеживать взаимосвязь данных и выстраивать предиктивную аналитику. Решить проблему можно с помощью инструментов, позволяющих на регулярно проводить семантический анализ содержимого хранилищ данных и выявлять коллизии в части структуры хранения и обнаруженных семантических доменов», — дополняет Никита Андреянов, руководитель отдела внедрения и продвижения решений Crosstech Solutions Group. Эксперт также напоминает, что данные необходимо не только качественно обрабатывать и поддерживать в актуальном состоянии, но и грамотно предоставлять их людям, которые с ними взаимодействуют. «Визуализация и бизнес-аналитика в лице BI-платформ должна быть верхушкой любой DMP-системы. Компетентно разработанный дашборд не только демонстрирует информацию о том, что, например, на прошлой неделе было зафиксировано падение продаж. Он отвечает и на ключевые и самые важные вопросы: почему это произошло? какие меры необходимо предпринять? какой у нас прогноз на следующую неделю?» — поясняет он.
Большинство современных компаний уже сегодня стараются быть data-ориентированными и выстраивать процессы по сбору, обработке, хранению и прикладному использованию данных. Однако на практике часто возникает ряд сложностей, которые не позволяют организации стать полноценной data-driven-компанией и начать монетизировать данные.
Большинство современных компаний уже сегодня стараются быть data-ориентированными и выстраивать процессы по сбору, обработке, хранению и прикладному использованию данных. Однако на практике часто возникает ряд сложностей, которые не позволяют организации стать полноценной data-driven-компанией и начать монетизировать данные.
С чего начнем и кто главный
Управление данными — один их важнейших внутренних процессов для любого предприятия. Это какой-то разовый проект вроде внедрения ИС или перехода на новые стандарты работы. «Чтобы улучшать эффективность предприятия, этот продукт нужно постоянно расширять, дополнять из разных источников и делать новые выводы. Для внедрения Data Management необходимо большое количество данных из разных сфер предприятия. Как правило, ресурсом управления всеми сферами компании с целью сбора и обработки данных обладает Chief Data Officer — главный специалист по данным», — утверждает Павел Подкорытов, генеральный директор компании Napoleon IT. С чего начать этот процесс? На такой вопрос ответил Никита Кардашин, руководитель практики комплексной цифровизации процессов компании Naumen. «Начать внедрение практик управления данными следует с разработки стратегии и утверждения ее на самом высоком уровне. Типична ситуация, когда средний и низовой менеджмент сопротивляется трансформации, пытаясь сохранить монополию на «свои» данные и даже скрыть их от смежных подразделений и руководства. Преодолеть подобное сопротивление поможет только воля высшего менеджмента», — объясняет он.
«Иногда самый большой барьер на пути к эффективному использованию данных заключается в том, что владельцам данных в организации банально не хватает экспертизы в вопросе управления ими. Важнейшей частью стратегии управления будет предоставление всей команде знаний и навыков, необходимых для анализа и понимания данных, — добавляет Иван Кузнецов, инженер данных компании Tet. — Успешно внедренный процесс управления данными гарантирует, что вся информация используется правильно и единообразно во всей организации. Важно, чтобы принятые политики и процедуры понимались не только владельцами бизнеса и заинтересованными сторонами, но и всеми сотрудниками компании. Это поможет развить культуру данных в масштабах всей организации».
Примитивным сбором и простым хранением информации современным компаниям уже не обойтись — без отчетливого понимания сферы и глубокого анализа данные будут в лучшем случае бесполезны. Эффективное использование данных вкупе с четким пониманием процессов и тенденций может помочь компании выбрать правильный вектор развития, принимать более обоснованные решения, улучшить показатели маркетинговых кампаний, оптимизировать бизнес-операции, сокращать расходы и увеличивать прибыль. В свою очередь работа с неверными данными или разрозненными системами может привести к краху всего предприятия.
Любые данные — в работу
Что касается актуализации данных, проверки их соответствия текущей ситуации, аудита, то здесь Павел Подкорытов (Napoleon IT) не рекомендует однозначно негативно относиться и сбрасывать со счетов устаревшую информацию. «Любые исторические данные — плодородная почва для обучения и принятия решений, — объясняет он. — При этом необходимо обеспечить актуализацию датасета в реальном времени, чтобы не упустить важные события и возможности. Для этого нужно обязательно разработать информационную политику, которой все поставщики данных, как внутренние, так и внешние, будут придерживается. А вы, как центр агрегации, должны сделать систему мониторинга для входящих данных на предмет консистентности и своевременности».
Типичной проблемой заказчиков становится неконсистентность данных. Другими словами, данные являются неполными и несогласованными. Зачастую это происходит из-за использования большого количества информационных систем от разных вендоров. В таком случае предприятию необходима роль, которая будет следить за целостностью и согласованностью данных, попадающих в хранилище из разных систем.
Никита Кардашин (Naumen) для решения задачи по актуализации данных «раз и навсегда» советует в первую очередь ликвидировать цифровые барьеры между системами и построить единое информационное пространство на предприятии. «Создание единой информационной среды снимает, среди прочего, и проблему актуальности данных, ведь исчезает звено сбора данных, зачастую искусственно надстроенное над бизнес-процессом. Данные создаются непосредственно в единой информационной среде и в ней же потребляются, что исключает расхождения и потерю актуальности», — считает он.
Тяжелая наследственность
Чаще всего организации приходят к процессу управления данными с большим количеством унаследованных систем. Каждая из них действует по-своему, но в этом случае говорить о построении единого пространства работы с данными очень сложно. Ряд полезных советов дает Иван Кузнецов (Tet). «Во-первых, предстоит доказать руководству, что инвестиции оправданы и в долгосрочной перспективе принесут прибыль. Во-вторых, на внедрение новых процессов всегда требуется время, чтобы сотрудники освоили дополнительные навыки. Кроме того, нужно и персоналу объяснить, каковы преимущества от новых систем, как это облегчит рабочие процессы. Очень полезно регулярно проводить внутренние мероприятия «О чем говорят данные», где специалисты по данным разъясняют остальным коллегам актуальные тенденции и преимущества работы с данными. После внедрения опять нужно время — на этот раз чтобы ситуация стабилизировалась и все привыкли к работе в рамках новых политик и процедур. Вначале могут быть обнаружены недостатки в системе и пробелы в самих данных, однако этого не стоит бояться.
Еще один важный аспект, который следует держать в голове, — смена технологий часто предполагает не только перестройку систем, но и изменения паттернов взаимодействия между работниками, что тоже необходимо учитывать», — комментирует он. Сразу несколько аспектов подобного перехода выделяет и Александр Данилов, партнер «Лиги цифровой экономики»). «Во-первых, нужно готовиться к тому, что вовлекаться в этот процесс будут как сотрудники ИТ, так и бизнес-подразделений, причем в равной степени. Второе — процесс перехода будет болезненным для всех, поэтому необходимо постоянно корректировать траекторию выбранной стратегии с учетом полученных результатов. Сейчас все происходит очень быстро, так что в процессе возможна как корректировка конечных целей и бизнес-эффектов, так и изменение траектории, по которой этот процесс будет идти. И наконец, надо осознавать, что не существует учебника о том, как правильно сделать проект по построению и внедрению DMP. Это знание, которое необходимо самостоятельно приобрести каждой компании на основе полученного опыта, придется сформировать методологию и набор практик, в дальнейшем позволяющих эффективно развивать и поддерживать процессы управления данными в организации», — уверен он.
Сейчас на рынке есть множество технологических решений в области Data Management. Наш опыт говорит о том, подводные камни в основном встречаются в организационной плоскости, в части построения процессов внутри компании, особенностей корпоративной культуры. Также важно терпение ключевых спонсоров и стейкхолдеров подобных инициатив, ведь зачастую быстрого бизнес-эффекта добиться сложно – это, скорее всего, можно назвать основным вызовом для организаций, которые планируют подобные проекты.
«Волшебная таблетка» не спасет
Искусственный интеллект решает задачи намного быстрее и эффективнее, чем человеческий мозг. Это касается и технологий управления данными. Но не следует использовать его бездумно, как некую «волшебную таблетку». От подобного подхода предостерегают эксперты. «Если говорить об инструментах, то часто неоправданно много внимания уделяется централизованным инструментам сбора и анализа данных, создаваемым вне основных бизнес-систем — «внедрим некий черный ящик, который проанализирует наши данные и принесет счастье». Считаю этот подход во многих ситуациях вредным: данные должны собираться, обрабатываться и анализироваться непосредственно внутри базовых бизнес-процессов организации, а результат анализа должен быть доступен «на кончиках пальцев» участникам процессов. Поэтому я рекомендовал бы тем, кто еще только задумывается об управлении данными, обратить внимание на базовые системы предприятия — CRM, BPM, CEC и другие. Вероятно, начать использовать подход data-driven следует именно с них, а не с внедрения «единой Data Management Platform». В любом случае, начать стоит с анализа существующих процессов и практик организации, поиска существующих цифровых барьеров и определения путей их устранения», — заключает Никита Кардашин (Naumen).
Стратегия управления данными, data governance, становится неотъемлемой частью корпоративной стратегии в целом и стратегии цифровизации в частности. Ее разработка и исполнение должно находиться под непосредственным наблюдением высших корпоративных органов управления — CEO, правления или совета директоров. Стратегия должна регулярно обновляться для соответствия текущим технологическим и юридическим реалиям, внедряться целостно и иметь поддержку на всех управленческих уровнях.
Павел Подкорытов (Napoleon IT) предлагает использовать подход для тестирования гипотез. По его словам, гипотезы основываются на наборе данных, а мы, как исследователи, предполагаем, какие выводы и с какой точностью мы можем сделать. Никогда невозможно предугадать, как утверждает Павел, какой объем данных потребуется для точного прогнозирования будущих событий, пока не проведен эксперимент. Для этой цели нужно собрать маленькую гибкую команду, которая во-первых, поставит определенную гипотезу. Во-вторых, соберет необходимые для гипотезы данные. В-третьих, создаст прогностическую модель на основе машинного обучения, а в-четвертых, протестирует ее работу на прошлых и будущих событиях. «Конечно, необходимо учитывать что подобная модель имеет эффект переобучения: данные должны дополняться и исключаться в процессе повышения точности модели, — поясняет он. — Улучшать точность и искать недостающие данные можно всегда, поэтому такая работа никогда не заканчивается».
Опубликовано 08.09.2021
Применение облачных технологий (перенос данных в облако) делает их более доступными, так как облачные решения позволяют распределять данные и ресурсы. Ими можно управлять и работать из разных точек мира. Благодаря облакам также повышается безопасность данных и гибкость всех систем предприятия.