Какую выгоду приносит бизнесу управление качеством данных

Логотип компании
Какую выгоду приносит бизнесу управление качеством данных

Иллюстрация: Timepopo/Shutterstock.com

Какие инструменты способны решить проблему отсутствия доверия к данным (которая приводит к финансовым потерям из-за ошибочных решений, задержкам в подготовке отчетности и снижению производительности труда сотрудников)?

На наших глазах произошло значительное изменение в восприятии роли данных в жизни компаний. Организации по всему миру, включая успешные стартапы, крупные корпорации и правительства, признали, что данные стали ключевым стратегическим ресурсом.

Вне зависимости от того, идет речь о сервисе «Госуслуги», цифровом банке, маркетплейсе, на котором мы привычно заказываем продукты на дом, или даже о заказе такси через онлайн-приложение: все эти инновации базируются на обработке больших объемов данных. Организации, которые развивают подобные передовые сервисы, на практике осознали необходимость перехода к управлению на основе анализа данных, что позволяет им успешно поддерживать прибыльность, внедрять инновации и развивать бизнес, оставаясь конкурентоспособными в быстро меняющейся среде. Подход получил название Data Driven, или «управление, основанное на данных».

Среди сложностей, которые возникают при переходе к этой модели управления, наиболее заметной является обеспечение качества данных. По оценкам консультантов Gartner, «каждый год низкое качество данных обходится организации в среднем в 12,9 миллиона долларов. Помимо существенного влияния на доходы, в долгосрочной перспективе плохое качество данных приводит к принятию неправильных бизнес-решений».

С увеличением объемов информации и роста количества источников данных эта проблема только усугубляется. В 2022 году проводилось исследование, посвященное оценке доверия топ-менеджмента к данным. Результаты этого исследования оказались шокирующими: 75% руководителей не доверяют данным, с которыми работают, а 70% считают, что обработка информации в их организации не соответствует потребностям бизнеса.

Отсутствие доверия к данным — это ежедневная реальность для любого сотрудника, который нуждается в достоверной информации. Проблема затрагивает всех: генерального директора, получающего неточную оперативную отчетность с существенной задержкой; финансового руководителя, принимающего ошибочные решения, опираясь на устаревшие данные; сотрудников отдела аналитики, вынужденных вручную составлять отчеты, что приводит к постоянным ошибкам; специалистов отдела data science, пытающихся разработать новые цифровые сервисы на основе недостоверных данных; менеджера в банке, принимающего решение о выдаче кредита, опираясь на неполные данные о заемщике; руководителя департамента рисков, формирующего резервы, основываясь на мнениях, а не на фактах. В результате возникают реальные финансовые потери из-за ошибочных решений, задержек в подготовке отчетности и снижения производительности труда сотрудников.

Возникает вопрос: существует ли решение, которое может помочь справиться с этими вызовами?

Инструменты, способные решить указанные проблемы, появились. Они представляют собой специализированный класс программного обеспечения — каталог данных.

Каталог данных сегодня

Информационные системы, которые мы сейчас называем «дата-каталог», или «каталог данных», неслучайно возникли в передовых компаниях, успешно развивающих свой бизнес в цифровой сфере. Компания Netflix, являющаяся гигантом индустрии развлечений, разработала каталог данных Metacat, а компания Uber была родоначальником системы OpenMetadata.

Дата-каталог создает и поддерживает хорошо организованную инвентаризацию информационных активов предприятия. Он обеспечивает сотрудников единой средой для совместной работы, включающей бизнес-глоссарий, каталог метаданных и модуль контроля качества данных.

Бизнес-глоссарий

Бизнес-глоссарий представляет собой энциклопедию бизнес-знаний, написанную на доступном языке, которая позволяет любому пользователю, даже неспециалисту, понять контекст бизнеса.

Бизнес-глоссарий подробно и наглядно описывает термины, объекты и единицы измерения, используемые в организации. Он помогает разобраться в значениях показателей и методах их измерения, обнаружить факторы, влияющие на полученные результаты, а также найти отчеты, дашборды или витрины данных, на которых представлена визуализация этих показателей.

Каталог метаданных

Каталог метаданных содержит информацию о формате и структуре данных, включая модели данных, схемы преобразования, форматы файлов, а также понятные рядовому пользователю описания таблиц.

Современный каталог метаданных способен автоматически извлекать необходимые описания из различных баз данных, таких как Postgres, Greenplum, MySQL, из популярных аналитических систем вроде LuxmsBI или Superset, и многих других информационных систем.

Технические метаданные позволяют ответить на вопросы: когда последний раз производилось обновление данной таблицы, каким образом данные были загружены в хранилище, сколько раз таблица была использована и кем, а также определить, являются данные конфиденциальными или персональными и соответствуют ли они установленным критериям качества.

Модуль контроля качества данных

Инструменты по управлению качеством данных гарантируют снижение рисков, связанных с использованием в организации недостоверных или непроверенных данных, и обеспечивают соблюдение требований регулирующих органов. Перечислим основные шаги, которые требуются для обеспечения качества данных. Во-первых, профилирование данных. Программное обеспечение позволяет организациям тщательно проверить информацию и получить полное представление об ее характеристиках и качестве. Изучая паттерны, распределение и взаимосвязи внутри наборов данных, организации могут обнаруживать несоответствия, ошибки, дубликаты или недостающие сведения.

Во-вторых, проверка данных на соответствие заранее определенным стандартам, правилам и требованиям бизнеса. Контроль качества данных не является одноразовым мероприятием; это процесс, требующий непрерывного мониторинга и активного участия. Программное обеспечение управления качеством данных позволяет создать набор проверок, которые будут автоматически выполняться по расписанию. Процесс помогает организациям отслеживать свои данные в реальном времени, выявляя ошибки прежде, чем сведения поступят пользователям. В случае выявления ошибок система предупредит, что информацию нельзя использовать, включив красный сигнал на светофоре качества данных.

Автоматически созданное оповещение проинформирует всех заинтересованных лиц о выявленных проблемах с качеством данных, что позволяет своевременно вмешаться и предотвратить дальнейшее распространение ошибок.

В конечном итоге, применяя каталог данных, сотрудники организации имеют удобный и эффективный инструмент для работы. Они могут легко находить необходимую информацию, использовать ее в своей работе и на основе достоверных данных принимать обоснованные бизнес-решения.

Примеры бизнес-кейсов управления качеством данных

Финансовые компании одними из первых осознали, что без надлежащего управления информацией о клиентах невозможно разрабатывать и предлагать цифровые сервисы. Одна из болезненных задач — подготовка аналитической отчетности. Например, представители крупного российского финансового холдинга рассказали, что без каталога данных подготовка нового аналитического отчета занимала более двух месяцев, что, естественно, не удовлетворяло ни команду менеджмента, ни владельцев холдинга. Причем до 80% времени расходовалось на поиск достоверных данных. Внедрение дата-каталога сократило этот срок до двух дней.

Фармацевтические компании, работающие с чувствительными данными, касающимися разработки новых методов лечения или препаратов — одни из самых требовательных к качеству данных организаций в мире. Например, предприятие-производитель из фармацевтической отрасли, используя возможности автоматической проверки качества данных, за три дня обнаружило ошибку в работе лабораторного оборудования, грозящую привести к многомиллионным потерям.

Значительная область экономии, возникающая в связи с внедрением каталога данных, связана с очисткой хранилища от неиспользуемой информации и дубликатов. Благодаря идентификации и обнаружению неиспользуемых баз данных специалисты крупного российского банка смогли оптимизировать затраты на хранение информации.

Резюме

Управление качеством данных становится необходимым процессом для современных компаний на пути цифровой трансформации, так как:

  •  позволяет принимать обоснованные решения на основе надежной информации;
  • обеспечивает прозрачность в процессах работы с данными и улучшает управление рисками;
  • помогает бизнесу соблюдать требования законодательства и нормативов относительно защиты данных и конфиденциальности;
  • позволяет лучше использовать данные для принятия решений, оптимизации процессов и повышения конкурентоспособности;
  • помогает снизить издержки на хранение, обработку и анализ данных за счет улучшения их качества и упорядочения процессов работы с ними;
  • создает инфраструктуру, которая позволяет бизнесу быстрее адаптироваться к изменяющимся условиям рынка и внедрять инновационные решения на основе данных.

Внедрение каталога данных и процессов Data Governance способствует эффективному и безопасному управлению данными, что в конечном итоге обеспечивает успешную и устойчивую деятельность бизнеса.

Опубликовано 24.04.2024

Похожие статьи