Настоящее и будущее аналитических систем: от BI к комплексному управлению данными
Витрины медицинских данных в контексте цифровизации отрасли
Аналитика в здравоохранении сегодня может применяться в самых разных сценариях. Когда ИТ-компании, работающие в этой сфере, выбирают направления для дальнейшего развития, они чаще всего опираются на конкретные насущные задачи, стоящие перед отраслью. Например, во время пандемии мы анализировали скорость выполнения лабораторных исследований, качество поставленных диагнозов и результаты лечения.
Сегодня же внимание Минздрава сосредоточено прежде всего на эффективной автоматизации бизнес-процессов с помощью технологии витрин данных. В данном случае под «витриной» понимается стандартизованный механизм доступа к первичной информации в распределенной сети обмена данными. В качестве пилота для апробации такой технологии в здравоохранении на федеральном уровне был выбран востребованный и вместе с тем сравнительно простой и понятный процесс записи на прием к врачу. В дальнейшем подход будет масштабироваться и работать со многими другими видами медицинских данных. «Нетрика Медицина», которая обслуживает информационный обмен более чем в 20 региональных системах здравоохранения, также обеспечивает разработку и своевременное наполнение «федеральных» витрин.
Однако в контексте нашего флагманского продукта, региональной системы управления здравоохранением, мы определяем витрины данных более широко – как часть комплексного процесса управления данными. Фактически наш BI-продукт «N3.Аналитика» уже сегодня может качественно анализировать множество различных областей: лабораторные и инструментальные исследования, электронные медицинские карты, управление потоками пациентов и т. д., – то есть оперативно реагировать на любые запросы отрасли. Рассмотрим подробнее, за счет чего это достигается и какую пользу приносит.
Преимущества цифровых сервисов и аналитики данных
Пользователями «N3.Аналитики» являются органы управления здравоохранением (ОУЗ), лица, принимающие решения на региональном уровне, отраслевые эксперты. Платформа дает им возможность как оценивать отчетные параметры целого региона, так и детализировать информацию до первичных данных, рассматривать их в различных разрезах, проводить многофакторный анализ.
Для региональной системы управления здравоохранением крайне важны достоверность, оперативность и простота обмена данными. Наш инструмент позволяет руководителям всегда получать актуальные отчеты: все данные уже находятся в аналитических витринах и специалистам не нужно самостоятельно открывать дополнительные источники. Конструктор аналитических отчетов формирует необходимую отчетность в интуитивно понятном интерфейсе. Достоверность информации достигается за счет того, что она извлекается нами из исходных источников, выверяется и только после этого попадает в единую базу.
В итоге, если система отстроена, на основе данных аналитики выработаны и отлажены регламенты, установлена обратная связь между ОУЗ, медорганизациями и поставщиками информационных систем, – данные становятся управляемыми, а качество информации в них начинает расти. Обеспечивается преемственность оказания медицинской помощи, повышается качество медицинских услуг. Поэтому наши разработки крайне востребованы рынком, и на достигнутых преимуществах мы не планируем останавливаться.
От BI к платформе управления данными
Сегодня в арсенале «Нетрика Медицины» имеется классическая BI-платформа «N3. Аналитика», которая реализует две основные функции: а) сбор данных из различных источников, б) их интеграцию и формирование аналитических витрин, включая предоставление визуальных инструментов для работы с ними. За это отвечают несколько взаимосвязанных компонентов системы: корпоративное хранилище данных, ETL-платформа, аналитическое хранилище и инструменты визуализации.
Здесь под термином «аналитическая витрина» мы понимаем многомерный проблемно-ориентированный набор данных, объединяющий всю доступную информацию (так называемый контекст) с точки зрения какой-либо проблемы. Например, набор «Результаты лабораторных обследований» строится, отталкиваясь от результатов тестов, проведенных в медицинских лабораториях, о которых собираются сведения по более чем 700 параметрам: от домашнего телефона пациента до наименования оборудования, на котором выполнялся конкретный лабораторный тест. Сведением контекста занимаются программисты: это достаточно трудоемкий и ресурсоемкий процесс, учитывая, что у нас уже более 30 витрин по разным направлениям медицины.
Поэтому сегодня мы предлагаем пользователям принципиально новый подход к формированию наборов данных, который позволит снять нагрузку с технических специалистов, снизить требования к вычислительным мощностям и ускорить наполнение витрины данными. Для этого мы внедряем методику управления данными на основе моделей и техническое решение, способное ее реализовать. В состав технического решения должен войти набор сервисов и пользовательских интерфейсов, обеспечивающих весь цикл управления данными: обнаружение и идентификацию данных, организацию потоков данных, обеспечение доступа и т. д.
Одним из ключевых компонентов системы является каталог данных – сервис, в котором описываются и хранятся все данные, которые мы собрали из разных источников, идентифицировали, обнаружили взаимосвязи. Пользователь системы имеет возможность в программном или графическом интерфейсе по определенным критериям получить к ним доступ.
Второй, важный с точки зрения техники, компонент называется «Реестр моделей данных», и предполагает управление описаниями логических моделей данных. А с точки зрения методологии, мы предполагаем разработку (или загрузку существующей) центральной референсной информационной модели предметной области, с которой будут сопоставляться любые подключаемые источники. Одним из ключевых пользователей нашей системы являются аналитики – это эксперты в определенной предметной области, необязательно обладающие глубокой технической экспертизой. Аналитик взаимодействует с системой в бизнес-терминах, совершенно не вникая, как данные хранятся на физическом уровне, – и происходит это именно благодаря референсной модели. В простом случае речь идет об адресации полей, но система предполагает и более сложные преобразования.
Третий компонент – реестр типовых операций с данными (в том числе операций трансформации данных). Его задача – идентифицировать все операции, которые с данными могут быть произведены.
Идентификация всех операций, наравне с идентификацией самих данных, применяется для управления доступом. Что не менее важно, идентифицированные операции позволяют нам построить трассировку для любого значения – однозначно установить его происхождение на любом этапе жизненного цикла. Раскрывая конкретный показатель в витрине, мы можем посмотреть весь путь прохождения данных от первоисточника: откуда и в какой момент они были забраны, как изменялись на пути до витрины, какие промежуточные состояния принимали. Такой механизм называется Data Lineage – он позволяет однозначно интерпретировать данные и быть уверенными в их достоверности.
Среди прочего на граф Data Lineage будут нанесены индикаторы оценки критериев качества (от ФЛК до сложных проверок содержания) данных.
Таким образом, если раньше аналитик должен был надеяться на то, что программист нигде не ошибся, реализуя постановку, то сейчас он сам может проверить достоверность данных, оценить их путь. Это очень важно, в том числе для медицинских информационно-аналитических центров (МИАЦ), которые часто запрашивают у нас информацию: откуда взялась такая-то цифра, как она считалась. Точно так же происходит в любой отрасли, где в результате цифровой трансформации произошел переход к управлению на основе данных.
Перечисленные компоненты становятся логическим ядром нашей новой платформы управления данными. Кроме них, решение содержит ряд технических компонентов: например, механизм управляемого доступа к данным.
Поверх этого реализуется визуальная часть – то, с чем конечный пользователь непосредственно взаимодействует. То есть веб-портал, где реализованы интерфейсы по группам: административный и пользовательский разделы, конструкторы запросов и трансформаций, сама BI-система. Предполагается, что даже технически малоподготовленный аналитик, вооружившись только документацией, сможет подключить простые источники, сопоставить модели с референсной информационной моделью, заполнить критерии качества и таким образом дать системе достаточный объем структурированной, формализованной информации, чтобы она сгенерировала нужные потоки данных. Иными словами, речь идет об автоматизации базовых ETL-процессов, призванной сократить сроки внедрения системы и затраты организации на простую аналитику.
Есть и цели, и путь
Как уже сказано выше, на данный момент платформа «N3.Аналитика» уже внедрена как элемент государственной информационной системы здравоохранения более чем в 20 регионах страны. Получив достаточный опыт в цифровизации здравоохранения, сегодня мы тиражируем ее в любых других областях, где требуется глубокая Data-аналитика.
Мы уверены, что наша новая платформа управления данными востребована, к примеру, в нефтегазовой промышленности, транспортном секторе и логистике, в финтехе, фармацевтике и т. д. У нас уже есть запросы от компаний крупного и среднего бизнеса на разработку разных видов отчетности, в том числе сложной. Многие из них имеют большой штат ИТ-специалистов и сами хотят настраивать ETL. Поэтому, развивая платформу, мы исходим из рыночного спроса и целенаправленно обеспечиваем нашу систему необходимой функциональностью.
Опубликовано 03.08.2023