Данные как базис
Поиски ответа на вопрос «что делать?» обычно бывают намного конструктивнее вопроса «кто виноват?». Именно конструктивному анализу и предложениям концептуальных подходов в области цифровой трансформации был посвящен в прошлом году доклад Центра стратегических разработок «Государство как платформа. (Кибер)государство для цифровой экономики. Цифровая трансформация»[1]. Логическим развитием его стал труд «Государство как платформа. Люди и технологии»[2], выпущенный под эгидой РАНХГиС в 2019 году.
Основной автор первого доклада и один из соавторов второго – Михаил Петров, директор Департамента цифровой трансформации Счетной палаты Российской Федерации, преподаватель программы «Руководитель цифровой трансформации» ВШГУ РАНХиГС, – делится своим теоретическим и практическим опытом.
Счетная палата имеет доступ к десяткам информационных систем. В них хранится огромное количество записей. В ходе проверок также запрашивается и собирается огромное количество информации. Есть множество открытых данных. Поэтому с точки зрения возможности применения современных аналитических инструментов для работы с данными перспективы есть. Можно выявлять закономерности и аномалии и отдавать в работу инспекторам только какие-то нестандартные транзакции, документы, не заставляя их анализировать тысячи страниц и десятки тысяч записей, а концентрировать внимание на десятках и сотнях «подозрительных» или «интересных» операций, существенно сокращая время проверок и не тратя ресурсы объекта проверки.
Приведу лишь несколько примеров, над которыми мы непосредственно ведем работу.
При проведении плановой проверки каждый инспектор Счетной палаты составляет акт. Это прямой и непосредственный результат его работы. В этом документе фиксируется все, что удалось обнаружить инспектору в проверяемой организации: например, отсутствие определенных документов, наличие которых предписано нормами и регламентами, нарушения установленных законодательством сроков различных действий, несоблюдение требований нормативных актов и т. д. Решение же о том, какие меры должны быть предприняты относительно проверенной организации, принимается на основе другого документа – отчета о проверке, который составляется на основе всей совокупности актов, собранных инспекторами в рамках мероприятия. За годы существования Счетной палаты накоплен большой архив актов и отчетов. Возникает естественная задача: давайте сопоставим тексты актов и отчетов, попробуем выявить расхождения, особенно принципиальные, поймем их причину, а дальше уже можно будет в новых проверках обеспечивать независимый контроль, чтобы все значимые факты нашли отражение в отчете, и затем переходить, может быть, к полуавтоматической генерации отчета из актов. Провести необходимый анализ текстов с помощью машинного обучения – задача техническая. Правда, для начала нужно разметить архивные тексты определенным образом, с тем чтобы программы машинного обучения могли научиться находить нужные моменты в них и на этой основе уже разработать решение, которое облегчит работу руководителя проверки.
Другой возможный, очень близкий кейс тоже связан с анализом текстов. В область проверок входят ГИС – государственные информационные системы, самые разные ИТ-решения, внедренные и используемые государством. Все их роднит одно: наличие технического задания на входе, и на выходе – проектная документация, акты сдачи-приемки. Все это тоже можно попытаться сопоставить методами текстового анализа и машинного обучения, постараться выявлять определенного рода закономерности – в том числе ценообразования, отнесения затрат на те или иные статьи, определения реальной трудоемкости реализации тех или иных функций, или следить за «неперекрытием» функционала систем (что государство не заплатило два раза за одно и то же), за полнотой выполнения технического задания.
Если в первом примере мы уже получаем определенные результаты, то по второму пока только начинаем двигаться. Кроме того, появляются интересные наработки в области исследования аффилированности. Так, выясняется, что если посмотреть на закупочные процедуры с участием аффилированных компаний, то можно выявить определенные закономерности в снижении начальной минимальной цены контракта, и поведение участников закупочных процедур может дать информацию для размышления проверяющим.
Есть и задачи другой направленности. Чтобы составлять оптимальный план проверок, необходимо иметь «информационные паспорта» (не буду употреблять термин «цифровой двойник» – ограничусь «паспортом») проверяемых объектов. Их пока нет, и быстро сделать их для всей страны сложно, однако можно начать эту работу, к чему мы и планируем в этом году приступить. Если же «информационный паспорт» у объекта будет, то станет возможно свести воедино всю информацию по этой организации из всех ведомственных баз, которые нам доступны. В этих массивах данных на основе уже накопленной информации в сопоставлении ее с определенными факторами и признаками можно выявлять «группы риска» – кластеры объектов, нуждающихся в проверках Счетной палатой в приоритетном порядке.
Новые возможности несет и оптимизация процессов. Например, в прошлом году мы детально изучали опыт международных аудиторских компаний, чья работа близка к деятельности Счетной палаты в части финансового аудита. Судя по нашему исследованию (а мы поговорили с PricewaterhouseCoopers, Ernst&Young и KPMG), практически все компании Big4 идут примерно одним путем в поисках повышения эффективности. Они провели огромную методологическую работу с целью унифицировать операции в рамках аудита и представить их в виде чек-листов, с которыми могут работать специалисты уже необязательно высокой квалификации. Кто-то из Big4 уже очень сильно продвинулся на этом пути, кто-то менее, но вектор движения одинаковый.
Как это происходит? Когда начинается аудит какой-либо компании, руководитель проверки получает типовой план работы и шаблоны, списки проверяемых параметров и факторов из аудиторской базы знаний, опирающихся на отраслевые особенности: практически для любого варианта есть шаблоны и известен порядок действий. Затем список работ уточняется, декомпозируется, и каждый член команды проверки получает свой набор задач в зависимости от своей роли и специализации. Этот набор практически полностью формализован в виде чек-листа. Проверяющему не нужно долго думать, что ему делать и как именно, в какой форме представить результат. Все это не просто известно заранее – задан строгий шаблон, который нужно точно и аккуратно заполнить, опираясь на документы проверяемой компании. Каждый аудитор таким образом четко выполняет свой небольшой кусочек работы. Затем результаты всех сотрудников объединяются, после чего у аудиторских компаний-лидеров более 60% финального отчета генерируется автоматически. Руководителю проверки остается лишь посмотреть отчет, проверить ключевые моменты и написать текстовое заключение с основными выводами. Все детали прилагаются к отчету в виде структурированного текста, таблиц и графиков. Разумеется, невозможно в одночасье перейти от существующей практики работы Счетной палаты к такой схеме (компании Big4 потратили на создание методологического базиса и его воплощение в программных продуктах порядка сотен человеко-лет), но двигаться по этому пути разумно и необходимо.
Попытку такого обобщения мы предприняли еще при подготовке доклада «Государство как платформа» в 2018 году, а также в его продолжении, вышедшем в текущем году. Уже несколько сотен человек (на момент проведения интервью – 250, сколько их будет на момент выхода материала – непонятно, так как потоки обучения запускаются постоянно, только за полгода их было уже 9) прошли обучение по программе «Руководитель цифровой трансформации», много кто поделился опытом и рассказал нам о проблемах.
Видно, что в целом государственные организации отличает устаревшая документоцентрическая система управления, многозвенная вертикаль, непрозрачная система распределения полномочий и ответственности. Очевидна неконсистентность данных различных ведомств, взаимодействие на уровне информационных систем скудно. Уровень достоверности, актуальности и полноты статистической информации удручает. Изменения происходят, но обычно точечно, в отдельных ведомствах с инициативным руководителем, но системных изменений нет. Сотрудники органов власти тоже в массе своей «документоцентричны»: они не работают с данными, потому что не умеют этого. Они умеют только обращаться с документами.
Показатели эффективности при взаимодействии граждан или бизнеса с государством не применяются, а данные лежат мертвым грузом, решения принимаются без опоры на них.
Ведомства применяют несовпадающие методики формирования данных, по-разному понимают, «что есть что», в реальности у каждого ведомства есть собственный набор данных, и работа зачастую идет без оглядки или апелляций к данным других ведомств. Все это очень напоминает положение дел в крупном холдинге перед внедрением единой системы BI: каждый отдел по-своему считает и себестоимость, и прибыль.
Проблем добавляет и «монолитность» государственных информационных систем. На самом деле зачем нужны CDO (chief digital/ data officers)? Или CDTO (chief digital transformation officers)? Тут масса аббревиатур сейчас, и идет игра в умные слова и громкие названия. Суть не в названиях. Накопленная автоматизация (и те, кто ее поддерживает, – CIO) на самом деле сейчас зачастую тормоз для быстрого движения организации вперед. «Классический» CIO на что нацелен? Как в том анекдоте – «только ничего не трогай, только ничего не меняй». KPI понятен – чтобы все системы работали. А CD(T)O нацелен как раз на изменения, на привнесение новых технологий в бизнес. Объективно это разные люди, роли, во многом антагонистичные. Позицию CD(T)O компании вынуждены вводить, чтобы иметь необходимый темп внедрения нового. И проблема в том, чтобы найти таких людей и «встроить» их в процесс изменений в организации.
Есть и еще одна всеобщая проблема: малая распространенность электронной подписи. Анекдот «Электронный документооборот в России — это когда ты распечатываешь документы, чтобы подписать, отсканировать и загрузить в систему электронного документооборота», к сожалению, не просто анекдот – это жизнь. Причем зачастую, когда спрашиваешь «зачем вы все это печатаете?», получаешь ответ «ну, имярек требовал, он бумагу любил – поэтому с той поры все печатаем».
Как я часто говорю: цифровизация – она не про цифру, она про людей. Проблема в первую очередь в менталитете и в квалификации. Если не победить «менталитет» – все остальное работать не будет.
Что можно почерпнуть в мировом опыте повышения культуры работы с данными и изживания названных вами проблем?
Мировой опыт интересен, и он быстро нарастает. Стратегии работы с данными на государственном уровне есть у Мексики и Колумбии, а не только у таких «продвинутых» государств, как США, Австралия и Швеция. И список тех, у кого стратегия есть, постоянно увеличивается. В этих документах много внимания уделяется общей архитектуре, открытости данных, обмену между ведомствами.
Сложность обсуждения инициатив по обращению с данными в нашей стране связана с фрагментированностью. Нет пока даже внятных попыток разработать целостную модель. И проблема тут не в технической части, инфраструктуре, а в разработке свода правил, касающихся работы с данными, которых должно придерживаться государство. В России появляются проекты публикации открытых данных, пусть не все они качественные, преследуют целью именно открытость, – но процесс идет. Государственные данные в открытом доступе активно используются и обсуждаются: сведения о госзакупках, оперативная информация ЦБ, данные спутников ГЛОНАСС. В то же время в государственных программах тема открытых данных практически не упоминается. Часть данных ведомства передают в открытый доступ только принудительно, по требованию законодательства, и качество этих данных низкое.
Помочь изменить ситуацию могут несколько подходов. Один из них – организация обратной связи, когда государство будет реагировать на сигналы, исходящие непосредственно от граждан, экспертов, общественных организаций, и они сами будут контролировать качество данных. Другой – инвентаризация источников данных. В нее входит анализ распределения полномочий, реестров ГИС, данных унаследованных систем, коммерческих организаций. Общепринятый способ инвентаризации – создание карт данных, связанных с определенной темой, например экологией, с указанием источников данных за пределами одного ведомства. Такие карты включают в себя в том числе и режимы доступа к данным. Третий путь – единое архитектурное проектирование структуры данных, можно сказать – workflow их обработки. Он самый сложный, но наиболее правильный, так как на долгосрочном горизонте обеспечивает максимальный эффект от использования «чистых» (однократно вводимых, полных, непротиворечивых, актуальных и т.п.) данных и реальную дата-центричность управления.
Проблемы межведомственного взаимодействия обсуждаются публично не менее десяти лет, но серьезного прогресса пока незаметно. Какова ситуация сейчас?
Устранение ведомственных барьеров – одна из серьезнейших задач, которую неминуемо придется решать в рамках цифровой трансформации. До сей поры все усилия в этой области направлены на то, чтобы более-менее успешно проделывать «дырочки в стенах», связывая ИС разных ведомств. Более продуктивным может быть принципиально другой поход: нужно устранять сами стены. Здесь пока много вопросов. Надежны возлагались на национальную систему управления данными – но даже сами ее разработчики сейчас говорят, что первых пилотных результатов надо ждать пару лет, и облик системы до конца не определен и будет сформирован только по результатам пилотов.
Гражданин уже создает «цифровой след», может быть построен граф его взаимодействий с государственными структурами. Если бы такой «цифровой двойник» человека существовал как единое целое, не раздробленное на ведомственные кусочки, можно было бы намного эффективней решать как житейские проблемы (как сейчас говорят – жизненные ситуации) граждан, так и государственные управленческие задачи.
Появился бы, наверное, и единый подход к коммерческому использованию государственных данных, – пока, как мы недавно обсуждали это на одной конференции, эксперты говорят о существовании серого рынка данных и практически полном отсутствии официального. А как раз персональные данные, обрабатываемые государством, в сочетании с данными коммерческого сектора могли бы дать очень полный портрет человека, что за счет появившихся возможностей персонализации толкнуло бы вперед медицину, потребительский сектор, шеринговую экономику и т. д.
Нужно ясно отдавать себе отчет в том, что изменения такого уровня могут происходить только при наличии сильнейшей мотивации всех, кто участвует в работе, и методы кавалерийской атаки в этой сфере неприменимы. Для прогресса в сфере обращения с государственными данными нужны годы планомерных, продуманных усилий.
[1] https://www.csr.ru/wp-content/uploads/2018/05/GOSUDARSTVO-KAK-PLATFORMA_internet.pdf.
[2] https://www.ranepa.ru/images/News/2019-01/16-01-2019-GovPlatform.pdf.
Опубликовано 05.06.2019