Искусственный интеллект в национальном депозитарии
Инновации стали ключом к сохранению устойчивости и приобретению новых конкурентных преимуществ компании.
Тенденции времени
Международная консалтинговая компания, специализирующаяся на решении задач стратегического управления, McKinsey, сделала смелое заявление в своем недавнем исследовании[1]. По ее мнению, банкам следует интегрировать новые технологии в свою деятельность, чтобы получить до $1 трлн ежегодной экономии. В исследовании говорится: «Для успешного развития и здоровой конкуренции банки должны активно внедрять искусственный интеллект и сделать его базой для новых ценностных предложений и отличительного обслуживания клиентов». Инновации позволяют кредитным организациям развиваться в соответствии с рыночным вектором и иметь конкурентные преимущества не только в цифровом будущем, но и в цифровом настоящем.
Искусственный интеллект во многом стал ответом на процессы автоматизации. Он позволяет компьютерам выполнять те задачи, которые раньше были под силу только человеку. Машинное обучение — наиболее распространенная прикладная область искусственного интеллекта, которая на основе закономерностей в данных может самостоятельно принимать решения и строить прогнозы. Имея достаточное количество данных, можно оптимизировать или автоматизировать человеческий труд без явного программирования правил. Подобный подход открывает множество возможностей в организациях финансового сектора, и его появление в центральном депозитарии РФ — Национальном расчетном депозитарии (НРД), который является частью биржевого холдинга «Московская биржа», было только вопросом времени.
С чего мы начинали
Согласно мировому опыту, зачастую внедрение искусственного интеллекта и машинного обучения в организациях начинается с решения кейсов ИТ. Именно так и случилось в НРД. Мы начали с автоматизации одной из обязанностей менеджера разработки — распределения дефектов программного обеспечения по разработчикам. Поскольку в НРД все процессы разработки автоматизированы и ведутся в единой системе управления, то мы располагаем большой базой данных обо всех стадиях процесса производства программного обеспечения. Она стала отличной отправной точкой для экспериментов, ведь именно от данных во многом зависит успех проектов с применением машинного обучения. Идея зародилась в конце 2016 года, и уже в начале 2017-го ИИ-решение было внедрено. Позитивный эффект мы ощутили сразу — появилась существенная экономия времени руководителей разработки. Экономию времени мы рассчитывали исходя из оценки 5 минут на один дефект. Может показаться, что это много, однако на самом деле переключение внимания обычно «стоит» еще больше полезного времени сотрудника.
Все наши ИИ-решения созданы с помощью языка программирования Python. Первое решение полностью базировалось на инструментах библиотеки Scikit-learn — у нее очень низкий порог входа, базовые алгоритмы можно запустить буквально с помощью нескольких строк кода. Однако для достижения приемлемых метрик алгоритма обычно требуется грамотная предобработка данных и тонкая настройка алгоритма. В нашем первом кейсе они позволили поднять точность с 33 до 65%. Этой величины было достаточно для запуска пилота. Со временем значения метрик подросли за счет дальнейших настроек и увеличения количества данных.
Увидев первые результаты, другие команды разработки в НРД просили распространить решение и на их задачи. И перед нами встал вопрос масштабирования. Это требовало от нас обучения и навыков обслуживать модели в разрезе систем. Позднее мы автоматизировали с помощью машинного обучения и другие рутинные операции, выполняемые командами разработки, поддержки и тестирования. В итоге небольшой скрипт превратился в полноценный проект, который можно назвать маркетплейсом ИИ-решений, где пользователь может заказать необходимые решения. Сейчас в нашей базе есть решения, легко применимые и на новых сферах.
Меньше рутины — больше творчества
Сегодня искусственный интеллект в НРД шагнул за пределы ИТ. Так, еще в 2019 году накопленный опыт был применен для решения бизнес-задачи по автоматическому разбору неструктурированных сообщений. Речь идет об обработке корпоративных действий — важных событий в том или ином акционерном обществе. Это одна из сервисных функций НРД. Сведения поступают в НРД из множества источников по различным каналам связи, часть из которых поддается классической автоматизации и подходит для программной обработки, а часть — нет. Это требует внимательности и много часов рабочего времени, особенно в сезон корпоративных действий. Наши ИТ-специалисты задумались, получится ли у них передать эту часть монотонной работы искусственному интеллекту, подарив коллегам больше времени на другие, более интересные задачи. Подготовив прототип решения за месяц, рабочая группа поняла, что проект «взлетит».
Текст писем электронной почты по своей природе не предусматривает единой структуры сообщения и изначально подразумевает обработку человеком. В сезон количество таких сообщений достигает тысячи в день. Ранее такие сообщения обрабатывались и заводились в корпоративную базу данных вручную. Но с помощью машинного обучения удалось автоматизировать этот сложный для работы «машины» блок. Подобно человеку, нейросеть читает такие сообщения, выделяет нужную информацию и раскладывает по полям базы данных. С помощью этого решения удалось освободить по 3–4 часа рабочего времени нескольким сотрудникам, а также существенно повысить качество данных.
Описывая процесс работы над кейсом, можно сказать, что это была гибкая разработка: бизнес-заказчик и ИТ находились в непрерывном общении с другу другом, обсуждая особенности реализации и дополняя функционал. К моменту опытной эксплуатации доработка была полностью готова, менялись лишь косметические детали, связанные с удобством пользования или отображения. Спустя три месяца доработка попала на промышленный контур. В индустрии практически нет упоминаний о подобной адаптации общей задачи под частную. Вызовом было достижение синхронного видения возможностей современного машинного обучения у всех участников. Это помогло провести четкую линию между классической алгоритмической и нечеткой интеллектуальной автоматизацией.
Решение получилась комплексным: модуль машинного обучения заменил человека в поиске нужной информации в неструктурированном тексте, а доработка системы классическим алгоритмом позволила связать требуемые сущности в базах данных и выполнить необходимые проверки.
Помочь в реализации задуманного нам помогла DeepPavlov — библиотека для обработки естественного языка. Она свела обработку новостей о корпоративных действиях к очень специфичному NER'у (named entity recognition) — распознаванию именованных сущностей. С внедрением технологии на базе искусственного интеллекта сотрудники получили больше времени для решения более продуктивных задач.
Это первое бизнес-применение машинного обучения в группе «Московская биржа». Кейс помог нам накопить опыт по постановке задачи с заказчиком, по созданию минимального работающего прототипа, по разработке и внедрению в существующую систему. Релиз данного решения стал своего рода катализатором для применения машинного обучения и в других сферах деятельности компании.
С момента внедрения технологии летом 2020 года нам удалось существенно сэкономить рабочее время сотрудников НРД. В итоге мы сократили обработку одного сообщения с нескольких минут до нескольких секунд. Наши коллеги отметили, что на практике решение функционирует еще лучше, чем ожидалось во время разработки: с момента релиза не зарегистрировано ни одного инцидента. Не так много инфраструктурных компаний могут похвастаться успешным внедрением машинного обучения в бизнес-процессах.
Проблема «курицы и яйца»
Читатели, заинтересовавшиеся нашим опытом, могут задаться вопросом: какое подразделение компании является катализатором масштабирования технологии машинного обучения? Как уже было сказано, блок информационных технологий, чтобы оптимизировать собственные задачи, начинает экспериментировать с инновациями и вырабатывать решения под собственные нужды. Для масштабирования используется несколько разных путей.
Во-первых, разработчики могут быть осведомлены о главных потребностях бизнеса и проблемах, которые «съедают» их время для более продуктивных задач. В таком случае бизнесу предлагается прототип разработки, которая может быть кастомизирована под определенные нужды. Во-вторых, процесс поиска оптимального решения может быть комплексным, когда разработчики и бизнес работают в связке. Эта ситуация позволяет ИТ-специалистам занять наблюдательную позицию. Таким образом, последние могут вживую понять алгоритм работы коллег и найти оптимальное решение проблем.
В любом случае, чтобы охватить цифровизацией все заинтересованные департаменты, необходима тесная коммуникация между ИТ и представителями бизнеса. Плюс еще в том, что наши коллеги в целом дружелюбно настроены к инновациям и видят в новых технологиях зоны для развития. Они понимают, что это путь к свободному времени для творческих и стратегических задач. Все опасения о том, что машины полностью заменят людей и отберут у них работу, ошибочны. Как только разработки попадают в промышленную эксплуатацию, все опасения настороженных коллег полностью развеиваются.
Взгляд в будущее
Для себя мы определили, что развитие искусственного интеллекта станет одной из постоянных и важных задач. Уже намечены направления, где его применение будет особенно результативным, учитывая специфику нашей работы. В частности, это работа со сканированными копиями документов. Несмотря на то что многие компании сделали существенные шаги в сторону электронного документооборота, объем бумажных документов остается существенным. Физические копии, как правило, архивируются, а вся основная работа происходит со сканами. Автоматическое распознавание текста отсканированных документов и его дальнейшая обработка с помощью машинного обучения помогут вывести процессы на новый уровень технологичности и надежности.
Успешно реализованные кейсы предоставляют НРД возможность масштабировать технологии уже в текущем году. В планах компании расширение функционала разбора ленты сообщений по аналогии с корпоративными действиями, использование ИИ для прогнозирования нагрузки на системы, предупреждение инцидентов, работа с бизнес-линиями НРД на тему применимости ИИ и расширение функционала ИИ-ассистента менеджера. Также перспективной видится тема цифровых двойников — виртуальных аналогов реальных объектов, дублирующих их в ключевых характеристиках.
Опубликовано 04.10.2021