Нейронные сети используют данные о банковских транзакциях для кредитного скоринга
Исследователи из Сколтеха совместно с одним из крупных европейских банков разработали нейронную сеть, которая превосходит самые современные решения в области использования данных о банковских транзакциях для оценки кредитоспособности клиентов. Результаты исследования опубликованы в трудах Международной конференции IEEE International Conference on Data Mining (ICDM) 2020 года.
Максим Панов, Кирилл Федянин и их коллеги из банковской сферы смогли показать, что использование данных о переводах между клиентами значительно улучшает качество кредитного скоринга по сравнению с алгоритмами, в которых используются только данные о заданном клиенте. Учет таких данных не только позволит банкам готовить более выгодные предложения для своих надежных клиентов, но и снизит негативные последствия мошеннических действий.
Исследователи использовали сверточную графовую нейронную сеть специальной архитектуры для обработки графов, в которых узлы графа соответствуют обезличенным идентификаторам клиентов банка, а ребра – связям между ними. Таким образом обеспечивается агрегирование данных связанных клиентов и прогнозирование кредитного рейтинга для заданного клиента. Главная особенность предложенного подхода − возможность обработки крупномасштабных временны́х графов, присутствующих в банковских данных, в неизменном виде, т.е. без какой-либо предварительной обработки, которая зачастую очень трудоемка и приводит к частичным потерям содержащейся в этих данных информации.
Проведено экспериментальное сравнение шести моделей, в котором победу одержала модель EWS-GCN. «Успех этой модели можно объяснить тремя факторами. Во-первых, модель напрямую обрабатывает полные данные о банковских транзакциях и тем самым сводит к минимуму потери содержащейся в них информации. Во-вторых, структура модели специально построена таким образом, чтобы модель одновременно обладала высоким качеством предсказания и была вычислительно эффективной. Наконец, мы предложили специальную процедуру обучения для системы в целом», − отмечает Максим Панов.