Использование искусственного интеллекта в медицине и финансах: разработчик международного класса Вадим Атаманенко

Логотип компании
Использование искусственного интеллекта в медицине и финансах: разработчик международного класса Вадим Атаманенко
Параметры искусственных нейронных сетей с малым числом нейронов и скрытых слоев используют для простой классификации изображений или распознавания речи. Параметры искусственных нейронных сетей с большим числом нейронов и скрытых слоев используют для сложных задач.

Вадим Атаманенко: с моим опытом в разработке и глубоким пониманием требований бизнеса, а также моей страстью к медицине писать статьи очень интересно, это дает мне новый стимул для развития в этих направлениях.

 

На вопросы главного редактора журнала IT News Геннадия Белаша отвечает Вадим Атаманенко, опытный инженер-разработчик, старший программист аналитического отдела в Freedom Life, с 25-летней историей успешных проектов, научными статьями, и собственным учебным курсом по разработке приложений для бизнеса.

 

Вы трудитесь  в крупнейшем финансовом холдинге Freedom и решаете для корпорации множество сложнейших задач. Как ваша профессиональная деятельность помогает вам более глубоко разбираться в работе искусственного интеллекта? Ведь благодаря профессиональному опыту, вы являетесь одним из ведущих международных экспертов в области ИИ. Как ваша высокая квалификация помогает готовить статьи по ИИ в медицине и финансах?

Пожалуй, Freedom Holding дал мне наибольший опыт: здесь я получил общее направление, куда стоит развиваться. Поскольку Freedom – это огромный финансовый холдинг, с различными задачами, с которыми я встречаюсь ежедневно, то и мысли об их автоматизации и переводе в сторону ИИ обретали свои черты довольно явно.

Один из таких примеров на памяти работа с системой KYC (Know Your Client), которая, запрашивая данные из различных источников, анализирует их на предмет вхождения в группы риска (лицо, находящееся в розыске, участие в террористических организациях и т. д.)

По поводу квалификации: с моим опытом в разработке и глубоким пониманием требований бизнеса, а также моей страстью к медицине писать статьи очень интересно, и это дает мне новый стимул для развития в этих направлениях.


Вас, как специалиста высокой квалификации, часто приглашают участвовать в мероприятиях по оценке различных ИТ-продуктов и ИТ-сотрудников для их рейтингования, в том числе на такие знаковые конференции как MentorPRO IT. Не могли бы вы рассказать подробнее о таком опыте? Подобная работа не отвлекает вас от вашей деятельности или она вам нравится?

Вы правы, меня зовут довольно часто, стараюсь находить время и помогать в различных мероприятиях. Наверное, стоит привести несколько примеров. 

Скажем, конференция MERGE INNOPOLIS 2021 в ведущем ИТ-университете России, куда меня пригласили прочесть доклад на тему «Как стать востребованным специалистом на современном ИТ-рынке». Также конференция MentorPRO IT, где необходимо было, помимо формирования оценки ИТ-специалистов, также дать оценку и их продуктам, которые они представляли на проекте.

Еще могу упомянуть GlobalCIO первую международную встреча «Global CIO: ИТ в эпоху перемен. Взгляд CIO». Обсуждались актуальные проблемы ИТ-индустрии, в разговоре приняли участие спикеры из Казахстана, Узбекистана и Турции. После окончания встречи организаторы предложили написать статью, на что я с радостью согласился и написал «AWS Bedrock: как предварительно обученные модели помогут разработчикам быстрее разрабатывать ИИ-проекты». Если говорить об опыте в США, могу упомянуть TheCIOCircle, сюда пригласили дать интервью и поделиться своим опытом в ИТ наши коллеги из США.

Такая работа меня не отвлекает, а порой и стимулирует для дальнейшего развития и дает заряд для новых проектов. Не менее вдохновляющей можно назвать преподавательскую работу. Всегда приятно осознавать, что накопленные знания и умения могут быть полезны начинающим специалистам. В качестве наставника, мною даже был разработан целый курс для студентов Алмаатинского политехнического колледжа.


Вы разработали образовательный курс, основанный на вашем более чем 25-летнем опыте в сфере разработки. Студентам каких специальностей может пригодиться этот курс для повышения их компетенций?

Я разработал свой курс именно в том направлении, в котором у меня больше всего опыта, в частности в разработке приложений для бизнеса. Он состоял из трех довольно емких месяцев как со стороны разработки, понимания бизнеса, так и развития софтскилов, которые являются немаловажным фактором в работе разработчика. Именно такое внимание к развитию навыков работы и профессионального взаимодействия с другими людьми сделало, на мой взгляд, курс уникальным и эффективным. В результате обучения, окончившие курс студенты получили отличный опыт для дальнейшего совершенствования и самостоятельного развития. Так, один из моих студентов получил офер в крупный холдинг и нанимающие его коллеги из ИТ высоко оценили полученные им знания на курсе. Курс будет полезен студентам, которые планируют зайти в специальность как можно скорее.


Вы вели этот курс перед студентами Алмаатинского политехнического колледжа - одного из самых престижных средних профессиональных учебных заведений города. Не секрет, что уровень преподавания уроков по разработке, которые предоставляются государственной программой обучения в колледже, и специализированные курсы от опытного эксперта серьезно различаются. Получили ли вы обратную связь по результатам этого курса?

Я получил обратную связь от студентов, которые окончили курс. Вот отрывок из одного из благодарственных писем студента: «С первых же занятий я понял, что курс разработан на высшем уровне. Об этом говорили уровень организации курса, его продуманность и манера преподнесения информации, учет как теоретических аспектов, так и практических навыков, необходимых для успешной карьеры в разработке программного обеспечения. (ссылка на пост в Instagram Политехнического колледжа об этом событии).

Вот отрывок из отзыва ректора этого учебного заведения: «Курс включал 90 лекционных часов и 460 часов практических занятий. Отличное качество разработанных учебных материалов, их насыщенность и полнота изложения, исчерпывающая информация способствовали приобретению нашими студентами навыков, необходимых для дальнейшей работы по специальности. Хотелось бы отметить профессионализм, внимательность и доброжелательное отношение к слушателям курса».

 

Опираясь на свой научный опыт, расскажите, кто все же несет ответственность за последствия принимаемых искусственным интеллектом решений в медицине?

На мой взгляд, такой вопрос необходимо рассматривать в двух плоскостях – технической и правовой. Если руководствоваться положениями российского законодательства, то становится понятно – ответственность будет нести учреждение, где этот ИИ внедрен и где технология применяется. Рассматривая техническую сторону вопроса, абстрагируясь от права, я бы говорил об ответственности разработчика, поскольку именно разработчики закладывают основу функционирования ИИ, его обучения и эволюционирования. Так, например, неправильно заданные данные для обучения могут привести к критическим последствиям, поскольку ИИ обучается и эволюционирует на основе ошибок, и такие ошибки будут только расти в геометрической прогрессии с каждым этапом обучения. При этом ошибки в действиях ИИ могут быть незаметны долгое время даже при его практическом применении. Отсюда напрашивается абсолютно логичный вывод: если изначально ошибка допущена разработчиком, а технология с ИИ используется в медицинском учреждении и медицинские работники никак не могут повлиять на ее работу, то как они могут нести ответственность за последствия принимаемых ИИ решений? Вот такая несогласованность правовой и технической составляющей видится для меня основной проблемой внедрения ИИ в медицине.

 

На каких данных вами проводились исследования и обучение искусственных нейронных сетей? Достаточен ли был объем этих данных для получение адекватных результатов системы ИИ? Каким образом эти данные собираются?

Обучающие выборки состояли из данных измерений в сочетании с решениями, которые помогали нейронной сети обобщить всю эту информацию в соответствующую связь вход-выход. В том случае, когда объем данных не позволял получить адекватные результаты системы ИИ, проводилось новое исследование, и так до тех пор, пока не получался нужный результат. В целом это нормальная практика работы с ИИ добавлять или менять наборы данных. Ни одна система в самом начале ее работы не лишена ошибок, ИИ не является исключением. Говоря о сборе данных, необходимо упомянуть, что, если речь идет о генеративном ИИ, надо отметить, что он отличается от обычного искусственного интеллекта как раз возможностью контролировать ошибки. То есть человек, который ИИ “учит”, может вручную вносить различные данные, исправляя те или иные ошибки ИИ, который, в свою очередь, собирает, в том числе, различные аналитические данные.

 

При диагностике по изображениям, скажем, туберкулез легких или рак легкого часто путают с другими заболеваниями. Данные, которые используют для обучения нейронных сетей, должны содержать такие же ошибочные данные. Как вы с этим боретесь?

В данном случае всё просто, при обучении сети используются изображения, которые содержат ошибочные данные. Разрабатывается соответствующий алгоритм поиска ошибок. При этом нейронные сети, в чем их безусловный плюс, точнее, чем человеческий глаз, способны различать ошибки в изображениях, они более чувствительны, а соответственно, и точнее в прогнозах. 

 

Понятно, что эффективность работы нейронной сети зависит от множества факторов, в частности от алгоритмов обучения сети. Будучи опытным специалистом в работе с нейросетями, не могли бы вы рассказать, как эффективность той или иной нейросети зависит от ее параметров?

Здесь больше вопрос выбора нейронной сети для обучения и задач, которые необходимо решить. Так, чем сложнее задача, тем сложнее параметры сети. Например, параметры искусственных нейронных сетей с малым числом нейронов и скрытых слоев используют для простой классификации изображений или распознавания речи. Параметры искусственных нейронных сетей с большим числом нейронов и скрытых слоев используют для сложных задач. Например, в медицине для классификации болезней и отграничения одних болезней от других.

 

Прошу пояснить вашу фразу: «Чтобы сеть могла наиболее точно классифицировать изображения на основе пикселей, каждый последующий слой обучается на ошибках предыдущих слоев».

Речь идет как раз о работе свёрточной нейронной сети со сложными параметрами для правильной идентификации болезней на основе изображений. В свёрточных нейронных сетях происходит обучение не только на основании загруженных данных: сеть учитывает свои прошлые ошибки и в дальнейшем учитывает это при обучении. 

 

Ваша система может стать достаточно серьезным новым инструментом в руках врача, учитывая сравнительно высокую точность прогнозирования системы. Каковы конечные результаты вашего медицинского исследования? Насколько может вырасти количество данных, предоставляемых ИИ?

Сложно судить объективно результаты своего труда. По моему мнению, моя система ИИ диагностирования заболевания легких достаточно точна, чтобы применяться на практике и стать подспорьем современному мировому здравоохранению. На основе собственных исследований и оценках коллег, можно предположить, что к 2025 году на генеративный искусственный интеллект будет приходиться до 10% всех производимых данных по сравнению с менее чем 1% сегодня.

 

Частичным решением проблемы контроля обучения нейронных сетей является обучение сети с «учителем», то есть под контролем человека, который мог видеть ошибки обучения и своевременно их устранять. Опираясь на свой богатый профессиональный опыт, расскажите, как человек обнаруживает такие ошибки?

Такая система есть, однако, по моему экспертному мнению, с позиции развития ИИ уже является устаревшей, поскольку появились свёрточные нейронные сети, способные исправлять ошибки без «учителя». В целом же, суть обучения с «учителем» в том, что данные на вход сети подают, ожидая получить правильный выход, то есть ответ, который даст сеть после обработки внутри своей структуры. Затем получившийся результат сравнивают с эталонным, то есть правильным ответом. Если сеть выдает неверное решение, то необходимо скорректировать весовые коэффициенты связи и запустить процесс заново, тем самым добиваясь снижения процента ошибочных ответов. Обучающие данные вводят в сеть в определенной последовательности. Для каждого ответа происходит расчет ошибки и подстройка весов. Все это повторяется до тех пор, пока неверные ответы по всему объему обучающего материала не примут значение допустимых показателей. В целом такой подход и я, и большинство коллег считает наиболее прогрессивным, так как он позволит быстрее находить и исправлять ошибки нейросети.  

 

Теперь перейдем к другой теме, ИИ в финансах. Разработанная и запущенная вами система для торгового комплекса “Armada” позволила сильно сократить время обработки заявок предприятия, увеличив эффективность работы компании на невероятные 80%, что однозначно доказывает вашу высокую компетенцию и в этом вопросе. Существует ли какая-то принципиальная разница в подходах к работе с ИИ для медицины и в области финансов?

Я бы не говорил о какой-то существенной разнице, подходы к ИИ одни и те же что в медицине, что в финансах: и там, и там в основе обучения – нейронные сети, однако выбор параметров сети лежит исключительно в плоскости решаемой задачи. Например, в медицине больше мы говорим не о прогнозах, а о постановке более точного диагноза, поэтому используем свёрточные сети. В финансах в большей степени нас будет интересовать прогноз, и это снова свёрточные сети. Что же касается успеха Armada, то это, не в последнюю очередь, запущенный мною процесс автоматизации, охватывающий все этапы от приема заявок до окончательных расчетов, сыграл важнейшую роль в этой трансформации.

 

Благодаря вашим разработкам, цифровизация компании NewTelCom привела к росту оборота предприятия с 0 до 7000 активных абонентов.  Возможно ли предсказать такой рост с помощью ИИ? Для чего, по-вашему, могут использоваться прогнозные модели искусственного интеллекта в финансах?

Для прогноза. В целом для прогнозирования различных явлений в финансовой сфере: прогнозирования поведения рынков, прогнозирования цен на ресурсы, акции и так далее. В целом, автоматизация и цифровизация рабочих процессов предоставляет бизнесу много дополнительных возможностей для прогнозирования. Например, благодаря разработанному мной программному обеспечению, телекоммуникационная компания NewTelCom, упомянутая ранее, получила возможность принимать и отслеживать заявки своих клиентов о подключении услуг связи, на основе которых могут точнее прогнозировать многие финансовые и административные показатели. 

  

Как производится очистка используемых для обучения исходных данных? Как часто модели глубокого обучения используются в финансах?

Очистка данных это процесс обработки выборки для интеллектуального анализа информации с помощью алгоритмов машинного обучения. Это этап, на котором выполняется выявление и удаление ошибок и несоответствий в данных с целью улучшения их качества, его также называют data cleaning. Так как сейчас различные роботы-помощники и чат-боты для клиентов банков, страховых, брокерских компаний и иных субъектов, функционирующих на финансовых рынках, являются чем-то обыденным, то можно говорить о популярности моделей, но еще десять лет назад такое взаимодействие участников финансового рынка виделось чем-то невозможным. Поэтому сравнительно недавно, последние 8 лет свидетельствуют о резком росте применения моделей глубокого обучения в финансовой сфере. Эти модели показали свою эффективность в различных областях, таких как прогнозирование цен на акции, анализ рисков, управление портфелем, обнаружение мошенничества как многое другое, о чем компании не готовы разглашать результаты своих исследований. Да и тут важно отметить, что использование глубокого обучения в финансах также сталкивается с некоторыми вызовами. Например, нестабильность финансовых рынков может оказывать влияние на точность прогнозов моделей. Кроме того, объяснимость результатов работы нейронных сетей остается актуальной проблемой, особенно когда решения могут иметь значительное влияние на финансовые решения. В будущем можно ожидать еще более широкое проникновение и развитие моделей глубокого обучения в финансовой сфере. Дальнейшие исследования, как и продвижение в области интерпретируемых моделей и интеграция с экономическими и финансовыми теориями поможет сделать эти инструменты более надежными и применимыми в разнообразных ситуациях на рынке.

 

Почему свёрточные нейронные сети не подходят для прогнозирования в финансовой сфере?

Наверное, было бы неправильно говорить, что не подходят. Правильнее говорить, что подходят при совокупности условий – правильно подобранных данных и функции активации для свёрточных нейронных сетей. Но, опять же, такие решения возможны для простых задач прогнозирования. Для сложных задач прогнозирования в финансовой сфере, на мой взгляд, свёрточные не подходят для прогнозирования. Обусловлено это тем, что для свёрточных нейронных сетей традиционный метод обучения с учетом веса основан на определенном правиле и веса постоянно обновляются при обучении сети до тех пор, пока ожидания не оправдаются. При этом в самом начале обучения собственные начальные параметры сети играют чрезвычайно важную роль в ее обучении. Если начальные параметры заданы неправильно, вполне вероятно, что сеть не сможет конвергировать и конечная производительность сети может не соответствовать заявленным требованиям и, как следствие, прогнозные возможности сети будут минимальны.

Опубликовано 21.10.2023

Похожие статьи