Иван Волков: «Искусственный интеллект — это больше, чем просто хайп»

Логотип компании
После ухода ABBYY команда ее бывшего российского подразделения продолжила работать со всеми заказчиками и партнерами под новым именем. А главное — компания Content AI смогла лицензировать технологии, фактическим разработчиком которых она была, и продолжила развивать их в русле импортозамещения.

Сетования об уходе западных компаний и их продуктов с отечественного рынка уже стали дежурной риторикой на различных ИТ-мероприятиях. Список тех, кого мы недосчитались за последние полтора года, внушителен. А «импортозамещение — это боль», как уверяют (чаще в кулуарах) айтишники. Тем интереснее кейс компании Content AI: после ухода ABBYY команда ее бывшего российского подразделения продолжила работать со всеми заказчиками и партнерами под новым именем. А главное — компания смогла лицензировать технологии, фактическим разработчиком которых она была, и продолжила развивать их в русле импортозамещения. Чего удалось добиться такими небанальными решениями, рассказал Иван Волков, технический директор компании.

В решениях Content AI используется искусственный интеллект. Как вам кажется, можно ли считать это главным направлением в глобальном технологическом развитии и основной сферой интересов ИТ-сообщества? И почему?

Тема эта, безусловно, горячая, привлекающая внимание представителей самых разных областей. В первую очередь потому, что искусственный интеллект значительно расширяет возможности машин и, как следствие, позволяет качественно трансформировать многие бизнес-процессы. Сегодня компании пытаются использовать большие лингвистические модели для решения все новых и новых задач. И, повторюсь, искусственный интеллект реально предоставляет новые возможности — это не просто хайп. Накопленный опыт позволил совершить своего рода революцию в этой области. Мы активно следим за происходящим в глобальном ИТ-сообществе и размышляем, как использовать технологические тренды и новые инструменты для развития своих продуктов.

Сейчас некоторые компании сокращают специалистов, делая ставку на искусственный интеллект. Руководство полагает, что разработчика сможет заменить цифровое решение. Тот же Chat GPT умеет писать код. Что вы об этом думаете? Искусственный интеллект действительно стал полноценным соперником человека и вскоре заменит его?

Я думаю, что прямой угрозы для ИТ-специалистов, то есть их работы и рабочих мест, нет. Но изменения, притом значительные, неизбежны. И это дело ближайшего будущего.

Начну издалека. Современная экономика — это экономика сервисов. Когда покупаешь некую вещь, ее себестоимость составляет 10–20% ее цены. А остальное уходит на логистику, маркетинг, сервис. Вот что составляет большую часть добавочной стоимости. И, как мне кажется, в области производства контента и в области разработки спустя некоторое время будет происходить примерно то же. Создать что-то окажется просто и дешево. Это не будет основным фактором, определяющим ценность.

В новых условиях труд программистов станет намного более производительным. Они смогут решать куда более сложные задачи, чем сейчас. Другими словами, небольшая команда будет способна за короткий срок создать, например, свой компилятор или программный пакет. То есть, отвечая на ваш вопрос, программисты не исчезнут, но характер их работы изменится. Кроме того, им придется изменить свои навыки и знания — простое написание кода когда-нибудь станет автоматизированным.

В каком-то смысле это уже происходит. Сервисы вроде GitHub Copilot решают задачи в области интеллектуальной помощи разработчикам. И в некоторых случаях результаты действительно впечатляют — они осуществляют сложные манипуляции с кодом, которые раньше мог делать только опытный разработчик. Но повсеместным применение подобных решений будет, как мне кажется, через 5–10 лет.

За последнее время в каких новых сферах появились прикладные решения с ИИ? И как они себя показали?

Технологии машинного обучения развиваются активнейшим образом, поэтому даже перечисление сфер, в которых они применяются, будет достаточно долгим. Я бы предложил остановиться на том, что происходило за последние год-два. Главным событием за этот период стало появление генеративных нейросетей. Их все обсуждают, они уже сгенерировали невероятное количество контента (изображения, тексты, музыка, видео), заполонившего Интернет.

К слову, замечу: если, образно говоря, покопаться в стартапах на основе машинного обучения, у многих найдешь «под капотом» ChatGPT и Promt Engineering.

Показали себя новые решения, на мой взгляд, наилучшим образом. Благодаря им появились сервисы и проекты, которые еще недавно невозможно было вообразить. ChatGPT реалистично имитирует ответы человека и способен быть гибким в этой области. С изображениями, их созданием и обработкой, искусственный интеллект тоже отлично справляется. Если же сосредоточиться на корпоративной выгоде от применения новых решений, то они могут помочь автоматизировать многие процессы, например работу кол-центров. В нашей компании отдельные элементы рабочих процессов разработки автоматизированы с помощью ChatGPT.

Кстати, почему именно ChatGPT стал столь громким событием не только в индустрии, но и в широком общественном поле?

Причин несколько. Главная из них — поведение ChatGPT очень похоже на человеческое. Его «мысли» неотличимы от человеческих. По его ответам создается ощущение, что запрос им действительно понят, а ответ обдуман. Это качественно отличается от всего, что было прежде.

Также я хотел бы обратить внимание на новое свойство — способность решать разноплановые задачи без переобучения. Это открывает принципиально новые возможности во множестве областей, от копирайтинга до генерации кода.

Если вернуться на 30 лет назад и оценить различные прогнозы, можно ли увидеть там предположения о появлении искусственного интеллекта и сбывшиеся сценарии его развития?

На самом деле тема искусственного интеллекта волнует человека давно. Может быть, даже не 30 лет, а гораздо дольше. За этот период даже появилось выражение «зима искусственного интеллекта». Это о ситуации, когда происходит какой-то локальный прорыв в данной области, но за ним ничего не следует, технология не развивается. Из-за этого у искусственного интеллекта сформировался во многом «хайповый» имидж. Многим стало казаться, что дальше разговоров и обещаний тут дело не пойдет.

Но сейчас многие специалисты сходятся во мнении, что новой «зимы» в ближайшей перспективе ждать не стоит, потому что стала видна реальная перспектива развития. С пресловутым тестом Тьюринга новые решения справляются. Так что скептики в этот раз ошиблись.

Многие прогнозы относительно практического применения искусственного интеллекта сбылись. То, что раньше было в научно-фантастических книгах, стало доступной для многих реальностью.

Расскажите чуть подробнее, как в Content AI используется ChatGPT для решения задач разработки?

Мы экспериментировали с разными задачами. Целью было повышение производительности труда разработчиков. Отзывы смешанные. Например, возможность трансформации одного языка программирования в другой в Refact.ai действительно работает. Но наш проект просто не влезает в контекст, которым может оперировать нейросеть. Поэтому мы не можем применить здесь новое решение, и писать приходится как раньше, вручную. Инструменты применения нейросетей, скажем так, сыроваты, но я уверен, что это преодолимые проблемы. Мы продолжаем работать с этим и рассчитываем получить эффект в ближайшем будущем.

Недавно Content AI объявила о выпуске продукта ContentCapture с новой функциональностью – распознаванием русского рукописного текста. Расскажите об этом подробнее.

ContentCapture – флагманский продукт нашей компании. Это программный комплекс с элементами искусственного интеллекта, который позволяет обрабатывать в едином потоке любые документы — акты и товарные накладные, договоры, отчеты и т.д. Объем корпоративного документооборота может достигать сотен тысяч документов в день. Сразу перед несколькими подразделениями стоит задача их оперативного ввода и обработки – сверки данных в документе с внутренними базами, переноса в соответствующие системы. Делать это вручную зачастую непосильный труд. Наша универсальная платформа как раз позволяет решить эту задачу. Достаточно просто отсканировать бумагу или указать, где находится электронный документ, и ContentCapture самостоятельно определит его тип, распознает все необходимые текстовые и числовые данные, проверит корректность извлеченной информации и отправит в нужную корпоративную систему.

В недавнем релизе нашего продукта появилась важная функция распознавания русского рукописного текста. Прежде ContentCapture могла распознавать печатный и так называемый рукопечатный текст — текст, написанный от руки печатными буквами. Но по-прежнему множество документов хотя бы частично заполняется от руки, курсивом. Это отдельные разделы в документах, удостоверяющих личность, анкеты, заявления, служебные записки. И исчезать они в ближайшем будущем не собираются.

Тесты показали высокую эффективность новой функции. Качество распознавания рукописного текста варьируется в промежутке 85–95% в документах определенного типа: речь идет о паспортах и других документах, удостоверяющих личность, тестовых формах. Но важно отметить, что большое значение имеет почерк. Грубо говоря, если текст можно прочитать, то система его распознает. Но есть, конечно, случаи, когда написанное даже человек не сможет разобрать. Тут технологиям пока тоже трудно справляться.

А слова, в рукописном виде состоящие из множества похожих элементов, например «шиншиллы», ContentCapture хорошо распознает?

Мы обучали систему на огромном количестве документов. В тестовой выборке в том числе были и школьные сочинения, которые разбирались построчно. И именно для этих текстов качество распознавания составляло 95%. Это очень хороший показатель, особенно с учетом того, что почерк у детей бывает очень разный — и по стилю, и по качеству.

Как разрабатывался ContentCapture? И как вы планируете развивать продукт в дальнейшем?

Наша компания является технологическим преемником ABBYY в России. ContentCapture выросла, если можно так сказать, из аналогичного продукта ABBYY — платформы FlexiCapture, которая в свою очередь имеет долгую историю, у нее было 12 версий за более чем 25 лет существования. Это демонстрирует зрелость продукта и широту его возможностей, ведь с каждой новой версией появлялась новая продвинутая функциональность. Но отмечу, что хотя система ContentCapture и немало унаследовала от FlexiCapture, мы привнесли в нее много своего и продолжаем развивать уже по новому сценарию, с акцентом на решение задач российских пользователей. Например, распознавания русского рукописного в продукте ABBYY не было и нет. А для английского языка качество распознавания текста у нашего продукта выше, чем в платформе FlexiCapture.

Сейчас мы работаем над версией ContentCapture, адаптированной к операционным системам на базе Linux. Релиз кросс-платформенного продукта запланирован на осень. Этого у ABBYY не было — все их решения были только под Windows.

Также добавлю, что устанавливать наш продукт можно как непосредственно на машины, так и в корпоративном облаке.

Очевидно, что среди обрабатываемых ContentCapture документов может встречаться и коммерческая тайна, и другая конфиденциальная информация. Как обеспечивается безопасность в этом случае? Можно ли быть уверенным, что подобные данные не попадут ни к кому постороннему?

Да, можно. Для этого есть вариант разворачивания ПО локально, без доступа к Интернету. А внутри комплекса предусмотрены широкие возможности управления правами доступа. То есть утекать данным некуда. И все посторонние лица отсечены.

Для некоторых сценариев необходима дополнительная визуальная проверка корректности данных оператором. Чтобы избежать риска утечки, существуют специальные режимы верификации. Поясню на примере паспорта. У него есть серия и номер. Режим реализован так, что серию видит и подтверждает один оператор, а номер — другой. Таким образом, ни у кого нет полной информации о данном паспорте и соблюдена полная конфиденциальность.

Вы работаете с заказчиками напрямую или через партнеров?

В основном через партнеров. В редких случаях, с особенно крупными заказчиками, мы работаем как вендор, но для поставки или внедрения нашего продукта в корпоративную систему заказчика всегда привлекается партнер. Техническое сопровождение всех клиентов мы осуществляем самостоятельно.

Что планируется реализовывать в ContentCapture в будущем?

У нас несколько основных векторов развития. Первый — движение в сторону отечественных операционных систем. Продукт уже в реестре российского ПО. Мы поддерживаем отечественные операционные системы, но некоторые функции для них пока недоступны. Это планируется исправить в осеннем релизе.

Второй вектор — снижение порога входа. Наш комплекс мощный, он способен решать множество задач, но в некоторых случаях требуется хорошо его знать. В одном из ближайших релизов будет представлена технология, которая позволит вместо ручного описания документа размечать его, указывать, где находятся необходимые данные, а система будет сама учиться их извлекать. Сюда же относится план по упрощению установки и настройки комплекса.

Третий вектор связан с производительностью. ContentCapture способна обрабатывать до миллиона документов в день. Но архитектура такова, что отдельные документы при этом могут обрабатываться относительно долго. Наша цель — улучшить результат.

Наконец, мы работаем над автоматической валидацией документов на основе подписи и печати. Это будет реализовано уже в осеннем релизе.

Реклама ООО "Контент ИИ" erid: LjN8KaKWH

Опубликовано 27.07.2023

Похожие статьи