ABBYY добавляет интеллекта
В рамках ABBYY Data Capture Forum 2015 компания ABBYY представила три новых решения на базе своей технологии понимания и анализа текстов ABBYY Compreno.
Директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин поделился результатами своего подразделения в минувшем году. Рост корпоративных продаж увеличился на 19% в рублевом исчислении. По данным IDC, компания лидирует на российском рынке потокового ввода данных с долей 60%. В частности, в банковском секторе 80 из ТОП-100 российских банков внедряют технологии ABBYY. Решения компании активно внедряются на предприятиях энергетики, нефтегазового, телекоммуникационного и других секторов рынка. По оценке ABBYY, потоковый ввод есть смысл использовать, если в организации имеется хотя бы один из следующих признаков: поток документации составляет 5000 и более документов в месяц; не менее 3 сотрудников заняты ручным вводом данных в ИС; у организации 50 и более контрагентов; планируется создание общего центра обслуживания или внедрение СЭД; можно выделить не менее 20 типов используемых документов.
Проведенный компанией анализ выполненных проектов показал, что внедрение решений ABBYY окупается в срок от 3 месяцев до одного года, при этом скорость ввода данных увеличивается в 3-10 раз, вдвое сокращаются затраты на обработку данных, в 3-10 раз сокращается количество ошибок ввода.
По оценкам независимых экспертов, рынок потокового ввода документов стабильно растет приблизительно на 7,5% в год, и эта тенденция сохранится в этом году. К 2018 году этот сектор мирового рынка превысит $4 млрд. Все это позволяет компании рассчитывать на стабильный рост и вести разработки новых направлений интеллектуальной обработки информации. Об одном из таких направлений - технологии ABBYY Compreno, которую компания развивала в течение 20 лет, вложив в нее более $80 млн, и теперь выводит на рынок, рассказал старший вице-президент и директор департамента ABBYY Compreno Максим Михайлов.
По его словам, ABBYY Compreno - это технология понимания и анализа текстов на естественном языке (пока на русском или английском). Рассказывая об ее отличительных особенностях, Максим Михайлов привел несколько примеров возможностей, которые она открывает: Compreno, в частности, позволяет на основе анализа контекста определять значение многозначных слов, умеет восстанавливать пропущенные слова и «понимает», к какому из ранее упомянутых в тексте существительных относится заменяющее его местоимение. Это наиболее простые для восприятия возможностей технологии, на самом деле ее функциональность гораздо шире. Compreno, например, может определять связи между упомянутыми в тексте объектами, выявлять ключевые факты, переводить неструктурированные документы организации в структурированную форму и снабжать их тегами.
Применяя эту технологию, кредитная организация на основе анализа неструктурированных документов может быстро получить сведения о потенциальном заемщике и оценить риски, связанные с предоставлением ему кредита. Разработчики крупных проектов могут уже на ранней стадии проектирования провести сопоставительный анализ информации в системе САПР и проектной документации на предмет обнаружения несоответствий и таким образом избежать проблем на более поздних этапах проектирования. Используя Compreno для поиска по текстовым документам, можно автоматически включить в результаты только релевантную информацию, произвести ее осмысленное ранжирование и фильтрацию по заданным признакам. Эта технология может применяться и для сортировки входящей информации с автоматическим направлением документов соответствующим специалистам.
Сегодня компания предлагает на базе ABBYY Compreno три решения для разработчиков: ABBYY InfoExtractor SDK, ABBYY Smart Classifier SDK и ABBYY Intelligent Search SDK. Уже начаты пилотные проекты в Государственной Думе, «КЭС-Холдинге» и в нескольких крупных компаниях.
Потенциальные возможности развития интеллектуальной технологии Compreno очень велики - к примеру, она позволит резко повысить качество машинного перевода текстов. Так что в недалеком будущем можно ждать интересных новостей от ABBYY.Смотреть все статьи по теме "Большие данные (Big data)"