OCR в бизнесе: инструменты для распознавания документов

Логотип компании
OCR в бизнесе: инструменты для распознавания документов
Расскажем о линейке приложений от российской компании Smart Engines, которая известна своими научными разработками и солидным числом докторов и кандидатов наук среди сотрудников.

Технологии оптического распознавания символов (Optical Character Recognition, OCR) появились не один десяток лет назад. Когда-то в качестве источника образа документа использовались сканеры и МФУ, затем цифровые фотокамеры. Сегодня встроенные камеры мобильных устройств (смартфонов и планшетов) позволяют получить великолепное разрешение при съемке документа, а процессор и наличие ОЗУ позволяют распознать многостраничный документ практически за считанные секунды – так же быстро, как это происходит на настольных ПК.

Иными словами, мобильные устройства уже давно готовы к полноценному использованию для распознавания и оцифровки документов. Дело за технологиями распознавания, а именно за соответствующим программным обеспечением – оно также широко присутствует на рынке. Чаще всего в подобных продуктах заинтересованы бизнес и госструктуры: и тем и другим приходится тратить немало времени на ввод и оцифровку большого объема типовых структурированных документов.

Подсчитано, что при ручном вводе ошибки могут составлять до 30%, что совершенно недопустимо. Использование классической OCR для настольных ПК способствует снижению количества ошибок и ускоряет работу, но самым оптимальным вариантом может стать применение специальной системы для распознавания структурированных документов, а в качестве терминала – мобильного устройства. В таком продукте уже «зашиты» шаблоны для огромного количества документов, поэтому на выходе формируется не просто распознанный текст, а полностью отформатированный документ согласно государственному и другим стандартам.

Для российских заказчиков из сферы бизнеса крайне желательно, а для госструктур обязательно, чтобы такая система была зарегистрирована в реестре российского ПО Минцифры. Мы бы хотели рассказать о линейке приложений от российской компании Smart Engines, которая известна своими научными разработками и солидным числом докторов и кандидатов наук среди сотрудников.

Платформа

В основе всех OCR-приложений этой компании, среди которых как мобильные продукты, так и программы для настольных ПК, серверов и веб-приложения, лежит созданная и запатентованная специалистами Smart Engines технология распознавания GreenOCR, а также SDK с документированным API распознавания, бесшовной интеграцией, необходимыми примерами и материалами для встраивания. Встроить SDK можно в приложения для настольных ПК и серверов, для iOS, Google Android и российской мобильной операционной системы “Аврора” при помощи интерфейсов на C++, Objective C, Swift, Java, а также при помощи оберток для React Native и Flutter. Web SDK позволяет реализовать распознавание и проверку документов в любых Web приложениях. Это стало возможным за счет использования технологии WebAssembly (Wasm). Банки, микрофинансовые организации, страховые компании, транспортные перевозчики, государственные структуры, медицинские учреждения, одним словом все организации, которым необходимо работать с документами граждан, оцифровывать их, проверять на подлинность и сохранять для дальнейшей работы, могут воспользоваться этими продуктами, встроить их в свои приложения или программно-аппаратные комплексы. Весь процесс распознавания происходит исключительно на локальном устройстве пользователя. Никакие удаленные или облачные ресурсы при этом не задействуются, что дополнительно гарантирует безопасность чувствительных данных и их сохранность от попадания в чужие руки.

Бесплатное знакомство

Для того, чтобы оценить, как работают мобильные OCR-приложения от Smart Engines, можно бесплатно скачать демо-приложение для мобильных устройств. Это можно сделать в одном из популярных магазинов: для владельцев iPhone и iPad это однозначно AppStore, а для пользователей Android-устройств – Google Play либо российский RuStore. Первое, что попросит демо-программа сразу же после установки, – доступ к камере устройства, поскольку без нее получить образ документа не получится. Приложение содержит три набора функций: Smart ID Engine, Code Engine и Smart Document Engine. На самом деле это три самостоятельных приложения, которые размещены в Реестре отечественного ПО Минцифры. Разработчики позиционируют их как три самостоятельных программных продукта – именно в таком статусе они размещены в реестре отечественного ПО Минцифры.

Smart ID Engine

Приложение Smart ID Engine предназначено для распознавания документов гражданина. Для начала работы в Smart ID Engine нужно выбрать тип документа, который вы хотите обработать. Предлагается несколько преднастроенных типов документов для России, СНГ, США и Европы: как правило, это паспорт (ID Card) или водительские права. Доступны также варианты «любой документ», в частности «любой паспорт». Если нужно распознать документ конкретного государства, его можно выбрать из списка.

Помимо распознавания документов, Smart ID Engine умеет сравнивать два фото человека, чтобы определить, одна и та же персона запечатлена на них или разные.

После выбора шаблона распознавания можно приступить к сканированию документа. Необязательно класть его на ровную поверхность, можно просто держать документ в руках, не закрывая пальцами никаких цифр, букв и изображений. Далее программа сама распознает все информационные блоки и в течение нескольких секунд выдаст результат. Помимо описанного, можно использовать и заранее отсканированный или сфотографированный образ документа.

OCR в бизнесе: инструменты для распознавания документов. Рис. 1

Распознавание паспорта РФ с помощью Smart ID Engine на смартфоне

Особое внимание разработчики уделяют качеству распознавания российских документов: в новой версии Smart ID Engine искусственный интеллект выявляет 36 признаков подделки паспорта РФ. Пользователям доступны проверка следов редактирования изображений, выявление copy-paste и проверка голограмм. Система проводит автоматическую верификацию шрифтов, которыми выполнен документ, проверяются защитные элементы паспорта РФ, включая машиночитаемые зоны MRZ, а также действительность документа на данный момент.


Распознавание ID-карты Марокко на арабском языке с помощью Smart ID Engine

Результат сканирования можно увидеть сразу же на экране. Сохранить его в демо-программе невозможно. Разве что сделать скриншот, но это не очень удобно, особенно когда речь идет о массовом вводе документов. Как нам объяснил Владимир Арлазаров, кандидат технических наук, генеральный директор компании Smart Engines, это сделано в целях безопасности, поскольку документ содержит персональные данные, а их сохранность строго защищена законодательством во многих странах. Пользователь может забыть, куда он сохранил свой документ, а это чревато неприятными последствиями.

Smart Document Engine

Если приложение Smart ID Engine ориентировано на проверку документов гражданина, то то область использования Smart Document Engine значительно шире. Это любые документы, которые используют компании в бухгалтерии и в целом в бизнесе. Далеко не все клиенты полностью перешли на электронный документооборот – накладные, акты, счета-фактуры и другие виды документов требуют оцифровки и внесения в информационные системы. Smart Document Engine поддерживает документы из России, Белоруссии, Армении, а также из США.


Smart Document Engine распознает универсальный передаточный документ (УПД) на смартфоне

Помимо распознавания, в программе имеются функции обрезки и продвинутой обрезки. Вы можете держать документ в руках, на весу, на фоне других объектов, но Smart Document Engine аккуратно обрежет все лишнее – и в результате вы получите только образ документа и ничего более.

Конечно, в Smart Document Engine есть опция загрузки любого документа, но если его тип не поддерживается, пользователь получит сообщение, что документ не найден. Поэтому лучше заранее ознакомиться с поддерживаемыми типами файлов. Результат распознавания также отразится на экране в демо-программе, но без возможности сохранения в файл.

Smart Code Engine

Это приложение поможет распознать банковские карты, телефонные номера, MRZ (машиночитаемые зоны) на паспортах и других документах, баркоды (по отдельности и несколько сразу). Здесь уже не нужно указывать страну, достаточно выбрать тип данных и поднести камеру либо выбрать ранее сделанную фотографию.

OCR в бизнесе: инструменты для распознавания документов. Рис. 4

Smart Code Engine распознает номер телефона, написанный от руки

Smart Code Engine справляется со своей задачей неплохо. Например, при сканировании банковской карты сразу распознала на ней номер, дату, имя клиента и даже показала фотографию самой карты. И при попытке обработать номер телефона, напечатанный на документе, тоже распознала его и показала фото. Распознавание баркодов в результате выдает цифровое значение каждого кода, а MRZ демонстрирует четко структурированную информацию на основе машиночитаемых данных, а также фото человека на паспорте.

OCR в бизнесе: инструменты для распознавания документов. Рис. 5

Smart Code Engine сканирует QR-код

*          *          *

Как видим, область практического применения продуктов компании Smart Engines очень широка, особенно в нынешнее непростое время, когда меры безопасности повсеместно усиливаются. Для российских заказчиков дополнительно отметим, что программы Smart Engines подходят для задач импортозамещения.

Реклама Smart Engines erid: LjN8KTdhX

Опубликовано 26.05.2023

Похожие статьи