Обзор решения для интеллектуальной обработки документов
А вы уже ознакомились с возможностями интеллектуального решения DIRECTUM Ario и оценили его применимость к закрытию потребностей вашего предприятия? Если нет, то эта статья для вас. В статье постараемся сопоставить ожидания наших заказчиков от интеллектуальных механизмов и реальность их внедрения, а также возможности DIRECTUM Ario.
Ожидания: Интеллектуальные механизмы полностью заменят секретарей
Интеллектуальные механизмы возьмут на себя все функции по обработке потока документов в организации. Сотрудники больше не будут задействованы в этом процессе.
Реальность
На первом шаге решение Ario освобождает пользователей от рутины при первичной обработке документов: извлечение текстового слоя, определение вида документа, извлечение реквизитов документа и занесение их в карточку документа, отправка документа ответственному лицу для дальнейшей обработки. А также может заносить информацию о новом контрагенте, переносить данные между ИТ-системами и т.д.
В будущем решение облегчит труд пользователей в ходе подготовки проектов резолюций, автоответов, при аннотировании документов, создании кредитного досье или личного дела сотрудника, реализации интеллектуального поиска и т.д.
Использование решения Ario позволяет двигаться в сторону «умной» ECM-системы, максимально исключающей выполнение рутинных операций пользователями.
Согласно исследованию компании Transparency Market Research, офисный работник тратит до 40% своего рабочего времени на рутину. Повторяющиеся операции с документами в ECM-системах отнимают не только время, но и вызывают негатив у исполнителей и ошибки человеческого фактора.
Использование Ario позволяет снизить рутину и высвободить человеческие ресурсы для более сложной интеллектуальной деятельности. Ario обеспечит:
● корректную классификацию не менее 80% поступающих документов по их видам;
● корректное извлечение 70% реквизитов документов в текстовой выборке*.
(*) Без учета рукописного текста.
Сотрудники остаются важным и неотъемлемым звеном, так как необходимо верифицировать результаты, которые автоматически были занесены. Необходимо контролировать качество данных, чтобы система далее обучалась на правильных данных, особенно в нестандартных ситуациях.
Как это работает
Занесение документа в систему
Документы могут поступить на вход решению из различных источников: электронная почта, потоковый сканер, оператор обмена электронными документами, например, Synerdocs.
В случае массового занесения документов возможно:
● разделение документов в потоке без использования страниц разделителей и штрих-кодов;
● определение ведущего документа в потоке (например, отделение письма от приложений);
● занесения всего потока документов как в виде единого документа, так и в виде комплекта связных между собой документов.
Распознавание текста (извлечение текстового слоя)
В результате обработки скан-образа формируется документ в формате PDF с извлеченным текстовым слоем. Далее полученный текст используется для классификации документов и извлечения фактов, а также для полнотекстового поиска с помощью удобных инструментов поиска (ElasticSearch).
Классификация документов
Классификация документов может осуществляться в различных разрезах: по виду документа, источнику поступления, категории документа, журналу регистрации, месту регистрации и т.д. Классификация происходит на основе результатов машинного обучения на данных заказчика.
Кроме того, Ario теперь анализирует файл, который поступил на вход, и находит первые страницы, определяя таким образом, что файл состоит из нескольких документов и заносит комплект документов, например, договор и приложение или счет-фактура и акт.
Извлечение реквизитов документов (фактов)
Решение поддерживает извлечение определенного набора реквизитов для следующих видов документов:
● финансовые документы: товарно-транспортная накладная, счет-фактура, корректировочный счет-фактура, универсальный передаточный документ, универсальный корректировочный документ, счет на оплату, акт выполненных работ;
● договорные документы: договор, дополнительное соглашение;
● входящее письмо;
● паспорт гражданина РФ;
● свидетельство о постановке на налоговый учет.
В системе настроен ряд правил для извлечения фактов.
Например, у писем извлекается корреспондент, адресат, тема письма и гриф доступа. Из паспорта — серия, номер и дата выдачи документа, а также ФИО и дата рождения гражданина. Из свидетельства — наименование организации/ФИО физического лица, ИНН, ОГРН и КПП организации. Для заказчика может быть разработана поддержка извлечения фактов из специфических видов документов.
Решение не зависит от формы обрабатываемого документа и может успешно применяться на любых видах документов, в том числе неструктурированных.
Извлеченные реквизиты заносятся в карточку документа.
Решение встроено в систему DIRECTUM, что позволяет работать в едином интерфейсе ECM-системы, сопоставлять распознанные реквизиты с имеющимися в системе справочными данными. Для специалиста, который проводит верификацию, поля для удобства подсвечены.
Отправка документов в обработку
Информация, получаемая по итогам обработки документов с помощью решения, используется в прикладной логике системы DIRECTUM в соответствии с потребностями заказчика. Например, документ может быть вложен в задачу и отправлен на дальнейшее согласование ответственному сотруднику. Может быть реализован процесс потоковой обработки документов или миграции исторических данных.
Процесс потоковой обработки документов:
1. Документы массово заносятся в систему из электронной почты и с потокового сканера.
2. Производится классификация документов по видам и извлечение их реквизитов.
3. Реквизиты документа заносятся в его карточку.
4. Документ регистрируется в системе и отправляется на обработку ответственному сотруднику.
Миграция исторических данных
1. Скан-образы документов заносятся в систему из текущего электронного архива.
2. Производится классификация документов по видам, извлечение текстового слоя и реквизитов документов.
3. Документ помещается в оперативный или долговременный архив организации.
Ожидания: Внедрение слишком сложно
Внедрение интеллектуальных механизмом на предприятии – это довольно сложный и трудоемкий процесс.
Реальность
Для эффективного внедрения Ario достаточно провести комплекс следующих мероприятий:
1. Исследование и анализ бизнес-процессов заказчика.
Включает в себя анализ видов обрабатываемых документов, определение перечня извлекаемых реквизитов, изучение бизнес-процесса, в который встраивается решение.
1. Проектирование и адаптация системы DIRECTUM.
Включает в себя адаптацию сценариев импорта, типовых маршрутов обработки документов.
2. Обучение Ario для создания модели классификации по видам документов.
3. Проведение тестовой эксплуатации.
4. Проведение опытно-промышленной эксплуатации.
Например, для входящих писем средняя продолжительность проекта внедрения силами вендора составляет 2 месяца.
Работы по внедрению решения могут осуществляться вендором, партнерами и даже самим заказчиком.
Ожидания: Внедрение окупится на любом предприятии
Достаточно установить решение, обучить его немного, запускать в промышленную эксплуатацию и внедрение интеллектуальных механизмов окупится моментально на любом предприятии.
Реальность
Рекомендуется внедрять решение на больших объемах обрабатываемых документов, где трудоемкость рутинных операций сопоставима с затратами на автоматизацию.
За помощью в расчете эффективности внедрения Ario на вашем предприятии обращайтесь к вендору или партнерам.
Для этого достаточно предоставить следующую информацию:
1. Виды и количество документов в месяц, которые планируется обрабатывать решением.
2. Задачи автоматизации: распознавание текста, классификация документов, извлечение реквизитов.
3. Источники занесения документов в систему: сканер, электронная почта, системы обмена. Количество точек занесения.
4. Дальнейшие действия в системе по итогам обработки документов: регистрация документа, отправка на согласование и т.д.
Надеемся, реальность вас не разочаровала, но приблизила к пониманию, как и для чего можно начать использовать действительно современные интеллектуальные механизмы вместе с DIRECTUM Ario.