ABBYY FineReader Engine помогает выделять текст из видео

25.04.2012

Технология распознавания ABBYY легла в основу разработанного ЗАО «НТЦ Передовые Системы» модуля для извлечения текста из видеоизображений

Компания ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, сообщает о внедрении инструментария разработчика ABBYY FineReader Engine в аппаратно-программный комплекс приема и обработки телевизионных видеосигналов, телетекста и интернета АСПАТ, созданного компанией ЗАО «НТЦ Передовые Системы».<br />
<br />
Система АСПАТ ориентирована на решение информационно-аналитических задач и предназначена для контроля, накопления и анализа новостной информации в ситуационных центрах, пресс-службах, аналитических отделах государственных и коммерческих организаций. Современные телевещатели обладают оперативными средствами получения и трансляции новостей. АСПАТ позволяет записывать в различных режимах до 20 каналов одновременно, что составляет около 15000 часов исходного видео в месяц. Ручной просмотр и анализ такого объема видеоинформации для поиска необходимого контента – кропотливый и длительный процесс, поэтому работающий с видеоизображениями аналитик не может оперативно и эффективно искать интересующую его информацию. Так перед компанией встала задача автоматизировать извлечение данных из видеопотока – распознавать образы, речь, лица, текст, чтобы таким образом облегчить и расширить возможности поиска необходимых данных. Руководство компании ЗАО «НТЦ Передовые Системы» приняло решение разработать функциональный модуль для выделения любой текстовой информации в кадре с бегущих строк, титров и подписей, используя ядро распознавания ABBYY. Выбор технологии ABBYY определили многие параметры, но, в первую очередь, высокий уровень точности распознавания исходного видеоматериала (что особенно актуально, учитывая, что сам видеокадр обладает достаточно низким качеством). <br />
<br />
Также положительную роль сыграли такие возможности инструментария для разработчиков ABBYY FineReader Engine, как доступность информации о месторасположении распознанных текстовых данных в кадре, о степени уверенности распознавания текста, хорошо продуманный и простой в использовании API, подробная и понятная документация, стабильность функционирования, а также способность работать в ОС Linux. В ходе проекта был создан функциональный модуль АСПАТ-Титр, который выделяет кадры из видеопотока, производит их предварительную обработку, запускает процесс распознавания для извлечения любой текстовой информации с кадра и осуществляет склейку извлеченных текстовых данных бегущей строки в единую логически законченную фразу. В дальнейшем вся текстовая информация индексируется, автоматически привязывается к рубрикам и становится доступной для поиска в системе АСПАТ. Программный модуль АСПАТ-Титр стал составной частью системы АСПАТ и успешно прошёл тестовую эксплуатацию. На текущий момент средняя скорость обработки на одном процессорном ядре составляет 2 реальных масштаба времени, то есть около 250 часов видеофрагментов в сутки. «С применением ABBYY FineReader Engine наш продукт АСПАТ приобрёл новое качество, а поиск нужной информации значительно упростился. Достигнут хороший уровень программной реализации модуля выделения текста АСПАТ-Титр. В наших дальнейших планах – доработка функциональности решения для выделения областей в кадре и автоматическое определение языка канала», – комментирует Михаил Каймин, руководитель проекта в компании ЗАО «НТЦ Передовые Системы».