Маска, я тебя знаю

Логотип компании
13.11.2012Автор
Маска, я тебя знаю
На сайте www.biometrics.gov  (официальный ресурс правительства США, посвященный биометрии) указано, что первые опыты по распознаванию лиц относятся к 1960-м годам.

Проверить алгеброй физиономию

На сайте www.biometrics.gov (официальный ресурс правительства США, посвященный биометрии) указано, что первые опыты по распознаванию лиц относятся к 1960-м годам. Поначалу такие системы были полуавтоматическими: оператор указывал на фотографии лица распознаваемого человека точки, где расположены глаза, уши, нос и рот, и ПО рассчитывало расстояния между этими точками, которые потом сравнивались с заранее записанными показателями из базы данных.

В 1970-х годах А. Голдстейн (A. J. Goldstein), Л. Хармон (L. D. Harmon) и А. Леск (A. B. Lesk) использовали 21 параметр (цвет волос, толщину губ и др.), чтобы повысить точность распознавания. Основная проблема заключалась в том, что точки на изображении лиц по-прежнему указывались вручную. Некоторым прорывом стала работа 1988 года, когда М. Кирби (M. Kirby) и Л. Сирович (L. Sirovich) применили методы линейной алгебры к проблеме распознавания лиц, показав, что для описания лица математическими методами достаточно сотни параметров.

В 1991 году М. Турк (M. A. Turk) и А. Пентланд (A. P. Pentland) создали алгоритм Eigenface, в основе которого лежит использование таких инструментов математической статистики, как математическое ожидание и ковариационная матрица. В алгоритме применяются такие понятия линейной алгебры, как собственные значения (eigenvalues) и собственные векторы (eigenvectors). Подробно этот алгоритм рассмотрен в работе «Распознавание изображений. Алгоритм Eigenface» на сайте Хабрахабр.Ру.

Среди математических методов, применяемых при распознавании лиц в настоящее время, сайт www.biometrics.gov выделяет следующие: метод главных компонент, линейный дискриминантный анализ, анализ эластичных деформаций и статистические марковские модели. Многие работы в области распознавания лиц в США финансирует исследовательское подразделение Министерства обороны – DARPA.

Методы распознавания лиц

Специалист компании Yahoo! Inc. Юрий Лифшиц, выпускник СПбГУ, защитивший кандидатскую диссертацию в Математическом институте им. В. А. Стеклова (ныне г-н Лившиц работает в стартап-школе «Графен»), указывал в своих лекциях для студентов «Методы распознавания лиц», что при решении этой задачи возникают две проблемы. Первая состоит в том, что любая картинка представляет собой массив пикселей. В то же время один пиксель картинки ничего не значит (его цвет можно изменить, и никто не заметит разницы). Это означает, что пиксельное представление картинок избыточно и неэкономично и для эффективного распознавания лиц необходимо разработать другой формат представления картинок. Вторая проблема заключается в том, что одно и то же лицо может быть сфотографировано при различных внешних факторах, таких как свет, поза и эмоции. 

{PAID}

Алгоритм распознавания лиц состоит из нескольких этапов: на первом из общего изображения выделяется лицо, затем следует нормализация изображения (например, разрешение приводится к параметрам 100×100, а цвет – к 256 оттенкам серого). Далее выполняется выделение характеристик лица. На последнем этапе распознавания применяется классификатор, который по полученным характеристикам выдает ответ на поставленный вопрос: тот это человек, или не тот.

Фильтры Габора

Одним из математических аппаратов, применяемых для распознавания лиц путем сравнения их с эталоном, являются фильтры Габора. У всех людей отношение расстояния между глазами к высоте носа примерно одинаково. Поэтому целесообразно выделить на лице некоторые контрольные точки, такие как нос, глаза, брови, рот, скулы, щеки, подбородок. После этого для идентификации того или иного человека нужно посчитать значения фильтров Габора в этих контрольных точках и построить граф, который называется «единым портретом».

Юрий Лифшиц рассказывал и о принципиально ином математическом подходе, основанным на идее извлечения не локальных, а глобальных характеристик. Отметив факт, что все картинки имеют размерность 10 000 (100×100), можно сделать предположение, что все портреты располагаются в некоторой плоскости, например 100-мерной. В таком случае лицо можно разложить на две составляющие: 1) проекция на 100-мерную плоскость, 2) расстояние до этой плоскости (шум). Этот подход требует меньшего количества вычислений и, таким образом, менее требователен к вычислительным ресурсам.

Лице-мерие

В 2004 году в полицейском отделении Ньюхэма (один из районов Лондона) была внедрена система распознавания лиц. Как сообщает газета UK Guardian, эта система прославилась выдающейся неэффективностью: за все годы работы она не выдала ни одного правильного результата. Тем не менее активное освещение в СМИ невероятных возможностей нового ПО привело к снижению преступности в районе на 34%, поскольку потенциальные преступники стали бояться системы, которая якобы видит и «узнает» каждого.

Система распознавания лиц в аэропорту Бостона, как сообщает газета USA Today, была закрыта после того, как в течение двух лет не обнаружила ни одного потенциального террориста. Точность системы оказалась весьма невысокой – порядка 61%.

Интересно, что случаи неудач в деле распознавания лиц активно муссируются в прессе. Не для того ли, чтобы граждане не воспринимали подобные системы как угрозу их частной жизни, поскольку есть и примеры весьма эффективных приложений для распознавания лиц, связанных с системами видеонаблюдения. Так, сайт Security Focus указывает, что в настоящее время в практике торговли полным ходом идет внедрение систем, где камера на входе плюс ПО для распознавания лиц на сервере автоматически предупреждают менеджера магазина о том, что в зале появился клиент, пойманный полтора года назад с поличным на краже пакета чипсов. А журнал Forbes опубликовал недавно статью, предупреждающую, что в ближайшем будущем могут иметь место «кражи лиц»: 3D-принтер способен изготовить копию лица человека по его трехмерному изображению. Такая маска может быть намного более эффективной, чем чулок на голове, балаклава или шляпа с большими полями.

Высокую эффективность (более 90%) демонстрируют и системы распознавания лиц по фотографиям в социальных сетях.