Голосовая биометрия в сфере VoIP

Если отпечатки пальцев, параметры глаз и вен на руках можно смело отнести к физическим характеристикам, то голос человека – спорный момент.

Осознаете ли вы свою уникальность, перелистывая страницы этого журнала? Уверен, что да. Папиллярный рисунок пальцев, вены на руках, сетчатка или радужная оболочка глаза, голос и даже походка – все эти черты уникальны для каждого человека и называются биометрическими характеристиками. Обобщая, биометрическая характеристика – это любой параметр живого организма, который может быть представлен в абсолютном значении, то есть мы можем его оценить и измерить, а значит – управлять и понимать.

Виды биометрии

В целом биометрические данные можно разделить на два типа – физиологические и поведенческие. Если отпечатки пальцев, параметры глаз и вен на руках можно смело отнести к физическим характеристикам, то голос человека – спорный момент. С одной стороны, наш голос формируется под воздействием физиологических особенностей, связанных с колебанием голосовых связок и их формы, а с другой стороны – на него влияют и поведенческие факторы, в частности эмоциональное состояние (например, уверенность в себе), а также окружение. Именно поэтому корректнее всего отнести голос сразу к двум типам – физике нашего тела и поведению.

Голосовая биометрия в сфере VoIP. Рис. 1

Задачи биометрических систем в контексте определения голоса

Любая биометрическая система решает две задачи: идентификации и верификации. Условно говоря, процесс идентификации заключается в ответе на вопрос «кто звонит?». В контексте голосовой биометрии в телефонии мы сопоставляем голос звонящего с множеством образцов, а на выходе голосовая система дает ответ: «С уверенностью в 98,3% могу сказать, что это Иван Иванов».

Верификация же отвечает на вопрос «а точно ли звонящий, который представился Иваном Ивановым, есть Иван Иванов?» Голос звонящего сопоставляется в точности с одним шаблоном, который хранится в базе, затем система на выходе дает характеристику вероятности того, что это именно тот человек. Например, вероятность совпадения 91%, а далее вы сами решаете, насколько этот параметр достаточен для вас.

Голосовая биометрия в сфере VoIP. Рис. 2

Начало работы с голосовой биометрией

Любой человек, желающий звонить в наш офис или контактный центр, должен зарегистрироваться в системе. Процедура такая: абонент звонит в центр обработки вызовов, где ему предлагают зарегистрироваться в системе – то есть оставить свой голосовой слепок, или, как он еще называется, шаблон.

Текстозависимость

Голосовые биометрические системы также можно разделить на два типа: текстонезависимые и текстозависимые. В первом случае оператор контактного центра ведет естественную беседу с абонентом, а система на лету сопоставляет его речь и шаблон. Как правило, этот тип биометрии требует больше всего времени – до 10 секунд.

В свою очередь текстозависимые системы делятся на два подвида: а) со статической и б) с динамической парольной фразой. Первые подразумевают, что абонент на этапе регистрации произносит некое слово (это может быть девичья фамилия матери, кличка питомца и т. д.), по которому он и будет верифицирован. То есть каждый раз при звонке потребуется называть это слово (нечто похожее происходит в банке). Но преимущества очевидны: в данном кейсе мы экономим ресурс оператора.

Динамическая же парольная фраза подразумевает, что звонящий на этапе верификации будет «проброшен» на специальное голосовое меню, где ему придется произносить фразы вслед за системой. Например, некий случайный набор цифр – и вуаля, верификация прошла.

Что под капотом?

Итак, предлагаю разобраться, как работают алгоритмы верификации и идентификации в голосовых биометрических системах. Отмечу сразу: «мозг» подобных механизмов анализирует до 80 параметров голоса, поэтому выделю основные и наиболее интересные среди них.

Голосовая биометрия в сфере VoIP. Рис. 3

Основной тон

А именно базовая частота основного тона (ЧОТ), то есть самый низкий тон, свойственный голосу конкретного человека. Изменение ЧОТ отражает эмоциональное возбуждение человека: так, у взрослого мужчины (нижний тон натурального звукоряда) он колеблется в диапазоне 85–155 Гц, у взрослой женщины – от 165 до 255 Гц, а диапазон разговорного детского голоса – от 170 до 600 Гц.

Кстати говоря, в социальной плоскости исследования показывают, что чем выше ЧОТ во время обычной беседы супругов, тем больше вероятность развода.

Как вы уже могли понять, в биометрических механизмах есть свои особенности: зачастую на основной тон человека накладывают большой отпечаток его эмоциональное состояние, реверберации, а также шумы в канале передачи и другие факторы.

Форманты

Сначала поговорим, что это такое. Форманты формируют специфический, уникальный тембр голоса и появляются под влиянием биологических резонаторов (носовые ходы, гайморовы и лобные пазухи, легкие, бронхи и трахея), то есть совпадений колебаний собственного голоса и частот внешнего воздействия. Метод носит название спектрально-формантного анализа. Чувствуете, как начинает раскрываться сам по себе термин биометрия? Условно говоря, форманты – области спектра звука, где концентрация энергии максимальна.

Гаусс

На самом деле в нашей повседневной жизни куда ни плюнь, везде гауссово распределение. Более того, даже сам плевок будет распределен по Гауссу:) В контексте голосовой биометрии мы можем формировать гладкие аппроксимации экспериментальных распределений компонент акустического пространства и определять, сопоставим ли голос звонящего шаблону (экземпляру, который мы храним у себя) в нужных точках.

Атаки

Любая система имеет уязвимости. И первое, что приходит в голову, если задуматься о брешах голосовой биометрии: что случится, если записать аудио, в котором говорит жертва? Например, у нее можно обманным путем извлечь парольную фразу. Подобному виду уязвимостей подвержены только системы со статической парольной фразой. И те, кто считает данный вид атак опасным, абсолютно правы.

Запись звука (заранее записанный файл)

Здесь в первую очередь многое зависит от качества записывающего устройства. Большинство систем умеют отличать воспроизведенный микрофоном звук от реальной речи по акустическим характеристикам. А во-вторых, любая голосовая биометрическая система со статической парольной фразой запросит повторить ее несколько раз, и, когда в первой и второй попытке полученный от диктора шаблон совпадет с вероятностью выше определенного процента, система «забанит» злоумышленника либо отправит на дополнительную проверку оператором.

Синтез речи

Синтезированная речь, то есть некий механизм TTS (Text To Speech), может быть использована как в текстозависимых, так и текстонезависимых системах. Этот вид атак безусловно опасен: параметр FAR (False Acceptance Rate) доходит в нем до 80%.

Есть такая штука, как марковский процесс, описывающий последовательность событий, в которой вероятность каждого следующего события, зависит от предыдущего. Базируется он на максимуме вероятности, то есть в случае цепочки событий (слогов или букв в слове) возможно породить последовательность речевых звуков с характеристиками, которые были бы у реально звонящего, чью речь мы проанализировали.

Основным методом борьбы с такого рода злоумышленниками служит анализ волатильности, то есть изменчивости речи. Кроме того, различия между естественной и синтезированной речью выявляются на высоких частотах: естественная проявляет более высокую дисперсию (то есть разброс значений параметров).

Конвертация голоса

Еще один метод атак: злоумышленник говорит с системой через некий преобразователь, обученный конвертировать речь согласно требуемым параметрам. Основным заградительным барьером здесь выступает артикуляция – совокупность работы отдельных органов, участвующих в формировании голоса. Например, такой биометрический компонент, как зубы, имеет уникальные характеристики, и в совокупности с рисунком реверберации, который они вносят в речь, данный метод атак неэффективен. Вдобавок, чтобы обмануть систему, злоумышленнику требуется множество попыток, но мы же помним, что система забанит его уже после первых трех:)

Вендоры

Среди энтерпрайз-решений можно выделить продукты компаний Nice, Nuance и российской ЦРТ. Помимо прочего, попробовать биометрию можно и на халяву. Например, VoiceIt, облачная платформа для голосовой биометрии речи, позволяет делать до 1000 запросов к API бесплатно (за 30 дней). Ребята имеют готовые библиотеки под C++, node.js, питон, php, ruby и многие другие.

Журнал IT Expert [№ 11/2018] Подписка на журналы

Опубликовано 14.11.2018

Предыдущая
Смартфон Xiaomi Mi 8S получит сенсор камеры Sony IMX586

Следующая
Apple разрабатывает большие наушники для меломанов

Новостная лента

Главное за неделю

Нажимая на кнопку, я принимаю условия соглашения.

Соглашение об использовании сайта

Внимательно прочитайте настоящее Соглашение, прежде чем начать пользоваться Сайтом. Вы обязаны соблюдать условия настоящего Соглашения, заходя на Сайт и используя сервисы, предлагаемые на Сайте. В случае, если Вы не согласны с условиями Соглашения, Вы не можете пользоваться Сайтом или использовать любые сервисы, предлагаемые на Сайте, а также посещать страницы, размещенные в доменной зоне Сайта. Начало использования Сайта означает надлежащее заключение настоящего Соглашения и Ваше полное согласие со всеми его условиями.

1. Термины и определения

1.1. Компания - Общество с ограниченной ответственностью «ИТ Медиа» (ООО «ИТ Медиа»).

1.2. Пользователь - лицо, получающее доступ к сервисам и информации, размещенным на Сайте.

1.3. Сайт – веб-сайт Компании, размещенный в сети Интернет по адресу https://www.it-world.ru.

1.4. Соглашение - настоящее Соглашение между Пользователем и Компанией, устанавливающее правила использования Сайта, включая графические изображения, элементы дизайна и средства индивидуализации, текстовую информацию и документацию, программы для ЭВМ и файлы для скачивания, любые иные произведения, объекты и материалы Сайта, а также условия и правила размещения Пользователем информации и материалов в соответствующих открытых разделах Сайта.

2. Общие положения и условия

2.1. Любые материалы, файлы и сервисы, содержащиеся на Сайте, не могут быть воспроизведены в какой-либо форме, каким-либо способом, полностью или частично без предварительного письменного разрешения Компании, за исключением случаев, указанных в настоящем Соглашении. При воспроизведении Пользователем материалов Сайта ссылка на Сайт обязательна, при этом текст указанной ссылки не должен содержать ложную, вводящую в заблуждение, уничижительную или оскорбительную информацию. Перевод, переработка (модификация), любое изменение материалов Сайта, а также любые иные действия, в том числе удаление, изменение малозаметной информации и сведений об авторских правах и правообладателях, не допускается.

2.2. Действующая редакция настоящего Соглашения размещена в сети Интернет на Сайте по адресу: https://www.it-world.ru/about/agreement.php. Компания вправе в любое время в одностороннем порядке изменять условия настоящего Соглашения. Такие изменения вступают в силу по истечении 2 (двух) дней с момента размещения новой версии Соглашения в сети Интернет на Сайте. При несогласии Пользователя с внесенными изменениями он обязан удалить все имеющиеся у него материалы Сайта, после чего прекратить использование материалов и сервисов Сайта. Ваше регулярное посещение данного Сайта считается вашим убедительным принятием измененного соглашения, поэтому Вы обязаны регулярно просматривать настоящее Соглашение и дополнительные условия или уведомления, размещенные на Сайте.

3. Обязательства Пользователя

3.1. Пользователь обязуется не предпринимать действий, которые могут рассматриваться как нарушающие российское законодательство или нормы международного права, в том числе в сфере интеллектуальной собственности, авторских и/или смежных правах, а также любых действий, которые приводят или могут привести к нарушению нормальной работы Сайта и сервисов Сайта.

3.2. Любые средства индивидуализации, в том числе товарные знаки и знаки обслуживания, а равно логотипы и эмблемы, содержащиеся на страницах Сайта, являются интеллектуальной собственностью их правообладателей. Пользователю Сайта запрещено воспроизводить или иным способом использовать указанные средства индивидуализации и/или их элементы без предварительного письменного разрешения соответствующих правообладателей.

3.3. Компания стремится обеспечить, однако не контролирует и не гарантирует конфиденциальность и охрану любой информации, размещенной на Сайте или полученной с Сайта. Компания принимает разумные меры в целях недопущения несанкционированного разглашения размещенной Пользователем на Сайте информации третьим лицам, однако не несет ответственность в случае, если такое разглашение было допущено. В этой связи, передача информации на Сайт означает согласие Пользователя на любое воспроизведение, распространение, раскрытие и иное использование такой информации. Размещая информацию и материалы, включая, фотографии и изображения, Пользователь также гарантирует, что обладает всеми правами и полномочиями, необходимыми для этого, с учетом условий настоящего Соглашения и что такое размещение не нарушает охраняемые законом права и интересы третьих лиц, международные договоры и действующее законодательство Российской Федерации.

3.4. Пользователь самостоятельно несет ответственность за любую информацию и материалы, размещенные им на Сайте. Компания не инициирует размещение указанной информации, не выбирает получателей информации, не влияет на содержание и целостность размещаемой информации, а также в момент размещения Пользователем информации на Сайте не знает и не может знать, нарушает ли такое размещение действующее законодательство Российской Федерации, однако Компания вправе отслеживать, просматривать и/или удалять любую информацию и материалы, размещенные Пользователем на Сайте. При размещении любой информации и материалов Пользователь не становится соавтором Сайта и отказывается от каких-либо претензий на такое авторство в будущем. Компания не выплачивает Пользователю авторского или любого иного вознаграждения, как в период, так и по истечении срока действия настоящего Соглашения.

3.5. В случае предъявления третьими лицами претензий Компании, связанных с нарушением Пользователем условий настоящего Соглашения, а равно с размещенной Пользователем информацией на Сайте, указанный Пользователь обязуется самостоятельно урегулировать такие претензии, а также возместить Компании все понесенные убытки и потери, включая возмещение штрафов, судебных расходов, издержек и компенсаций.

3.6. Компания не несет ответственности за посещение Пользователем, а также любое использование им внешних ресурсов (сайтов третьих лиц), ссылки на которые могут содержаться на Сайте. Компания не несет ответственности за точность, надежность, достоверность и безопасность любой информации, материалов, рекомендаций и сервисов, размещенных на внешних ресурсах. Использование внешних ресурсов осуществляется Пользователем добровольно, исключительно по собственному усмотрению и на свой риск.

3.7. Компания стремится к обеспечению достоверности информации, размещенной на Сайте, однако не несет ответственности за любые неточности и/или недостоверность информации, а равно сбои в работе предоставляемых через Сайт сервисов. Пользователь согласен с тем, что Компания не несет ответственность и не имеет прямых или косвенных обязательств перед Пользователем в связи с любыми возможными или возникшими потерями, или убытками, связанными с любым содержанием Сайта, интеллектуальной собственностью, товарами или услугами, доступными на нем или полученными через внешние сайты или ресурсы либо иные ожидания Пользователя, которые возникли в связи с использованием размещенной на Сайте информации или ссылки на внешние ресурсы. Ни при каких условиях, включая, но не ограничиваясь невнимательностью или небрежностью Пользователя, Компания не несет ответственности за любой ущерб (прямой или косвенный, случайный или закономерный), включая, но не ограничиваясь потерей данных или прибылей, связанной с использованием или невозможностью использования Сайта, информации, файлов или материалов на нем, даже если Компания или ее представители были предупреждены о возможности такой потери. В случае, если использование Сайта приведёт к необходимости дополнительного обслуживания, исправления или ремонта любого оборудования, а равно восстановления данных, все связанные с этим затраты оплачиваются Пользователем самостоятельно.

3.8. Вся представленная на Сайте информация предоставляется «как есть», без каких-либо гарантий, явных или подразумеваемых. Компания полностью, в той мере, в какой это разрешено законом, отказывается от какой-либо ответственности, явной или подразумеваемой, включая, но не ограничиваясь неявными гарантиями пригодности к использованию, а также гарантиями законности любой информации, продукта или услуги, полученной или приобретенной с помощью этого Сайта.

3.9. Пользователь согласен, что все материалы и сервисы Сайта или любая их часть могут сопровождаться рекламой. Пользователь согласен с тем, что Компания не несет какой-либо ответственности и не имеет каких-либо обязательств в связи с такой рекламой.

4. Условия обработки и использования персональных данных. Принимая условия настоящего Соглашения Пользователь выражает свое согласие на:

4.1. Предоставление своих персональных данных, включающих имя, номера контактных телефонов; адреса электронной почты; место работы и занимаемая должность; пользовательские данные (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) своей волей и в своем интересе.

4.2. Цель обработки персональных данных:

предоставление Пользователю услуг Сайта;
направление уведомлений, касающихся услуг Сайта;
подготовка и направление ответов на запросы Пользователя;
выполнение регулярной информационной рассылки;
направление информации о продуктах и услугах Компании, а также рекламно-информационных сообщений, касающихся продукции и услуг Компании и ее партнеров.

4.3. Перечень действий с персональными данными, на которые Пользователь выражает свое согласие:

сбор, систематизация, накопление, хранение, уточнение (обновление, изменение), использование, обезличивание, передача третьим лицам для указанных выше целей, а также осуществление любых иных действий, предусмотренных действующим законодательством РФ как неавтоматизированными, так и автоматизированными способами.

4.4. Компания обязуется принимать все необходимые меры для защиты персональных данных Пользователя от неправомерного доступа или раскрытия.

4.5. Настоящее согласие действует до момента его отзыва Пользователем путем направления соответствующего уведомления заказным письмо с уведомлением на адрес Компании.

5. Прочие положения

5.1. Использование материалов и сервисов Сайта, а равно размещение на нем материалов Пользователя, регулируется нормами действующего законодательства Российской Федерации. Все возможные споры, вытекающие из настоящего Соглашения или связанные с ним, подлежат разрешению в соответствии с действующим законодательством Российской Федерации по месту нахождения Компании.

5.2. Признание судом какого-либо положения Соглашения недействительным или не подлежащим принудительному исполнению не влечет недействительности иных положений Соглашения.

5.4. Бездействие со стороны Компании в случае нарушения кем-либо из Пользователей положений Соглашения не лишает Компанию права предпринять соответствующие действия в защиту своих интересов и защиту авторских прав на охраняемые в соответствии с законодательством материалы Сайта позднее.

Пользователь подтверждает, что ознакомлен со всеми пунктами настоящего Соглашения и безоговорочно принимает их.

По всем вопросам, связанным с нарушением авторских прав Компании, незаконного использования материалов Сайта или размещением ложной, вводящей в заблуждение информации о Компании, просим обращаться по  следующим контактным данным:

ООО «ИТ Медиа» ИНН 7802426999, КПП 781301001,
Санкт-Петербург, ул Большая монетная, 16 / К. 30 литера А, пом. 14-Н №30