ГлавнаяПрактикаМир технологий

Что такое психоакустика, или Теория звуковых лабиринтов

06.07.2021Автор Евгений Курышев
Что такое психоакустика, или Теория звуковых лабиринтов
Согласно современным научным представлениям, до 25% информации, получаемой нами из окружающей среды, приходится на звуки.

Сложно переоценить влияние звуков и музыки на жизнь человека. На протяжении всей истории человечества они имели определяющее значение для его выживания и ориентирования в пространстве. Человек постоянно запоминал и классифицировал звуки, которые слышал. Часть из них сигнализировала об опасности, другие, наоборот, выступали в роли положительных стимулов. Очевидно, что человек также запоминал звуки, которые вызывают различные эмоции или настраивают на определенный лад, впитывал их в подсознание. Шум дождя, треск костра, стук сердца — все имело значение. И в определенной степени послужило основой для возникновения музыки. Скорее всего, музыка в ее примитивном виде появилась даже раньше, чем полноценная разговорная речь. В то же время музыка и речь связаны между собой, так как имеют общую основу — звуки различной громкости, высоты и продолжительности. Не менее важными характеристиками звука, которые способен оценивать человек, являются их тембр и пространственная локализация.

Чем занимается психоакустика?

Психологические и физиологические особенности восприятия звука — это предметная область науки под названием «психоакустика». В наше время она оказалась особенно важной, поскольку сильнейший технологический рывок, произошедший на стыке XX–XXI веков, предоставил невероятные возможности для работы со звуком. Появление компьютеров и их довольно быстрая популяризация среди широких масс привела к экстремальному росту числа звуковых и музыкальных экспериментов. Причем очевидно, что давать оценку всему этому мы способны исключительно благодаря нашему мозгу и слуховой системе, говорить о полном понимании работы которых явно преждевременно. Люди, занимающиеся психоакустикой, пытаются досконально разобраться в том, как именно функционирует человеческий слух, а главное, установить взаимосвязь между тем, что мы слышим, и тем, как это влияет на нас. В частности, изучаются аспекты влияния определенных характеристик звука на эмоциональное состояние человека или усвоение информации. Ведь с помощью звуков определенной частоты можно вызывать как приятные, так и очень неприятные ощущения — например, страх, отчаяние, желание спрятаться. Иные же звуки могут, наоборот, успокаивать человека, настраивать на медитативный лад. Коротко говоря, звук может приносить как боль, в том числе ощутимую физически, так и радость. Безусловно, все это в значительной степени связано непосредственно с анатомическим устройством слуховой системы. Возможно, некоторые из нас помнят экскурсы в теорию совместной работы молоточков, стремечек и улиток, однако в рамках настоящей статьи у нас нет возможности углубиться в физиологическую часть обсуждаемого вопроса. Но даже сегодня, когда о механизмах работы слухового аппарата известно довольно много, мы все еще не всегда способны объяснить некоторые субъективные особенности восприятия звуков. Основная сложность психоакустики заключается в том, что с легкостью можно измерить физические параметры воспринимаемого нами звука, но гораздо сложнее понять, как именно он интерпретируется мозгом. Предмет психоакустики касается нас намного больше, чем может показаться на первый взгляд. Навскидку очевидный пример — пожалуй, все сталкивались с неприятными ощущениями, когда при просмотре интересного кинофильма внезапно начинается реклама. В большинстве случаев она воспринимается значительно громче, чем звуковая дорожка киноленты, поэтому возникает резонное возмущение, что телеканал осознанно увеличил громкость рекламы. Да, бывает и так, однако ощущение повышенной громкости рекламы может быть связано и с психологическим эффектом: размеренное погружение в сюжет кинополотна прерывается чем-то резким и не имеющим к нему отношения. Это тоже один из вопросов, которым занимается психоакустика. Стереоэффект, панорамное звучание, бинауральные ритмы и алгоритмы кодирования информации в аудиокодеках — все это в определенной степени касается психоакустики и нейрофизиологии.

Основы восприятия звука

Небольшая энциклопедическая справка. С точки зрения физики звук, как и любая волна, описывается в первую очередь амплитудой и частотой. Амплитуда определяет громкость звука, а частота — его высоту, тональность. Несмотря на то что диапазон слышимых человеком звуков отличается от индивидуума к индивидууму, ученые давно определились со средними цифрами. Сегодня считается, что большинство людей слышит звуки с частотами от 15–20 Гц до 15–20 кГц. Звуки ниже различаемого человеком диапазона называются инфразвуком, а выше — ультразвуком (до 1 ГГц) и гиперзвуком (от 1 ГГц). Для облегчения понимания стоит вспомнить, что 1 Гц — это одно колебание в секунду, а 100 Гц — 100 колебаний за ту же секунду. И нижний, и верхний пороги восприятия звуков человеком весьма условны и меняются с возрастом. Обычно по мере старения организма сильнее всего страдает верхний порог, с каждым годом человек все хуже слышит высокие звуки. В то же время эволюция постаралась сделать так, что лучше всего люди воспринимают частоты, свойственные человеческой речи, — это диапазон 1–4 кГц.

В свою очередь, громкость звука принято оценивать с помощью децибелов. Нулевой уровень звукового давления (0 дБ) — это порог слышимости для звука с частотой 1 кГц, то есть самый тихий уровень громкости на данной частоте, который едва способно уловить человеческое ухо. Полноценно различаемые звуки, например человеческий шепот или шелест листвы, будут издавать громкость уже на уровне 20–30 дБ, а обычный разговор — примерно 45–60 дБ. Верхний предел громкости принято оценивать по уровню болевого порога, который для большинства людей составляет примерно 120 дБ. При 130 дБ человек может ощущать физическую боль, а при 140–150 дБ, скорее всего, получит травму внутреннего уха или контузию. Рассуждая о громкости, необходимо вспомнить банальные и всем известные особенности восприятия громкости человеком. Очевидно, что громкие звуки заглушают менее тихие, однако и здесь не все так просто, есть значимый нюанс. Тихие высокие звуки меркнут на фоне громких низких, а вот тихие низкие почти не приглушаются громкими высокими. При этом лучше всего на одной и той же громкости человек будет слышать все те же среднечастотные звуки.

Еще одна важная характеристика восприятия звука — это пространственная локализация его источника. Наш мозг создает объемную звуковую картинку на основании разности громкостей в ушах и времени запаздывания поступающих в слуховой аппарат звуков. С пространственным восприятием определенных частот связан интересный момент. Наверняка каждый обращал внимание на то, что количество колонок в акустических системах может быть разным, но обычно не меньше двух, а вот сабвуфер в большинстве случаев один. Дело в том, что задача по локализации источника звука с частотами ниже 100 Гц представляется практически невыполнимой для нашего мозга, в связи с чем нет необходимости дублировать сабвуфер, отвечающий за низкие частоты. В то же время звуки в диапазоне 100–500 Гц мы способны локализовать с помощью времени запаздывания. Определение положения в пространстве источников звука средних (до 2400 Гц) и высоких (до 20000 Гц) частот происходит с помощью как разности громкостей в левом и правом ухе, так и запаздывания. Поэтому с помощью подачи сигналов разной громкости на левый и правый каналы можно создавать в голове слушателя иллюзию определенного расположения в пространстве отдельных источников звука, допустим, скрипка левее, гитара правее, а контрабас — по центру.

Подходы к кодированию звука

Сегодня на рынке существует значительное количество различных аудиоформатов, в которых распространяется музыка. Среди наиболее известных можно назвать MP3, AAC и FLAC. И этого будет достаточно для целей статьи. В столь небольшом списке есть представители двух основных подходов к кодированию звука. Это lossless-форматы вроде FLAC и lossy-форматы типа AAC и MP3. Первые подразумевают сжатие без потерь, вторые — с потерями. При кодировании во FLAC убирается лишь ненужная техническая информация, которая никак не влияет на восприятие звука слушателем — по сути, декодированный сигнал и оригинальная запись идентичны. При кодировании в форматах MP3, AAC и многих других используются алгоритмы на базе выводов психоакустики, то есть отсекаются те частоты, которые человек слышит плохо или не слышит вовсе, — например, из-за эффекта частотного маскирования, когда соседние тоны приглушают друг друга. Такие кодеки называются перцептивными, от английского слова perception («восприятие»). Несмотря на вполне научный фундамент, перцептивный подход имеет свои недостатки. В частности, решение об удалении тех или иных частот спектра принимается на основании уверенности в том, что их не воспринимает слуховой аппарат человека. В то же время давно известно, что звук воспринимается не только ушами, но и телом в целом. Например, звуки ниже 15 Гц мы не слышим, но можем ощущать телом. Безусловно, эти ощущения могут существенно влиять на восприятие музыки. Тем более что в процессе кодирования звука с помощью перцептивных кодеков удаляются звуки из участков по всему слышимому диапазону. Тем не менее практика показывает, что большинство людей не слышит разницу между MP3 и FLAC либо быстро привыкает к ней и перестает замечать. То есть знание о том, как человек воспринимает звуки, оказывается вполне применимым на практике. Хотя согласны с этим далеко не все. Дело в том, что многие люди все же слышат разницу в качестве звука MP3 и FLAC, а некоторые из них даже способны определить ее на слух, то есть успешно пройти двойное слепое тестирование. В решении этой задачи может помочь использование высококачественной аудиотехники, любовь к музыке и внимание к самым тонким особенностям звучания. Поэтому точка зрения о том, что использование знаний психоакустики в перцептивных аудиокодеках позволяет ухудшить качество звука до такой степени, которая незаметна для большинства людей, также имеет право на жизнь.

Выводы

Появление перцептивных аудиоформатов было связано с ограниченными техническими возможностями того времени, когда они появлялись на свет. Научная база психоакустики оказалась весьма полезной в этом направлении. Поначалу инженеры и ученые хотели сократить объем кодируемых файлов и не потерять в качестве. Сегодня эти знания используются в том числе для того, чтобы приукрасить сжатый материал при прослушивании в режиме реального времени, например, с помощью DSP-процессоров.

Психоакустика — это очень интересная и серьезная наука, требующая хороших познаний в смежных дисциплинах, в том числе в анатомии, нейрофизиологии, физике, математике и других. Особенно интересны ученым механизмы влияния звуков на настроения людей. В этом контексте следует вспомнить о так называемых бинауральных ритмах, которые, как принято считать, способны менять ритмы головного мозга. Эта тема давно обросла спекуляциями и псевдонаучными историями, однако продолжает оставаться предметом научных изысканий и интересных экспериментов.

Большинство современных аудиоформатов кодирует звук на основании знаний о работе слухового аппарата, в частности, с помощью понимания механизмов работы базилярной мембраны в улитке внутреннего уха. Банки фильтров, применяемые в перцептивных кодеках, соотносятся именно с представлениями о том, как устроена и функционирует базилярная мембрана. Тем не менее при кодировании звука используются модели с определенными, подчас весьма грубыми допущениями, которые влияют на качество звука и, скорее всего, не в лучшую сторону. В то же время благодаря специальным эффектам и технологиям, улучшающим звук на лету, искажения, связанные с работой кодеков, можно свести к минимуму.

В определенном объеме знания психоакустики используются в любой сфере, связанной с записью и обработкой звука, например, в кинотеатрах, концертных залах или даже в гостиной, где собрались друзья и родные для просмотра кинофильма с многоканальной аудиодорожкой. За иллюзией присутствия в кино, панорамным звучанием, ощущением многомерного звукового пространства и другими стереоэффектами стоит кропотливая работа сотен людей — ученых, инженеров и программистов. Но не нужно забывать, каким значительным может быть влияние звуков на человеческую психику. По аналогии с так называемым эффектом 25-го кадра в видео с помощью звука можно осознанно управлять эмоциями и поведением человека, чем, кстати, еще с 60-х годов прошлого века пользуются многие популярные музыканты.