Синтезируемой речи можно придать индивидуальность

Логотип компании
18.03.2014Автор
Синтезируемой речи можно придать индивидуальность
Суррогатные голоса, созданные на основе специфических фильтров и записей мнемоник, помогут немым людям обрести индивидуальную речь.

Об этом заявила Рупал Патель (Rupal Patel), профессор Северо-Восточного Университета (Бостон, США). По ее словам, главная проблема устройств синтеза речи на основе текста, которыми пользуются люди с нарушением коммуникативных возможностей, – абсолютная безликость воспроизводимых словосочетаний.

В результате одинаковыми голосами снабжаются все пациенты, обреченные на немоту: и маленькая девочка, и пожилая женщина, и Стивен Хокинг. Идея Рупал Патель основана на сочетании записи мнемоник донорами (на базе специально подобранных предложений и фраз) и специфических фильтров.

Исследователь уверена, что суррогатные голоса можно будет создавать, сопоставляя психотипы людей – пол, возраст, внешность, особенности характера и прочее. Работа, несомненно, займет много времени (каждому донору придется потратить несколько часов на запись фраз), но в итоге удастся сформировать уникальную базу данных, позволяющую синтезировать индивидуальный голос для каждого нуждающегося в нем.

Проект не носит теоретический характер: любой желающий может посмотреть и послушать результаты на видео, а тем временем специально организованная команда VocaliD ищет спонсоров для продолжения проекта. Приемлемые плоды пока что достигнуты на программном продукте, действующем под Windows, но ученые планируют сделать версии для Android и iOS.

Единственное ограничение – цена решения, которая находится в пределах $10 000, но Рупал Патель уверена, что с развитием технологий и этот барьер будет преодолен – тогда индивидуальные голосовые синтезаторы станут общедоступными.