Just AI выводит в продакшн гибридный синтез речи

16.03.2022
Разработчик технологий разговорного ИИ Just AI выводит в продакшн гибридный синтез речи. Технология позволяет быстро менять фразы в дикторских записях для голосового бота, требуется только отредактировать текст. При этом синтезированная речь копирует интонацию и эмоции диктора и звучит естественно.

Гибридный синтез позволяет персонализировать IVR и роботизированные обзвоны с целями NPS-опросов, анкетирования, напоминаний, upsale и поддержки программ лояльности. В таких кейсах реплики голосового бота как правило содержат переменные — слова, которые невозможно записать голосом диктора заранее, так как они меняются в зависимости от контекста. Например, когда робот звонит клиенту и подтверждает визит в медцентр, переменными выступают имена пациента и лечащего врача, дата и время приема, в других сценариях — номера договоров, суммы заказов, перечень покупок. Гибридный синтез делает звучание генерируемых фраз неотличимым от дикторских записей и обеспечивает бесшовную склейку переменных с основной частью реплики.

«Если для генерации фраз с переменными использовать TTS (Text-to-Speech, синтез речи), реплики будут звучать эмоционально нейтрально и с меньшей вероятностью найдут отклик у пользователей. Если синтезировать с помощью TTS только переменные из фразы и склеить их с дикторской записью, синтез будет выбиваться по тембру голоса, интонации и эмоциональной окраске. Решает данную проблему и обеспечивает естественное звучание фраз с переменными специальная модель машинного обучения — гибридный синтез», — говорит Александр Чернин, Product Owner компании Just AI.

Just AI предлагает готовую модель для гибридного синтеза. Вызовы шаблона работают на платформах JAICP и JAICF, вызовы из ботов, созданных в других сервисах, возможны по API. Настройка сценария с нуля занимает несколько часов. На старте на выбор предоставляются два женских голоса и один мужской, в дальнейшем голосом станет больше. Оплата за одну уникальную синтезированную реплику составит 9 копеек.

Альтернативный вариант использования гибридного синтеза от Just AI — создание модели с собственным диктором, официальным голосом компании. Стоимость предоставляется по запросу.

Похожие статьи