Yandex Cloud разработала нейросеть-полиглота

Логотип компании
30.06.2022
Yandex Cloud разработала нейросеть-полиглота
Облачная платформа Yandex Cloud разработала модель на базе машинного обучения, которая умеет распознавать более 10 иностранных языков одновременно.

С помощью новой нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов.

Нейросеть-полиглот умеет работать и с популярными языками, такими как английский и французский, и с более редкими – датским, финским, турецким. Модель распознает речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей “подсказки”, чтобы улучшить качество распознавания.

Новая мультиязычная модель работает на базе архитектуры Transformer. “Трансформеры” обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений Яндекса.

“Мы стремимся к тому, чтобы диалоговые сценарии для разработки голосовых помощников вроде Алисы, автоматизации работы с клиентами, проведения опросов и контроля качества были доступны каждому бизнесу. Для внедрения любой фичи в речевые технологии требуются большие массивы данных, высококвалифицированные специалисты и сотни часов обучения. Мы в Yandex Cloud постоянно развиваем сервис синтеза и распознавания: делаем речь максимально естественной, расширяем возможности для ее распознавания и создаем уникальные голоса помощников”, – рассказал Василий Ершов, руководитель разработки Yandex SpeechKit.

Новая нейросеть работает в сервисе синтеза и распознавания речи Yandex SpeechKit. Cервис уже используют более 1000 клиентов, в том числе X5 Retail Group и “Додо Пицца”. Новое мультиязычное распознавание уже доступно для проектов пользователей Yandex SpeechKit и настраивается стандартными средствами в API.

Читайте также
После падения в 2023 году мировой рынок микроэлектроники демонстрирует устойчивый рост, опираясь на государственную поддержку и высокие инвестиции в технологии. В России, в отличие от мирового тренда, драйвером роста становится активное участие государства и национальные программы, направленные на локализацию производства. IT-World изучил, какие факторы и вызовы формируют микроэлектронную индустрию сегодня и как развивается ее потенциал.

Похожие статьи