Alibaba включила датасет библиотеки Aniemore в обучение ИИ

09.02.2024
Набор данных открытой библиотеки Aniemore команды «Социальный код» использовался для сравнения производительности авторской модели китайских разработчиков emotion2vec.

Alibaba совместно с научными сотрудниками трех ведущих вузов Китая создала авторскую модель для распознавания эмоций emotion2vec. Для сравнения производительности и метрик зарубежные коллеги включили в исследование и использовали сравнительный набор данных Russian dataset of emotional speech dialogues (RESD), подготовленный для открытой библиотеки Aniemore командой «Социального кода».

При разработке искусственного интеллекта важно иметь наборы данных (датасеты) для сравнения производительности модели с уже существующими моделями. Для этого берут хорошо известные и проверенные датасеты, имеющие определенное качество, описание и содержание.

«Инженеры университетов Китая и Alibaba взяли RESD, как одну из метрик на которой тестировали свою разработку и определяли качество ее работы. Приятно, что для этих целей, они воспользовались именно нашей базой, не включая в тесты даже такие известные датасеты, как Dusha (Сбер). Это победа и международное признание нашей работы» – прокомментировал публикацию Артем Аментес, лидер разработки библиотеки Aniemore.

Набор данных Russian Emotional Speech Dialogues содержит более 3000 аудиофрагментов от 200 различных людей, а модель способна распознавать эмоции в зашумленных аудиофайлах длительностью до 3х секунд. В датасете также содержатся реальные диалоги высокого качества и разного эмоционального окраса. Для подготовки этих материалов «Социальный код» привлек к работе профессиональных актеров, чтобы выборка была максимально приближена к реальности.

Библиотека Aniemore (Artem Nikita Ilya EMOtion REcognition) разработана коллективом авторов на базе ООО "Социальный код" при поддержке Фонда содействия развитию малых форм предприятий в научно-технической сфере в 2023 г.

Похожие статьи