Прототип собственной нейросети «Яндекса» для генерации картинок

05.04.2023

Яндекс показал прототип собственной нейросети для генерации картинок по текстовым запросам пользователей. Увидеть, как она выполняет задания, можно в бета-версии 0.1.4 приложения Шедеврум на Android и iOS.

Шедеврум понимает русский и английский языки и очень любит конкретику. Чем подробнее описание, тем точнее результат. Нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях.

Нейросеть Шедеврума формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться.

Алексей Гусаков, руководитель управления машинного интеллекта и исследований Яндекса: «Мы пока в самом начале пути. В основе Шедеврума прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше».

Для просмотра готовых изображений достаточно скачать Шедеврум. Понравившиеся изображения можно лайкать в общей ленте. Самые популярные из них попадают в топ лучших на отдельной вкладке. Чтобы генерировать картинки по собственным запросам, нужно оставить заявку и дождаться её подтверждения. В будущем такую возможность получат все зарегистрированные пользователи.

Яндекс Искусственный интеллект AI Нейронные сети

Тинькофф объявил о запуске Вселенной ассистентов — AI-помощников, которые умеют подстраиваться под запросы человека и давать ему персонализированный ответ с рекомендациями или подборками товаров по самым разным темам и вопросам.

Новости компаний, 24.04.24

«Должник прав»: 30% конверсия с голосовым ботом Robovoice от SL Soft

Юридическая компания «Должник прав» автоматизировала обработку входящих обращений на сайте с помощью голосового бота, созданного на платформе Robovoice компании SL Soft.

SoftlineПроекты, 24.04.24

Виртуальный гид Красный конь использует GigaChat для диалогов на выставке Россия

Виртуальный гид Красный конь, работающий на стенде Ростовской области на выставке Россия, получил возможность говорить уникальным голосом на любые темы в режиме свободного диалога. Это стало возможным благодаря нейросетевой модели GigaChat и платформе речевых сервисов SaluteSpeech от SberDevices.

Проф ИТНовости компаний, 23.04.24

«Телфин» расширяет возможности чат-бота в Telegram

Российский провайдер коммуникационных сервисов «Телфин» увеличивает функциональные возможности «Телфин.Бот» для контроля качества телефонного обслуживания и работы колл-центров.

ТелфинНовости компаний, 23.04.24