Прототип собственной нейросети «Яндекса» для генерации картинок

05.04.2023
Прототип собственной нейросети «Яндекса» для генерации картинок

Яндекс показал прототип собственной нейросети для генерации картинок по текстовым запросам пользователей. Увидеть, как она выполняет задания, можно в бета-версии 0.1.4 приложения Шедеврум на Android и iOS.

Шедеврум понимает русский и английский языки и очень любит конкретику. Чем подробнее описание, тем точнее результат. Нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях.

Нейросеть Шедеврума формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться.

Алексей Гусаков, руководитель управления машинного интеллекта и исследований Яндекса: «Мы пока в самом начале пути. В основе Шедеврума прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше».

Для просмотра готовых изображений достаточно скачать Шедеврум. Понравившиеся изображения можно лайкать в общей ленте. Самые популярные из них попадают в топ лучших на отдельной вкладке. Чтобы генерировать картинки по собственным запросам, нужно оставить заявку и дождаться её подтверждения. В будущем такую возможность получат все зарегистрированные пользователи.

Похожие статьи