AI устал, и не творит, а выдает лишь копии оригинала…
В последнее время системы генерации изображений на основе AI – Stable Diffusion, Imagen и Dall-E 2, были в топ новостей из-за их способности генерировать изображения с высоким разрешением, основываясь только на подсказках пользователя. Такие системы обучались на тысячах изображений в качестве исходного материала для их «творчества».
В своем исследовании ученые обнаружили, что нейросети могут совершать довольно серьезные ошибки. Вместо создания нового изображения система просто выдает идентичную оригиналу копию из базы обучающих данных. Это происходит довольно часто. Во время тестов они обнаружили более 100 экземпляров из 1000 возвращенных изображений.
Это является большой проблемой, потому что наборы данных обычно берутся из Интернета, и многие из них защищены авторскими правами. Команда обнаружила, что примерно 35% скопированных изображений содержали уведомления об авторских правах. Приблизительно 65% картин не имели явного уведомления, но явно были чьей-то собственностью.
Известно, что большинство систем генерации изображений на основе AI имеют этап обработки, во время которого добавляется шум, чтобы не допустить создания изображения сходного до смешения с каким-либо из образцов для обучения. Этот прием подталкивает систему к созданию чего-то нового. Однако в проблемных случаях, нейросеть добавляла шум к скопированному изображению, как будто бы желая скрыть примитивное копирование оригинала.