AI устал, и не творит, а выдает лишь копии оригинала…

Логотип компании
03.02.2023Автор
AI устал, и не творит, а выдает лишь копии оригинала…
Группа ученых из Google, DeepMind, ETHZ (Швейцарской высшей технической школы Цюриха), Принстонского университета и Калифорнийского университета в Беркли обнаружила, что системы генерации изображений на основе ИИ иногда генерируют практически точные копии изображений, которые использовались для их обучения.

В последнее время системы генерации изображений на основе AI – Stable Diffusion, Imagen и Dall-E 2, были в топ новостей из-за их способности генерировать изображения с высоким разрешением, основываясь только на подсказках пользователя. Такие системы обучались на тысячах изображений в качестве исходного материала для их «творчества».

В своем исследовании ученые обнаружили, что нейросети могут совершать довольно серьезные ошибки. Вместо создания нового изображения система просто выдает идентичную оригиналу копию из базы обучающих данных. Это происходит довольно часто. Во время тестов они обнаружили более 100 экземпляров из 1000 возвращенных изображений.

Это является большой проблемой, потому что наборы данных обычно берутся из Интернета, и многие из них защищены авторскими правами. Команда обнаружила, что примерно 35% скопированных изображений содержали уведомления об авторских правах. Приблизительно 65% картин не имели явного уведомления, но явно были чьей-то собственностью.

Известно, что большинство систем генерации изображений на основе AI имеют этап обработки, во время которого добавляется шум, чтобы не допустить создания изображения сходного до смешения с каким-либо из образцов для обучения. Этот прием подталкивает систему к созданию чего-то нового. Однако в проблемных случаях, нейросеть добавляла шум к скопированному изображению, как будто бы желая скрыть примитивное копирование оригинала.