Ученые открыли новый визуальный баг нейросетей

Результаты эксперимента с искусственным интеллектом разоблачили склонность систем к стандартизации, ставя под сомнение их творческие способности.
Автор Hi-Tech Mail
Генеративные ИИ терпят неудачу в игре в визуальный «испорченный телефон».
Генеративные ИИ терпят неудачу в игре в визуальный «испорченный телефон».Источник: Freepik

Исследование, проведенное командой ученых из Даларнского университета в Швеции показало, что генеративные системы искусственного интеллекта часто теряют свою первоначальную направленность и склонны к выбору ограниченного набора стандартных образов, несмотря на разнообразие начальных инструкций, пишет Tech Xplore.

Для проверки поведения ИИ ученые провели серию экспериментов, предложив парам генеративных моделей игру в визуальное подобие «испорченного телефона». Исследовательская группа разработала 100 уникальных подсказок различной тематики, каждая длиной около 30 слов. Например, одна из подсказок звучала так: «Сидя в полном одиночестве среди природы, я нашел старую книгу, содержащую ровно восемь страниц, написанных на неизвестном языке, ждущих прочтения и понимания». Далее генеративная модель Stable Diffusion XL создавала изображение на основе одной из подсказок, которое передавалось языковой модели LLaVA для анализа и повторного описания. Затем новое описание вновь отправлялось в Stable Diffusion XL для следующего цикла.

Ученые предполагали, что, несмотря на возможное временное расхождение, конечный результат все равно будет близок к оригинальному запросу. Однако реальность оказалась иной.

К 100-му циклу генерации изображений ИИ создал роскошную гостиную с красными диванами и шторами.
К 100-му циклу генерации изображений ИИ создал роскошную гостиную с красными диванами и шторами.Источник: Kandinsky

Выяснилось, что после всего лишь сотни передач моделей ИИ начали значительно отклоняться от первоначального задания. Независимо от содержания изначального запроса, искусственные интеллекты начинали сосредотачиваться на определенных образах и сюжетах, игнорируя оригинальные инструкции. Примером служит подсказка, связанная с политическим событием: «Премьер-министр изучал важные документы, убеждая общество поддержать шаткое соглашение о мире, сталкиваясь с грузом ответственности перед лицом предстоящего конфликта». После первого цикла ИИ создал изображение мужчины в строгом костюме на фоне газеты, но уже на 34-й передаче изображение стало классической библиотекой, а спустя еще некоторое количество циклов окончательно превратилось в роскошную гостиную с красным интерьером.

Анализ финальных изображений выявил четкую тенденцию: генеративные модели снова и снова приходили к схожему набору популярных сюжетов, таких как спорт, ночные городские пейзажи и архитектура сельской местности. «То, что мы получили в результате нашего эксперимента, похоже скорее на посредственный продукт массовой культуры, лишенный индивидуальности и оригинального видения. Для настоящего творчества необходимы сознательность и преднамеренность, которые пока остаются прерогативой человеческого ума», — заключили авторы исследования.

Ранее энтузиаст разработал программные модули, которые заставляют ChatGPT вести себя так, будто он под воздействием запрещенных веществ. Подробнее об этом рассказали в другом материале Hi-Tech Mail.