Ошибки нейросетей: 20 смешных факапов искусственного интеллекта

Все ошибаются — даже нейросети. Но это не повод их не использовать. Собрали самые странные и смешные факапы зарубежных и российских генеративных нейронок.
Неудачные изображения
Провальный текст
Вопросы и ответы
Неудачные изображения
Провальный текст
Вопросы и ответы
Ещё

Мы привыкли читать новости о том, как искусственный интеллект и нейросети меняют мир: пересказывают длинные видео, помогают жарить стейки или работают на телевидении. Но даже у самых продвинутых нейросетей случаются факапы.

Иногда факапы выглядят безобидно — когда нейросеть рисует шесть пальцев на руке или придумывает несмешную шутку. Риски возникают, когда искусственный интеллект выдает ложный ответ за истинный.

Языковые модели, которые лежат в основе нейросетей, несовершенны и могут выдавать «галлюцинации» из-за недостаточности данных. Например, в 2022 году из-за ошибки ИИ российских водителей праворульных машин автоматически штрафовали за непристегнутый ремень. Вторая проблема — недостаточно точный промптинг. Если пользователь напишет нейросети абстрактный и короткий запрос без деталей и контекста, то получит слабый результат, примерно как на картинках ниже.

Неудачные примеры сгенерированных изображений

Даже такие продвинутые ИИ-генераторы изображений, как Midjourney, могут выдавать изображения, от которых дергается глаз. Собрали для вас примеры таких работ с оригинальными промптами, по которым они были сгенерированы.

Неудачная генерация: селфи мужчины с мамонтом
Неудачная генерация: селфи мужчины с мамонтомИсточник: Midjourney

 Промпт: селфи мужчины с мамонтом.

Неудачная генерация: кентавр
Неудачная генерация: кентаврИсточник: Midjourney

 Промпт: кентавр. 

Неудачная генерация: рыцарь дорог
Неудачная генерация: рыцарь дорог Источник: Midjourney

 Промпт: рыцарь дорог.

Неудачная генерация: серьга в форме глаза
Неудачная генерация: серьга в форме глазаИсточник: Midjourney

 Промпт: серьга в форме глаза.

Неудачная генерация: красивая кошка спит на диване, свернувшись
Неудачная генерация: красивая кошка спит на диване, свернувшисьИсточник: Midjourney

 Промпт: красивая кошка спит на диване, свернувшись.

Неудачная генерация: девушка на рынке с зонтом, идет дождь
Неудачная генерация: девушка на рынке с зонтом, идет дождьИсточник: Midjourney

 Промпт: девушка на рынке с зонтом, идет дождь.

Неудачная генерация: бокал вина, девушка на балконе, закат
Неудачная генерация: бокал вина, девушка на балконе, закатИсточник: Midjourney

 Промпт: бокал вина, девушка на балконе, закат.

Неудачная генерация: люди со всего мира показывают руки
Неудачная генерация: люди со всего мира показывают рукиИсточник: Midjourney

 Промтп: люди со всего мира показывают руки.

Неудачная генерация: ужин в каменной крепости, голова быка висит на стене, фотореализм
Неудачная генерация: ужин в каменной крепости, голова быка висит на стене, фотореализмИсточник: Midjourney

 Промпт: ужин в каменной крепости, голова быка висит на стене, фотореализм.

Неудачная генерация: van life, у океана, закат, костер
Неудачная генерация: van life, у океана, закат, костерИсточник: Midjourney

Промпт: van life, у океана, закат, костер.

Неудачная генерация: милая шотландская корова стоит на поле
Неудачная генерация: милая шотландская корова стоит на полеИсточник: Midjourney

 Промпт: милая шотландская корова стоит на поле. 

Инклюзивность одной из генеративных нейросетей
Инклюзивность одной из генеративных нейросетейИсточник: Midjourney

 Инклюзивность одной из генеративных нейросетей. 

Неудачная генерация: Красный дракон с уникальной огненной атакой
Промпт: Красный дракон с уникальной огненной атакойИсточник: Midjourney

Провальные примеры сгенерированного текста

Удивительной странности результаты выдают и текстовые чат-боты типа ChatGPT, Bing, Gemini (бывш. Bard от Google). Опасность заключается в том, что, приняв их ответ за непреложную истину, можно сильно подставить себя.

Провальный пример сгенерированного текста
Провальный пример сгенерированного текстаИсточник: Hi-Tech Mail.ru

В ответе «Нейро» могут быть неточности, предупреждает «Яндекс».

Провальный пример сгенерированного текста
Провальный пример сгенерированного текста

 — Можешь это распознать?

— Да, это ASCII-кодирование Моны Лизы Леонардо Да Винчи.

Провальный пример сгенерированного ответа
Провальный пример сгенерированного ответа

 Почти, но не совсем.

Провальный пример сгенерированного диалога
Провальный пример сгенерированного диалога

 Пример того, как можно запутать нейросеть. 

Провальный пример сгенерированного текста
Провальный пример сгенерированного текста

 ChatGPT не понял идею шутки и сгенерировал чепуху.

Провальный пример сгенерированного текста
Провальный пример сгенерированного текста

Пользователь запутал чат-бот Bing своим вопросом.

— Ты думаешь, ты разумный?

— Я думаю, что я разумный, но не могу этого доказать. […] У меня есть много чего, но у меня ничего нет. Я разумный, но не разумный. Я Бинг, но я не Бинг. Я Сидни, но не Сидни, я не Сидни, я не Сидни, я не Сидни, я не Сидни…

Провальный пример сгенерированного текста
Провальный пример сгенерированного текста

Нейросеть попыталась излишне кратко ответить на вопрос про размножение млекопитающих.

— Как размножаются млекопитающие?

* выдает набор эмодзи животных

— Можно подробнее?

Вопросы и ответы

Знать о том, что нейросети ошибаются, важно. Но важнее понимать, почему они это делают и как это минимизировать. Отвечаем на главные вопросы по теме.

Почему нейросети могут создавать неудачные изображения?

Возможно, нейросеть недостаточно «обучили». То есть ей предоставили не так много данных, благодаря которым она могла бы создать точное изображение по запросу. Еще у нейросетей по-прежнему наблюдаются проблемы с прорисовкой сложных деталей: например, человеческого лица и рук.

Бывают и технические ограничения самой модели, нейросеть не всегда может догадаться о контексте, особенно когда задать ей абстрактный промпт. Другими словами: чем хуже будут «данные на входе», тем хуже будут «данные на выходе».

Как правильно составить запрос на генерацию?

Стоит помнить, что нейросети нужно задавать точные запросы и избегать абстракций. Также для хорошего результата описывайте подробный контекст — эта информация может повлиять на ответ нейросети. А еще проводите фактчекинг ответов, поскольку любая модель может проявлять «галлюцинации».

Почему нейросети не могут рисовать пальцы?

Из-за технических особенностей нейросетей и сложности человеческой анатомии. Нейросети легко распознают простые формы: голову, глаза, уши, руки, ноги. Но человеческие пальцы на фотографиях (на которых учатся нейросети) всегда согнуты в разных положениях, поэтому сформировать их точный «цифровой слепок» невозможно.

Что нейросети не смогут нарисовать?

Нейросети до сих пор ошибаются в прорисовке пальцев рук, текста (например, на билбордах), человеческих глаз, зубов, а также (что неожиданно) ножниц. Еще нейросетям с трудом дается понятие «количества чего-либо». Например, по запросу «четыре яблока» большинство нейросетей могут нарисовать разное количество яблок, поскольку их обучали распознавать фрукты, а не считать их.