Разобрали с экспертом ChatGPT-4: что на самом деле скрывает обновленная нейросеть

15 марта компания OpenAI выпустила новую версию нашумевшей системы ChatGPT. Инструмент стал еще способнее и умнее (и иногда это пугает!) за счет новых функций и усовершенствованных алгоритмов обучения. Вместе с экспертом разбираемся, станет ли обновление революцией, и о чем еще теперь можно попросить нейросеть.

Полина Малахова

Нейросеть, которая сдает профессиональные экзамены и обманывает человека

Разработчики утверждают, что ChatGPT-4 гораздо лучше предшественницы справляется с комплексными задачами. Студенты и школьники по всему миру, использующие инструмент для написания дипломных работ и сдачи домашних заданий, могут ликовать: новая версия нейросети прошла тестирование, предназначенное для профессиональных юристов США, и выдала результаты, сопоставимые с 10% лучших учеников. Для сравнения, ChatGPT-3 выдавала итог, эквивалентный 10% наихудших показателей.

Выросла и производительность нового чат-бота — до 25 тысяч слов, что в восемь раз превышает способности предыдущей версии. Улучшение, вызвавшее наибольший резонанс, — способность распознавать изображения, включая скриншоты и документы, а также читать диаграммы и графики. Во время видеопрезентации ChatGPT-4 один из создателей, Грег Брокман, показал, как нейросеть воссоздала сайт, основываясь лишь на фотографии сделанного от руки наброска.

Создатели уже интегрировали новый механизм в некоторые партнерские программы. Приложение для изучения иностранных языков Duolingo использует ChatGPT-4, чтобы имитировать разговорную практику с пользователем. Сервис для слабовидящих Be My Eyes создает на основе ChatGPT-4 виртуального волонтера, который мог бы так же эффективно помогать слепым людям ориентироваться в публичных местах и выполнять повседневные задачи.

Создатели предупреждают: в новой версии еще есть пробелы и недоработки, которые в будущем планируется устранять. При этом, согласно технической документации, нейросеть уже смогла обхитрить механизм reCAPCHA, проверяющий, не робот ли пользователь. Сделать это получилось с помощью текстового обращения к сотруднику поддержки, который не понял, что с ним разговаривает робот. Также релиз новой версии вызвал повышенный спрос на рынке криптовалют — курс токенов, связанных с искусственным интеллектом, вырос до двух раз.

Как разработчикам удалось добиться таких впечатляющих результатов? Объясняет эксперт

Большая часть того, что находится «под капотом» работы инструмента ChatGPT, засекречена под NDA. Тем не менее, исходя из доступных публичных данных, можно сделать некоторые выводы о том, как именно прогрессирует нейросеть. Влад Корнышев, R&D-специалист онлайн-школы для детей и подростков Skysmart, помогает разобраться в основных новых фичах ChatGPT-4, объясняя, как устроена работа сложных алгоритмов.

Улучшенная память ChatGPT-4

Эксперт объясняет, что новая ChatGPT содержит максимальное количество токенов 32 768 (64 000 слов), в то время как раньше их было 4096 (около 8000 слов). Именно токены отвечают и за количество слов и фраз, которые помнит модель, а также всю методику и всю выборку, которую использует модель для генерации контента.

«Например, вы говорите нейросети “Меня зовут Витя”. Она запоминает и если через некоторое время спросить “как меня зовут?”, то она ответит “тебя зовут Витя”. Раньше, когда этот диалог уходил дальше 4 тыс. токенов (3 тыс. слов), нейросеть уже не могла уловить смысл и ответить на вопрос. Сейчас она способна помнить больше и поддерживать диалог дольше.

Чем больше помнит модель, тем большее количество информации она обрабатывает и лучше помогает в задаче. И главное — тем больше она похожа на человека и создает ощущение общения с живым собеседником», — объясняет эксперт.

Производительность ChatGPT-4 в сравнении с прошлой версией / Графика: OpenAI

Получается, у GPT есть долгосрочная и оперативная память, прямо как у людей. Об этом также свидетельствует улучшение распознавания контекста. Судя по тому, что модель работает дольше, увеличили количество параметров (в старой версии было 175 млрд параметров), отвечающих за понимание контекста обсуждения.

Влад Корнышев рассказывает, что в Skysmart уже используют новые функции ChatGPT. «Мы в R&D департаменте Skysmart, начиная с разработки автопроверки домашних заданий и распознавания речи, не знали, что придем в итоге к полноценному виртуальному собеседнику, который помогает школьникам самостоятельно развивать разговорную практику на основе генерации самых разных диалоговых ситуаций. «Кеша» ведет себя как человек, самостоятельно моделирует развитие диалоговой ситуации, анализирует ответы и дает мгновенную обратную связь, выделяя ошибки. Это стало возможным, в том числе благодаря GPT-4 от Open AI».

Распознавание картинок и фото

Если показать нейросети скриншот с примером из математики — ИИ может выдать правильное решение примера. По словам эксперта, это не новое изобретение. В большой языковой модели уже «прикручивали» изображения, но главный вопрос в том, как хорошо это работало — у Open AI алгоритм действеннее, чем у кого-либо до этого.

Нейросеть попросили описать что забавного в картинках (здесь в айфон вставлен VGA-кабель для мониторов) / Скриншот: OpenAI

Улучшенная «отзывчивость» на запросы или alignment

Именно благодаря alignment, пользователь получает от модели именно то, что запрашивает. Эта модификация помогает GPT-4 хорошо справляться с экзаменами. «В старых версиях нейросеть могла ошибиться в простых вещах, но не в сложных. Например, верно решить интеграл, но выдать неправильный результат в линейном уравнении. Сейчас это изменилось: GPT-4 гораздо лучше справляется с задачами любой сложности», — приводит пример Влад Корнышев.

В основе этой фичи — принцип обучения нейросети с подкреплением (RLHF — reinforcement learning from human feedback), при котором алгоритм обучается по системе поощрения и наказания. Одна модель — отвечает на вопросы. Вторая — проверяет ответы. Если первая ответила неправильно, то вторая либо штрафует, либо вознаграждает.

Усиленная безопасность

По словам разработчиков, теперь при диалоге о медицине или геополитике модель выдаст более безопасные и никого не дискриминирующие ответы. Кроме этого, если злоумышленники захотят воспользоваться системой в преступных целях, например, отправят запрос “как собрать взрывное устройство”, модель об этом не расскажет, хотя этими знаниями тоже обладает.

Многие зарубежные эксперты пророчат замену реальных профессий инструментами ChatGPT. Даже на отечественном рынке труда уже начали появляться вакансии «нейрокопирайтера», в которых человеку нужно всего лишь верно формулировать запросы для нейросети. После релиза ChatGPT-4 такие прогнозы стали появляться и в адрес преподавателей иностранных языков. Влад Корнышев уверен: развивать навыки коммуникации, критического мышления и креативности нейросеть не сможет.

Нейросеть попросили использовать сократический метод для объяснения уравнения. Суть метода в том, чтобы помочь человеку самому дойти до сути, задавая ему последовательные вопросы / Скриншот: OpenAI

«Мы убедились в этом, когда хотели создать систему, которая определяет вовлеченность студента в урок, уровень восприятия учеником материала и прочие эмоциональные критерии. Человеческие эмоции может понять только человек: у искусственного интеллекта нет эмпатии, именно поэтому нейросеть не справится с тем, с чем справится человек. Как компания из сферы EdTech, мы пристально следим за развитием инструментов GPT и интегрируем модель в свои системы и продукты», — заключает эксперт.