ChatGPT обновилась: теперь нейросеть может работать с фото

Раньше ChatGPT работала на базе языковой модели GPT-3. Компания OpenAI представила четвертую версию GPT, с которой нашумевшая нейросеть стала еще умнее.
Фото: OpenAI
Фото: OpenAI

Представлена GPT-4 — новейшая языковая ИИ-модель, которая работает почти на уровне мозга человека. GPT-4 была обучена на большем количестве, что делает нейросеть более дорогой в работе. Новая технология может работать не только с текстом, но и с фотографиями. На выходе пользователь по-прежнему получает только текст.

Что изменилось:

  • Работа с фото — ChatGPT может понимать, что изображено на снимке или рисунке, и учитывать эти данные при решении задачи. Например, вы можете попросить нейросеть написать код для сайта, который вы сам нарисовали;
  • Работа с диаграммами — нейросеть может структурировать данные и предоставлять их в виде таблиц, схем и диаграмм;
  • «Здоровые» ответы — ChatGPT теперь меньше врет и дает меньше фактических ошибок. Например, GPT-4 удалось сдать адвокатский экзамен лучше 90% людей. Также нейросеть реже «сходит с ума» и не переходит на личности.

Примеры работы:

Нейросеть рассказала, что она думает об этом фото:

Фото: Reddit
Фото: Reddit

ChatGPT решил пример из скриншота учебника:

Фото: Reddit
Фото: Reddit

Нейросеть описала снимок:

Фото: Reddit
Фото: Reddit

Разработчики предупреждают, что GPT-4 — еще не совершенная языковая модель, и что во многих сценариях она уступает людям. У GPT-4 все еще проблемы с враньем (но их меньше). Также GPT-4 склонна настаивать на своей правоте, даже если ошибается.

Microsoft заявила, что в браузере Bing уже используется ChatGPT на основе GPT-4. Там нейросеть работает бесплатно. GPT-4 уже доступна платным подписчикам нейросети. Также она доступна в составе API, что позволит сторонним разработчикам интегрировать ИИ в свои проекты.