ChatGPT научился слушать, видеть и говорить

Нейросеть стала еще больше похожа на человека. Рассказываем, на что способен ИИ-бот с новыми чувствами.
ChatGPT

OpenAI обновила нейросеть ChatGPT. Теперь нейросеть умеет слушать людей и отвечать им голосом. Об этом разработчики рассказали в своем блоге. Всего чатбот получил три крупных нововведения:

Слух

ChatGPT научился отвечать на вопросы, которые пользователь не написал, а произнес с включенным микрофоном. Функция диктовки запросов доступна в мобильном приложении ChatGPT. Вот как выглядит диалог с нейросетью:

Голос

Теперь ChatGPT может вам отвечать не только в текстовом, но и в голосовом формате. Чтобы активировать функцию, нужно в мобильном приложении ChatGPT перейти в Настройки > Новые функции приложения > Ответы голосом.

Переписка с ChatGPT. Фото: OpenAI
Переписка с ChatGPT. Фото: OpenAI

Всего доступно 5 голосов на выбор: 2 женских, 2 мужских и 1 небинарный. Послушать каждый из них можно по ссылке. Озвучкой ChatGPT занимались профессиональные актеры дубляжа. Помогала преобразовывать речь в текст собственная технология OpenAI Whisper.

«Глаза»

ChatGPT получил еще одно человеческое чувство — способность видеть. Человек может отправить нейросети фотографию, чтобы чатбот проанализировал ее. Примеры сценариев использования этой функции:

  • У вас сломался велосипед — сфотографируйте его и отправьте ChatGPT. Нейросеть расскажет, как его починить;
     
  • Вы не знаете, что приготовить — отправьте ChatGPT фото с продуктами в холодильнике. Нейросеть расскажет, что можно сделать из имеющихся ингредиентов;
     
  • Вы не можете решить задачу — сфотографируйте условия задачи или пример и отправьте ChatGPT. Нейросеть озвучит или напишет ответ с объяснением.

Новые функции уже доступны некоторым пользователям. Вскоре они будут открыты всем. Чтобы пользоваться опциями, нужно быть подписчиком ChatGPT Plus (19,99 доллара в месяц). Голосовой чат работает только в программе ChatGPT для Android и iOS.