Вспомнить все: главные события в мире генеративных нейросетей в 2023 году

В декабре принято подводить итоги года. Генеративные нейросети стали самой обсуждаемой темой в техномире в 2023 году, поэтому они тоже этого достойны. Вспоминаем главные события, происходившие c GenAI и чат-ботами, а также с компаниями, которые их создают.

Денис Акатов

Январь

Microsoft инвестирует в ОpenAI $10 млрд. Теперь Microsoft — эксклюзивный облачный провайдер создателя ChatGPT. В планах Microsoft внедрить ИИ в поисковые результаты Bing и программы Word, PowerPoint и Outlook. Газета Time выпускает расследование о том, что OpenAI использовала низкооплачиваемых кенийских сотрудников для разметки токсичного контента, за $2 в час. OpenAI запускает экспериментальную модель подписки ChatGPT Professional за за $42 в месяц — позже ее запустят для всех пользователей за $20 в месяц. Фотосток Getty Images подает в суд на Stability AI, создателя ИИ-генератора изображений Stable Diffusion, за сканирование и обработку миллионов авторских изображений. Похожие иски против Stability AI, Midjourney и DeviantArt подают трое художников.

Февраль

Microsoft внедряет ИИ в поиск Bing, Microsoft Edge и Skype — применяют новую большую языковую модель (LLM) от OpenAI. Google боится, что ChatGPT пошатнет его позиции на поисковом рынке, и объявляет «код красный». Компания ускоряет разработку своего чат-бота Bard после инвестиций в размере $400 млн в компанию Anthropic. Meta* создает команду для разработки генеративного ИИ (GenAI), в планах — интеграция GenAI в продукты компании, а также разработка «ИИ-персон». В США отказывают в регистрации авторских прав на изображения, созданные Midjourney. Многие компании, включая банки JP Morgan и Citigroup, а также Amazon, запрещают использовать ChatGPT на рабочем месте из-за опасений по поводу безопасности и конфиденциальности. Стартап Runway выпускает революционный ИИ-инструмент Gen-1 по генерации видео с помощью текста.

Генеративный чат-бот в браузере Microsoft EdgeИсточник: Microsoft

Март

Главное событие месяца — выпуск GPT-4, самой передовой LLM от OpenAI. Модель дает более точные ответы, понимает больший контент и распознает изображения. На момент написания текста (декабрь 2023 года) GPT-4 доступна для подписчиков ChatGPT Plus. Adobe анонсирует Adobe Firefly — набор генеративных ИИ-моделей для создания визуального контента. В мае они заработают в Photoshop и других продуктах компании. Google дает ранний доступ к своему чат-боту Bard на языковой модели LaMDA. Bard считается ближайшим конкурентом ChatGPT от OpenAI. Более 1800 человек, включая Илона Маска и Стива Возняка, призывает лаборатории по искусственному интеллекту приостановить на шесть месяцев разработку мощных ИИ-систем, превосходящих GPT-4. Они также хотят разработать общие протоколы безопасности для ИИ. Google, Zoom и Canva интегрируют ИИ в свои продукты.

Апрель

Илон Маск запускает новую ИИ-компанию под названием X.AI и представляет чат-бот TruthGPT для конкуренции с ChatGPT. TruthGPT задуман как ИИ, который способен «понять природу вселенной» и быть «политически не ангажированным». Берлинский фотограф Борис Эльдагсен отказывается от приза на престижном конкурсе Sony World Photography Awards 2023: его фотография для конкурса была сгенерирована с помощью искусственного интеллекта, но судьи этого не распознали. Его действие вызвало дискуссию о том, как определять фотографию в эпоху ИИ. Dropbox увольняет 500 сотрудников (16% штата) из-за влияния искусственного интеллекта. В гонку по GenAI включается Amazon с сервисом Bedrock, а Boston Dynamics интегрирует ChatGPT в своих робособак. В России Сбер в ответ на ChatGPT запускает нейросесть GigaChat, которая может поддерживать диалог, писать программный код, создавать тексты и картинки.

Робособаки Boston Dynamics cо встроенным ChatGPT

Май

Adobe внедряет генеративные возможности в Photoshop с помощью Firefly. Пользователи теперь могут создавать изображения с использованием Generative Fill и других инструментов. Проходит конференция Google I/O 2023, на которой компания рассказывает о достижениях: ИИ в Google Workspace, генеративный ИИ-редактор в Google Photo, обновления Bard, новая языковая модель PaLM 2.0, «убийца» GPT-4 под названием Gemini. В России Яндекс добавляет генеративную нейросеть YandexGPT в «Алису».

Июнь

McKinsey выпускает прогноз: GenAI может внести вклад в мировую экономику в размере $2,6 — $4,4 трлн в год. Аналитики ждут автоматизации до половины рабочих задачи между 2030 и 2060 годами. На конференции WWDC 2023 Apple представляет хэдсет Vision Pro. Одна из ключевых особенностей — продвинутая нейротехнология на основе ИИ для предсказания поведения пользователя. Журналисты The Information выясняют планы OpenAI запустить магазин приложений для искусственного интеллекта, где разработчики могли бы продавать свои ИИ-модели, созданные на базе технологий OpenAI. Яндекс запускает функцию пересказа текста и статей с помощью YandexGPT. Сбер представляет Kandinsky — модель генерации изображений по текстовому описанию. А еще в России выходит нейросеть Жириновского.

Нейросеть Яндекса в «Алисе»Источник: Яндекс

Июль

Meta* представляет Llama 2, новое поколение своей open source LLM. VK запускает расшифровку видеосообщений в «Мессенджере» с помощью нейросетей. Anthropic показывает «убийцу» ChatGPT Claude 2.

Август

TikTok позволяет креаторам легко маркировать контент, созданный искусственным интеллектом, — это говорит о пошаговом признании и легализации на платформе сгенерированного контента. Запускается первая социальная сеть для ИИ-контента Ideogram: приложение позволяет создавать и делиться изображениями, созданными с помощью текстовых подсказок. Google тестирует ИИ-инструмент Genesis для создания новостных статей. В индийских СМИ появляются виртуальные ведущие «Lisa» и «Sana».

Сентябрь

OpenAI выпускает важные обновления для ChatGPT, которые расширяют возможности чат-бота. Теперь ChatGPT распознает и взаимодействует с изображениями, понимает речь и отвечает в разговоре, а также умеет искать в интернете актуальную информацию. OpenAI также представляет модель генерации изображений DALLE 3, которая теперь понимает значительно больше нюансов и деталей. Stability AI представляет технологию, которая позволяет создавать короткие аудио с помощью простых текстовых запросов. Яндекс выпускает новую версию своей языковой модели YandexGPT 2.

Октябрь

Canva выпускает Magic Studio — набор ИИ-инструментов для создания визуального контента: редактирование изображений, создание видео, копирайтинг и перевод. Крупнейший фотобанк Shutterstock интегрирует ИИ в свою библиотеку с 700 миллионами изображений, предлагая редактируемые стоковые фотографии. Amazon Ads внедряет ИИ для генерации рекламных изображений. Collins Dictionary называет словом года «искусственный интеллект», а журнал Time выпускает список лучших инноваций 2023 года, в котором фигурирует множество ИИ-устройств и инструментов. Яндекс запускает нейросеть YandexART для генерации изображений и анимации с помощью текста.

Ноябрь

Сэма Альтмана увольняют с поста генерального директора OpenAI. 95% сотрудников OpenAI подписывают открытое письмо в поддержку Альтмана. Тем временем Microsoft, основной инвестор OpenAI, нанимает Альтмана на работу. Затем все договариваются друг с другом, и Альтман возвращается на пост гендиректора OpenAI, а Microsoft получает место в совете директоров компании без права голоса. За пару недель до этих событий OpenAI представляет новые функции на своей первой конференции для разработчиков. Анонсируют GPT Store — платформу, позволяющую пользователям создавать и продавать свои индивидуальные GPT. Компания улучшает языковые модели GPT-4 и GPT-3.5, а также анонсирует более совершенную GPT-4 Turbo. Бывшие сотрудники Apple выпускают Humane Ai Pin — умную брошь с ИИ, которая считается заменой смартфонов. Илон Маск представляет чат-бот Grok, которые отвечает на провокационные вопросы и подходит «людям со всеми политическими взглядами». Выходит номер журнала The New Yorker с обложкой Кристофа Нимана об ИИ в искусстве. В России Сбер выпускает Kandinsky Video — нейросеть для генерации видеороликов. 30 ноября ChatGPT празднует день рождения — чат-боту исполнился год.

AI Pin умеет примерно все, что делает смартфонИсточник: TheVerge

Декабрь

Meta*, IBM, AMD и еще 50 компаний создают альянс для разработки ИИ, чтобы составить конкуренцию закрытым системам генеративного ИИ. Яндекс показывает «Нейростат» — систему аналитики использования генеративных нейросетей. Google выпускает Gemini — самого близкого конкурента GPT-4. Чат-бот Grok Илона Маска становится доступным для пользователей за $16 в месяц. Появляется информация о LLM от Apple под названием Ferret с открытым исходным кодом. В ЕС разрабатывают правила для ИИ. Новая open source модель Mixtral 8x7B от французской компании Mistral AI приближается по качеству ответов к GPT-3.5. В России пытаются запретить поисковую программу OpenAI GPTBot.

Gemini от Google объясняет формулы в математике и физике