ChatGPT забыл Гарри Поттера и ест много электричества. ИИ-дайджест недели

С помощью Гарри Поттера ученые научили ChatGPT «забывать» информацию, технологический стартап переворачивает индустрию озвучки кино, а Google дает всем «зеленый свет».

Жгут электричество как целая страна

Исследователь из Нидерландов Алекс дэ Врие (Alex de Vrie) предупреждает, что быстрое развитие нейросетей параллельно ведет к многократному росту потребления электроэнергии. Особенно большая нагрузка на электросети происходит, когда ИИ находится в стадии генерации контента.

По словам ученого, если Google встроит ChatGPT во все свои поисковые системы, то потребление электричества искуственным интеллектом за год сравняется с объемом электроэнергии, которую тратит целая Ирландия.

Ожидается, что к 2027 году лидер рынка Nvidia поставит до 1,5 млн. серверов для ИИ. В итоге уровень годового энергопотребления нейросетями сравняется с показателями таких стран, как Аргентина, Нидерланды или Швеция.

Всем — зеленый свет

Новый проект от Google с помощью искусственного интеллекта помогает делать светофоры более эффективными и менее раздражающими водителей.

Компания анализирует данные из своего приложения Google Maps и советует властям городов, как можно скорректировать время работы светофоров, чтобы сократить время ожидания на дорогах и уменьшить количество вредных выбросов от автомобилей. IT-гигант утверждает, что проект помог миллионам водителей не тратить лишнее время на ожидание зеленого света. Также, по подсчетам Google, количество выбрасываемого углекислого газа от 30 млн автомобилей в месяц уменьшилось на 30%.

Проект так и назван — «Зеленый свет». Сейчас он реализован в четырех городах мира: Сиэттле (США), Джакарте (Индонезия), Гамбурге (Германия) и в Рио-де-Жанейро (Бразилия).

Озвучка на любом языке

Стартап ElevenLabs обещает полностью перевернуть индустрию озвучки фильмов. Компания готовит универсальный искусственный интеллект, который будет создавать дубляж кино за считанные минуты.

Профессиональные актеры озвучания и переводчики больше не понадобятся. ИИ полностью скопирует голос оригинального актера, сохранит эмоции и интонации голоса и создаст адаптированный перевод.

AI dubbing demo of ElevenLabs

ElevenLabs специализируется на технологиях копирования голоса и синхронного перевода. Сейчас ее продукты доступны на 30 языках, среди них хинди, португальский, японский, польский, арабский и русский.

Разработку компании пользователи Рунета уже вовсю используют для перевода и озвучки российских мемов.

Интерфейс ElevenLabs
Интерфейс ElevenLabsИсточник: ElevenLabs

Гарри Поттер учит ИИ

Нейросети научат игнорировать авторский контент. Исследователи из Microsoft разработали метод, позволяющий заставить большие языковые модели (LLM) по типу ChatGPT от OpenAI забывать специфическую информацию. Например, защищенные авторским правом материалы из серии фильмов о Гарри Поттере.

Традиционные модели машинного обучения в основном направлены на пополнение или закрепление знаний ИИ путем базовой тонкой настройки, но не предусматривают простых механизмов «забывания» или «отмены» знаний.

Однако ученым из Microsoft удалось решить эту проблему с помощью специального метода, состоящего из трех шагов. Для этого и были использованы произведения о мальчике-волшебнике.

Сначала подопытные нейросети — ChatGPT и Lliama — были обучены на целевых данных (книгах о Гарри Поттере), чтобы они могли определять главные и основные слова и фразы, которые связаны с этими книгами. Это делалось путем сравнения предсказаний нейросетей с предсказаниями базовой модели. Под этим обычно понимают последующую генерацию слов. Если простыми словами то, когда нейросеть генерирует текст, на самом деле она предсказывает каждое последующее в нем слово, используя теорию вероятности. Базовая модель (baseline model) — это модель машинного обучения, которая используется в начале процесса для определения того, какие слова, фразы и образы связаны с определенными данными или контекстом. Она служит как отправная точка для дальнейшего улучшения нейросети.

Затем уникальные выражения и лексика, характерные только для произведений о Гарри Поттере, заменили на более общие аналоги-синонимы. Затем были сгенерированы альтернативные предсказания, которые приближают модель к состоянию, когда она не была обучена на данных о Гарри Поттере.

После этого базовую модель доработали, используя эти альтернативные предсказания. Это позволило практически «стереть» оригинальный текст о Гарри Поттере из памяти нейросети, когда ей давали контекст или вопросы для ответа.