В конце 2015 года бизнесмен Илон Маск и инвестор Сэм Альтман основали компанию OpenAI. Илона Маска знают сразу по нескольким проектам — это PayPal, SpaceX и Tesla. А Сэм Альтман известен в более узких кругах как бывший директор фонда Y Combinator, который инвестировал во множество стартапов. Сооснователи поставили цель для OpenAI — разработать искусственный интеллект, который будет помогать людям и развивать современные технологии.
OpenAI позиционируется как некоммерческий проект — сотрудникам и разработчикам не нужно думать о прибыли и их никто не ограничивает.
На старте у проекта OpenAI была небольшая команда из девяти человек. Директором отдела исследований стал Илья Суцкевер, в прошлом он отвечал за искусственный интеллект в Google Brain. Отдел разработки возглавил Грег Брокман — до этого он работал в известном сервисе для онлайн-платежей Stripe. Для запуска основатели привлекли сторонних инвесторов из Amazon, YC Research и других компаний, получилось собрать миллиард долларов.
Правда сам Илон Маск перестал участвовать в делах OpenAI уже в начале 2018 года из-за конфликта интересов. В его компании Tesla тоже работают над искусственным интеллектом для автопилота в электромобилях.
На первых этапах OpenAI только публиковала научные статьи на тему искусственного интеллекта, машинного обучения и нейросетей. Первым значимым продуктом стал анонс OpenAI Gym в середине 2016 года — это открытая платформа для тестирования и сравнения программ машинного обучения. Сервис похож на набор мини-игр, в которые разработчики загружают свои алгоритмы и проверяют их эффективность — боты соревнуются в управлении виртуальным человеком, игре «Понг» и других задачах.
Развивая искусственный интеллект и алгоритмы машинного обучения через игры, OpenAI хочет получить универсальную систему, которая сможет быстро решать другие задачи без дополнительных затрат на обучение. Условно, сначала ИИ выигрывает людей в «Понг» или «Го», а потом сможет заполнять анкеты в интернете или отвечать на вопросы. При этом OpenAI Gym — это полностью открытый проект, исходники сервиса доступны всем на GitHub.
Чтобы перейти от создания ботов для игр к чему-то более сложному, OpenAI прошла множество этапов. Многие помнят OpenAI после победы искусственного интеллекта в игре Dota 2 над профессиональными киберспортсменами, но это только одно из направлений деятельности компании. Другим проектом стала языковая модель OpenAI GPT, которая призвана помочь компьютерам лучше понимать живую речь и анализировать тексты. Также у OpenAI есть и более понятные примеры — роботизированная рука для сборки кубика Рубика на скорость.
С каждым годом алгоритмы OpenAI становятся более сложными и комплексными — вместе с этим растут требования к вычислительной мощности компьютеров. Для решения этой проблемы компания объединилась с Microsoft, о партнерстве объявили в июле 2019 года. OpenAI эта сделка дала не только дополнительный миллиард долларов инвестиций, но и доступ к облачным ресурсам Microsoft Azure для разработки и тестирования искусственного интеллекта. Взамен Microsoft сможет первой получать доступ к технологиям OpenAI, которые можно использовать в других облачных продуктах.
Благодаря партнерству с Microsoft, разработчики OpenAI смогли перейти к реализации новой задачи — создать так называемый AGI (Artificial General Intelligence), на русский язык этот термин переводят как «общий искусственный интеллект». Это масштабная модель, которая умеет выполнять сразу несколько задач и подстраиваться под человека, лучше понимая его запросы. Современные нейросети умеют действовать только в определенных рамках, ограниченных исходными данными и настройками. Например, есть алгоритм для распознавания лиц на фотографиях, который обучается на тысячах снимков, но не может определять примерный возраст людей, если этот параметр специально не вводили при обучении. Для этого и нужен искусственный интеллект нового поколения.
Чтобы масштабировать возможности иксусственного интеллекта, Microsoft и OpenAI начали строить вычислительную платформу, которая справится с таким объемом данных. В результате появился новый облачный суперкомпьютер на базе технологий Azure, который по производительности входит в пятерку самых мощных компьютеров мира в рейтинге TOP500 Supercomputers.
Суперкомпьютер работает на 285 тысячах процессорных ядер, 10 тысячах графических блоков и со скоростью сетевого подключения 400 Гб/с. Вычислительная мощность такого уровня нужна для обработки миллионов текстов, документов, фотографий и другой информации. Его представили в рамках конференции Microsoft Build 2020.
Уже через неделю после анонса суперкомпьютера OpenAI представила третье поколение алгоритма GPT-3 (Generative Pretrained Transformer), который обучили на более чем 500 гигабайтах текста — это в десять раз больше, чем в предыдущей языковой модели. Для понимания масштаба: в систему загрузили всю «Википедию», несколько сотен книг, статей и других источников. Главное отличие этого алгоритма от предыдущих — большой набор задач и понимание сложных запросов. Систему можно попросить написать стихотворение на основе нескольких примеров, и получится новое уникальное произведение. Еще новый алгоритм GPT-3 умеет переводить тексты между несколькими языками, отвечать на вопросы по статьям, решать арифметические задачи и создавать новые тексты. Получается что-то вроде большой и очень сложной программы, которая умеет работать с текстами в разных направлениях.
OpenAI и Microsoft понадобится время, что реализовать идею искусственного интеллекта нового уровня. Только компании стараются не раскрывать детали проекта — это долгосрочная разработка, которая требует длительного обучения ИИ.
К тому же Microsoft продвигает ответственный подход к машинному обучению. В рамках конференции Build 2020 представили «Инструменты для ответственного использования машинного обучения», который стали частью платформы Azure Machine Learning — они помогут разработчикам лучше понимать механизмы работы искусственного интеллекта и избежать возможных этических проблем на этапе проектирования модели. И дополнительно нужно позаботиться о конфиденциальности, чтобы для искусственного интеллекта и машинного обучения использовали только открытые данные.
Это тоже интересно: