Современные суперкомпьютеры — это мощные машины, способные выполнять квадриллионы вычислений в секунду. Их производительность измеряется в арифметических операциях с плавающей запятой (FLOP). Чем больше операций за секунду, тем мощнее суперкомпьютер. В отличие от обычных компьютеров с 32 ядрами, суперкомпьютеры могут иметь тысячи и даже миллионы ядер.
Основной показатель их мощности — скорость выполнения операций, измеряемая в терафлопсах (триллионы операций) и петафлопсах (квадриллионы операций). Сегодняшние топовые системы из рейтинга Топ 500 работают на скорости от одного петафлопса и выше. Лидерами становятся экзафлопсные машины, выполняющие около квинтиллиона операций в секунду (10^18 FLOP). Пока лишь несколько систем достигли такой производительности, так что Jupiter после запуска всех кластеров сможет возглавить рейтинг суперкомпьютеров.
К осени 2024 пятерка лидеров Топ 500 суперкомпьютеров выглядит следующим образом.
Пятое место: LUMI (Финляндия)
LUMI — один из самых мощных суперкомпьютеров в Европе и мире, расположенный в городе Каяани, Финляндия. Его название расшифровывается как Large Unified Modern Infrastructure и переводится с финского как «снег». LUMI — самый мощный в 2024 году суперкомпьютер Европы. При мощности около 380 петафлопсов он также выделяется высокой энергоэффективностью, соответствуя требованиям к «зеленым» суперкомпьютерам.
LUMI был официально запущен в эксплуатацию в июне 2022 года. Система была спроектирована при участии компаний Hewlett Packard Enterprise (HPE) и AMD. Финансирование и координацию проекта обеспечила Европейская инициатива EuroHPC Joint Undertaking, в партнерстве с консорциумом из десяти европейских стран. LUMI располагается в здании бывшей бумажной фабрики, которую переоборудовали под суперкомпьютерный центр.
Финский суперкомпьютер построен на базе процессоров AMD EPYC и графических ускорителей AMD Instinct MI250X, что позволяет достигать высокой производительности при низком потреблении энергии. LUMI считается одним из самых экологичных суперкомпьютеров благодаря использованию возобновляемых источников энергии.
Он работает на 100% за счет энергии, вырабатываемой гидроэлектростанциями, а холодный финский климат обеспечивает нужный уровень охлаждения. Система спроектирована таким образом, чтобы минимизировать углеродный след. Тепло, выделяемое LUMI, используется для обогрева близлежащих зданий, что позволяет экономить до 12 000 МВт·ч энергии в год.
Половина мощностей LUMI принадлежит совместному предприятию EuroHPC, 20% из которых зарезервированы для использования в промышленности и малом и среднем бизнесе. Другая половина распределяется между 10 странами (Финляндией, Бельгией, Чехией, Данией, Норвегией, Польшей, Швецией, Швейцарией, Эстонией и Исландией) в соответствии с финансовым вкладом каждой страны.
Четвертое место: Fugaku (Япония)
Fugaku — это один из самых мощных суперкомпьютеров в мире, разработанный для широкого спектра научных и промышленных исследований. Он не использует графические ускорители, полагаясь только на центральные процессоры с высокой производительностью. Он долгое время лидировал в рейтинге, но уступил лидерам из-за отсутствия GPU-ускорителей. Fugaku базируется на процессорах Fujitsu A64FX и достигает 442 петафлопсов.
Название «Fugaku» является альтернативным названием горы Фудзи, символа Японии, что подчеркивает его статус флагманского проекта. Разработка системы в сотрудничестве между японским исследовательским институтом RIKEN и компанией Fujitsu началась в 2014 году и была завершена в начале 2021 года, через 7 лет. В тот же день суперкомпьютер Fugaku стал доступен для широкого круга исследователей из академических и промышленных областей.
В первые же месяцы своего существования Fugaku был использован для реализации новой инициативы — модели искусственного интеллекта, которая прогнозирует наводнения и цунами в реальном времени. Суперкомпьютер смоделировал серию из 20 000 цунами с различными формами волн и их последствиями на суше. Это моделирование помогает людям лучше подготовиться к чрезвычайным ситуациям.
Fugaku активно использовался для моделирования распространения вируса COVID-19, помогая ученым разрабатывать эффективные стратегии социального дистанцирования и выявлять потенциальные препараты для лечения. Также с помощью этой машины моделировали белки и другие биомолекулы для разработки новых лекарств в области онкологии.
Fugaku способен достигать 1 экзафлопс (один квинтиллион операций в секунду) при вычислениях с пониженной точностью, что особенно важно для задач, связанных с искусственным интеллектом и анализом больших данных.
Третье место: Eagle (США)
Microsoft Azure Eagle — суперкомпьютер, который сильно отличается от других устройств. Все дело в том, что он… облачный.
Компания Microsoft развернула суперкомпьютер мощностью 561 петафлопса в своем облаке Azure, объединив стандартные модули в единую систему, включающую более миллиона ядер. Разработку Eagle команда Microsoft вела в партнерстве с NVIDIA, используя 14,400 графических процессоров NVIDIA H100 и процессоры Intel Xeon Sapphire Rapids. Этот суперкомпьютер специально оптимизирован для искусственного интеллекта и высокопроизводительных вычислительных задач, таких, как обучение больших языковых моделей и другие ресурсоемкие AI-приложения.
Eagle активно используется для ускорения исследований в области машинного обучения, включая обучение моделей для OpenAI, таких, как GPT-4. Этот суперкомпьютер также играет важную роль в разработке новых AI-решений для Microsoft и ее клиентов, помогая быстро запускать сложные модели и снижать время обучения. Eagle полностью развернут в облаке Microsoft Azure, что позволяет компаниям быстро масштабировать свои AI-проекты, используя мощности этого суперкомпьютера по запросу.
Поскольку этот суперкомпьютер запущен меньше года назад, он не успел проявить себя в сколько-нибудь значимых исследований. Однако Eagle имеет огромный потенциал, поскольку облачная архитектура позволяет ему масштабироваться дальше.
Второе место: Aurora (США)
Суперкомпьютер Aurora, созданный в США на базе Argonne National Laboratory, является одним из самых мощных суперкомпьютеров нового поколения, рассчитанных на выполнение экзафлопсных вычислений. Первоначально его запуск планировался на 2018 год, но из-за изменений в спецификациях и технических трудностей с масштабированием проект был отложен и официально запущен в 2023 году.
Aurora разработан при поддержке компаний Intel и Hewlett Packard Enterprise (HPE). Перед полноценным запуском Aurora, ученые тестировали системы на миниатюрной версии — Sunspot, которая использовала ту же архитектуру для предварительных исследований.
За работу Aurora отвечают 63 744 процессора Intel Data Center GPU Max серии Ponte Vecchio и 21 248 процессоров Intel Xeon CPU Max серии Sapphire Rapids. Суперкомпьютер занимает пространство размером с два баскетбольных поля и включает 166 стоек, каждая из которых содержит до 64 вычислительных узлов.
Сейчас Aurora обеспечивает порядка 1 экзафлопса с возможностью увеличения в будущем. Aurora показала производительность в 1,012 экзафлопса в классических задачах, а в задачах ИИ показатель составил 10,6 экзафлопса, что сделало Aurora самым мощным суперкомпьютером в этой сфере.
На базе Aurora уже запущены проекты в областях ядерного синтеза и моделирования климата, поиска новых материалов и разработки лекарств. Также суперкомпьютер задействовали для анализа данных из токамаков с целью прогнозирования сбоев и предотвращения аварийных ситуаций в системах ядерного синтеза.
Первое место: Frontier (США)
Hewlett Packard Enterprise Frontier, созданный на базе Oak Ridge National Lab, — первый экзафлопсный суперкомпьютер в мире. Он оснащен жидкостным охлаждением, что обеспечивает в 5 раз большую тепловую емкость и эффективность по сравнению с системами на воздушном охлаждении. Помимо производительности, Frontier занимает первое место в рейтинге Green500, который оценивает энергоэффективность суперкомпьютеров. Он достигает 52,23 гигафлопса на ватт, что делает его одним из самых экологичных мощных компьютеров в мире.
Frontier был разработан и построен при поддержке компаний Hewlett Packard Enterprise (HPE) и AMD в рамках проекта Министерства энергетики США. Он основан на архитектуре HPE Cray EX и использует процессоры AMD EPYC и графические процессоры AMD Instinct. Суперкомпьютер включает в себя 606 208 процессорных ядер и 8 335 360 графических ядер. После полного развертывания системы стоимость машины составила $600 млн.
В конце 2022 года суперкомпьютер находился на стадии тестирования и испытывал регулярные сбои при выполнении ресурсоемких задач, некоторые из которых были связаны с графическими ускорителями AMD. Лишь в 2023 году удалось стабилизировать систему.
Frontier предназначен для использования учеными, например, в моделировании различных материалов для ядерной энергетики на атомном уровне, включая материалы для токамаков. Например, он помог ученым создать крупнейшую в мире молекулярную симуляцию, включающую более 466 миллиардов атомов, что в 400 раз больше, чем предыдущая модель.
После ввода в эксплуатацию всех систем суперкомпьютера Jupiter нынешний лидер Frontier может оказаться на второй строчке. К чему приведет эта борьба за лидерство, покажет время.