В России запустили суперкомпьютер с производительностью 55 триллионов операций в секунду

В Хабаровском Вычислительном центре ДВО РАН (ВЦ ДВО РАН) при поддержке Федерального агентства научных организаций запустили в работу уникальный вычислительный комплекс. Система прежде всего ориентирована на решение задач в области искусственного интеллекта и машинного обучения. Hi-Tech Mail.ru удалось узнать о новом суперкомпьютере все возможные подробности.
Григорий Матюхин

Мощь на службе ученых

Фото: ВЦ ДВО РАН
Фото: ВЦ ДВО РАН

В основу новой мощнейшей вычислительной машины легла разработанная сотрудниками Центра гибридная архитектура с пиковой производительностью 55 триллионов операций в секунду. Кластер состоит из 5 вычислительных узлов. Такая мощь будет направлена на исследования и разработку алгоритмов компьютерного зрения и обработки изображений.

За год на модернизацию шести российских суперкомпьютеров было выделено 300 млн рублей

Алексей Сорокин, руководитель ЦКП «Центр данных ДВО РАН» рассказал Hi-Tech Mail.ru, что в 2016 году Фе­деральное агентство научных организаций (ФАНО России) выделило на модернизацию шести суперкомпьютерных центров подведомственных науч­ных организаций 300 млн рублей. Сами узлы со специализированным коммутатором обошлись в 20 млн рублей. Это стало возможным благодаря целевой субсидии от Федерального агентства научных организаций.

Что будет исследоваться?

Собеседник Hi-Tech Mail.ru рассказал, что его команда прошла этап тестовой эксплуатации вычислительной машины вместе с сотрудникам Института водных проблем РАН (г. Москва), Института морской геологии и геофизики ДВО РАН (г. Южно-Сахалинск) и Института материаловедения ХНЦ ДВО РАН (г. Хабаровск). На реальных задачах они оценивали эффективность архитектуры и отрабатывали оптимальные режимы работы нового кластера, а пользователи получили возможность провести исследовательские расчеты. Ученые из ИВП РАН ведут проекты, связанные со сверхкраткосрочным прогнозом движения полей осадков, в которых используется библиотека машинного обучения tensorflow, разрабатываемая в Google. На Сахалине с использованием авторских алгоритмов ведутся расчеты распространения волн цунами от сейсмических источников в глобальном масштабе. Ученые довольны скоростью расчетов.

Заявки уже начали поступать в ВЦ ДВО РАН, где они рассматриваются и принимаются решения о предоставлении доступа к ресурсам системы. Предпочтения отдаются тем проектам, которые получат реальный прирост в производительности по сравнению с кластерами на базе X86 архитектуры без графических ускорителей.

Технические характеристики (на один узел)

  • 2 десятиядерных процессора IBM POWER8 (2,86 ГГц) (всего 160 потоков);
  • память ECC, 256 ГБ;
  • 2 х 1 ТБ 2.5" 7K RPM SATA HDD;
  • 2 x NVIDIA Tesla P100 GPU, NVLink.
  • Cети передачи данных: EDR InfiniBand.
  • Управляющая сеть: Gigabit Ethernet.
  • Производительность кластера (ТФЛОПС): 55,84 (пиковая), 40,39 (Linpack)

Производительность обеспечивается графическими ускорителями NVIDIA Tesla P100 на архитектуре Pascal, а обмен данными между центральным процессором POWER8 и графическим процессором осуществляется через высокоскоростной интерфейс NVLink с пропускной способностью до 80 Гбайт в секунду.

Фото: NVIDIA
Фото: NVIDIA

Tesla P100 — один из самых передовых графических ускорителей для датацентров с интерфейсом NVIDIA NVLink, который позволяет создавать высокоскоростные вычислительные узлы, значительно повышая производительность высокомасштабируемых приложений. Архитектура Pascal обеспечивает максимально высокую производительность для решения задач в области HPC и сверхмасштабирования.

Как сказал Алексей Сорокин Hi-Tech Mail.ru, что при запуске вычислительного кластера есть два важных этапа работ. Первый – это сама поставка и базовая проверка оборудования. Второй этап – установка, отладка системного (операционные системы, планировщик, библиотеки и т.п.) и прикладного программного обеспечения. Задачи первого этапа были выполнены в срок, в рамках контрактных обязательств весной, по второй задаче основная работа была выполнена в начале лета.

У пакетов прикладных программ всегда есть особенности, которые нужно учитывать при их установке и дальнейшей эксплуатации, поэтому эта работа ведется постоянно.

Более того, те, кто подает заявки на исследование при помощи ресурсов суперкомпьютера, могут пользоваться как готовыми математическими библиотеками, так и своими авторскими.

Партнерство с IBM и NVIDIA

Фото: ВЦ ДВО РАН
Фото: ВЦ ДВО РАН

Директор ВЦ ДВО РАН Сергей Смагин уверен, что новое оборудование откроет новые направления исследований для всего института. Для этого Центр подписал соглашения о сотрудничестве с IBM и NVIDIA согласно стандартам консорциума OpenPOWER. Совместно с гигантами индустрии Центр планирует «минимизировать преграды для ученых при использовании гибридных вычислительных систем и таких технологий, как машинное обучение, искусственный интеллект и многое другое».

В научном сообществе Дальнего Востока уверены, что разработка архитектур обработки больших данных, машинного обучения и искусственного интеллекта соответствует приоритетным направлениям Стратегии научно-технологического развития Российской Федерации и курсу руководства страны.

Ученые рассказали Hi-Tech Mail.ru, что недавно подали заявку на включение в рейтинг. Попадут они в него или нет будет ясно этой осенью.

Читайте также о другом российском суперкомпьютере под названием «Ломоносов» из ТОП-50, который установлен в Московском Государственном Университете.