Суперкомпьютеры входят в нашу жизнь

Не так давно высокопроизводительные вычисления преодолели планку производительности в один петафлопс (квадриллион, или 1015 операций с плавающей запятой в секунду). Представляем состояние дел с суперкомпьютерами в России.
High Performance Computing, HPC
) определяет ситуацию на рынке персональных систем в следующем десятилетии.


Ведущие страны мира используют и совершенствуют возможности суперкомпьютеров для решения особо сложных задач науки, образования, экономики, для формирования долгосрочных прогнозов, в том числе в области метеорологии и экологии, с целью обеспечения национальной безопасности.

В последнее десятилетие произошли заметные сдвиги в организации научного процесса: вследствие широкого внедрения вычислительной техники заметно усилилось направление компьютерного моделирования и численного эксперимента, что позволяет значительно повысить эффективность процессов научного и технологического поиска. Стало возможным моделировать сложные биологические структуры, имитировать взаимодействия систем, состоящих из колоссального количества микро-, нанообъектов, молекул и атомов, анализировать возможные способы их взаимодействия и результаты таковых, прогнозировать глобальные атмосферные явления и т.д.

Суперкомпьютеры сегодня – это кластерные серверы с несколькими десятками, сотнями и даже тысячами процессоров, работа которых строится на одновременном выполнении задач, специально разделенных между собой в общей структуре исполнения программ, поскольку именно это необходимо для повышения быстродействия при получении итогового результата.


Такой способ организации называется параллельными вычислениями. Эта отрасль программирования подразумевает разделение задач (распараллеливание) на множество потоков. Сегодня они актуальны для суперкомпьютеров из списка ТОР500, но уже в недалеком будущем станут рядовым делом для пользователей настольных компьютеров.

В последние годы Правительство России уделяет большое внимание наукоемким технологиям и резервирует значительные средства на развитие нанотехнологий, однако это возможно лишь при максимально широком использовании суперкомпьютеров. В этой связи Россия стремится следовать в русле общих мировых тенденций, наращивая свои ресурсы высокопроизводительных вычислений.

По мнению Стива Павловского, генерального директора по технологиям и научного руководителя Intel Digital Enterprise Group, появления компьютеров с производительностью в секстиллион операций в секунду (это тысячи петафлопс) можно ожидать уже к 2029 году.

Список 500 самых мощных суперкомпьютеров мира два раза в год составляют и публикуют эксперты Джек Донгарра (Jack Dongarra) из университета Теннесси, Эрих Штромайер (Erich Strohmaier) и Хорст Саймон (Horst Simon) из Национального вычислительного центра энергетических исследований (NERSC)/Национальной лаборатории им. Лоуренса в Беркли и Ханс Мойер (Hans Meuer) из Мангеймского университета (Германия). С полным списком можно ознакомиться на сайте www.top500.org. В его очередную редакцию в июне 2008 года попали восемь российских суперкомпьютеров (напомним, что в ноябре 2006 года в нем присутствовал лишь один, а в июне 2007 года – четыре).

Профессор и писатель Стив Чен (США) попытался рассчитать, какая производительность необходима для решения различных задач будущего. По его мнению, аэродинамике хватит производительности в несколько петафлопс, молекулярной динамике – 20 петафлопс, а космологии – порядка 10 эксафлопс. Квантовая химия и молекулярное моделирование потребуют еще более мощных ресурсов.

За комментариями по поводу положения дел с высокопроизводительными вычислениями (НРС) в России мы обратились к Николаю Местеру, директору российского представительства Intel по корпоративным проектам.

Два года назад весь мир перешел на многоядерные CPU, и это кардинальным образом поменяло ситуацию с НРС – до этого рост производительности суперкомпьютеров происходил почти линейно. Но с появлением четырехъядерных процессоров достижение производительности в один терафлоп существенно упростилось: сегодня это можно сделать с помощью одной «корзины» блейд-серверов, что доступно не только крупным, но и средним предприятиям. Однако экономика оказалась неготовой к тому, чтобы эффективно использовать столь высокую вычислительную мощность. К тому же появилась возможность строить системы, обладающие тысячами и десятками тысяч ядер, и возник вопрос о направлении дальнейшего движения, поскольку ПО стало несостоятельным в решении задач распараллеливания вычислений на столь большое количество процессоров. Это одна из главных проблем, возникшая в связи с появлением суперкомпьютеров с производительностью 0,5-1 петафлоп.

Упомянутая проблема касается ПО всех уровней. Операционные системы должны уметь работать с десятками тысяч ядер, поэтому встал вопрос об архитектурах суперкомпьютеров – программы просто не успевают адаптироваться к скачку производительности. Возникает сомнения: а следует ли продолжать «гонку за петафлопами» или лучше ограничиться системами среднего размера?

В России кластеростроение находится на высоком уровне: строятся и успешно работают системы на 50-100 терафлопс; мы научились эксплуатировать очень мощные системы и предлагаем их ученым для решения разных задач. Но пока в стране есть лишь три HPC-центра: Межведомственный суперкомпьютерный центр (около 100 терафлопс), СКИФ-МГУ (60 терафлопс) и Курчатовский научный центр (35 терафлопс).

Важно отметить, что в России высокопроизводительные вычисления развиваются очень активно. Именно в этой отрасли наша страна может стать одним из мировых лидеров. Но для этого требуются серьезные усилия и финансовые вложения и, прежде всего, участие государства. Ни одна коммерческая структура не способна на координацию столь масштабных действий. Очевидно, активное участие в этом должно принимать научное сообщество, следует разработать специальную программу по коммерциализации результатов НРС. Я неслучайно говорю о необходимости участия государства в развитии НРС, так как создание и организация эксплуатации современного кластера – это очень серьезный проект.

Активно работавшая в 2007 году государственная программа «Образование» привела к появлению целого ряда установок, расположенных не только в Москве. Среди них суперкомпьютеры в УГАТУ (Уфа), Новосибирске, Красноярске и Томске (первая реализация по программе СКИФ).

Важнейшей практической задачей является внедрение суперкомпьютеров в индустрии. В августе 2008 года объявлено, что НПО «Сатурн» завершило проект по созданию суперкомпьютерного центра, где был запущен в эксплуатацию самый высокопроизводительный суперкомпьютер в промышленности России и СНГ мощностью 14,3 терафлопс на базе 1344 четырехъядерных CPU Intel Xeon.

Широко используются высокопроизводительные вычисления в нефтяной и газовой отрасли, правда там для решения самых разных задач используются кластеры невысокой по нынешним меркам производительности – 2-4 терафлопс. К сожалению, в России неактивно ведется разведка новых месторождений, а значит и нет острой потребности в более производительных компьютерах. Основная идея использования мощных вычислительных средств в промышленности – это сокращение издержек при добыче ископаемых, поэтому в современных условиях мирового экономического кризиса они могут стать средством выживания.

Кластер мощностью в 5 терафлопс построен в ФГУП ММПП «Салют», два новых создаются и будут запущены в эксплуатацию в самое ближайшее время в «Росгидромете». Один из них – это крупнейший в России кластер с общей памятью производительностью 11 терафлопс, второй – стандартный кластер на Intel Xeon с 16 терафлопс.

Для НРС есть и еще одна очень интересная сфера применения – нанотехнологии. Для того чтобы завтра можно было создавать и использовать новые материалы и продукты на их основе, сегодня надо все основательно просчитать, для чего просто необходимые мощные вычислительные ресурсы. Кстати, в этой области в мире существует достаточно много моделей и открытого ПО, которое можно с успехом использовать. Корпорация Intel активно сотрудничает с исследовательскими организациями, которые разрабатывают схемы моделирования наноструктур с заданными свойствами, и этот опыт вполне можно использовать в России.

Я с такой уверенностью говорю о том, что без использования НРС в нанотехнологиях не обойтись, потому что сама корпорация Intel по сути дела занимается нанотехнологиями – изготовлением процессоров, детали транзисторов в которых имеют размеры несколько нанометров, а число этих транзисторов в некоторых моделях превышает миллиард штук.

Иной перспективной областью для использования НРС является создание новых лекарственных препаратов. Высокопроизводительные вычисления позволяют заменить обычный скрининг (проверку очередного нового химического соединения на его пригодность для лечения тех или иных заболеваний) целенаправленным моделированием нужных молекул веществ, которые в состоянии оказывать целенаправленное терапевтическое воздействие на болезнь и ее симптомы. И даже более того: HPC ускоряют и облегчают выявление причин человеческих недугов.

Более подробно об использовании НРС в научных исследованиях и разработках рассказывает Николай Суетин.

Зачастую люди, далекие от развития современных технологий, задают вопрос: А зачем, собственно, нужны столь мощные суперкомпьютеры? Ответы на этот и другие подобные вопросы можно найти в недавно вышедшем IBM Journal of Research and Development (Volume 52, Number 1/2, 2008), который целиком посвящен различным аспектам использования массово параллельных высокопроизводительных вычислений. Прежде всего, это области квантовой химии, квантовой молекулярной динамики и все что с ними связано, начиная от разработки новых лекарственных препаратов до моделирования ферментов и клеточных структур. Сейчас с помощью HPC изучаются механизмы устойчивости различных вирусов к лечебным воздействием, выявляются причины возникновения аллергических реакций и аутоиммунных заболеваний.

До последнего времени поиск подходящего лекарственного препарата выглядел как экспериментальный отбор (методом проб и ошибок) пригодных соединений из огромного количества синтезированных молекул, которые, как планировали исследователи, должны обладать терапевтическим эффектом. Однако если сократить это количество производимых в пробирке веществ хотя бы в несколько раз, можно сэкономить огромные средства. Именно это и позволяют делать суперкомпьютеры. Моделирование дает возможность отбраковать те структуры, которые теоретически заведомо не подходит для обеспечения нужных химических превращений, причем еще до начала экспериментальных испытаний.

Благодаря суперкомпьютерам стало понятным, что часто учет влияния, казалось бы, малозначимых факторов способен в корне изменить решение задач, скажем, в метеорологии. Например, выяснилось, что «озоновые дыры» над полюсами возникают в результате воздействия некоторых фреонов на поверхности микрочастиц льда с молекулами озона. В результате были предприняты действия по запрету производства и снижению выброса этих веществ.


Другой важной областью использования петафлопных вычислений является исследование изменения погоды и климата. Для этого требуется моделировать взаимосвязанное поведения атмосферы, воды океанов, льдов с учетом всевозможных процессов тепло- и массообмена. Очевидно, что чем более полны эти модели – тем более точны прогнозы, полученные на их основании. Однако из-за слишком большой сложности учесть все процессы просто невозможно и приходилось отбрасывать детали, которые, как казалось ранее, могут и не являться существенными для формирования моделей картины атмосферных явлений.




После того, как станут ясны электрофизические характеристики самого транзистора, возникает следующая задача – моделирование поведения самого процессора. Напомним, что сегодня он состоит из миллиардов логических элементов, причем каждый полевой транзистор моделируется эквивалентной схемой (около 20 элементов). Таким образом, для описания электрических процессов, протекающих при работе чипа, нам придется учитывать работу 20 млрд. таких элементов, а это невозможно реализовать без использования мощных параллельных вычислительных систем.




После проектирования встает следующая задача – производство. Практически все технологические процессы первоначально моделируются и оптимизируются для создания заданной структуры того элемента микросхемотехники, который мы собираемся изготавливать. Одним из критических процессов современной полупроводниковой технологии, для разработки которых требуются суперкомпьютерные мощности, является литография. Это связано с тем, что даже для 32-нанометрового технологического процесса все еще используется фотолитографический процесс на длине волны 193 нм. Отметим, что это существенно превышает классический предел оптического разрешения. Разработка маски, которая позволяет создавать мелкие структуры на чипе в результате сложных эффектов дифракции и интерференции лучей, проходящих сквозь ее различные элементы, требует огромных вычислительных затрат даже на самых современных кластерах.




В НПО «Сатурн», о котором говорил Николай Местер, моделируется процесс работы турбины современного реактивного самолета для выявления последствий того, например, как может повлиять на работу двигателя попадания в него птицы. А ведь минимизировать отрицательные последствия такой ситуации – это спасение жизней членов экипажа, пассажиров и самого воздушного судна.

Одна из серьезных проблем, о которой уже упоминалось, – неготовность современного ПО использовать нарастающие возможности НРС. Но проблема еще шире: не только программисты, но и многие ученые и разработчики в промышленности просто не знают, какие возможности предоставляют им современные вычислительные системы, насколько они сейчас доступны, как можно использовать предоставленные ими возможности в конкретных делах.