Суперкомпьютер: Прогресс

Соображения, заставляющие строить суперкомпьютеры, пугающе напоминают логику, которая двигала гонкой вооружений. Нам нужны все большие компьютерные мощности, чтобы наши конкуренты не использовали против нас свое технологическое превосходство.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Крис Маррокин залез по пояс в открытый на полу люк. Этот высокий парень среднего телосложения сейчас выглядит коротышкой, а его рубашка раздута до шварценеггеровского объема вырывающимся из люка прохладным ветром. Сжимая в руках дюймовый шланг, он пытается объяснить мне устройство системы жидкостного охлаждения в суперкомпьютерах IBM следующего поколения, однако из-за ревущего ветра я почти ничего не слышу. Мы находимся на заводе IBM в Рочестере, штат Миннесота, в экспериментальном цеху. Здесь инженеры компании собирают и испытывают суперкомпьютеры Blue Gene. Воздушный поток, который сейчас раздувает рубашку Маррокина, должен охлаждать небольшую, собранную всего на четырех стойках систему Blue Gene/P. Ее производительность — 13,9 терафлопа в пересчете на одну стойку. А вот шланг, который Маррокин держит в руках, — часть куда более продвинутой системы охлаждения. Через него идет деионизированная вода с бензотриазолом в качестве антикоррозионной добавки и небольшой дозой антисептика, и этот шланг тянется к прототипу сверхмощной новинки — компьютеру Blue Gene/Q. Стойка Blue Gene/Q установлена как бы на приподнятой трибуне и обеспечена собственной системой охлаждения — это 250 м медных трубок с контрольными клапанами, легкосъемными резиновыми шлангами и электронным монитором, который следит за скоростью потока, давлением и точкой росы. Если что-то в системе пойдет наперекосяк, она должна автоматически отключиться.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Впрочем, в разряд наивысших достижений современной техники этот аппарат попал не из-за своей весьма сложной системы охлаждения, а благодаря неслыханной вычислительной мощности — в каждой стойке здесь содержится 1024 процессорных чипа, и в каждом таком микропроцессоре имеется по 16 ядер. Умножив, получим 16384 — это общее число действующих процессоров, которые, работая совместно, выдают производительность 209 терафлопов (это в 15 раз больше, чем у компьютера Blue Gene/P). В будущем году 96 комплектов Blue Gene/Q отправятся в Калифорнию, в Национальную лабораторию им. Лоуренса в Ливерморе (LLNL), прямо в руки к Брюсу Гудвину. Будучи включены в единую сеть, эти 96 стоек превратятся в самый мощный компьютер мира. Супермашина сможет предсказывать пути движения ураганов, расшифровывать генные цепочки и вести анализ топографии океанского дна в поисках нефтяных месторождений. Правда, у Гудвина для нее уготовлена в основном другая работа — его интересуют ядерные взрывы.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Раньше Гудвин подрывал ядерные заряды старым дедовским способом. С 1983 по 1991 год он разработал и провел пять испытаний ядерного оружия в Неваде на испытательном полигоне министерства энергетики. Вместе с коллегами он бурил колодец глубиной 600 м, укладывал боеголовку вместе с измерительным оборудованием в стальной контейнер высотой с 10-этажный дом и весом в 500 т и спускал этот контейнер на дно колодца. Потом всем оставалось только отбежать подальше, скрестить пальцы и нажать на кнопку. «Когда сидишь в пультовом бункере за 16 км от эпицентра, чувствуешь себя как при землетрясении магнитудой 5 — 6 баллов», — рассказывает Гудвин.

В октябре 1992 года все переменилось — президент Джордж Буш объявил мораторий на все виды ядерных испытаний. Этот акт предшествовал «Всестороннему договору 1996 года о запрете ядерных испытаний». С этого момента, если у страны возникала потребность испытать какую-либо боеголовку в своем многотысячном арсенале, она могла обратиться только к компьютерному моделированию. Таким образом, потребность в мощных компьютерах вышла в число национальных приоритетов.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Понятие «суперкомпьютер» существует почти так же долго, как и само представление о компьютере, но этот термин вошел в оборот только в 1976 году, когда Сеймур Крей построил аппарат Cray-1. Он обошелся в $8,8 млн ($35 млн по нынешнему курсу) и работал со скоростью 160 мегафлопов. Да уж! Современный ПК раз в 50 превосходит по быстродействию тогдашний Cray. Приставка «супер» в этом контексте стала настолько расплывчатой, что многие компьютерщики теперь вообще избегают термина «суперкомпьютер» и называют такие машины просто «высокопроизводительными компьютерами» (High-Performance Computers, HPC). Чтобы внести хоть немного ясности в этот вопрос, с 1993 года частная группа Top500 начала два раза в год публиковать список из 500 самых мощных компьютеров мира.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Список Top500 публикуется уже 18 лет, и в течение 17 из них первые места делились между американскими и японскими машинами. Но вот пришел 2010 год, и Китай объявил претензию на первое место, представив аппарат Tianhe-1A мощностью 2,6 петафлопа. Обычно компьютерные специалисты, разрабатывающие и воплощающие эти технические решения, служат в транснациональных компаниях, а потому не торопятся объявлять о своих достижениях как о поводе для национальной гордости. Тем не менее суперкомпьютер стал символом технического уровня государства. Теперь космическая гонка как бы продолжилась, но уже в форме состязаний на поприще транзисторных технологий. В нынешних гонках лидеры и догоняющие поминутно меняются местами. Не прошло и восьми месяцев, как Япония снова обошла Китай, продемонстрировав в июне 2011 года K Computer мощностью 8 петафлопов. В августе китайцы ответили публикацией своей «дорожной карты», ведущей к компьютерным технологиям уровня exascale (это значит повышение быстродействия еще на три порядка — от «пета» до «экза»). В течение ближайших 10 лет обещано 125-кратное увеличение компьютерного быстродействия. В этом контексте Tianhe-1A можно рассматривать как китайский аналог первого советского спутника. Тогда проект exascale будет аналогичен полету на Луну.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Роль суперкомпьютеров в поддержании боеспособности американского ядерного потенциала обеспечивает им приоритетный статус. Теперь, когда Китай бросает вызов западному компьютерному превосходству, многие специалисты в этой области, равно как и многие эксперты по политической части, заговорили о том, что суперкомпьютеры должны играть немалую роль и в обеспечении национальной экономической безопасности. Эти машины многократно умножают мощь американской науки, инженерных разработок и коммерческого планирования, так что обладатели самых мощных компьютеров имеют фору в экономической гонке. Суперкомпьютеры не просто отражают достигнутый уровень интеллектуальной и технологической мощи — они сами способны повышать этот уровень.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В Рочестере, на заводе IBM, сотрудники не слишком много думают о претензиях Китая на мировое господство в области суперкомпьютеров. Их дело — решать инженерные задачи при создании Blue Gene/Q, так что в центре их внимания не политика, а конструкция, над которой они работают. Это настоящие технари, и их звания согласно штатному расписанию звучат по-бюрократически коряво и ничего не говорят посторонним об их реальных полномочиях. «Наше дело просто вкалывать, закатав рукава, — объясняет Пат Маллиган, начальник экспериментального цеха в системе Global Server Integration (у него действительно были закатаны рукава, что подкрепляло искренность его слов). — Мы не слишком интересуемся вопросами национального приоритета и просто стараемся делать компьютеры как можно лучше».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Само здание, в котором Маррокин, Маллиган и остальные сотрудники IBM конструируют самые мощные компьютеры XXI века, можно считать памятником корпоративному честолюбию в стиле середины ХХ века. Его проектировал знаменитый архитектор Ээро Сааринен (Мост Сан-Луи — это тоже его работа), раскинувшаяся во все стороны постройка облицована темно-синим стеклом. Внутри здания цеха проходы почти на километр. Когда-то компания, старающаяся всегда быть на переднем крае технического прогресса, заложила под полом этих залов электрические кабели — чтобы роботы могли самостоятельно перевозить детали для сборки и прочую технику из цеха в цех. Роботов здесь уже нет — мечта о полной механизации не устояла под натиском реальности. Роботы оказались слишком медлительны и так часто ломались, что на заводе решили вернуться к обычным погрузчикам с ручным управлением.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Те компьютеры Blue Gene/Q, которые мне показали в середине лета, еще нельзя назвать частью суперкомпьютера Брюса Гудвина (ему дано имя Sequoia). Это были пока еще только тестовые модели, которые используются для испытаний и поиска ошибок в аппаратной и программной части. Производство тех 96 стоек, из которых будет собрана Sequoia, должно начаться позднее. Гудвин со своей командой в лаборатории им. Лоуренса в Ливерморе уже что-то вводит в эту еще не до конца собранную машину, что-то свое подстраивает, действуя из своего далекого далека. На одной из стоек в сборочном цеху Рочестера красуется табличка «LLNL, блок удаленного доступа».

Установка моделирования терамасштаба (TSF), которая стоит у Гудвина в Ливерморе, — это один из двух центров DOE (министерства энергетики), выполняющих работы по ядерному компьютерному моделированию и являющихся частью программы Stockpile Stewardship (второй такой центр расположен в Нью-Мексико, в Национальной лаборатории в Лос-Аламосе). Для того чтобы проводимое моделирование отражало реальные физические процессы с приемлемой точностью, в лаборатории Гудвина строят трехмерную модель 50-микросекундного фрагмента взрыва с пространственным разрешением до 10 микрон. «Задача становится очень сложной, — говорит Гудвин. — Вещество здесь и сжимается, и взрывается, а вам нужно отслеживать всю динамику в этих потоках с точностью швейцарских часов». Каждый раз, когда в американских боеголовках заменяют или модернизируют тот или иной компонент, на TSF проводят новую серию виртуальных тестов, чтобы убедиться, что обновленная бомба взорвется именно в нужный момент. При компьютерном моделировании всплывают такие аспекты ядерной реакции, которые изначально даже и не предполагались, так что число и сложность используемых алгоритмов непрерывно растут. При современных технологиях за один цикл моделируется лишь какая-то часть полного взрыва, и даже при таком дроблении самые сложные программы, которые прогоняют в лаборатории Гудвина, могут содержать до миллиона строчек кода. Если бы у нас была в запасе тысяча лет, все эти расчеты можно было бы провести и на обычном ноутбуке, та система Blue Gene/P, которая стоит сейчас в Ливерморе и имеет мощность 500 терафлопов (ей присвоено имя Dawn), управляется с задачами моделирования высокой степени сложности за один месяц. Когда в 2012 году запустят систему Sequoia быстродействием в 20 петафлопов, время прогона одного теста снизится до нескольких дней».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Математика, воплощенная в суперкомпьютерах, обретает невиданную силу. Так, компьютер Blue Gene/P недавно просчитал число «пи» до миллиардного знака. Интересно еще и то, что конструкция современного суперкомпьютера позволяет легко менять его масштаб. Рассмотрим эту возможность на примере компьютера Sequoia, который состоит из 96 отдельных стоек с процессорами. Как говорит доктор Джордж Л.Т. Чу, один из ведущих исследователей в компании IBM, проведя относительно несложную перестройку в аппаратной части и программном обеспечении, Blue Gene/Q можно раздуть до агрегата, содержащего 32768 отдельных стоек. При этом его быстродействие должно достичь 6848 петафлопов. «Теперь вас может ограничивать только сумма в долларах, которую вы готовы потратить, — говорит Чу. — Ну и конечно, вам потребуется приличный источник энергии».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Да, мы чуть не забыли об электроэнергии. Здесь суперкомпьютеры сталкиваются с серьезной проблемой. Sequoia станет самым мощным суперкомпьютером в мире, но при этом она будет и самым прожорливым аппаратом. На пиковых нагрузках Sequoia должна потреблять больше 9 МВт — это энергозапросы примерно 7200 частных жилых домов. С другой стороны, та же Sequoia обещает стать и самым экономичным компьютером, так как в удельном пересчете картина выглядит гораздо оптимистичней. Эта машина на один израсходованный ватт электроэнергии будет выполнять 2 гигафлопа вычислений. Сравним с японским рекордсменом по имени K Computer — тот на 1 Вт электроэнергии выполняет всего 800 мегафлопов, то есть в 2,5 раза меньше. Отметим, что, наращивая вычислительную мощность такого компьютера, мы прямо пропорционально увеличиваем и его энергопотребление. Берем компьютер Sequoia и удваиваем в нем количество стоек. В результате получим вдвое более высокую производительность, но зато новый компьютер будет потреблять вдвое больше энергии. Доведя энергоэффективность до уровня мирового рекорда, мы, конечно, смягчаем эту проблему, но решенной ее считать нельзя.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Китай — не единственная страна, замахнувшаяся на exascale. В министерстве энергетики США считают, что американская технологическая конкурентоспособность напрямую зависит от достижений в области суперкомпьютеров. Такие компании, как Intel и Nvidia, уже к концу этого десятилетия обещают выйти на уровень exascale. Это настоящий технический вызов, который нужно встретить во всеоружии, когда не обойдешься простым наращиванием вычислительных мощностей. «Для того чтобы создавать машины уровня exascale, необходимо предвидеть, как будут выглядеть прикладные задачи и программы через 10, 15 или 20 лет», — говорит Дэйв Турек, вице-президент IBM, занимающийся работами в направлении exascale. Турек хорошо представляет себе наше будущее, когда объемы данных и скорость их поступления на машины повысятся на несколько порядков, когда потребуется радикальный пересмотр всех основ компьютерной техники — таких, как принципы хранения данных, организация работы сетей, программное обеспечение и системы энергопитания.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Разработка суперкомпьютеров — это такое хобби, которое влетает государству в копеечку. В министерстве энергетики оценивают общую стоимость разработки компьютера Sequoia и Blue Gene/P Dawn примерно в $250 млн. Плюс к этому годовые энергорасходы на работу компьютера петауровня составляют от 5 до 10 млн. Специалисты в этой области уже понимают, что нельзя и дальше повышать расходы, надеясь, что они окупятся новыми вычислительными возможностями. С другой стороны, Гудвин и другие такие же потребители уже не мыслят жизни без подобных компьютеров. Гудвин обращает наше внимание на то, что китайское правительство официально поставило перед собой цель использовать суперкомпьютеры, чтобы вывести страну на передовой промышленный уровень. Естественно, никому не хочется отставать. «Используя суперкомпьютер при разработке новой продукции, можно заранее предвидеть многие скрытые инженерные проблемы и довести продукт до рынка в пять раз быстрее, чем это делалось раньше, когда в работоспособности нового продукта нужно было убеждаться собственными глазами, — говорит Гудвин. — Подумайте, как это скажется на национальной экономике, если Boeing, General Motors или General Electric будут выпускать на рынок новую продукцию, тратя не годы, а всего лишь месяцы. Это играет огромную роль, и если кто-то успеет на рынок впятеро быстрее, чем вы, вам придется просто уйти из бизнеса».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Понятна нынешняя потребность в подобных машинах, так как они нужны для поддержания ядерных арсеналов в боевой готовности, но строительство такой техники в будущем напоминает нам недавнюю ситуацию с гонкой ядерного вооружения. Либо у нас будут большие вычислительные мощности, чем у конкурентов, либо же они используют против нас свое технологическое превосходство. Какой же компьютер удовлетворил бы Гудвина с его моделированием ядерных взрывов? Если компьютер с быстродействием 500 терафлопов решает такие задачи за месяц, а компьютер с быстродействием 20 петафлопов управляется за считанные дни, сможет ли компьютер с экзафлоповой производительностью проводить моделирование в режиме реального времени? Ответ самого Гудвина таков: «Для моделирования в режиме реального времени экзафлоповая машина все еще слишком медлительна». Он объяснил, что для режима реального времени потребуется компьютер с производительностью 100 йоттафлопов — это означает 100 х 1024 вычислений в секунду, то есть в 100 млн раз быстрее, чем должна работать «экзафлоповая» машина.