2010/05/23 20:56:12

Кластер "АЛ-100"

В настоящее время в России, как и во всем мире, наблюдается самый настоящий бум в области построения вычислительных кластеров. Однако если на Западе и зарубежном Дальнем Востоке кластеры используют прежде всего в промышленности, то у нас пока тон задают научные и учебные учреждения. Одним из исключений является вычислительный кластер «АЛ-100», запущенный в научно-производственном объединении «Сатурн».

Каталог Суперкомпьютеры (системы и проекты) доступен на TAdviser.

НПО «Сатурн» — ведущая двигателестроительная корпорация, специализирующаяся на разработке и производстве газотурбинных двигателей. «АЛ-100» — это не первый опыт «Сатурна» в области высокопроизводительных вычислений. Внедрение суперкомпьютера, запущенного в эксплуатацию ещё в 2005 году, позволило конструкторским подразделениям предприятия перейти на новый уровень аналитического проектирования, основанный на использовании численных методов на всех этапах разработки газотурбинных двигателей.

Современный рынок газотурбинных двигателей требует от разработчика существенного сокращения сроков и затрат при создании нового продукта. Для выполнения данной задачи необходимо провести колоссальный объём инженерных расчетов по направлениям газодинамики, прочности, акустики. А моделирование цифрового эксперимента на суперкомпьютере вообще трудно переоценить, так как это существенно сокращает количество дорогостоящих натурных испытаний изделий. Сегодня с внедрением кластерных технологий НПО перешел на качественно новый уровень выполнения конструкторских работ, а с вводом данного суперкомпьютера расширил свои возможности. В результате цикл разработки газотурбинной установки удалось сократить втрое, до четырёх-пяти лет против двенадцати-пятнадцати в 70—80‑х годах, а количество опытных образцов — в пять раз, с полусотни до десяти. Кроме того, применение высокопроизводительных вычислений позволяет существенно снизить расход топлива и шумность разрабатываемого двигателя, что также является важным параметром, влияющим на конкурентоспобность продукции.

Однако к концу 2006 года, когда к суперкомпьютеру были подключены филиалы в Москве и Перми, загрузка вычислительных мощностей кластера вплотную приблизилась к 100%. К тому же объем вычислений вырос в 160 раз. И в середине 2007‑го было принято решение о создании нового суперкомпьютера, который должен был обойти по производительности уже имевшийся более чем в 20 раз. Заказчиком такого проекта снова стала конструкторская служба. А исполнителем работ, как и в первый раз, была выбрана компания КРОК, предложившая решение на базе технологий IBM.


Технические подробности

Общая архитектура вычислительного кластера «АЛ-100»

Изображение:61-saturn_f.jpg

Созданное решение представляет собой высокопроизводительный кластер на базе решения IBM System Cluster 1350 с пиковой производительностью 14,3 Терафлопс. Основой для вычислительного поля стали серверы-лезвия HS21 на базе четырёхъядерных процессоров Intel Xeon, объединенные высокоскоростной сетью DDR Infiniband (см. рисунок). Расчетное поле кластера включает 1344 процессорных ядра и 1344 Гбайт оперативной памяти. За управление кластером отвечает ПО IBM Cluster Systems Management. Для управления вычислительными заданиями в состав кластерного ПО входит система IBM Tivoli Workload Scheduler LoadLeveler.

Работоспособность вычислительного комплекса обеспечивается инженерной инфраструктурой, включающей в себя системы бесперебойного электропитания, прецизионного кондиционирования и автоматического газового пожаротушения. Основой для построения инфраструктуры было выбрано комплексное решение APC InfraStruXure. Решение включает систему энергообеспечения мощностью 250 кВТ, воздушное охлаждение с горячим и холодным коридорами, а также водяное охлаждение в кондиционерах. В результате удалось добиться более высокой плотности размещения оборудования, существенно уменьшить затраты на электроэнергию («АЛ-100» потребляет всего 72 кВт) и снизить уровень шума. Весь комплекс объединен системами централизованного мониторинга и автоматизации. Рынок ИТ-услуг в России: оценки, тренды, крупнейшие участники. Обзор и рейтинг TAdviser 300.4 т

На момент запуска данный суперкомпьютер являлся самым высокопроизводительным в промышленности России и СНГ, занимает пятое место в списке суперкомпьютеров СНГ Top 50 и вошел в десятку мощнейших в промышленных предприятиях Европы. По прогнозам мощностей суперкомпьютера должно хватить на два-три года. Причем 50—60% его ресурсов предполагается отдать под разработку двигателя для истребителя пятого поколения.

Затраты на создание суперкомпьютера «АЛ-100» составили около 100 млн. рублей. Из них 30 млн. ушли на разработку своими силами ПО для инженерных расчетов (решение задач газовой динамики и прочности, оптимизации конструкции двигателя), а 70 млн. — непосредственно на оборудование и системное ПО, переустройство помещений и т. д. При этом по словам менеджеров «Сатурна» на инженерную инфраструктуру ушло около 40% всех проектных расходов.

Полностью окупить эти затраты предполагается довольно быстро. Первый суперкомпьютер НПО окупил себя уже спустя полгода. В последние три года в «Сатурне» перешли на виртуальное проектирование. Именно так были разработаны двигатели SaM146 и АЛ-55И, ныне проходящие лётные испытания.

Системы такого уровня в мировой практике имеют собственные имена. В НПО «Сатурн» был объявлен конкурс среди работников на лучшее название нового суперкомпьютера. Из нескольких сотен предложений победителем признано имя «АЛ-100» — в честь столетия со дня рождения основателя компании, выдающегося ученого и конструктора Архипа Михайловича Люльки, двигателям которого традиционно присваивалась марка «АЛ».


Общая архитектура вычислительного кластера «АЛ-100»

Ссылки