Установка суперкомпьютерного блейд-сервера Aurora завершена

Суперкомпьютер Aurora в Аргоннской национальной лаборатории теперь полностью оснащен всеми 10 624 вычислительными блейд-серверами, включая 63 744 процессора Intel® Data Center GPU Max Series и 21 248 процессоров Intel® Xeon® CPU Max Series.

Суперкомпьютер Aurora, созданный совместно Intel, Hewlett Packard Enterprise и Министерством энергетики, предназначен для раскрытия потенциала трех столпов высокопроизводительных вычислений: моделирования, анализа данных и искусственного интеллекта в чрезвычайно больших масштабах. Система включает более 1024 узлов хранения (использующих распределенное асинхронное хранилище объектов), обеспечивая емкость 220 терабайт (ТБ) при общей пропускной способности 31 ТБ, и использует высокопроизводительную структуру HPE Slingshot. Ожидается, что позднее в этом году Aurora станет первым в мире суперкомпьютером, достигшим теоретической максимальной производительности более 2 экзафлоп (экзафлоп — это 1018 или миллиард миллиардов операций в секунду), когда он войдет в список TOP500.

Aurora будет использовать всю мощь семейства графических процессоров и процессоров Intel Max Series. Разработанные для удовлетворения потребностей динамических и новых рабочих нагрузок HPC и AI, первые результаты с графическими процессорами серии Max демонстрируют лучшую производительность в реальных научных и инженерных рабочих нагрузках, демонстрируя до 2 раз производительность графических процессоров AMD MI250X на OpenMC и почти линейную масштабирование до сотен узлов.1 ЦП Intel Xeon серии Max обеспечивает 40-процентное преимущество в производительности по сравнению с конкурентами во многих реальных рабочих нагрузках HPC, таких как моделирование систем Земли, энергетика и производство.

Почему это важно: от борьбы с изменением климата до поиска лекарств от смертельных болезней исследователи сталкиваются с огромными проблемами, требующими передовых вычислительных технологий в масштабе. Aurora готова удовлетворить потребности сообщества высокопроизводительных вычислений и искусственного интеллекта, предоставляя необходимые инструменты для расширения границ научных исследований.

«Пока мы работаем над приемочным тестированием, мы собираемся использовать Aurora для обучения некоторых крупномасштабных генеративных моделей искусственного интеллекта с открытым исходным кодом для науки», — сказал Рик Стивенс, заместитель директора лаборатории Аргоннской национальной лаборатории. Графические процессоры, очень быстрая система ввода-вывода и полностью твердотельная система хранения данных — идеальная среда для обучения этих моделей».

Как это работает: В основе этой ультрасовременной системы лежат гладкие прямоугольные блейд-серверы Aurora, в которых размещены процессоры, память, сетевые технологии и технологии охлаждения. Каждый блейд состоит из двух процессоров Intel Xeon серии Max и шести графических процессоров Intel серии Max. Семейство продуктов Xeon Max Series уже демонстрирует отличную раннюю производительность на Sunspot, испытательном стенде и системе разработки с той же архитектурой, что и Aurora. Разработчики используют инструменты oneAPI и AI для ускорения рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта и повышения переносимости кода на несколько архитектур.

Установка этих блейд-серверов была деликатной операцией, поскольку для вертикальной интеграции каждого блейд-сервера весом 70 фунтов в стойки Aurora размером с холодильник требовалось специальное оборудование. 166 стоек системы вмещают по 64 блейд-сервера каждая и охватывают восемь рядов, занимая пространство, эквивалентное двум профессиональным баскетбольным площадкам в центре обработки данных Argonne Leadership Computing Facility.

Исследователи из программы Aurora Early Science Program ALCF и Exascale Computing Project Министерства энергетики перенесут свою работу с испытательного стенда Sunspot на полностью установленную Aurora. Этот переход позволит им масштабировать свои приложения на всей системе. Первые пользователи проведут стресс-тестирование суперкомпьютера и выявят потенциальные ошибки, которые необходимо устранить перед развертыванием. Сюда входят усилия по разработке генеративных моделей искусственного интеллекта для науки, о которых недавно было объявлено на конференции ISC’23.
Поделиться:

Похожие публикации

Тут ничего нет

Нет комментариев