Установка суперкомпьютерного блейд-сервера Aurora завершена

База знаний Gubin Systems
24 июня 2023, 07:01

Суперкомпьютер Aurora в Аргоннской национальной лаборатории теперь полностью оснащен всеми 10 624 вычислительными блейд-серверами, включая 63 744 процессора Intel® Data Center GPU Max Series и 21 248 процессоров Intel® Xeon® CPU Max Series.

Суперкомпьютер Aurora, созданный совместно Intel, Hewlett Packard Enterprise и Министерством энергетики, предназначен для раскрытия потенциала трех столпов высокопроизводительных вычислений: моделирования, анализа данных и искусственного интеллекта в чрезвычайно больших масштабах. Система включает более 1024 узлов хранения (использующих распределенное асинхронное хранилище объектов), обеспечивая емкость 220 терабайт (ТБ) при общей пропускной способности 31 ТБ, и использует высокопроизводительную структуру HPE Slingshot. Ожидается, что позднее в этом году Aurora станет первым в мире суперкомпьютером, достигшим теоретической максимальной производительности более 2 экзафлоп (экзафлоп — это 1018 или миллиард миллиардов операций в секунду), когда он войдет в список TOP500.

Aurora будет использовать всю мощь семейства графических процессоров и процессоров Intel Max Series. Разработанные для удовлетворения потребностей динамических и новых рабочих нагрузок HPC и AI, первые результаты с графическими процессорами серии Max демонстрируют лучшую производительность в реальных научных и инженерных рабочих нагрузках, демонстрируя до 2 раз производительность графических процессоров AMD MI250X на OpenMC и почти линейную масштабирование до сотен узлов.1 ЦП Intel Xeon серии Max обеспечивает 40-процентное преимущество в производительности по сравнению с конкурентами во многих реальных рабочих нагрузках HPC, таких как моделирование систем Земли, энергетика и производство.

Почему это важно: от борьбы с изменением климата до поиска лекарств от смертельных болезней исследователи сталкиваются с огромными проблемами, требующими передовых вычислительных технологий в масштабе. Aurora готова удовлетворить потребности сообщества высокопроизводительных вычислений и искусственного интеллекта, предоставляя необходимые инструменты для расширения границ научных исследований.

«Пока мы работаем над приемочным тестированием, мы собираемся использовать Aurora для обучения некоторых крупномасштабных генеративных моделей искусственного интеллекта с открытым исходным кодом для науки», — сказал Рик Стивенс, заместитель директора лаборатории Аргоннской национальной лаборатории. Графические процессоры, очень быстрая система ввода-вывода и полностью твердотельная система хранения данных — идеальная среда для обучения этих моделей».

Как это работает: В основе этой ультрасовременной системы лежат гладкие прямоугольные блейд-серверы Aurora, в которых размещены процессоры, память, сетевые технологии и технологии охлаждения. Каждый блейд состоит из двух процессоров Intel Xeon серии Max и шести графических процессоров Intel серии Max. Семейство продуктов Xeon Max Series уже демонстрирует отличную раннюю производительность на Sunspot, испытательном стенде и системе разработки с той же архитектурой, что и Aurora. Разработчики используют инструменты oneAPI и AI для ускорения рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта и повышения переносимости кода на несколько архитектур.

Установка этих блейд-серверов была деликатной операцией, поскольку для вертикальной интеграции каждого блейд-сервера весом 70 фунтов в стойки Aurora размером с холодильник требовалось специальное оборудование. 166 стоек системы вмещают по 64 блейд-сервера каждая и охватывают восемь рядов, занимая пространство, эквивалентное двум профессиональным баскетбольным площадкам в центре обработки данных Argonne Leadership Computing Facility.

Исследователи из программы Aurora Early Science Program ALCF и Exascale Computing Project Министерства энергетики перенесут свою работу с испытательного стенда Sunspot на полностью установленную Aurora. Этот переход позволит им масштабировать свои приложения на всей системе. Первые пользователи проведут стресс-тестирование суперкомпьютера и выявят потенциальные ошибки, которые необходимо устранить перед развертыванием. Сюда входят усилия по разработке генеративных моделей искусственного интеллекта для науки, о которых недавно было объявлено на конференции ISC’23.

Gubin Systems

Установка суперкомпьютерного блейд-сервера Aurora завершена

Похожие публикации

Нет комментариев

База знаний Gubin Systems

Литературное

Новости провайдеров

Новости банков

Параметр	Значение
Операционная система	Linux
Архитектура	x64
Платформа	linux
Версия Node.js	v12.22.9
Версия PHP	5.6-8.1
Версия Python	3.10.12
Версия Perl	v5.34.0