СуперЭВМ «Говорун» в ОИЯИ-Дубна стал мощнее и быстрее
Следи за успехами России в Телеграм @sdelanounas_ru14 ноября в Лаборатории информационных технологий ОИЯИ состоялась презентация и демонстрация модернизированного суперкомпьютера «Говорун». В машинном зале лаборатории собрались сотрудники ЛИТ и других лабораторий ОИЯИ, российских вычислительных центров, специалисты «РСК Технологии».
Суперкомпьютер «Говорун» состоит из трех компонент: две компоненты базируются на процессорах от Intel, третья — это графические ускорители NVIDIA. На этом этапе мы модернизировали первые две компоненты, следующим этапом будет модернизироваться компонента с графическими процессорами. После модернизации суммарная пиковая производительность составляет 1,7 петафлопс с одинарной точностью, а наиболее востребованная процессорная часть увеличилась в три раза. Мы анализируем, какие части наиболее востребованы у пользователей, и их модернизируем в первую очередь.
Существенно увеличена вычислительная мощность суперкомпьютера: наряду с установкой новых вычислительных узлов были заменены все процессоры. Установлена сверхбыстрая система хранения данных — для многих классов задач требуется не только вычислительная мощность, но и очень быстрая работа с данными. Теперь у нас трехуровневая система работы с данными: сверхбыстрая, быстрая и медленная, в итоге мы получили новое качество, которое, надеемся, пользователи оценят в ближайшее время.
Одной из основных групп пользователей суперкомпьютера «Говорун» является группа из Лаборатории теоретической физики, у них много задач, требующих очень больших вычислений, в первую очередь, это задачи квантовой хромодинамики на решетке, моделирование сложных процессов. Следующий класс ресурсоемких задач — задачи для мегасайенс проекта NICA: моделирование и реконструкция событий для проектов MPD, BM@N, SPD — они также занимают немалую часть ресурсов суперкомпьютера. Сейчас появились пользователи, которые занимаются радиационной безопасностью, — это очень сложные задачи, требующие большого количества вычислений. Некоторые группы, занимающиеся нейтринной физикой, начали использовать ресурсы суперкомпьютера. Число задач растет, а, главное, все хотят все больше ресурсов.
О новых характеристиках суперкомпьютера рассказал ученый секретарь ЛИТ Д.В.Подгайный: Сегодня мы представляем вторую очередь нашего суперкомпьютера, который благодаря поддержке дирекции ОИЯИ получил существенное развитие: мы переходим на новый вид процессорной архитектуры от Intel — на Cascade Lake, мы существенно наращиваем производительность нашего суперкомпьютера: CPU компонента становится практически в три раза мощнее. Новые процессоры третьего поколения имеют каждый по 24 вычислительных ядра, всего их 48 на вычислительном узле, а суммарное количество вычислительных ядер свыше 4 тысяч. Похвастаюсь, в вычислительных центрах России вычислительных систем с такими процессорами пока мало, и «Говорун» является самой большой из них, мы заняли десятое место в Top-50 самых мощных суперкомпьютеров России и стран СНГ.
Основная специфика нашей машины — это возможность быстрой работы с данными. У нас установлена сверхбыстрая система хранения данных также от Intel, которая позволяет записывать и считывать данные со скоростью, превышающей 300 гигабайт в секунду, — это очень высокий показатель и особенно высокий в сфере суперкомпьютеров. Практически ни один суперкомпьютер не только в нашей стране, но и в Европе не имеет столь высоких скоростей работы с данными. Это очень важно, особенно когда мы говорим о мегапроекте NICA, в котором ожидается очень большой поток данных, и скорость их обработки имеет ключевое значение. Мы надеемся, что наша система поможет участникам этого проекта сделать еще больше полезных расчетов — пока в плане теоретических вычислений, а после запуска коллайдера и в обработке экспериментальных данных.
Приветствуя всех собравшихся, В.В.Кореньков заметил, что «вчера закончилась модернизация суперкомпьютера, а сегодня он готов к продолжению активной деятельности». С замечательным событием поздравил коллектив ЛИТ вместе с их коллегами из Intel и РСК вице-директор ОИЯИ Р.Ледницки: «Без больших вычислительных мощностей сегодня немыслим прогресс науки. Анализ данных с нового коллайдера без суперкомпьютера будет невозможен». Ректор университета «Дубна» Д.В.Фурсаев подчеркнул, что большое число выпускников работает в ЛИТ, поздравил коллектив лаборатории и их коллег с очередным этапом развития компьютерных мощностей: «Мы действительно готовим кадры для лаборатории, у нас действует совместный с ЛИТ проект „IT-школа аналитики больших данных“, которым руководит В.В.Кореньков».
Ю.Мигаль (РСК, Москва) представил итог работы их компании, которая не только занимается инженерной составляющей CPU компонент суперкомпьютера, базирующихся на 100-процентном жидкостном охлаждении, а также разработкой гиперконвергентной архитектуры высокоскоростной системы хранения данных. Уникальное внедренное решение «системы хранения по требованию» позволяет формировать на «Говоруне» специфическую систему хранения для каждой запускаемой задачи. CPU компоненты суперкомпьютера базируются на решении «РСК Торнадо» с рекордной энергетической плотностью и системой прецизионного жидкостного охлаждения с пиковым значением температуры до +57°С. Вся система потребляет 70 кВт, из них на охлаждение требуется всего 2,4 кВт. Компания создает вычислительные системы с такой системой охлаждения уже 10 лет.
Координатор проекта MPD О.В.Рогачевский (ЛФВЭ) подчеркнул, что на площадке ЛФВЭ создается ускорительный комплекс, детекторы, магниты, а модернизация суперкомпьютера — еще один вклад в проект NICA со стороны ЛИТ. «Дальше — дело физиков ОИЯИ решать задачу о новом состоянии вещества. Это вызов для лаборатории, для нашей науки, которая должна снова занять свое место среди мировой физики высоких энергий». Н.С.Местер (Intel) добавил к уже сказанному, что все системы суперкомпьютера базируются на компонентах Intel. «Это очень интересный проект, поскольку он изначально построен на технологиях, которые еще никто не применял. Уникальна технология конвергенции, а благодаря жидкостному охлаждению максимально эффективно подводится и отводится тепло».
В.В.Кореньков напомнил участникам презентации, что в этом машинном зале размещается не только «Говорун», но и еще три очень крупных инфраструктуры: Tier1-центр для эксперимента CMS на LHC и Tier2-центр, на котором считаются задачи пользователей ОИЯИ, экспериментов на LHC и других коллабораций. «Мы полностью используем второй этаж машинного зала. Над нами есть такое же помещение на четвертом этаже, значит, нам есть куда развиваться. Сложность модернизации инженерной, сетевой и компьютерной инфраструктуры состоит в том, чтобы проводить модернизацию без остановки оборудования и сервисов, так как невозможно лишить Институт доступа в интернет и к электронной почте хотя бы на минуту».
А еще директор ЛИТ выразил надежду, что до конца ноября правительством будет принята программа развития национальной суперкомпьютерной сети, что позволит с большим энтузиазмом смотреть в будущее. Настоящее плачевно: сейчас в Top-500 мировых суперкомпьютеров входят только два российских, а без них невозможно говорить о цифровой экономике, искусственном интеллекте и других приложениях.
Затем Владимир Васильевич познакомил собравшихся с тенденциями развития Многофункционального информационно-вычислительного комплекса как базовой установки ОИЯИ. Также с докладами выступили Д.В.Подгайный, Н.С.Местер (Intel), представители «РСК Технологии» А.Шмелев и П.Лавренко.
14 и 15 ноября состоялись семинары, организованные группой по гетерогенным вычислениям ЛИТ, компаниями Intel и РСК. Лекции и тренинги провели Дмитрий Сивков (Intel), Игорь Одинцов (РСК), Алексей Стадник и Оксана Стрельцова (ЛИТ). Как рассказала Оксана, на семинары приехали представители российских вычислительных центров и дата-центров различных институтов — из Москвы, Санкт-Петербурга, Новосибирска. Все эти центры используют решения от РСК или планируют их использовать, а поскольку ЛИТ ОИЯИ многие технологии внедряет первыми, всем участникам семинаров было интересно обменяться опытом в суперкомпьютерных системах мониторинга и управления, интеграции высокопроизводительных систем и многих других вопросах. Отдельная благодарность Николаю Местеру, который собирает вокруг новых решений от Intel команды из различных научных вычислительных центров.
Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈
28.11.1923:40:16
04.12.1900:04:57
29.11.1919:42:13
04.12.1900:05:20