99

Отечественные реконфигурируемые суперкомпьютеры

Уже 15 лет у нас в стране производятся реконфигурируемые суперкомпьютеры, но только сейчас появилась возможность рассказать о них благодаря статье Сергея Шаракшанэ. Дополню текст автора фотографиями и примечаниями для популяризации материала. Этого так не хватает нашим отечественным научным статьям!

читать полностью

Подпишитесь на наш канал в Яндекс.Дзен и сделайте вашу ленту объективнее!

  • 1
    Денис Демидович
    07.08.1512:23:35

    В суперкомпьютерных вычислениях системы на основе ПЛИС показывают более лучшие характеристики чем процессоры Intel или AMD.

    Судя по тому что удалось понять, показывает он их ровно до тех пор пока не возникнет проблема работать с памятью, отлично понял как связываются вычислительные блоки и сколько гигафлопов это все дает, но мне совсем не понятно что там с памятью, какой её объем, какая латентность и прочие параметры, у современных видеокарт и процессоров это большая проблема, самая большая. И дело далеко не всегда в количестве операций сложения, как только у вас случился промах кеша ( это означает что процессор не угадал и не подгрузил данные заранее) те же операции сложения начинают работать в 1000 раз медленнее. Грубо говоря вместо одного такта надо 1000 из-за того что нет данных и их грузят из памяти.

    Судя по всему эти кластеры это очень специфичное решение которое может решать быстро только те задачи где нет необходимости работать с данными, с большими данными.

    • 3
      Zveruga
      07.08.1516:52:21

      Вот базовый модуль третьего поколения на основе ПЛИС IV.

      Память интегрирована на каждом модуле. В 2010 году поднимался вопрос о нехватке каналов доступа к памяти. Похоже они эту проблему решили.

      У РВС-7 памяти всего 192 Гб. Похоже это связано с тем, что данные во время вычислений хранятся не во вне, а на ПЛИС. В буферах и аккумуляторах.

      Кластерные суперкомпьютеры хранят программу в памяти. В реконфигурируемых компьютерах программа хранится в виде аппаратного алгоритма в самих ПЛИС. Память нужна только для хранения начальных и конечных данных.

      Пример применения для мониторинга сетей. На фотографии похоже модуль Кентавр.

      Отредактировано: Zveruga~17:53 07.08.15
      • 0
        Денис Демидович
        07.08.1517:11:49

        У меня в компьютере стоят две Radeon 280x суммарно 6 ГБ памяти, НО вы понимаете что в каждой по 3ГБ и могу оперировать только этими тремя ГБ, хотя мой алгоритм может выполняться параллельно на каждой видеокарте( упрощенно), поэтому общее количество памяти не отвечает на заданные вопросы.

        Эти видеокарты крайне быстро считают биткойны( не пробовал, но знаю что в 1000 раз быстрее процессора), если же попытаться на них работать с чем-то напоминающим базу данных они мгновенно сдуются и если такую задачу вообще можно решить скорее всего будут медленнее или около процессора.

        Задача с лексическим анализатором хорошая задача, но все же хочется конкретных параметров и примеров. Это вопрос не к вам, это просто так.

        Сейчас расскажу что мне интересно, про интеловские процы примерно все известно, известно как организованна память, известно что есть КЭШ, известно как туда попадают данные, известно как примерно писать так что бы алгоритмы не выбивали кэш, известны примерные соотношения скорости работы при разных случаях, примерно то же самое знаю про видеокарту, собственно это же интересно про эти самые кластеры, там много плис, какой у каждого кэш, как они синхронизируются, какой для каждого объем памяти, общая ли у них память, сколько уровней памяти, как исполняются алгоритмы(в смысле если ли там какие-то методы синхронизации потоков)

        • 3
          Zveruga
          07.08.1517:46:16

          В ПЛИС можно зашить любой алгоритм. При этом зашить так, чтобы все модули ПЛИС работали на благо задачи. По этому ПЛИС максимально эффективно работают на всех задачах.

          В графическое ядро видеоадаптера вы не сможете добавить недостающие вычислительные блоки, которые позволили бы вычислять определённые функции за 1 такт. А в ПЛИС вы сами творите любые нужные вам блоки.

          Модуль цифровой обработки 4V2P-32 для ответственных систем. Год производства где-то 2007. Работает он на древних процессорах Virtex II Pro, которые были разработаны ещё в 2002 году. Модуль на таких ПЛИС сравнивается с зарубежными модулями разработанными в 2005 и 2007 годах.

          И для примера сравнительная производительность в разных задачах у другого модуля работающего на Virtex 5. Возможно, что это модуль 16V5-50 Фекда 2006 года выпуска.

          Обратите внимание на процент реальной производительности от пиковой. Именно этот параметр и является важным отличием реконфигурируемых систем от универсальных кластерных.

          Это именно Фекда обрабатывает изображение с телескопа. Картинку Калеано-В в статье я привёл лишь для примера.

          Отредактировано: Zveruga~21:37 07.08.15
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,