99

Отечественные реконфигурируемые суперкомпьютеры

Уже 15 лет у нас в стране производятся реконфигурируемые суперкомпьютеры, но только сейчас появилась возможность рассказать о них благодаря статье Сергея Шаракшанэ. Дополню текст автора фотографиями и примечаниями для популяризации материала. Этого так не хватает нашим отечественным научным статьям!

читать полностью

  • 3
    Zveruga
    07.08.1516:52:21

    Вот базовый модуль третьего поколения на основе ПЛИС IV.

    Память интегрирована на каждом модуле. В 2010 году поднимался вопрос о нехватке каналов доступа к памяти. Похоже они эту проблему решили.

    У РВС-7 памяти всего 192 Гб. Похоже это связано с тем, что данные во время вычислений хранятся не во вне, а на ПЛИС. В буферах и аккумуляторах.

    Кластерные суперкомпьютеры хранят программу в памяти. В реконфигурируемых компьютерах программа хранится в виде аппаратного алгоритма в самих ПЛИС. Память нужна только для хранения начальных и конечных данных.

    Пример применения для мониторинга сетей. На фотографии похоже модуль Кентавр.

    Отредактировано: Zveruga~17:53 07.08.15
    • 0
      Денис Демидович
      07.08.1517:11:49

      У меня в компьютере стоят две Radeon 280x суммарно 6 ГБ памяти, НО вы понимаете что в каждой по 3ГБ и могу оперировать только этими тремя ГБ, хотя мой алгоритм может выполняться параллельно на каждой видеокарте( упрощенно), поэтому общее количество памяти не отвечает на заданные вопросы.

      Эти видеокарты крайне быстро считают биткойны( не пробовал, но знаю что в 1000 раз быстрее процессора), если же попытаться на них работать с чем-то напоминающим базу данных они мгновенно сдуются и если такую задачу вообще можно решить скорее всего будут медленнее или около процессора.

      Задача с лексическим анализатором хорошая задача, но все же хочется конкретных параметров и примеров. Это вопрос не к вам, это просто так.

      Сейчас расскажу что мне интересно, про интеловские процы примерно все известно, известно как организованна память, известно что есть КЭШ, известно как туда попадают данные, известно как примерно писать так что бы алгоритмы не выбивали кэш, известны примерные соотношения скорости работы при разных случаях, примерно то же самое знаю про видеокарту, собственно это же интересно про эти самые кластеры, там много плис, какой у каждого кэш, как они синхронизируются, какой для каждого объем памяти, общая ли у них память, сколько уровней памяти, как исполняются алгоритмы(в смысле если ли там какие-то методы синхронизации потоков)

      • 3
        Zveruga
        07.08.1517:46:16

        В ПЛИС можно зашить любой алгоритм. При этом зашить так, чтобы все модули ПЛИС работали на благо задачи. По этому ПЛИС максимально эффективно работают на всех задачах.

        В графическое ядро видеоадаптера вы не сможете добавить недостающие вычислительные блоки, которые позволили бы вычислять определённые функции за 1 такт. А в ПЛИС вы сами творите любые нужные вам блоки.

        Модуль цифровой обработки 4V2P-32 для ответственных систем. Год производства где-то 2007. Работает он на древних процессорах Virtex II Pro, которые были разработаны ещё в 2002 году. Модуль на таких ПЛИС сравнивается с зарубежными модулями разработанными в 2005 и 2007 годах.

        И для примера сравнительная производительность в разных задачах у другого модуля работающего на Virtex 5. Возможно, что это модуль 16V5-50 Фекда 2006 года выпуска.

        Обратите внимание на процент реальной производительности от пиковой. Именно этот параметр и является важным отличием реконфигурируемых систем от универсальных кластерных.

        Это именно Фекда обрабатывает изображение с телескопа. Картинку Калеано-В в статье я привёл лишь для примера.

        Отредактировано: Zveruga~21:37 07.08.15
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,