MAX
Подпишись
стань автором. присоединяйся к сообществу!
24 сентября 31
72

НТЦ «Модуль» представляет высокопроизводительный вычислительный модуль NM Card

 © module.ru

Высокопроизводительный вычислительный модуль NM Card представляет собой спецвычислитель, подключаемый в слот расширения PCIe на материнской плате компьютера.

Эффективен для реализации нейронных сетей, решения задач цифровой обработки сигналов и изображений.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: www.module.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 2
    Нет аватара guest25.09.20 16:04:02

    Я вообще в тёмном лесу! Ребята кто рыба в этой воде, скажите по простому, что это?

    • 6
      Нет аватара nwtour25.09.20 19:55:44

      В машинном обучении, нейронных сетях, физике часто требуется операция произведение матриц (грубо говоря таблица 4 строки и 4 столбца перемножается на другую таблицу 4 строки и 4 столбца где результат так же таблица 4 строки и 4 столбца), на обычном процессоре это 256 раз вызвать функцию умножения каждый раз сохраняя результат за пределами процессора.

      По этому создали отдельный сопроцессор для таких функций который выполняет такое перемножение за один раз. На домашнем компьютере её можно вызвать если современная карта от nvidia.

      Данный процессор «16 тензорных ядер NMC4 (FP32/64, 1000 МГц)» — означает что можно выполнить 16 миллиардов таких вызовов в минуту где в результатирующей матрице доступны значения с точностью в 64 бита

      • 1
        Нет аватара guest25.09.20 21:48:48

        nwtour, это по принципу многопроцесорной операци? К примеры на одной плате 16 процесоров и каждый просчитывает одну функцию переумножая: х1*у2 ну и так далее матрица 4×4?

        • 0
          Нет аватара nwtour25.09.20 22:28:45

          это по принципу многопроцесорной операци?

          Да. В один тик времени могут производиться до 16 одновременных вычислений

          и каждый просчитывает одну функцию переумножая

          Да. Только само перемножение на аппаратном уровне. И программист и железка знает что ей поступит тип данных матрицы для перемножения и за счет этого по сравнению с центральным процессором экономятся гигантское количество лишних очередей, проверок и копирований данных