Лого Сделано у нас
82

НТЦ «Модуль» представляет высокопроизводительный вычислительный модуль NM Card

 © module.ru

Высокопроизводительный вычислительный модуль NM Card представляет собой спецвычислитель, подключаемый в слот расширения PCIe на материнской плате компьютера.

Эффективен для реализации нейронных сетей, решения задач цифровой обработки сигналов и изображений.

Модуль выполнен на базе системы-на-кристалле (СнК) К1879ВМ8Я, в состав которой входят:

Основные характеристики

16 тензорных ядер NMC4 (FP32/64, 1000 МГц)

5 RISC ядер ARM Cortex-A5 (800 МГц)

5 ГБ памяти DDR 3L (до 32 ГБ/с)

PCIe 2.0 x4

Ethernet 100 Мб/с

4 высокоскоростных коммуникационных порта с суммарной пропускной способностью до 16 ГБ/с для построения многопроцессорных систем

Форм-фактор PCIe x16, 1 слот

Максимальная потребляемая мощность не более 25 Вт

Типовая потребляемая мощность 9 Вт

Области применения

Нейронные сети и искусственный интеллект

Специализированные высокопроизводительные вычислительные комплексы

Системы цифровой обработки сигналов и изображений

Облачная обработка данных

Системы машинного зрения

Робототехника

Телекоммуникационные и связные системы

Образование

Радиотехнические системы и комплексы

Автоматизация процессов производства

  • 16 тензорных ядер NMC4 (оригинальная вычислительная архитектура НТЦ «Модуль»)
  • 5 RISC ядер ARM Cortex-A5
  • 3
    Нет аватара Vzik
    25.09.2013:07:04

    Интересно, зачем ему активное охлаждение? Вроде всего 35ват максимальное тепловыделение.

    Всё же жаль, что ядро по лицензии ARM. Понятно, что так проще разработчикам и покупка лицензии в разы сокращает время вывода готового продукта на рынок. Если сделка Nvidia по покупке ARM состоится, то ARM поменяет юрисдикцию. Станет американским. Кто знает, устоит ли американская фемида от соблазна душить санкциями неугодные проекты.

    • 9
      CastedAway CastedAway
      25.09.2016:57:13

      Можно считать сделка состоится потому как она очень выгодна американскому правительству. И да теперь всем китайским разработчикам телефонов будет совсем грустно. Ещё одно подтверждение — нужна абсолютно СВОЯ архитектура! Об Эльбрусе можно спорить, но как бы там не было, это лицензионно чистая и абсолютно интеллектуально независимая разработана. В крайнем случае использовать надо архитектуры без лицензии типа RISC V, да так дольше и дороже, но смотрим внимательно на Huawei ;) Но здесь АРМ это дело второстепенное. Эти тензорный ядра — вот она изюминка.

      • 2
        Alex M Alex M
        25.09.2017:18:50

        использовать надо архитектуры без лицензии типа RISC V
        Тоже так считаю, не понимаю почему все опечалены уходом ARM. Ведь есть RISC V

        • 1
          shigorin shigorin
          27.09.2019:02:14

          Он как бы есть, но его как бы нет. У нас, если что, SiFive практически есть и порт альта на нём и собираем; вот только того же SATA там вообще нет, а тот, что на плате расширения (ещё дороже процессорной платы) -- одно из немногого, что там вообще работает.

          Понятно, что болячки роста и к архитектуре без отношения, вот только порой кричат теоретики по бумаге, а оврагов на местности не ведают. Вот, рассказываю чуточку, чтоб и Вас в заблуждение такие не ввели.    

          В общем, я бы тут скорее смотрел на отечественную встройку вроде КМ211.

  • 5
    Нет аватара elron
    25.09.2015:07:07

    там армы не самое главное, да и вообще непонятно зачем они нужны в сигнальном процессоре. там главное «16 тензорных ядер NMC4». судя по тому что сведений об этой архитектуре в сети нет --- скорее всего, оригинальная разработка. вот и написал бы автор на эту тему подробнее.

    • 3
      CastedAway CastedAway
      25.09.2016:47:33

      Я могу ошибаться, пусть знающие поправят, но эти хитрые ядра обеспечивают построение нейронных сетей, а АРМ ядра просто строят топологию и данные прокачивают. Если это так, то это вообщем то очень круто. Редкое направление.

      • 1
        shigorin shigorin
        27.09.2019:03:27

        ARM-ядра там -- по сути управляющие, да. У меня знакомый над этой штукой работал, рассказывал чуток.

  • 3
    Нет аватара Мафусаил
    25.09.2016:04:02

    Я вообще в тёмном лесу! Ребята кто рыба в этой воде, скажите по простому, что это?

    • 8
      Нет аватара nwtour
      25.09.2019:55:44

      В машинном обучении, нейронных сетях, физике часто требуется операция произведение матриц (грубо говоря таблица 4 строки и 4 столбца перемножается на другую таблицу 4 строки и 4 столбца где результат так же таблица 4 строки и 4 столбца), на обычном процессоре это 256 раз вызвать функцию умножения каждый раз сохраняя результат за пределами процессора.

      По этому создали отдельный сопроцессор для таких функций который выполняет такое перемножение за один раз. На домашнем компьютере её можно вызвать если современная карта от nvidia.

      Данный процессор «16 тензорных ядер NMC4 (FP32/64, 1000 МГц)» — означает что можно выполнить 16 миллиардов таких вызовов в минуту где в результатирующей матрице доступны значения с точностью в 64 бита

      • 1
        Нет аватара Мафусаил
        25.09.2021:48:48

        nwtour, это по принципу многопроцесорной операци? К примеры на одной плате 16 процесоров и каждый просчитывает одну функцию переумножая: х1*у2 ну и так далее матрица 4×4?

        • 1
          Нет аватара nwtour
          25.09.2022:28:45

          это по принципу многопроцесорной операци?

          Да. В один тик времени могут производиться до 16 одновременных вычислений

          и каждый просчитывает одну функцию переумножая

          Да. Только само перемножение на аппаратном уровне. И программист и железка знает что ей поступит тип данных матрицы для перемножения и за счет этого по сравнению с центральным процессором экономятся гигантское количество лишних очередей, проверок и копирований данных

  • 2
    Нет аватара Lovidar
    26.09.2023:16:58

    Хм… А эти ребята могу сообразить крутую видеокарту? Технологии-то схожие)

Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,