MAX
Подпишись
стань автором. присоединяйся к сообществу!
01 июня 1
129

Тестирование процессоров «Эльбрус-4С» и «Эльбрус-8С»

Опубликованы результаты сравнительного тестирования отечественных процессоров двух поколений — «Эльбрус-4С» (2014 год) и «Эльбрус-8С"(2016 год) в работе приложений по распознаванию паспортов и распознаванию автомобилей.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: habrahabr.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 0
    Нет аватара guest06.06.17 14:50:29

    Насколько я знаю SSE(а сейчас это уже AVX называется у Интел) на Эльбрусах не планируется. Упор идёт на увеличение числа инструкций за такт. В Э8СВ будет уже 50(правда из них только часть «вычислительных»). При ожидаемых 1.5 ГГц у Эльбрус-8СВ ожидается порядка 250 Гфлопс(32 Гфлопс на ядро), А от Э16С при ожидаемой частоте 2 ГГц, будет 32*(2/1.5) = 42 Гфлопс на ядро. У i7-6700 получается 230/4 = 57,5 Гфлопс на ядро. Для целых чисел результат аналогичный. Ко времени выхода Э16С у Интел появится AVX-512(уже в этом году будет в Xeon Skylake EP/EX и в следующем поколении Cannonlake). Производительность вырастет в 2 раза, до порядка сотни Гигафлопс на ядро. То есть он будет отставать в любом случае.

    95% софта под которым будет работать Эльбрус не будет написан для него с нуля. За основу взят Линукс. Поэтому оптимизация будет отставать от идеальных тестов к сожалению.

    • 0
      RadiantConfessor RadiantConfessor07.06.17 03:18:05

      Чтобы сделать вычисление «широких» данных необходимо их предварительно загрузить в специальный регистр. Так как команда в Эльбрусе уже широкая, то это позволяет вместе с командой сразу загружать весь необходимый набор данных. Единственным ограничением является количество функциональных блоков в АЛУ.

      Если у Эльбрус-8СВ количество подгружаемых за такт команд и данных вырастает в два раза, тогда производительность действительно возрастает в два раза. Но если ещё и частота вырастает на 200 МГц, тогда производительность дополнительно поднимется на 15%, составив 288 ГФлопс двойной точности. Это 36 ГФлопс на ядро. Тогда у Эльбрус-16С с его частотой 2 ГГц будет 48 ГФлопс на ядро.

      У i7-6700 хоть и 4 физических ядра, но у него 8 наборов АЛУ. То есть четыре конвейера на каждом из которых по два набора АЛУ. Как считать такие ядра? Они как двуглавые гидры. Но для честности всё же придётся учесть, что у процессоров Core с гипер трейдингом такие особенные навороченные ядра.

      Но есть один момент, расширение команд AVX увеличивает производительность только на этих командах, а расширения ширины команды в Эльбрусе предполагает и увеличение числа обрабатываемых за такт простых команд! Конечно для этого придётся в два раза увеличить АЛУ, но им есть куда его увеличивать, так как у МЦСТ на кристалле место не занято конвейером с предсказателем. Вся обработка идёт в момент компиляции. Следовательно процессор Эльбрус при росте ширины команды увеличивает производительность во всём спектре вычислений, а Core только в определённом классе задач связанных с командами AVX.

      То есть если Эльбрус-16С и будет отставать в пиковой производительности, то будет более быстрым в реальной производительности.

      Сама концепция предварительной компиляции говорит о том, что удельные энергозатраты на вычисление у Эльбруса всегда будут ниже чем у Сore при равных технологиях производства.

      Что же касается программного обеспечения, то по большей части здесь играет роль компилятор. Спектр задач для Эльбруса в ближайшем будущем не такой уж и широкий, чтобы нужно было много оптимизировать кода. Тоже самое затрагивает и Интел с их AVX. Там необходимо переписывать задачи для применения новых команд. То есть и под Интел с новыми командами программ будет не так много.

      Отредактировано: Zveruga~03:26 07.06.17