MAX
Подпишись
стань автором. присоединяйся к сообществу!
01 июня 1
129

Тестирование процессоров «Эльбрус-4С» и «Эльбрус-8С»

Опубликованы результаты сравнительного тестирования отечественных процессоров двух поколений — «Эльбрус-4С» (2014 год) и «Эльбрус-8С"(2016 год) в работе приложений по распознаванию паспортов и распознаванию автомобилей.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: habrahabr.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 0
    RadiantConfessor RadiantConfessor07.06.17 03:18:05

    Чтобы сделать вычисление «широких» данных необходимо их предварительно загрузить в специальный регистр. Так как команда в Эльбрусе уже широкая, то это позволяет вместе с командой сразу загружать весь необходимый набор данных. Единственным ограничением является количество функциональных блоков в АЛУ.

    Если у Эльбрус-8СВ количество подгружаемых за такт команд и данных вырастает в два раза, тогда производительность действительно возрастает в два раза. Но если ещё и частота вырастает на 200 МГц, тогда производительность дополнительно поднимется на 15%, составив 288 ГФлопс двойной точности. Это 36 ГФлопс на ядро. Тогда у Эльбрус-16С с его частотой 2 ГГц будет 48 ГФлопс на ядро.

    У i7-6700 хоть и 4 физических ядра, но у него 8 наборов АЛУ. То есть четыре конвейера на каждом из которых по два набора АЛУ. Как считать такие ядра? Они как двуглавые гидры. Но для честности всё же придётся учесть, что у процессоров Core с гипер трейдингом такие особенные навороченные ядра.

    Но есть один момент, расширение команд AVX увеличивает производительность только на этих командах, а расширения ширины команды в Эльбрусе предполагает и увеличение числа обрабатываемых за такт простых команд! Конечно для этого придётся в два раза увеличить АЛУ, но им есть куда его увеличивать, так как у МЦСТ на кристалле место не занято конвейером с предсказателем. Вся обработка идёт в момент компиляции. Следовательно процессор Эльбрус при росте ширины команды увеличивает производительность во всём спектре вычислений, а Core только в определённом классе задач связанных с командами AVX.

    То есть если Эльбрус-16С и будет отставать в пиковой производительности, то будет более быстрым в реальной производительности.

    Сама концепция предварительной компиляции говорит о том, что удельные энергозатраты на вычисление у Эльбруса всегда будут ниже чем у Сore при равных технологиях производства.

    Что же касается программного обеспечения, то по большей части здесь играет роль компилятор. Спектр задач для Эльбруса в ближайшем будущем не такой уж и широкий, чтобы нужно было много оптимизировать кода. Тоже самое затрагивает и Интел с их AVX. Там необходимо переписывать задачи для применения новых команд. То есть и под Интел с новыми командами программ будет не так много.

    Отредактировано: Zveruga~03:26 07.06.17