MAX
Подпишись
стань автором. присоединяйся к сообществу!
01 июня 1
129

Тестирование процессоров «Эльбрус-4С» и «Эльбрус-8С»

Опубликованы результаты сравнительного тестирования отечественных процессоров двух поколений — «Эльбрус-4С» (2014 год) и «Эльбрус-8С"(2016 год) в работе приложений по распознаванию паспортов и распознаванию автомобилей.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: habrahabr.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 0
    RadiantConfessor RadiantConfessor06.06.17 02:03:47

    Из той же статьи, которую ранее привёл я, а теперь и вы. Самая первая строка в первой таблице.

    Эльбрус-4С 401 мс

    Intel Core i7 255 мс

    Разница в 1,6 раз.

    Отсюда разница в скорости различается в определённом диапазоне. Я считаю, что в среднем эта разница в три раза. При этом напомню сказанное мной выше, читайте внимательно:

    Единственное что ему не хватает, так это поддержки SSE.

    Но это не гарантия, что так будет во всех задачах. Гарантия только на определённый круг задач, которые прошли тестирование.

    То есть есть определённые задачи, в которых тестировали Э4С и в каждой задаче тесты разнятся. Причины расхождений связаны:

    1. С неоптимизированным кодом тестов на Э4С.

    2. Отсутствием SSE.

    Реальная производительность Э4С в задачах обрабатывающих узкие данные (не более 64 бит) отличается от i7-6700K в среднем в три раза. Следовательно с появлением Э16С, если в нём будет присутствовать набор команд для обработки «широких» данных производительность обгонит современные процессоры Интел в пересчёте на одно ядро.

    Отредактировано: Zveruga~02:05 06.06.17
    • 0
      Нет аватара guest06.06.17 14:50:29

      Насколько я знаю SSE(а сейчас это уже AVX называется у Интел) на Эльбрусах не планируется. Упор идёт на увеличение числа инструкций за такт. В Э8СВ будет уже 50(правда из них только часть «вычислительных»). При ожидаемых 1.5 ГГц у Эльбрус-8СВ ожидается порядка 250 Гфлопс(32 Гфлопс на ядро), А от Э16С при ожидаемой частоте 2 ГГц, будет 32*(2/1.5) = 42 Гфлопс на ядро. У i7-6700 получается 230/4 = 57,5 Гфлопс на ядро. Для целых чисел результат аналогичный. Ко времени выхода Э16С у Интел появится AVX-512(уже в этом году будет в Xeon Skylake EP/EX и в следующем поколении Cannonlake). Производительность вырастет в 2 раза, до порядка сотни Гигафлопс на ядро. То есть он будет отставать в любом случае.

      95% софта под которым будет работать Эльбрус не будет написан для него с нуля. За основу взят Линукс. Поэтому оптимизация будет отставать от идеальных тестов к сожалению.

      • 0
        RadiantConfessor RadiantConfessor07.06.17 03:18:05

        Чтобы сделать вычисление «широких» данных необходимо их предварительно загрузить в специальный регистр. Так как команда в Эльбрусе уже широкая, то это позволяет вместе с командой сразу загружать весь необходимый набор данных. Единственным ограничением является количество функциональных блоков в АЛУ.

        Если у Эльбрус-8СВ количество подгружаемых за такт команд и данных вырастает в два раза, тогда производительность действительно возрастает в два раза. Но если ещё и частота вырастает на 200 МГц, тогда производительность дополнительно поднимется на 15%, составив 288 ГФлопс двойной точности. Это 36 ГФлопс на ядро. Тогда у Эльбрус-16С с его частотой 2 ГГц будет 48 ГФлопс на ядро.

        У i7-6700 хоть и 4 физических ядра, но у него 8 наборов АЛУ. То есть четыре конвейера на каждом из которых по два набора АЛУ. Как считать такие ядра? Они как двуглавые гидры. Но для честности всё же придётся учесть, что у процессоров Core с гипер трейдингом такие особенные навороченные ядра.

        Но есть один момент, расширение команд AVX увеличивает производительность только на этих командах, а расширения ширины команды в Эльбрусе предполагает и увеличение числа обрабатываемых за такт простых команд! Конечно для этого придётся в два раза увеличить АЛУ, но им есть куда его увеличивать, так как у МЦСТ на кристалле место не занято конвейером с предсказателем. Вся обработка идёт в момент компиляции. Следовательно процессор Эльбрус при росте ширины команды увеличивает производительность во всём спектре вычислений, а Core только в определённом классе задач связанных с командами AVX.

        То есть если Эльбрус-16С и будет отставать в пиковой производительности, то будет более быстрым в реальной производительности.

        Сама концепция предварительной компиляции говорит о том, что удельные энергозатраты на вычисление у Эльбруса всегда будут ниже чем у Сore при равных технологиях производства.

        Что же касается программного обеспечения, то по большей части здесь играет роль компилятор. Спектр задач для Эльбруса в ближайшем будущем не такой уж и широкий, чтобы нужно было много оптимизировать кода. Тоже самое затрагивает и Интел с их AVX. Там необходимо переписывать задачи для применения новых команд. То есть и под Интел с новыми командами программ будет не так много.

        Отредактировано: Zveruga~03:26 07.06.17