MAX
Подпишись
стань автором. присоединяйся к сообществу!
01 июня 1
129

Тестирование процессоров «Эльбрус-4С» и «Эльбрус-8С»

Опубликованы результаты сравнительного тестирования отечественных процессоров двух поколений — «Эльбрус-4С» (2014 год) и «Эльбрус-8С"(2016 год) в работе приложений по распознаванию паспортов и распознаванию автомобилей.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: habrahabr.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 1
    Нет аватара guest02.06.17 12:56:33

    Согласно тестирования приведённого в статье топикстартера Эльбрус-8С быстрее Эльбрус-4С в 3 раза.

    Где вы такой вывод нашли?

    Там тесты в пересчёте на 1 ГГц то есть результат i7-6700 разделён на 4, а Эльбрус-4С умножен на 1.25.

    i7-6700 выдаёт на тестах 230 Гигафлопс двойной точности

    Максимальная производительность Эльбрус-8С — 125 Гигафлопс двойной точности.

    То есть он полюбому в 2 раза менее производителен. Конкуренцию i7-6700 Эльбрус составит только с выходом Э8СВ с удвоенной производительностью на такт.

    Э8С даёт прирост в однопоточных тестах меньше 2 раз, по сравнению с Э4С, потому что рост в основном за счёт частоты. Поэтому прирост во многих приложениях будет не 3 раза.

    Вот сравнение Эльбрус-4С и i7-2600 в 7zip

     http://zoom.cnews.ru/publication/item/51820/3 

    Intel Core i7-2600 Эльбрус-2C+ Эльбрус-4С

    Архивация по алгоритму 7zip (сжатие), Мбайт/с 3,95 0,543 0,665

    Архивация по алгоритму 7zip (распаковка), Мбайт/с 33,437 6,296 8,679

    3.95/0.665 = ~6 раз медленнее Э4С чем i7-2600

    Ну, а в этом обзоре ещё одно сравнение Э4С и i7-2600

     https://geektimes.ru/post/270390/ 

    Отставание скачет от нескольких раз до десятков раз.

    А вообще сравнивать четырёхядерные процессоры и 8 ядерные неверно, из-за сильной зависимости результата от оптимизации под многопоточность. Разница до двух раз может быть не в пользу Эльбруса. Эльбрус-8С надо с восьмиядерным ryzen-1800x сравнивать. АМД тоже идут по пути много более простых ядер в ущерб частоте.

    Отредактировано: Tuck Trucker~13:33 02.06.17
    • 2
      RadiantConfessor RadiantConfessor02.06.17 19:55:20

      Там цифры не только в пересчёте на 1 ГГц, но и реальные. Вот их и сравнивайте. Начните с самой первой таблицы.

      В Эльбрусе-8С не только частота и количество ядер выросли, но и архитектура улучшилась.

      Ну и про наличие SSE в Intel не забывайте, о чём я упоминал. На Эльбрус-16С должен появиться аналог для вычислений с широкими данными.

      О чём говорят приведённые тесты сравнения Элбрус-4С и I7-7600K? В целочисленной арифметике с простыми данными (до 64 бит) наша архитектура показала себя лучше, а значит, если мы усовершенствуем АЛУ, наш процессор обгонит Интелы по производительности.

      Отредактировано: Zveruga~20:00 02.06.17
      • 0
        Нет аватара guest06.06.17 00:26:02

        Единственный тест без пометки о пересчёте.

         https://habrahabr.ru/comp...smartengines/blog/317672/ 

        Пример 6. Многопоточные вычисления

        Э4С выполнил его за 13170 мс

        6700 выполнил его за 2528 мс

        13170 / 2528 = 5.2 раза Э4С медленнее. Где те «в 3 раза медленнее i7-6700» о которых вы говорили?

        В целочисленной арифметике с простыми данными (до 64 бит) наша архитектура показала себя лучше

        Дайте ссылку, на примеры.

        Есть хороший тест, как раз на целые числа, называется 7zip(http://www.7-cpu.com).

        Выше я дал цифры(http://zoom.cnews.ru/publication/item/51820/3)

        3905/665 = ~6 раз медленнее Э4С чем i7-2600.

        Если мы опустим i7-2600 до частоты Э4C, получится 3.8 ГГц/0.75 ГГц= 5(в 5 раз меньше частота у Э4С)

        3950*(1/5) = 790 был бы результат у i7-2600 на частоте Э4С в тесте 7zip, у Э4С на этой частоте результат 665.

        665/790*100 = 84% даёт производительности Э4С от производительности i7-2600.

        То есть производительность Эльбрус чуть ниже производительности Интела на частоте Эльбруса и в 5-6 раз на собственных частотах процессоров( в лучших случаях). И если производительность Э8С в 3 раза выше, то он не догонит в этом тесте i7-2600, и тем более i7-6700.

        Ну и для сравнения

        Э4С 665*4= 2660

        Intel® Celeron® CPU G1610 @ 2.60GHz 2 ядра (цена 2.5 т.р) 5243

        Э8С (прикидка) 665*8*(1300/750) = 9221

        если просто на 3 умножить 2660*3 = 7980

        i7-2600 3888*4 = 15552(4 потока)

        i7-6700 24700

        AMD Ryzen 1800х 38000

        (https://www.servethehome.com/wp-content/uploads/2017/03/AMD-Ryzen-7-1800X-7-zip-Compression-.jpg)

        Отредактировано: Tuck Trucker~01:29 06.06.17
        • 0
          RadiantConfessor RadiantConfessor06.06.17 02:03:47

          Из той же статьи, которую ранее привёл я, а теперь и вы. Самая первая строка в первой таблице.

          Эльбрус-4С 401 мс

          Intel Core i7 255 мс

          Разница в 1,6 раз.

          Отсюда разница в скорости различается в определённом диапазоне. Я считаю, что в среднем эта разница в три раза. При этом напомню сказанное мной выше, читайте внимательно:

          Единственное что ему не хватает, так это поддержки SSE.

          Но это не гарантия, что так будет во всех задачах. Гарантия только на определённый круг задач, которые прошли тестирование.

          То есть есть определённые задачи, в которых тестировали Э4С и в каждой задаче тесты разнятся. Причины расхождений связаны:

          1. С неоптимизированным кодом тестов на Э4С.

          2. Отсутствием SSE.

          Реальная производительность Э4С в задачах обрабатывающих узкие данные (не более 64 бит) отличается от i7-6700K в среднем в три раза. Следовательно с появлением Э16С, если в нём будет присутствовать набор команд для обработки «широких» данных производительность обгонит современные процессоры Интел в пересчёте на одно ядро.

          Отредактировано: Zveruga~02:05 06.06.17
          • 0
            Нет аватара guest06.06.17 14:50:29

            Насколько я знаю SSE(а сейчас это уже AVX называется у Интел) на Эльбрусах не планируется. Упор идёт на увеличение числа инструкций за такт. В Э8СВ будет уже 50(правда из них только часть «вычислительных»). При ожидаемых 1.5 ГГц у Эльбрус-8СВ ожидается порядка 250 Гфлопс(32 Гфлопс на ядро), А от Э16С при ожидаемой частоте 2 ГГц, будет 32*(2/1.5) = 42 Гфлопс на ядро. У i7-6700 получается 230/4 = 57,5 Гфлопс на ядро. Для целых чисел результат аналогичный. Ко времени выхода Э16С у Интел появится AVX-512(уже в этом году будет в Xeon Skylake EP/EX и в следующем поколении Cannonlake). Производительность вырастет в 2 раза, до порядка сотни Гигафлопс на ядро. То есть он будет отставать в любом случае.

            95% софта под которым будет работать Эльбрус не будет написан для него с нуля. За основу взят Линукс. Поэтому оптимизация будет отставать от идеальных тестов к сожалению.

            • 0
              RadiantConfessor RadiantConfessor07.06.17 03:18:05

              Чтобы сделать вычисление «широких» данных необходимо их предварительно загрузить в специальный регистр. Так как команда в Эльбрусе уже широкая, то это позволяет вместе с командой сразу загружать весь необходимый набор данных. Единственным ограничением является количество функциональных блоков в АЛУ.

              Если у Эльбрус-8СВ количество подгружаемых за такт команд и данных вырастает в два раза, тогда производительность действительно возрастает в два раза. Но если ещё и частота вырастает на 200 МГц, тогда производительность дополнительно поднимется на 15%, составив 288 ГФлопс двойной точности. Это 36 ГФлопс на ядро. Тогда у Эльбрус-16С с его частотой 2 ГГц будет 48 ГФлопс на ядро.

              У i7-6700 хоть и 4 физических ядра, но у него 8 наборов АЛУ. То есть четыре конвейера на каждом из которых по два набора АЛУ. Как считать такие ядра? Они как двуглавые гидры. Но для честности всё же придётся учесть, что у процессоров Core с гипер трейдингом такие особенные навороченные ядра.

              Но есть один момент, расширение команд AVX увеличивает производительность только на этих командах, а расширения ширины команды в Эльбрусе предполагает и увеличение числа обрабатываемых за такт простых команд! Конечно для этого придётся в два раза увеличить АЛУ, но им есть куда его увеличивать, так как у МЦСТ на кристалле место не занято конвейером с предсказателем. Вся обработка идёт в момент компиляции. Следовательно процессор Эльбрус при росте ширины команды увеличивает производительность во всём спектре вычислений, а Core только в определённом классе задач связанных с командами AVX.

              То есть если Эльбрус-16С и будет отставать в пиковой производительности, то будет более быстрым в реальной производительности.

              Сама концепция предварительной компиляции говорит о том, что удельные энергозатраты на вычисление у Эльбруса всегда будут ниже чем у Сore при равных технологиях производства.

              Что же касается программного обеспечения, то по большей части здесь играет роль компилятор. Спектр задач для Эльбруса в ближайшем будущем не такой уж и широкий, чтобы нужно было много оптимизировать кода. Тоже самое затрагивает и Интел с их AVX. Там необходимо переписывать задачи для применения новых команд. То есть и под Интел с новыми командами программ будет не так много.

              Отредактировано: Zveruga~03:26 07.06.17