MAX
Подпишись
стань автором. присоединяйся к сообществу!
01 июня 1
129

Тестирование процессоров «Эльбрус-4С» и «Эльбрус-8С»

Опубликованы результаты сравнительного тестирования отечественных процессоров двух поколений — «Эльбрус-4С» (2014 год) и «Эльбрус-8С"(2016 год) в работе приложений по распознаванию паспортов и распознаванию автомобилей.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: habrahabr.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 2
    Нет аватара kerosene02.06.17 05:40:36

    Не будет соответствовать. У него частота в 3 раза ниже. Но даже будучи в 3 раза более медленным чем Скайлейк — это все равно отличный результат для микропроцессора, на разработку которого было потрачено около 7 млн $.

    • 2
      RadiantConfessor RadiantConfessor02.06.17 07:22:52

      В 3 раза медленнее чем Скайлейк Эльбрус-4С. Вот тут тестирование между Эльбрус-4С и i7-6700K. Эльбрус-4С в среднем отстаёт в 3 раза (если не учитывать тесты с SSE).

      Согласно тестирования приведённого в статье топикстартера Эльбрус-8С быстрее Эльбрус-4С в 3 раза. Выходит он сравнялся по производительности с i7-6700K. Единственное что ему не хватает, так это поддержки SSE.

      Но это не гарантия, что так будет во всех задачах. Гарантия только на определённый круг задач, которые прошли тестирование.

      Отредактировано: Zveruga~07:31 02.06.17
      • 0
        Нет аватара guest02.06.17 10:02:25

        Интересное сравнение с интелом. радует то что наши догнали штеуд в нужных приложениях.

        Только имхо сравнивать эльбрус с интелами потребительского сегмента в лоб бессмысленно. Интел делает процессоры для массового рынка, на них и поиграть, и порендерить, и посчитать можно. Эльбрус сделан под строго определенные задачи и в них хорош. Но ждать его в массовом рынке не стоит. Нестандартная архитектура это раз, и второе, сегмент настольных пк умирает.Эльбрус будет все еще нужен для ЦОДов и в оборонке для пк, но на выход в открытый рынок надежды мало,да и не нужно оно. А есть сравнение серверов на эльбрусе и интелах? Вот это весьма любопытно.

        • 3
          RadiantConfessor RadiantConfessor02.06.17 10:48:29

          Зато сегмент серверов развивается.    

          Эльбрус будет все еще нужен для ЦОДов

          Не всё ещё, а наверное навсегда.    

          Взойти на мировой рынок серверов гораздо проще, там не нужны драйвера под крутые видеокарты и поддержка современных видеоигр.

          • -2
            Нет аватара guest02.06.17 11:39:01

            Взойти на мировой рынок серверов гораздо проще, там не нужны драйвера под крутые видеокарты и поддержка современных видеоигр.

            Там нужно много памяти для in-Memory применений и/или быстрый интерконнект для распределенных вычислений.

            Я бы не сказал что это просто, когда ни того ни другого — нет.

            Да и как-то странно рассуждать о выходе на мировой рынок серверов и при этом сравнивать себя с десктопным процессором.

            Да — и там конечно же нужны драйвера под крутые видеокарты, просто не игровые.

            Нет, боюсь экспортные перспективы да еще и в массовом сегменте у Эльбруса — нулевые.

            Отредактировано: Антон Смоленский~12:34 02.06.17
            • 3
              ksey 02.06.17 11:48:57

              Интерконнект есть — Высокоскоростная сеть «Ангара» для суперкомпьютеров и кластеров:

              Сетевой адаптер представляет собой плату расширения PCI Express (аналогично сетевым адаптерам InfiniBand), к которой подключается до 6 (или до 8, с платой расширения) кабелей для соединения с соседними узлами. Поддерживаются топологии сети без коммутаторов: кольцо, 2D, 3D и 4D-тор (либо решётка); в общем случае передача данных между узлами может осуществляться через промежуточные узлы.

              Основной режим программирования — совместное использование MPI, OpenMP и OpenSHMEM; также поддерживаются другие модели программирования, в том числе Charm++, GASNet, ARMCI, UPC. Для поддержки OpenSHMEM и PGAS-языков на каждом узле выделяется регион памяти, доступный для удалённых обращений (чтения, записи, атомарных операций) от других сетевых узлов. Сеть «Ангара» совместима с коммерчески доступными процессорами и материнскими платами.

              СБИС сетевого адаптера (ЕС8430) была разработана в АО «НИЦЭВТ» и изготовлена на фабрике TSMC по технологии 65 нм. Плата сетевого адаптера изготавливается на собственном производстве в АО «НИЦЭВТ».

              Отредактировано: ksey~11:50 02.06.17
              • 0
                Нет аватара guest02.06.17 11:51:15

                Я прям себе живо представил как Гугл или Амазон рассуждает что бы поставить в ЦОД — IB HDR или Ангару. Очень непростой выбор надо сказать.

                Экспортные перспективы Ангары также туманны как и Эльбруса.

                Но я в общем-то говорил немного о другом. Я говорю том что у Эльбрус PCIe Gen2 (5GT), а на дворе уже Gen4 (16GT). У процессора нет быстрого интерконнекта. Адаптер то можно любой поставить — не об нем речь.

                Отредактировано: Антон Смоленский~12:07 02.06.17
                • 1
                  ksey 02.06.17 12:12:17

                  Сейчас не идет речь об экспортных перспективах. На первых порах нужно по максимуму обезопасить страну от различных «подлянок» со стороны запада.

                  • 0
                    Нет аватара guest02.06.17 12:15:58

                    Взойти на мировой рынок серверов гораздо проще, там не нужны драйвера под крутые видеокарты и поддержка современных видеоигр.

                    Напоминаю что в данной ветке как раз об них речь и идет. А про «обезопасить» и «подлянки» — я ничего и не говорил. Меня эта тема мало интересует.

                    Отредактировано: Антон Смоленский~12:19 02.06.17
                • 2
                  RadiantConfessor RadiantConfessor02.06.17 19:52:44

                  Гугл или Амазон

                  Зачем? После того как Т-платформы залезли на рынок США и эта страна прямым недвусмысленным указом показала, что она не допустит конкурентов на свой рынок, соваться туда нет смысла. А вот на рынок ОДКБ и ШОС есть смысл.

                  Не все в мире доверяют Гугл и Майкрософт.

                  Отредактировано: Zveruga~19:53 02.06.17
                  • 0
                    Нет аватара guest02.06.17 20:04:40

                    Зачем? После того как Т-платформы залезли на рынок США и эта страна прямым недвусмысленным указом показала, что она не допустит конкурентов на свой рынок, соваться туда нет смысла.

                    Не совсем. Более популярная версия — что это HP отомстил за проигранный тендер в Юлихе — туда Ломо-2 должны были ставить, то есть все по взрослому. А правду знает только Всеволод Юрьевич и госдеп. То что там поставили в США — достаточно незначительный проект на самом деле. Просто в СМИ так преподнесли — мол ура, наши продались в США.

                    Ну и собственно если ты не заметил — Т-Платформы больше не занимается этой тематикой. Они полностью ушли в Байкал и решения на нем. Да и там некому собственно уже. А посколько они были единственные у нас — то в общем-то никто вообще не занимается. Ну если не считать интеграторов, которые ставят решения на HP/Dell и прочем таком.

                    Но не суть.

                    Ты ж сам заговорил про мировой рынок серверов. А это США и Китай. Все.

                    Причем китайский рынок гораздо более жесткий. В США продавать проще. Ну и суперкомпьютерная тематика она полностью под гос. контролем везде, во всех странах. И скорее имиджевая чем коммерческая. Деньги зарабатывают продаваясь Гуглам, Амазонам, банкам и прочим подобным.

                    Отредактировано: Антон Смоленский~20:26 02.06.17
                    • 3
                      RadiantConfessor RadiantConfessor02.06.17 20:53:11

                      В их судах сидят патриоты националисты    , которые защищают интересы своей страны. Их власть поддерживает их коммерсантов.

                      Вся экономика США выросла благодаря противостоянию СССР. США объединилась с Европой на почве противостояния коммунизму и в первую очередь они взаимодействовали за счёт оборонной экономики. То есть НАТО это фактически такой рынок, который существует за счёт денег вливаемых в оборону НАТО. После распада СССР этот рынок стал глохнуть, ЕС уже неохотно вливается деньгами, заказы на F-35 это показывают и Трамп решил изменить эту ситуацию. С ЕС он решил трясти процент, заключил огромный договор с арабами.

                      Вот и нам следует использовать их опыт, не исключать этот путь в высоких технологиях. По этому думаю следует смотреть на рынок ОДКБ сейчас и на рынок ШОС в будущем.

                      По этому США оттуда исключаем, ЕС исключаем, это всё страны НАТО. Смотрим на Китай и Индию, как крупнейших партнёров. Параллельно подключаем в эту схему Иран, Пакистан, Бангладеш и Мьянму. Иран будет первым в этой очереди. Его НАТО недолюбливает, гайки ему закручивает, значит нам сейчас важно заключать договоры военно-технического сотрудничества с этой страной.

                      Убедим Иран поставлять нефть и газ в Индию. Сами будем тянут трубу в Китай. Замкнём это торговое кольцо

                      Россия-Китай-Мьянма

                      Россия-Туркменистан-Иран-Пакистан-Индия-Бангладеш-Мьянма

                      Получим половину населения планеты и большую част денег мира. Больше чем есть у всего НАТО!

                      Отредактировано: Zveruga~20:55 02.06.17
            • 2
              RadiantConfessor RadiantConfessor02.06.17 11:54:20

              Свой оптический интерконнект мы уже создали.

              МЦСТ как раз постоянно дистанционирует себя от десктопных процессоров, но общественность почему-то требует от него поддержки офисных и домашних задач. А они тем временем клепают потихоньку четырёхпроцессорные серверы для государства.

              Экспортные перспективы появляются уже с Эльбрус-8С в пределах ОДКБ, так как обеспечивают защиту от НАТО. Если появится Эльбрус-16С и Китай с Индией нам поверят, тогда мы выйдем и на рынок ШОС. А это половина населения планеты и большая часть денег в мире.

              Отредактировано: Zveruga~11:55 02.06.17
              • -1
                Нет аватара guest02.06.17 11:58:37

                Не люблю повторяться, но сделаю исключение.

                У самого Эльбруса нет быстрого интерконнекта.

                Российские решения по интерконнекту как-то Ангара — это тема отдельной дискуссии. И я в ней не очень силен. Моя тема в данном контексте — это Bandwidth, а не сетевые топологии. Хотя я думаю когда BW отличается в несколько раз — клевой сетевой топологией уже не отделаться.

                Ты ж говоришь о мировом рынке, а не о внутренних потребностях. На мировом рынке наши решения ни на Эльбрусе ни на Ангаре мало кого заинтересуют. Только если с академической точки зрения — изучить и сделать свое в 5 раз быстрее. Там утрирую — взять идеологию Ангары и запилить её на 56G сердесах — вот такое на мировом рынке будет интересно.

                Экспортные перспективы появляются уже с Эльбрус-8С в пределах ОДКБ, так как обеспечивают защиту от НАТО. Если появится Эльбрус-16С и Китай с Индией нам поверят, тогда мы выйдем и на рынок ШОС.

                У Китая есть свои процессоры, гораздо серьезнее, а еще они бегают по всему миру и лицензируют все подряд. Боюсь не стоит расчитывать на продажу процессоров в Китай. Я думаю скорее будет наоборот — мы начнем закупать ихние.

                Отредактировано: Антон Смоленский~13:33 02.06.17
                • 1
                  RadiantConfessor RadiantConfessor02.06.17 19:28:46

                  Если Интерконнект втыкается в PCI-E 3.0×8 слот думаю и ширины канала будет предостаточно, и к Элбрусу его можно беспроблемно прикрутить.

                  Отечественным оптическим интерконнектом у нас является Паутина. Скорость передачи на один кабель 56 Гбит/с. Таких кабеля в каждой плате два. Внешний маршрутизатор или коммутатор не нужен. Вся маршрутизация осуществляется на плате интерконнекта.

                  У Китая есть свои процессоры

                  Да, они это умеют и даже свои суперкомпьютеры строят, но ничего неизвестно про их собственные интерконнекты. Их Goodson/Loongson это MIPS архитектура в отличие от уникального Эльбруса. x86 их процессор не поддерживает, а эта фича помогает в наладке/отладке систем и расширяет спектр применения. В производительности они не особо далеко ушли. Выходит наша задача показать чем мы лучше. Для этого нужно сравнивать их ЦОД и наши. Мы уже умудрялись выигрывать иностранные тендеры на построение ЦОД даже в США, значит нам есть что показать миру в этой области.

                  Отредактировано: Zveruga~19:30 02.06.17
                  • -1
                    Нет аватара guest02.06.17 19:38:32

                    Если Интерконнект втыкается в PCI-E 3.0×8 слот думаю и ширины канала будет предостаточно, и к Элбрусу его можно беспроблемно прикрутить.

                    Отечественным оптическим интерконнектом у нас является Паутина. Скорость передачи на один кабель 56 Гбит/с. Таких кабеля в каждой плате два. Внешний маршрутизатор или коммутатор не нужен. Вся маршрутизация осуществляется на плате интерконнекта.

                    1) нет у Эльбруса PCIe Gen3 — о чем я собственно и пишу уже в 3 сообщении подряд. А это не то что там USB3.0 который хер поймешь нужен или нет вообще, а весьма серьезный недостаток для системы, которая позиционирует себя как серверная.

                    2) 8 x 8GT/s = 64GT/s. Вопрос — как 2×56GT/s будут работать с 64GT/s слотом? Но это не существенно на самом деле — так. Коннектор можно и пошире конечно, детали реализации.

                    3) У них там FPGA под радиатором. Вероятно Xilinx с ценой как у Боинга. Alterra за 4.5k$. То есть решение не рыночное — а прототип. Рыночное решение будет, когда/если будет ASIC с 56G 14G SerDes. Двухпортовые Адаптеры IB FDR (те же 2×56G) нынче продаются за 1.5k$ за адаптер, причем 50% я думаю это маржа Mellanox. Двухпортовые IB HDR 2×100G адаптеры уже штучно понапроданы всяким монстрам и скоро пойдут массовкой.

                    Даже с учетом того что я несколько прогнался и кое-что поправил — рано для покорения мира.

                    Отредактировано: Антон Смоленский~20:42 02.06.17
                    • 1
                      RadiantConfessor RadiantConfessor02.06.17 20:32:16

                      нет у Эльбруса PCIe Gen3

                      А ведь и правда нет. КПИ-2 поддерживает Gen 2. Значит, чтобы реализовать Эльбрус на Паутине придётся ждать Эльбрус-16С, а это ещё два года.

                      Вопрос — как 2×56GT/s будут работать с 64GT/s слотом? Но это не существенно на самом деле — так. Коннектор можно и пошире конечно, детали реализации.

                      Дак это, эта плата она же и коммутатор в одном лице. То есть она принимает чужой трафик, которой не предназначен для неё и проталкивает дальше по сети, по другому проводу. По этому часть данных на шину даже не попадает.

                      У них там FPGA под радиатором. Вероятно Xilinx с ценой как у Боинга. Alterra за 4.5k$. То есть решение не рыночное — а прототип.

                      Да, на ПЛИС. Но это не прототип. Создано для реального использования в наших суперкомпьютерах. Мы ведь даже целые суперкомпьютеры на ПЛИС создаём и довольно успешные. Нам пока нет необходимости свой специализированный процессор для этих задачь пилить, дешевле ПЛИС использовать. Но сам разработчик уже заявлял, что если понадобится выпустят и свой процессор.

                      Паутину на экспорт в дальнее зарубежье пока ещё не предлагают. Мы только только на рынок ОДКБ заходим. Ведь её создавали для военных, а ОДКБ это оборонная структура.

                      Когда ШОС объединится в оборонную структуру на подобие НАТО (а я в это искренне верю), тогда рынок Паутины и Эльбруса серьёзно расширится.

                      Отредактировано: Zveruga~20:36 02.06.17
                      • 0
                        Нет аватара guest02.06.17 20:46:11

                        Значит, чтобы реализовать Эльбрус на Паутине придётся ждать Эльбрус-16С, а это ещё два года.

                        А разве там будет Gen3 внутри?

                        Насколько я понял не Эльбрус-16С наверное надо ждать, а КПИ-3?

                        • 0
                          RadiantConfessor RadiantConfessor02.06.17 20:56:33

                          Говорят южный мост в Эльбрус-16С будет интегрирован в процессор. Но это пока только слухи.

                          Мыж графическое ядро в процессор не суём, места на чипе должно хватить.

                          Отредактировано: Zveruga~20:57 02.06.17
      • 1
        Нет аватара guest02.06.17 12:56:33

        Согласно тестирования приведённого в статье топикстартера Эльбрус-8С быстрее Эльбрус-4С в 3 раза.

        Где вы такой вывод нашли?

        Там тесты в пересчёте на 1 ГГц то есть результат i7-6700 разделён на 4, а Эльбрус-4С умножен на 1.25.

        i7-6700 выдаёт на тестах 230 Гигафлопс двойной точности

        Максимальная производительность Эльбрус-8С — 125 Гигафлопс двойной точности.

        То есть он полюбому в 2 раза менее производителен. Конкуренцию i7-6700 Эльбрус составит только с выходом Э8СВ с удвоенной производительностью на такт.

        Э8С даёт прирост в однопоточных тестах меньше 2 раз, по сравнению с Э4С, потому что рост в основном за счёт частоты. Поэтому прирост во многих приложениях будет не 3 раза.

        Вот сравнение Эльбрус-4С и i7-2600 в 7zip

         http://zoom.cnews.ru/publication/item/51820/3 

        Intel Core i7-2600 Эльбрус-2C+ Эльбрус-4С

        Архивация по алгоритму 7zip (сжатие), Мбайт/с 3,95 0,543 0,665

        Архивация по алгоритму 7zip (распаковка), Мбайт/с 33,437 6,296 8,679

        3.95/0.665 = ~6 раз медленнее Э4С чем i7-2600

        Ну, а в этом обзоре ещё одно сравнение Э4С и i7-2600

         https://geektimes.ru/post/270390/ 

        Отставание скачет от нескольких раз до десятков раз.

        А вообще сравнивать четырёхядерные процессоры и 8 ядерные неверно, из-за сильной зависимости результата от оптимизации под многопоточность. Разница до двух раз может быть не в пользу Эльбруса. Эльбрус-8С надо с восьмиядерным ryzen-1800x сравнивать. АМД тоже идут по пути много более простых ядер в ущерб частоте.

        Отредактировано: Tuck Trucker~13:33 02.06.17
        • 2
          RadiantConfessor RadiantConfessor02.06.17 19:55:20

          Там цифры не только в пересчёте на 1 ГГц, но и реальные. Вот их и сравнивайте. Начните с самой первой таблицы.

          В Эльбрусе-8С не только частота и количество ядер выросли, но и архитектура улучшилась.

          Ну и про наличие SSE в Intel не забывайте, о чём я упоминал. На Эльбрус-16С должен появиться аналог для вычислений с широкими данными.

          О чём говорят приведённые тесты сравнения Элбрус-4С и I7-7600K? В целочисленной арифметике с простыми данными (до 64 бит) наша архитектура показала себя лучше, а значит, если мы усовершенствуем АЛУ, наш процессор обгонит Интелы по производительности.

          Отредактировано: Zveruga~20:00 02.06.17
          • 0
            Нет аватара guest06.06.17 00:26:02

            Единственный тест без пометки о пересчёте.

             https://habrahabr.ru/comp...smartengines/blog/317672/ 

            Пример 6. Многопоточные вычисления

            Э4С выполнил его за 13170 мс

            6700 выполнил его за 2528 мс

            13170 / 2528 = 5.2 раза Э4С медленнее. Где те «в 3 раза медленнее i7-6700» о которых вы говорили?

            В целочисленной арифметике с простыми данными (до 64 бит) наша архитектура показала себя лучше

            Дайте ссылку, на примеры.

            Есть хороший тест, как раз на целые числа, называется 7zip(http://www.7-cpu.com).

            Выше я дал цифры(http://zoom.cnews.ru/publication/item/51820/3)

            3905/665 = ~6 раз медленнее Э4С чем i7-2600.

            Если мы опустим i7-2600 до частоты Э4C, получится 3.8 ГГц/0.75 ГГц= 5(в 5 раз меньше частота у Э4С)

            3950*(1/5) = 790 был бы результат у i7-2600 на частоте Э4С в тесте 7zip, у Э4С на этой частоте результат 665.

            665/790*100 = 84% даёт производительности Э4С от производительности i7-2600.

            То есть производительность Эльбрус чуть ниже производительности Интела на частоте Эльбруса и в 5-6 раз на собственных частотах процессоров( в лучших случаях). И если производительность Э8С в 3 раза выше, то он не догонит в этом тесте i7-2600, и тем более i7-6700.

            Ну и для сравнения

            Э4С 665*4= 2660

            Intel® Celeron® CPU G1610 @ 2.60GHz 2 ядра (цена 2.5 т.р) 5243

            Э8С (прикидка) 665*8*(1300/750) = 9221

            если просто на 3 умножить 2660*3 = 7980

            i7-2600 3888*4 = 15552(4 потока)

            i7-6700 24700

            AMD Ryzen 1800х 38000

            (https://www.servethehome.com/wp-content/uploads/2017/03/AMD-Ryzen-7-1800X-7-zip-Compression-.jpg)

            Отредактировано: Tuck Trucker~01:29 06.06.17
            • 0
              RadiantConfessor RadiantConfessor06.06.17 02:03:47

              Из той же статьи, которую ранее привёл я, а теперь и вы. Самая первая строка в первой таблице.

              Эльбрус-4С 401 мс

              Intel Core i7 255 мс

              Разница в 1,6 раз.

              Отсюда разница в скорости различается в определённом диапазоне. Я считаю, что в среднем эта разница в три раза. При этом напомню сказанное мной выше, читайте внимательно:

              Единственное что ему не хватает, так это поддержки SSE.

              Но это не гарантия, что так будет во всех задачах. Гарантия только на определённый круг задач, которые прошли тестирование.

              То есть есть определённые задачи, в которых тестировали Э4С и в каждой задаче тесты разнятся. Причины расхождений связаны:

              1. С неоптимизированным кодом тестов на Э4С.

              2. Отсутствием SSE.

              Реальная производительность Э4С в задачах обрабатывающих узкие данные (не более 64 бит) отличается от i7-6700K в среднем в три раза. Следовательно с появлением Э16С, если в нём будет присутствовать набор команд для обработки «широких» данных производительность обгонит современные процессоры Интел в пересчёте на одно ядро.

              Отредактировано: Zveruga~02:05 06.06.17
              • 0
                Нет аватара guest06.06.17 14:50:29

                Насколько я знаю SSE(а сейчас это уже AVX называется у Интел) на Эльбрусах не планируется. Упор идёт на увеличение числа инструкций за такт. В Э8СВ будет уже 50(правда из них только часть «вычислительных»). При ожидаемых 1.5 ГГц у Эльбрус-8СВ ожидается порядка 250 Гфлопс(32 Гфлопс на ядро), А от Э16С при ожидаемой частоте 2 ГГц, будет 32*(2/1.5) = 42 Гфлопс на ядро. У i7-6700 получается 230/4 = 57,5 Гфлопс на ядро. Для целых чисел результат аналогичный. Ко времени выхода Э16С у Интел появится AVX-512(уже в этом году будет в Xeon Skylake EP/EX и в следующем поколении Cannonlake). Производительность вырастет в 2 раза, до порядка сотни Гигафлопс на ядро. То есть он будет отставать в любом случае.

                95% софта под которым будет работать Эльбрус не будет написан для него с нуля. За основу взят Линукс. Поэтому оптимизация будет отставать от идеальных тестов к сожалению.

                • 0
                  RadiantConfessor RadiantConfessor07.06.17 03:18:05

                  Чтобы сделать вычисление «широких» данных необходимо их предварительно загрузить в специальный регистр. Так как команда в Эльбрусе уже широкая, то это позволяет вместе с командой сразу загружать весь необходимый набор данных. Единственным ограничением является количество функциональных блоков в АЛУ.

                  Если у Эльбрус-8СВ количество подгружаемых за такт команд и данных вырастает в два раза, тогда производительность действительно возрастает в два раза. Но если ещё и частота вырастает на 200 МГц, тогда производительность дополнительно поднимется на 15%, составив 288 ГФлопс двойной точности. Это 36 ГФлопс на ядро. Тогда у Эльбрус-16С с его частотой 2 ГГц будет 48 ГФлопс на ядро.

                  У i7-6700 хоть и 4 физических ядра, но у него 8 наборов АЛУ. То есть четыре конвейера на каждом из которых по два набора АЛУ. Как считать такие ядра? Они как двуглавые гидры. Но для честности всё же придётся учесть, что у процессоров Core с гипер трейдингом такие особенные навороченные ядра.

                  Но есть один момент, расширение команд AVX увеличивает производительность только на этих командах, а расширения ширины команды в Эльбрусе предполагает и увеличение числа обрабатываемых за такт простых команд! Конечно для этого придётся в два раза увеличить АЛУ, но им есть куда его увеличивать, так как у МЦСТ на кристалле место не занято конвейером с предсказателем. Вся обработка идёт в момент компиляции. Следовательно процессор Эльбрус при росте ширины команды увеличивает производительность во всём спектре вычислений, а Core только в определённом классе задач связанных с командами AVX.

                  То есть если Эльбрус-16С и будет отставать в пиковой производительности, то будет более быстрым в реальной производительности.

                  Сама концепция предварительной компиляции говорит о том, что удельные энергозатраты на вычисление у Эльбруса всегда будут ниже чем у Сore при равных технологиях производства.

                  Что же касается программного обеспечения, то по большей части здесь играет роль компилятор. Спектр задач для Эльбруса в ближайшем будущем не такой уж и широкий, чтобы нужно было много оптимизировать кода. Тоже самое затрагивает и Интел с их AVX. Там необходимо переписывать задачи для применения новых команд. То есть и под Интел с новыми командами программ будет не так много.

                  Отредактировано: Zveruga~03:26 07.06.17
    • 0
      Нет аватара guest02.06.17 09:51:53

      Это и частота 1300 МГц, и 25 операций за такт на ядро.

      Не совсем так:

      1. «Это и частота 1300 МГц, и 25 операций за такт на ядро."

      2."Особенностью VLIW является то, что в каждой команде процессора может содержаться до 23 элементарных операций, которые должны исполняться параллельно."

      Это означает что при выполнении задач написанных под конкретный процессор, Эльбрус получает огромную производительность по сравнению с X86. Что, правда, требует создание как минимум компилятора который будет переписывать код из исходника, а фактечески преписывать всё ПО.

      • 1
        RadiantConfessor RadiantConfessor02.06.17 20:23:47

        В Э4С было 23 команды на такт. В Э8С 25 команд на такт. Архитектура на месте не стоит, развивается.

      • 0
        Виктор Гюго Виктор Гюго07.06.17 14:59:50

        > а фактечески преписывать всё ПО.

        компилятор и базовые библиотеки.