Лого Сделано у нас
243

«Ижевский радиозавод» начал выпуск первых отечественных персональных компьютеров

АО «Ижевский радиозавод» начал производство персональных компьютеров «Эльбрус-401». Заказчиком является компания АО «МЦСТ» — разработчик микропроцессоров архитектуры «Эльбрус».

Компьютеры «Эльбрус-401», оснащенные отечественной операционной системой, предназначены потребителям с повышенными требованиями к информационной безопасности.

К настоящему моменту произведена и передана заказчику первая партия — 80 компьютеров и 20 материнских плат. В 2016 году Ижевскому радиозаводу предстоит выполнить новые заказы по производству российских компьютеров «Эльбрус».

читать полностью

  • 2
    Zveruga Zveruga
    04.12.1523:58:22

    Вот по поводу того, что архитектуре Эльбрус труднее достичь пиковой производительности — можете объясниться? Пиковая производительность доступна любой архитектуре только на одной задаче, собственно в которой эту производительность считали.

    • 0
      Tuck Trucker Tuck Trucker
      05.12.1501:57:20

      Речь о теоретической производительности. Ну то есть о сферическом коне в вакууме. Число операций за такт X число ядер X частота. А есть производительность измеренная, обычно измеряют софтиной linpack,под винду есть linx — linpack в красивой обёртке, это уже ближе к практике он всегда ниже пиковой. Хотя у Интела хорошие показатели отношения.

      Почему труднее достичь? У интел процессор хавает инструкции маленькими порциями и часто, а Эльбрус большими порциями и реже. Чтобы выполнить широкую VLIW инструкцию, надо чтобы данные в ней не были зависимыми. То есть чтобы можно было выполнять их параллельно. Если взять кусок кода в 5 инструкций, и в 25, то вероятней что в нем будет кусок в котором надо будет выполнить сначала одно вычисление, чтобы начать другое. В итоге выполнится не 25 инструкций, а только 3 к примеру, или 10. При этом вычислительные блоки процессора будут использоваться лишь частично. А частота-то ниже. Процессор будет простаивать. Если скажем мы на интел и на эльбрус запустим код в котором можно будет выполнять только по 6 скажем инструкций, то Интел мы можем загрузить по полной, а Эльбрус получится только на 25% где-то(6 из 25). Частота у Эльбруса-8С в 3 раза меньше. Значит Эльбрус будет в 3 раза медленнее.

      При этом никаких проблем не будет если ваш процессор может выполнять только по одной инструкции за такт, но частота тогда больно высокая нужна. На практике Интел может выполнить несколько, что-то около 6 емнип.

      https://ru.wikipedia.org/wiki/Зависимость_данных

      • 4
        Andrey Tupkalo Andrey Tupkalo
        05.12.1518:34:19

        Почему труднее достичь? У интел процессор хавает инструкции маленькими порциями и часто, а Эльбрус большими порциями и реже. Чтобы выполнить широкую VLIW инструкцию, надо чтобы данные в ней не были зависимыми. То есть чтобы можно было выполнять их параллельно. Если взять кусок кода в 5 инструкций, и в 25, то вероятней что в нем будет кусок в котором надо будет выполнить сначала одно вычисление, чтобы начать другое. В итоге выполнится не 25 инструкций, а только 3 к примеру, или 10. При этом вычислительные блоки процессора будут использоваться лишь частично. А частота-то ниже. Процессор будет простаивать.

        Вы уж извините, но это бред-с. Точнее, это имеет смысл, если в Эльбрус каким-то макаром запихать с ноги код, сгенерированный обычным традиционным компилятором. Тогда как минимум половину всего смысла архитектуры Эльбруса составляет написание особого компилятора, статически разрешающего зависимости данных на этапе компиляции, и набивающего широкую команду уже независимыми инструкциями. Итаниум у Интела пролетел как раз по причине того, что там не сумели в оптимизирующий компилятор, способный на такой трюк, и потом ШКС у Итаниума в основном состояло из НОПов — в итоге полуторагигагерцовый процессор уступал на х86 коде даже не Пентиуму 4, а 486.

        Так вот, в МЦСТ в такой компилятор смогли, и даже более того — продали лицензию на него в тот самый Интел, и в придачу не то заслали, не то сослали туда хитрого аармяна Бориса Арташесовича.     Который сейчас, ВНЕЗАПНО, работает там консультантом, в отделе ведущем разработки и сопровождение линейки Итаниума. А Эльбрусы народ на ЛОРе уже благополучно тестил, результат вполне соответствующий ожиданиям: на хорошо распараллеливающемся коде, типа научного числогрызения, 1200 МГц камень вполне тягается с i7, в плохопараллелящихся, типа гуя, — производительность падает примерно до уровня начальных i3.

        • 1
          Zveruga Zveruga
          06.12.1501:50:20

          А Итаниумы у Интела в итоге таки получились более производительными чем х86, но переписывать кучу ПО под него мало кто хотел. На том и погорела архитектура.

          Отредактировано: Zveruga~02:50 06.12.15
          • 1
            Andrey Tupkalo Andrey Tupkalo
            06.12.1507:52:59

            Там эмуляция вышла очень неудачной, поэтому х86-й код выполнялся на них крайне медленно. А так-то свою нишу в серверах они вполне себе нашли.

      • 0
        Zveruga Zveruga
        06.12.1501:46:01

        На самом деле пиковая производительность не такая уж и теоретическая. Пиковая производительность это скорость вычисления такой функции, быстрее которой процессор ни чего не считает.

        Например процессор быстрее всего складывает два числа с плавающей запятой, тогда пиковая производительность будет считаться именно в этой функции. А если быстрее всего процессор перемножает матрицы с вещественными числами, тогда пиковую производительность будут измерять в скорости выполнения именно этих команд.

        Естественно, что круг выполняемых центральными процессорами задач почти всегда состоит не только из таких функций, которые вычисляются в процессоре быстрее всего. По этому реальная производительность на реальных задачах всегда ниже пиковой.

        Но это не отменяет того, что любой процессор реально может показать свою пиковую производительность. Просто эта скорость будет достигнута только в специальных задачах.

        И вот по этому, говорить о том, что достигнуть пиковую производительность на архитектуре Эльбрус сложнее чем на других архитектурах, было бы опрометчиво.

        Ваше же объяснение на примере RISC команд микроядра Intel более чем неудачное. Так как количество специализированных вычислительных блоков в ядрах Intel ограничено. По этой причине там используется конвейер и существуют задержки, когда необходимое АЛУ занято.

        Кроме того, 25 команд в широкой команде Эльбрус не обязаны быть зависимыми. За такт в одной широкой команде могут выполнятся сразу несколько разных независимых вычислительных задач. Например перемножение четырёх пар вещественных чисел в четырёх специализированных АЛУ.

        Отредактировано: Zveruga~02:47 06.12.15
        • 0
          Andrey Tupkalo Andrey Tupkalo
          06.12.1507:51:55

          Четырёх «плавающих» АЛУ там просто нету, их там два. ;) Вообще АЛУ там шесть, но модулей плавающей точки там не то три, не то два, сейчас уже точно не помню, причём делить из них умеет только один. Правда это в прошлой версии архитектуры, в 8С добавили два АЛУ, одно из которых «плавающий», ЕМНИМС.

          • 0
            Zveruga Zveruga
            07.12.1500:35:47

            Это я по памяти, не уточняя детали.

Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,