стань автором. присоединяйся к сообществу!
Лого Сделано у нас
70

«Мультиклет»: завершены внутренние тесты первой партии мультиклеточных процессоров

Компания «Мультиклет» объявляет о завершении внутренних тестов первой опытно-промышленной партии мультиклеточных процессоров, выпущенной в июне.

Приводятся следующие параметры процессора:

кристалл с топологической нормой 180нм размером 10х10 мм в корпусе QFP-208, что обусловлено периферией: 2 интерфейса SPI с селектором “ведомых” устройств (в режиме “ведущий”), 4 универсальных асинхронных приёмопередатчика UART c FIFO на прием/передачу, 2 интерфейса I2C (один “master” и один “slave”), интерфейс I2S, Ethernet контроллер 10/100Мб/с, USB 1.1 FS (device) контроллер с последовательным внешним интерфейсом для подключения приемо-передатчика, часы реального времени с календарем, 7 таймеров общего назначения, 4 порта ввода-вывода, общее количество вводов-выводов – 104, 4-х канальный контроллер ШИМ, сторожевой таймер.

Выбор топологической нормы 180 нм обусловлен стоимостью начальной разработки и апробирования, а так же планируемой областью применения микропроцессора.

Подробная информация о мультиклеточной архитектуре, на основе которой создан микропроцессор MCp0411100101 находится на сайте компании www.multiclet.com в разделе поддержка, общетехническая информация. В тексте документа «Концепция мультиклеточного процессора» содержится подробная информация об описании и принципах построения процессора, а так же о его архитектурных особенностях.

«В ходе испытаний разработчиками нашей компании подтверждены ранее заявленные по микропроцессору характеристики, процессор и периферия работают штатно, - отметил генеральный директор ОАО «Мультиклет» Борис Зырянов. - Важно, что полученные в ходе тестов цифры, говорят о широких потенциальных возможностях мультиклеточной архитектуры». 

Так, по результатам тестирования на задаче CFFT 256, выполняемой за 2487 такта, с разрядностью в 32 бита энергопотребление процессора MCp0411100101 составляет 0,45 mW/Mflops. В приведенных показателях на одинаковую топологическую норму и напряжение питания у мультиклеточного процессора MCp0411100101 энергопотребление в 3 раза  ниже, чем даже у одного только IP ядра ARM VFP9-S или ARM VFP 10. Разработчики подчеркивают, что сравнение проводится для выявления потенциальных возможностей мультиклеточной архитектуры и не ставит целью позиционирование созданного первого мультиклеточного микропроцессора в абсолютных величинах. 

В ходе тестов, разработчиками также подтверждена ранее заявленная тактовая частота для исполнения Сommercial (0…+70 °C) в 100 MHz и производительность 2,4 Gflops. Разрядность процессора – 32/64 бита. Память данных мультиклеточного процессора MCp0411100101 составляет 128Кб, память программ  - 128Кб (для хранения исполняемого кода должно применяться внешнее последовательное FLASH ПЗУ XCF04S). Для мультиклеточного процессора разработаны ассемблер и Си компилятор.

Таким образом, можно смело говорить, что в России появился микропроцессор с собственной уникальной архитектурой, способный составить достойную конкуренцию зарубежным аналогам.

Хочешь всегда знать и никогда не пропускать лучшие новости о развитии России? У проекта «Сделано у нас» есть Телеграм-канал @sdelanounas_ru. Подпишись, и у тебя всегда будет повод для гордости за Россию.

Источник: http://www.multiclet.com/
  • 0
    Aleksey1992 Aleksey1992
    09.07.1219:33:35
    Здорово я ведь вреил что наши компы будут, неужели сбывается.
  • 0
    Нет аватара Дмитрий Яковлев
    09.07.1220:31:40
    Таким образом, можно смело говорить, что в России появился микропроцессор с собственной уникальной архитектурой, способный составить достойную конкуренцию зарубежным аналогам.
    УРА, товарищи! ) Очень интересные показатели: тактовая частота, производительность и энергопотребление. И это только начало
  • 0
    Login_off Login_off
    09.07.1220:32:28
    Привет! Уже задавал этот вопрос, судя по нику автора Вы должны быть в курсе, что дальше, мультиклеточный 32 клетки, многоядерный 4 ядра на технологии 90, когда!? Login_off
  • 0
    Skipper Skipper
    09.07.1220:33:37
    Ну что же?! Отлично     Удачи в продолжении данного проекта!!!
  • 0
    Нет аватара InetRU
    09.07.1221:13:37
    Ну если заявленная цена в 15 долл. за штуку на него это реальность, то вполне возможен и экспорт. Я так понимаю, что ниша для этого проца это что-то среднее между ПК и бытовой техникой. Т.е. для умных холодильников он слишком мощный, а для ПК -- слишком слабый. Какие-нибудь хай-энд гаджеты (не айфон, понятно) вполне могут работать с этим процем.
    • 0
      d-tatarinov.livejournal.com d-tatarinov
      10.07.1200:35:03
      На сколько я понимаю, он сгодится где очень много математики. Т.е. ПК и холодильники ему не светят, а фсяческие айфоны не выработают и 1/10 возможностей. Довольно пока узкоспециализированный.
  • 0
    Нет аватара Денис Демидович
    09.07.1222:14:09
    А есть роадмап или план по выпуску новых версий, 4 клетки все-таки не очень интересно, интересно хотя бы начиная от полсотни, а желательно пол тысячи.
    • 0
      Нет аватара zyryanov
      09.07.1222:20:00
      Полтысячи - это слишком) базовая модель для эксафлопсных настольных суперкомпьютеров будет иметь 64 клетки
      • 0
        Нет аватара 1111
        09.07.1223:53:01
        Не знаю ни одного суперкомпьютера на ARM, но из этого: http://www.gree...06/top/list.php следует, что самый экономичный на сегодня суперкомпьютер выполняет 2100.88 MFLOPS на 1 Ватт. Представленный образец 0,45 mW/Mflops, т.е. 2,2 Mflops на мВт, ну а далее совсем просто… Короче, не далеко ушёл. (если ушёл) Я, конечно, ЗА всё наше и передовое, но пока на существующих уровнях потребления эксафлопсные компьютеры никто не построил и вряд ли построят.
        • 0
          Нет аватара svk12
          10.07.1200:28:52
          Ну там же сказано: Разработчики подчеркивают, что сравнение проводится для выявления потенциальных возможностей мультиклеточной архитектуры и не ставит целью позиционирование созданного первого мультиклеточного микропроцессора в абсолютных величинах.
        • Комментарий удален
        • 0
          Нет аватара Алексей Панкратьев
          10.07.1207:43:16
          Специалисты меня поправят, но как я понимаю, когда со 180 нм перейдут на более "тонкий" тех. процесс (90? 60? 45 нм?...), удельное энергопотребление снизится. Кроме того, 64-клеточный процессор потребять будет явно меньше, чем 16 4-клеточных процессоров - т.е. удельное энергопотребление опять-таки снизится.
          • 0
            Нет аватара Keeperovod
            10.07.1218:43:30
            Потребление снизится, частота безболезненно возрастет, производительность вырастет, цена упадет, но: 1) Для военного применения не всегда нужны тонкие техпроцессы. 2) 64 клетки, вероятно, будут намного менее эффективными, чем 4-16. Вообще есть нелинейная связь между количеством узлов в системе и затратами на коммуникации между ними. Чем больше узлов, тем больше затраты на коммуникации, причем эти затраты растут с каждым узлом. Из-за этого, в определенный момент, добавление нового узла приведет к снижению производительности. Чтобы с этим бороться, надо усложнять среду взаимодействия клеток, что может свести на нет все преимущества клеточной модели. 3) Много клеток совершенно не гарантируют рост производительности из-за того, что их еще и загрузить чем-то надо. Сомневаюсь, что хоть один последовательный алгоритм, которых большинство, сможет загрузить больше 8 клеток в силу своей природы. Просто нет стольких независимых операций. Куда логичней делать много ядер по мало клеток, чтобы получить преимущества многопоточности не только для операций, но и для потоков. 4) При текущей реализации невозможно эффективно поднять частоту выше нескольких сотен мегагерц, т.к. без нормального конвейера и кэша будет дико тормозить память.
      • 0
        Georgy Melnikov
        10.07.1220:14:27
        Вы должны знать ответ на мой вопрос!     Итак, если одна клетка сгорела, оставшиеся подберут пошатнувшееся знамя, это здорово. Вопрос вот в чем. Каков процент распределения площади на кристалле между клетками и общей управляющей частью? Спасибо!
      • 0
        Нет аватара shpion_
        15.07.1221:44:21
        Здравствуйте, Борис Анатольевич. Я как раз насчет мультиклеточных суперкомпьютеров спросить хотел. После того как я про мультиклеточную архитектуру прочитал, то у меня сложилось представление, что на базе этой архитектуры можно сделать многопроцессорную систему, в которую можно добавлять новые блоки клеток так же как сейчас добавляется в систему планки с оперативной памятью, и тем самым наращивать производительность. Собственно вот насчет этого я и хотел поинтересоваться - насколько это целесообразный вариант, когда вся коммуникационная среда процессора (которая сейчас реализована на самом кристалле процессора) вынесена отдельным блоком и располагается на материнской плате, а клетки с вычислительными ядрами подключаются отдельными планками. Может быть можно дублировать эту коммуникационную среду и сделать ее внешней для клеток уже располагающей такой средой на кристалле? Или это как-то снизит производительность системы и более эффективный путь - наращивать число клеток в кристалле? Просто перспектива уж больно заманчивая на мой взгляд и по надежности и по конфигурируемости и вообще    
        Отредактировано: shpion_~21:45 15.07.12
  • 0
    Нет аватара Solncevorot
    09.07.1223:55:45
    Так смешно смотреть как непрофессионалы рассуждают о перспективах новой архитектуры процессоров! Ни в зуб ногой, товарищи!
    • 0
      Нет аватара pragmatik
      10.07.1202:05:48
      просвяти будь ласка
      • 0
        Нет аватара Solncevorot
        10.07.1210:08:34
        Зачем? 9 из 10 примеряют этот процессор для домашнего персонального компьютера, они же уже собрались хоронить Intel и AMD, они же ничего не понимают об энергетической эффективности, они не знают как работают настоящие конкуренты этого процессора (хотя-бы тот же ARM, не AMD!) и они же ничего не понимают в области применения таких микропроцессоров. То есть, о великолепии и перспективности этого конкретного единственного опытного процессора рассуждают люди, опыт знакомства с микропроцессорами ограничивается, в лучшем случае, доставанием процессора из коробочки и установкой его на материнскую плату у себя в компе. Просвети пишется с буковой а, а будь-ласка - это пожалуйста по-украински, пишется через дефис.
        • 0
          Нет аватара guest
          10.07.1211:52:54
          Просвети пишется с буковой а? И куда там эту букову а?    
          • 0
            Нет аватара Solncevorot
            10.07.1211:53:58
                С буквой е, конечно.
            Отредактировано: Solncevorot~11:54 10.07.12
        • 0
          abadello abadello
          10.07.1212:34:58
          Непрофессионалы хотят понять уровень наших технологий в сфере микроэлектроники. Это понятно и простительно, даже в свете неграмотных вопросов и ответов-домыслов, поскольку побуждает интересоваться и разбираться в вопросе. Скепсис-же это единственно верный вариант рассмотрения любого вопроса (презумпция невозможности отличает науку от лженауки). А великолепие и перспективность процессора еще пока очень под большим вопросом, я уже приводил пример сравнения с графическими процессорами, которые очень высокопроизводительны, но очень сильно ограничены по сфере применения.
          • 0
            Нет аватара Solncevorot
            10.07.1217:43:27
            поскольку побуждает интересоваться и разбираться в вопросе.
            Я вас умоляю, у каждого своя профессия, своя область знаний, своя работа - этот бестолковый галдеж не повысит нисколько уровень компетентности менеджеров и дизайнеров, юристов и экономистов в области микропроцессорной техники. И уж тем более могу сказать, что никто из них не начнет заниматься этим делом потому что у них нет базовых знаний для этого и это кроме того сложно и положительный результат весьма туманен, ну и самое главное - куда применить эти знания и навыки. Куда юрист применит знания С+ или ассемблера дли микроконтроллеров? Его и так неплохо кормят.
            • 0
              Нет аватара Keeperovod
              10.07.1218:34:32
              Если вы так "круты", то может мне ниже ответите? Лишних знаний не бывает никогда. Если люди интересуются и Вы можете им помочь, то просто подло это не делать. А дизайнерам, юристам и экономистам знание техники только жирный плюс.
            • 0
              abadello abadello
              10.07.1218:41:25
              Надеюсь вам не придется (не приходилось) никогда иметь дело с воспитанием детей, следуя вашей логике: "Зачем этим тупым детям знать математику, физику, химию ... ? У них нет базовых знаний для этого и это кроме того сложно и положительный результат весьма туманен, ну и самое главное - куда применить эти знания и навыки работая продавцом или водилой?" А по сути - быть образованным и эрудированным человеком становится модно, как не хочется вам обратного, и для этого совершенно не обязательно знать ассемблер, но совершенно необходимо знать ЧТО ЭТО ТАКОЕ.
              • 0
                Нет аватара Solncevorot
                10.07.1219:14:24
                Верх приличия и человеколюбия: сказать "дай бог чтобы у тебя детей не было". Ты козел. Но я желаю, чтобы у тебя было много детей и хороших. Теперь по сути, дети - это дети, они должны получать образование - целостное, а не кусочно-фрагментарное, набор фактов. А конкретно в этом вопросе дети вообще ни при чем. В данном случае комментаторы "я Пастернака не читал, но осуждаю...". Только на этом сайте не осуждают, а превозносят все российское (или условно российское) в ранг божества.
      • 0
        Georgy Melnikov
        10.07.1220:16:10
        есть пара статей на этот счет http://habrahab...ru/post/146964/ http://chiptalk.ru/multiclet
        Отредактировано: Georgy Melnikov~20:16 10.07.12
  • 0
    L__G L__G
    10.07.1205:35:03
    Ребят этот проц для оборонки, так что за его будущее не переживайте, лет через 5 сделают для сервоков, а вот потом может быть и для ПС.
  • 0
    Нет аватара apin
    10.07.1208:22:02
    Вообще это очень хорошо, такое соотношение частота/производительность/энергопотребление. Если бы еще компилятор С++ был и ОС собранная под него, можно было бы и попробовать руководству предложить. Хотя извиняюсь, на 128 Кб, никакую ОС не поднимешь.
    Отредактировано: apin~08:30 10.07.12
    • 0
      Нет аватара topaz1977
      10.07.1210:44:53
      Боевая управляющая система "Ка-50" около 230 килобайт занимает   
      • 0
        Нет аватара apin
        10.07.1210:52:06
        Я ведь про ОС говорил, а так, для огромного количества задач, если без ОС писать, этого достаточно. Например коммутационное оборудование, которое у нас очень сильно зависит от импортных процессоров, и какие там "закладки" могут быть, никто не знает.
    • 0
      Нет аватара strange2007
      10.07.1212:14:02
      Не, С++ не надо, слишком не нужный толком. Асм - наше все
      • 0
        abadello abadello
        10.07.1212:36:37
        Я вас умоляю, покиньте криокамеру!
        • 0
          Нет аватара strange2007
          10.07.1212:40:02
          Вот только не надо начинать. Я не зомбипоражение, что бы считать так же как и все С++ панацеей от всех бед. Оно круто в своих кругах и не более
          • 0
            abadello abadello
            10.07.1212:46:09
            Делать ставку на асм глупо, машинный уровень и фтопку, никаких трудозатрат на него не хватит.
            • 0
              Нет аватара strange2007
              10.07.1212:49:09
              Вот это уже аргументированно. Но обертка для асма дает большие плюсы как раз для таких систем. Мне сейчас очень нравится PureBasic. Просто прималых размерах, приходится отказываться от красивостей
              • 0
                abadello abadello
                10.07.1213:05:43
                Разговор не о том, что асм даёт преимущества по скорости, это и так понятно, разговор о том, что надо дотягивать платформу до преимуществ си, что и выполняется инженерами мультиклета, всё таки 2012 год на дворе и выходить на рынок с системами, заточенными под асм     ... несерьёзно, а вот в конкретных случаях, когда именно вам именно в конкретном случае охота по...возиться с асмом и его обочками ... да пожалуйста, поддержка нативная!
                • 0
                  Нет аватара strange2007
                  10.07.1213:09:45
                  Многие контроллеры имеют только обертки на С и дельфи. Это своя ниша. Чем проще, тем надежнее. Эльбрус - персоналка, мультиклеточный для спец.задач. Я знаю асм, поэтому не вижу проблем, кроме стоимости мат.платы для него
                  • 0
                    Нет аватара Lexus
                    10.07.1217:04:15
                    "С и дельфи"? Разве делфи не использует Object Pascal? К Object Pascal как раз ближе C++, чем Cи.
                    • 0
                      abadello abadello
                      10.07.1218:44:21
                      Делфи использует язык Delphi, базирующийся на OP, компоненты пишутся на С++ Несомненно это объектный язык, никакого отношения к Си не имеющий.
                      • 0
                        Нет аватара strange2007
                        11.07.1203:32:26
                        Извини, ты в ООП слишком погрузился. Во многих случаях разработчики понимают объектный подход как максимальная изоляция каждого модуля. Я ж пытаюсь объяснить, что пофиг какой инструмент, главное методики. В С++ некоторые конструкции внедрены от безысходности, т.е. для заделывания дыр заплаткой. Но теперь это преподносится как фича. В общем я к тому, что либо меняй взгляды на жизнь, либо доступна будет только узкая ниша реализации своего потенциала. Всегда и везде будут преследовать "убогость" и "не крутость" инструментов. Тогда как другие без предрассудков будут просто делать работу
                        • 0
                          abadello abadello
                          11.07.1210:22:56
                          ненене     я просто ответил чуваку на вопрос    
  • 0
    Нет аватара Lexus
    10.07.1208:48:39
    Таким образом, можно смело говорить, что в России появился микропроцессор с собственной уникальной архитектурой, способный составить достойную конкуренцию зарубежным аналогам.
    А Эльбрус не в России? Да и по производительности Эльбрус вроде получше, ОС под него есть.
    • 0
      Нет аватара zyryanov
      10.07.1209:31:30
      Эльбрус в России, но (1) с фон-неймановской архитектурой и (2) по цене конкурировать с зарубежными аналогами не может
      • 0
        Нет аватара Lexus
        10.07.1209:49:40
        1.
        в России появился микропроцессор с собственной уникальной архитектурой.
        А больше в мире не было процессоров с пост-неймановской архитектурой? x86 и Эльбрус - очень разные архитектуры, хотя вроде как обе фон-неймовские, как я понимаю. 2. Какие зарубежные аналоги у Эльбруса? Все зависит от области применения данного процессора.
        Отредактировано: Lexus~09:49 10.07.12
        • 0
          Нет аватара zyryanov
          10.07.1210:28:05
          постнеймановские архитектуры были, но мультиклеточная - уникальна и разработана на базе оригинальной классификации архитектур (что-то вроде таблицы Менделеева), позволяющей предсказывать свойства и прогнозировать направления развития
          • 0
            Нет аватара Lexus
            10.07.1210:52:29
            Так и Эльбрусовская архитектура уникальна. В общем хорошо, что у нас в стране развивается микроэлектроника, причем не на базе копирования чужих технологий, а на базе развития собственных идей. Но вот попытки замазать черной краской успехи своих товарищей по отрасли фразами типа: "в России появился микропроцессор с собственной уникальной архитектурой, способный составить достойную конкуренцию зарубежным аналогам." считаю мягко говоря неприличными.
            • 0
              Нет аватара zyryanov
              10.07.1211:20:16
              Господа, читайте внимательно! С каких пор появление нового конкурентоспособного является очернением других ???
          • 0
            RadiantConfessor RadiantConfessor
            10.07.1210:59:24
            Нас, на IXBT, в теме об отечественных процессорах больше заботит как вы получили 2,4 GFlops. Скажите хотя бы на 32 и 64 разрядных вычислениях? И второе что меня интересует, как я понимаю, ни что не мешает делать многоядерные мультиклеты. Т. е. Добавить параллелизм не только на уровне инструкций, но и на уровне потоков. У вас есть планы по соданию именно многоядерного мультиклета?
            Отредактировано: Zveruga~11:00 10.07.12
            • 0
              Нет аватара zyryanov
              10.07.1211:22:02
              пожалуйста, читайте внимательно! в этой статье сказано, что тест проведен на 32 разрядах. Многоядерный мультиклет - оксюморон)))
              • 0
                RadiantConfessor RadiantConfessor
                10.07.1212:35:45
                Так вас тут не хватает.
                Отредактировано: Zveruga~12:35 10.07.12
                • 0
                  Нет аватара Keeperovod
                  10.07.1212:41:59
                  Без обид, но форум iXbt во флеймовых темах та еще помойка)
                  • 0
                    Нет аватара Lexus
                    10.07.1217:06:18
                    Может и помойка, но иногда в соответствующих темах появляются разработчики, от которым можно узнать что-то новое и интересное.
                    • 0
                      Нет аватара Keeperovod
                      10.07.1218:30:07
                      Не спорю, но за последние лет 5 дай бог 1 раз что-то ценное на iXbt находил. Хотя, про железо мало чего искал. Самое ценное место для получения информации сейчас, это комментарии на Хабре в профильных статьях, на мой взгляд.
                      • 0
                        RadiantConfessor RadiantConfessor
                        10.07.1220:44:12
                        Да и на Хабре иногда чушь пишут, хотя эту чушь там же и в комментариях распинают.
                        Отредактировано: Zveruga~20:44 10.07.12
  • 0
    Нет аватара topaz1977
    10.07.1209:42:37
    Если комп продавали тысячи по 2-3 с таким процессором, за пару лет бы энтузиасты написали бы и операционку и софт и все остальное. Это же новая, не на что не похожая архитектура, поле для творчества огромное.
    • 0
      Нет аватара Денис Демидович
      10.07.1210:00:17
      Я пока не могу понять область применения этого проца. Скорее всего это будет все-таки не замена обычному ПС, а что-то ближе к управляющим микроконтроллерам, например мозги для беспилотника или другого оборудования. Роботов можно на нем делать, наверное.
      • 0
        Нет аватара Денис Демидович
        10.07.1210:06:41
        Или как сопроцессор для обработки специфичных данных, он не конкурент Эльбрусу, скорее его дополняет. Хотя то что они декларируют очень похоже на те же DSP процессоры в Эльбрус–2С. Может быть через время мультиклет и эльбрус подружат?
        • 0
          RadiantConfessor RadiantConfessor
          10.07.1211:12:54
          Сам об этом думаю. Эльбрус это VLIW, а значит команды там большие. Применять технологию параллельной обработки больших команд Эльбруса как у Мультиклета было-бы на мой взгляд очень удачно.
          Отредактировано: Zveruga~11:13 10.07.12
    • 0
      Нет аватара strange2007
      10.07.1212:15:37
      Ага, только плата для проца стоимостью в 38200 немного охлаждает пыл. Я уже не смогу купить, т.к. для игрушки это дорого
  • 0
    Нет аватара Keeperovod
    10.07.1211:17:13
    Solncevorot, конечно, палку перегнул, но во многом прав, т.к. многие просто не понимают в данной теме. Попробую объяснить на пальцах. Сам не "железячник", а "софтописатель", поэтому если где-то ошибусь в терминах или каких-то нюансах, то прошу не пинать сильно тех, кто действительно разбирается. Во-первых, нужно понимать, как выполняются программы. Вначале CPU (процессор), получает инструкцию. Например, сложить два числа из ячеек памяти по адресам А и Б, а потом записать результат по адресу В. В CPU все операции выполняются поочередно, т.е. тактами. Таким образом, чтобы выполнить сложение, CPU вначале тратит 1 такт на то, чтобы понять, что ему надо сделать, потом 2 такта на чтение данных, 1 такт на операцию сложения и 1 такт на запись результата. В сумме 1 + 2 + 1 + 1 = 5 тактов. Но это происходит только, если операции простые. На самом деле современные CPU могут осуществлять сотни операций разного назначения с огромным количеством параметров. Иногда "дешифровка" самой команды, т.е. понимание того, что нужно сделать, занимает до 10-15 тактов в современных x86 процессорах. Т.е. эти 10-15 тактов работает только 1 блок процессора, который отвечает за дешифровку, а все остальные, которые отвечают за вычисления, простаивают, что страшно неэффективно. Естественно, не все так плохо, т.к. простой составляет не 10-15 тактов, а существенно меньше, т.к. параллельно с дешифровкой происходит вычисление предыдущей операции. Еще больше это усугубляется тем, что доступ к памяти далеко не мгновенен и чтение данных из нее может занимать десятки тактов, что намного больше, чем дешифровка и вычисление сами по себе. Для того, чтобы с этим бороться была придумана такая вещь, как кэш инструкций, т.е. некоторая часть памяти процессора, в которой находятся расшифрованные команды в разной стадии исполнения. Для того, чтобы эффективно его использовать, был создан такой механизм, как "внеочередное исполнение" (OoO - out of order execution), который позволяет исполнять независимые команды не по очереди, а тогда, когда они уже расшифрованы и для них есть свободные вычислительные блоки. Обычно, в каждом ядре современного х86 процессора, есть не менее чем по одному вычислителю для каждого типа операций (с целыми числами, дробными, векторами и т.п.). Тех же целочисленных вычислителей в современных Intel Core по 4 штуки на ядро. OoO механизм раскидывает нагрузку на них параллельно, чтобы максимизировать загрузку этих блоков. Вообще ядра проектируются так, чтобы все вычислительные блоки ядра были более-менее равномерно загружены все время. Это приведет к тому, что на операцию сложения уйдет не 5 тактов, а 4, т.к. чтение из памяти будет распараллелено. Кстати, в Atom и Arm OoO не реализовано, из-за чего они крайне неэффективны на высоких частотах по сравнению с "полноценными" x86. Теперь вернемся к Мультиклету. Сразу скажу, что не претендую на объективность, т.к. глубоко не вникал. Да и материалов мало. Насколько я понимаю, клетка это совокупность из нескольких вычислителей. Грубо говоря, по одному вычислителю на клетку. Т.е. суммарно 4 клетки дают те же 4 целочисленных блока, но клетки независимы за счет того, что в каждой клетке есть все вычислители. Это создает избыточность, но повышает надежность за счет дублирования. Так же это дает возможность использовать другую реализацию OoO не на уровне инструкций, а на уровне вычислительных блоков. Т.е. независимые инструкции посылаются независимым блокам. Грубо говоря, сложение займет те же 5 тактов, но таких операций можно выполнять 4 штуки одновременно. Получается, что это хуже чем классическая реализация х86, на которой так же возможны 4 операции одновременно, причем быстрее? А вот здесь уже начинаются нюансы, связанные с тем, что Мультиклет на порядок, а то и 2 проще. Т.е. сам механизм OoO работает намного эффективнее за счет того, что ему не надо помнить, сколько у него и каких вычислителей свободно. Достаточно просто знать, что клетка свободна и способна считать. А если она сломалась и не работает, то планировщик, который выдает инструкции, просто ее игнорирует и продолжает вычисления на других клетках, что в принципе невозможно в классических процессорах, т.к. в них все модули взаимосвязаны. В этом и есть главное новшество. Что получаем в итоге? А получаем процессор, эффективный из-за своей простоты, но хорошо масштабируемый путем экстенсивного наращивания клеток. Кроме того, он способен обеспечить действительно высокую надежность. Есть ли в нем что-то прорывное? В целом нет. Но он идеально ложится в нишу промышленных и военных процессоров, которым действительно нужна надежность и эффективность именно в вычислениях. В телефонах/компьютерах/серверах мы его, скорее всего, никогда не увидим, т.к. нюансы реализации текущих средств разработки, рассчитанных на классический подход распараллеливания потока команд, не позволят создавать действительно эффективный код для Мультиклета. Более того, классический код будет работать едва ли не хуже. Из-за этого перенос существующего ПО просто слишком дорог да и не нужен. А вот в ракетах ПВО Мультиклету самое место    
    • 0
      RadiantConfessor RadiantConfessor
      10.07.1211:36:56
      Только вот Мультиклет способен расспараллеливать выполнение одной команды. Кроме того, данные предыдущих вычислений одни клетки получают от других не обращаясь к кешу инструкций или данных. За счет отсутствия работы с памятью ускоряется работа.
      Отредактировано: Zveruga~11:41 10.07.12
      • 0
        Нет аватара Keeperovod
        10.07.1212:01:43
        Если честно, то не представляю как можно распараллелить выполнение команды сложения, например, кроме одновременного чтения из памяти. Я так и не смог понять RISC он или CISC. Если CISC, то команда это сама по себе маленькая программа, которую можно понять как распараллелить. Если RISC, то тогда просто не понятно зачем "козе баян" и как все это синхронизируется и работает в рамках 1-й команды. Один механизм отката вычислений при сбое одной из клеток чего стоит. Кэша инструкций у Мультиклета нет, т.к. нет конвейера. Поэтому частотой в текущем виде производительность можно поднять сильно ограниченно. Сейча ARM в это же уперлись. Кэш данных нужен только, если память медленней регистров процессора. На 100 мегагерцах это не шибко актуально. "За счет отсутствия работы с памятью ускоряется работа." - а вот это уже интересно. Чем это отличается от обычных регистров в х86?
        • 0
          Нет аватара Keeperovod
          10.07.1212:04:22
          Имел ввиду CISC аналогичный современным х86 с микрокодом.
        • 0
          RadiantConfessor RadiantConfessor
          10.07.1212:15:04
          A=B+C Тут уже две операции, хотя команда одна. Результат посылается от клетки вычислившей ко всем клеткам со специальным флагом. Та клетка, которой этот результат нужен его возьмет, остальные проигнарируют.
          Отредактировано: Zveruga~12:17 10.07.12
          • 0
            Нет аватара Keeperovod
            10.07.1212:30:39
            Увы, не способен понять, чем это отличается от того, что было в моем начальном комментарии. Имеем 5 действий: 1) Расшифровка командного кода 2) Чтение B 3) Чтение C 4) Сложение 5) Запись результата в A 1 - вынесен за пределы клетки. 2 и 3 теоретически могут быть параллельны, но реализация одновременного чтения тоже требует затрат времени, поэтому далеко не факт, что тут выиграть вообще можно. 4 и 5 теоретически могут быть выполнены другой клеткой, нежели 2 и 3, но в чем здесь преимущество, если все клетки равнозначны? В общем, я просто логически не понимаю в чем тут можно выиграть. Можно сформулировать так - Мультиклет реализует аппаратный VLIW. В классическом загрузка блоков регулируется компилятором на стадии сборки программы. В Мультиклете аппаратно, на стадии выполнения. В х86 такого просто нет, процессор работает "от потока". Но ни в одном из 3-х случаев не идет речи об распараллеливании выполнения команд. Только об распараллеливании разных команд. Если говорить про A = B*(C+D) = B*C+B*D, то тут можно распараллеливать, но это уже известно как суперскалярность лет этак 15 с Pentium 3. Т.е. это очень сложно назвать прорывом. Думаю и в Эльбрусах такой подход используется. Аппаратный VLIW это здорово, но никто ни в одно документе и/или статье, которые я видел, так и не смог внятно это объяснить.
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,