С фабрики TSMC получены первые образцы микропроцессора MALT-C 9Mb96G
Следи за успехами России в Телеграм @sdelanounas_ruКристалл процессора 9Mb96G
В конце декабря 2017 года с фабрики TSMC (Тайвань) были получены образцы микропроцессора MALT-C 9Mb96G — первого чипа семейства MALT-C, изготовленного «в кремнии» по технологическому процессу 28 нм. TSMC HPCPlus (high-performance computing, высокопроизводительные вычисления). Процессор содержит 9 RISC ядер общего назначения и 96 специализированных процессорных элементов, объединенных в три SIMD кластера по 32 элемента каждый. Образцы микропроцессора MALT-C 9Mb96G успешно прошли входные испытания на тестовых векторах на чип-тестере FORMULA, показали на полной нагрузке соответствие проектируемых и достигнутых характеристик. Так полное энергопотребление на рабочей частоте 800 МГц составило 1,0 Вт.
MALT-C — семейство микропроцессоров российской разработки для выполнения вычислительно сложных криптопреобразований с предельной энергоэффективностью. Чип построен на базе отечественной многоядерной архитектуры. Благодаря чрезвычайно удачному компилятору С, программировать MALT-C 9Mb96G не многим сложнее, чем универсальные многоядерные процессоры.
Кто мы?
Мы — российская команда разработчиков многоядерных процессоров. Мы начали проект в 2011 году. Тогда мы утверждали, что через 5-10 лет в процессоре будут сотни вычислительных ядер, энергоэффективность будет важнее производительности, производительность будет достигаться за счет специализации вычислительных блоков и параллельной обработки, а микроархитектура будет определяться энергетикой и технологией. Мы поставили цель — стать к 2020 году разработчиком многоядерных процессоров мирового уровня. Мы собрали сильную команду и сегодня мы действующий fabless дизайн-центр. Наши процессоры производятся на крупнейшей независимой фабрике TSMC по технологии 28 нм. Мы разрабатываем не только кристаллы, но и всю необходимую программную инфраструктуру, создавая законченные программируемые решения.
Наши компетенции
Мы специалисты в цифровой микроэлектронике и программировании. Мы хорошо знаем историю развития вычислительной техники и имеем практический опыт работы с целым рядом программируемых вычислительных систем от 8-ми битных микроконтроллеров, содержащих тысячу транзисторов, до современных многоядерных CPU/GPU, содержащих миллиарды транзисторов, от первой UNIX ОС до современных дистрибутивов Linux, от первого компилятора языка Fortran до применяемых сейчас языков C/C++/C#/Python/Java/PHP и так далее. В наших разработках мы, с одной стороны, опираемся на традиции и накопленный за последние 30 лет российский и мировой микроэлектронный опыт. С другой, не скованы обязательствами архитектурной совместимости и не избегаем разработки отдельных компонентов «железа» и ПО «с нуля», когда это позволяет им стать предельно энергоэффективными.
Сегодня наша команда состоит из выпускников ведущих научных школ РФ: МГУ имени Ломоносова, МГТУ им. Баумана, МИФИ, МФТИ. В нашем коллективе семь кандидатов и два доктора наук. В нашем коллективе работают специалисты по цифровому и аналоговому RTL-дизайну и схемотехнике, специалисты по разработке процессорных ядер и архитектур, разработчики IP-блоков интерфейсов, специалисты по симуляции и верификации RTL, специалисты по контроллерам памяти, специалисты в области системного программирования, разработчики компиляторов универсальных и проблемно-ориентированных языков, С/С++ программисты, специалисты по параллельному программированию и отладке параллельных программ, разработчики прикладного ПО и алгоритмов, специалисты в области тестирования ПО, технические писатели, юристы, менеджеры по развитию.
Научные исследования мы проводим совместно с ведущими ВУЗами и научно-исследовательскими институтами России, наша технологическая база включает наиболее современное оборудование из Америки, Европы и Азии, мы используем ставшее стандартом в отрасли программное обеспечение компаний — технологических лидеров из США, мы плодотворно работаем с основными производителями микроэлектроники в России, мы выполняем работы в интересах государственных, коммерческих и индустриальных заказчиков, мы предлагаем как услуги по проектированию цифровой микроэлектроники и ПО в рамках нашего подхода, так и законченные решения на базе архитектуры MALT.
Архитектура
Как это работает?
Около 80% любого из разрабатываемых нами кристаллов, занимают однотипные вычислительные элементы, спроектированные «с нуля» специально под целевой класс задач . Эти элементы определяют производительность и энергетику чипа. Их на кристалле от сотен до тысяч! Все вычислительные элементы программируемы на языке С или его подмножестве. Вычислительные элементы объединены в группы, управляемые компактными универсальными RISC процессорами, объединенными в вычислительный массив, «выглядящий» для программиста как обычный, программируемый на C/C++многопотоковый процессор. Классические проблемы многопоточного программирования (механизмы разрешение конфликтов одновременного доступа к общим данным, в том числе атомарные операции) мы решили аппаратно на уровне контроллера памяти.
Краткий взгляд на архитектуру MALT
Основу архитектуры MALT составляют десятки или сотни, в зависимости от модели , компактных асинхронных универсальных вычислительных ядер, объединенных одной или несколькими оригинальными worm-hole сетями с топологией типа fat-tree. Коммуникация между сетями — программно-аппаратная. Иерархия универсальных ядер включает три уровня: supermaster — управляющее ядро, master — коммуникационные ядра, slave — доступные для задач пользователя вычислительные ядра. Slave ядра, в зависимости от модели , могут содержать векторные ускорители, выполняющие специализированные задачи целевого класса, каждый ускоритель содержит от 8-ми до 128-ми однотипных процессорных элементов с общей памятью команд. Все вычислительные ядра и ускорители имеют собственную локальную память данных. Все универсальные ядра непосредственно адресуют общую внешнюю динамическую память DRAM и другие общие ресурсы (PCIe, Ethernet, SATA). Арбитраж доступа к внешним ресурсам обеспечивается smart memory controller’ом (SMC) — аппаратным контроллером «умной памяти» с дополнительным признаком готовности данных. Количество SMC-контроллеров, перечень и конфигурация общих внешних ресурсов зависит от семейства MALT и определяется требованиями целевых задач.
Процессоры MALT
— Обработка смарт-контрактов на базе Ethereum— Создание доверенных блокчейн-решений— Потоковое шифрование, проверка целостности информации— Майнинг современных криптовалют
— Работа с большими графовыми структурами— Массивно-параллельная работа с B-деревьями— Глубокий анализ социальных сетей— Ускорение операций в SQL и NoSQL базах данных
— Клеточные автоматы для задач газовой динамики— Численные расчёты на адаптивных сетках— Метод Монте-Карло для физики элементарных частиц— Операции над нерегулярными разреженными матрицам
Применения
Решение для потокового шифрования
Мы предлагаем уникальное решение, MALT-C, — программируемый на C/C++ чип с энергетикой встраиваемого микропроцессора, производительностью на Ватт на уровне современного ПЛИС на всех популярных потоковых шифрах и ценой универсального микропроцессора! Ни одного микропроцессора с подобными характеристиками ранее в России спроектировано не было!
Построенные на процессорах семейства MALT-C криптографические ускорители предназначены для использования в задачах симметричного шифрования, в том числе для потоковых шифров. Предпочтительной является многоканальная обработка. Наши процессоры построены на доверенной отечественной архитектуре. В конце 2017 мы получили с фабрики и успешно протестировали первые образцы MALT в «кремнии».
Посмотрите на характеристики: базовый кристалл, 160-ядерный MALT-C с индексом 7Mb160PLV, с частотой 1 ГГц и пиковым энергопотреблением 5 Вт в задаче шифрования AES128 обеспечивает максимальную пропускную способность 195 Гбит/c! (режим ECB, без учета подготовки ключа). На нем эффективно реализуется шифрование по стандартам ГОСТ 28147-89 («Магма»), ГОСТ Р 34.11-2012 («Стрибог») и ГОСТ Р 34.12-2015 («Кузнечик»). Попробуйте MALT! Примените в своих разработках MALT-C вместо зарубежных ПЛИС и криптографических сопроцессоров! Подробное сравнение приведено в таблице ниже.
Примечания:
1) Увеличение скорости работы алгоритма шифрования «КУЗНЕЧИК» с использованием технологии CUDA.
2) Производительность ГОСТ-шифрования на х86- и GPU-процессорах.
3) AES-GCM Encryption Performance on Intel® Xeon® E5 v3 Processors.
4) High Performance CUDA AES Implementation: A Quantitative Performance Analysis Approach.
5) High-Performance Hardware Implementation for RC4 Stream Cipher.
6) New Speed Records for Salsa20 Stream Cipher Using an Autotuning Framework on GPUs.
8) ChaCha-IP-13 / EIP-13 ChaCha20 accelerators.
Эти и другие источники вы можете найти в разделе Статьи.
2Q2019 Начало проектирования графического процессора на архитектуре MALT.
********************************************************
Запрещается полное или частичное использование материалов данной авторской статьи без указания авторства и ссылки на данную статью!
Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈
21.04.1812:39:06
21.04.1813:36:14
22.04.1802:02:01
21.04.1813:31:25
21.04.1813:39:27
21.04.1814:41:25
21.04.1815:37:02
21.04.1816:25:38
21.04.1822:35:07
22.04.1803:17:36
22.04.1810:01:38
21.04.1816:31:15
21.04.1816:51:12
21.04.1821:45:51
22.04.1803:30:51
22.04.1810:23:54
23.04.1807:48:21