Лого Сделано у нас
137

В МГУ научились решать задачи уровня суперкомпьютеров на обычных персональных ПК

Группа физиков из Научно-исследовательского института ядерной физики МГУ научилась на простом персональном компьютере проводить расчеты сложных уравнений квантовой механики, для которых на Западе используются мощные суперкомпьютеры. При этом персональный компьютер справляется с задачей быстрее. Статья, рассказывающая о результатах работы, была опубликована в последнем номере журнала Computer Physics Communications.

Ученые из МГУ имени М.В. Ломоносова сумели применить персональный компьютер с графическим процессором для решения сложнейших уравнений квантовой механики — ранее для этого использовались только мощные и дорогие суперкомпьютеры. По словам ведущего автора работы Владимира Кукулина, персональный компьютер справляется с задачей в разы быстрее: за 15 минут он выполняет работу, на которую суперкомпьютер тратит 2-3 дня.

Уравнения, о которых идет речь, были сформулированы еще в 60-х годах прошлого века российским математиком Людвигом Фаддеевым. Уравнения описывали процесс рассеяния нескольких квантовых частиц, то есть представляли собой некий квантовомеханический аналог ньютоновой теории трех тел. В результате быстро возникла целая область квантовой механики под названием «физика малочастичных систем».

Эта область представляет огромный интерес для ученых, занимающихся квантовой механикой. Главной их целью было и остается научиться решать эти уравнения. Однако из-за своей невероятной сложности для расчета уравнения долгое время не поддавались исследователям — до тех пор, пока не появились суперкомпьютеры.

Ситуация резко изменилась после того, как группа из НИИЯФ МГУ решила использовать в своем персональном компьютере один из новых графических процессоров корпорации Nvidia, разработанный для работы в игровых приставках. Как утверждает первый автор статьи Владимир Кукулин, заведующий лабораторией теории атомного ядра, процессор, был не самый дорогой — из тех, что можно купить в магазине за 300-500 долларов.

Главной проблемой при решении уравнений рассеяния нескольких квантовых частиц было составление «ядра» — громадной двумерной таблицы, состоящей из десятков миллионов строк и столбцов, каждая ячейка которой сама по себе была результатом очень непростых вычислений. Но эта таблица представляла собой как бы экран с сотнями триллионов пикселей, и с помощью хорошего графического процессора ее вполне можно было построить. Воспользовавшись софтом, разработанным в Nvidia, и написав собственные программы, ученые разбили свои вычисления на 65 тысяч потоков и смогли блистательно разрешить задачу.

«Мы добились скорости, которая и присниться не может, — рассказал Владимир Кукулин. — Программа работает так, что 260 миллионов сложных интегралов на настольном компьютере она считает за три секунды. И никакого сравнения с суперкомпьютерами! Мой коллега из Тюбингенского университета, лаборатория которого занимается тем  же, ведет расчеты с помощью суперкомпьютера BLUEGENE, что на самом деле очень дорогое удовольствие. И то, чего он добивается за двое-трое суток, мы делаем за 15 минут, не потратив ни копейки».

Самое удивительное заключается в том, что и графические процессоры нужного качества, и огромное количества программного обеспечения к ним существуют уже давно, но на Западе никто не использовал их для таких расчетов, отдавая предпочтение суперкомпьютерам. Так или иначе, наши физики сумели изрядно удивить своих западных коллег.

«Эта работа, на наш взгляд, открывает совершенно новые пути в анализе ядерных и резонансных химических реакций, — говорит Владимир Кукулин. — Она также может оказаться очень полезной для решения большого числа вычислительных задач в физике плазмы, электродинамике, геофизике, медицине и множестве других областей науки. Мы хотим организовать что-то наподобие учебных курсов, где исследователи самых разных научных направлений из периферийных университетов, не имеющие доступа к суперкомпьютерам, смогли бы научиться делать на своих „персоналках“ то же самое, что делаем мы».

  • 21
    igorborisov Борисов igorborisov Борисов
    11.06.1606:02:56

    Вычисления на GPU сейчас довольно популярная тема. Те же Nvidia Tesla специально созданы для подобного. Они, конечно, сильно дороже бытовых видеокарт, но и существенно их мощнее. И сейчас, кстати, во многих суперкомпьютерах эти GPU используются.

    Так что тут скорее новость о том, что в МГУ создали софт, позволяющий эффективно выполнять необходимые вычисления на этих GPU.

    Отредактировано: igorborisov Борисов~08:07 11.06.16
    • 2
      Нет аватара termometrix
      11.06.1616:50:09

      Согласен.Хотя и российские процессоры выпускаются с встроенным графическим ядром.

      Отредактировано: termometrix~19:24 11.06.16
      • 3
        igorborisov Борисов igorborisov Борисов
        11.06.1618:25:32

        Ну тут несколько разные вещи. Встроенные графические ядра обычно не очень мощные, не для того они там, вряд ли на них какие-то очень серьёзные задачи получится решать, хотя часть подходящих вычисленеий на них переложить — почему бы и нет.

        Современные GPU — это же по сути процессоры (точнее, мультипроцессоры), которые могут очень быстро и в очень много потоков выполнять узкий диапазон операций, то есть такая числодробилка. Соответственно, под них требуются свои адгоритмы, отличные от обычных процессоров, да и не все задачи они будут выполнять эффективно.

      • 1
        Andrey Tupkalo Andrey Tupkalo
        12.06.1606:42:07

        Пока только разрабатываются, насколько мне известно. В серии, ЕМНИМС, ни одного такого пока нет.

  • Комментарий скрыт по причине низкого рейтинга. показать
    • 27
      OptimoPrincipi OptimoPrincipi
      11.06.1607:19:57

      Научный журнал Computer Physics Communications — уважаемый с импакт-фактором больше 3. да будет вам известно, что такие журналы печатают только оригинальные работы, которые содержат существенно новые результаты, статьи проходят тщательное рецензирование. Так что можно только поздравить ребят.

      Пробежался по абстракту самой статьи на английском — из него следует, что прежде всего предложен новый численный алгоритм решения задачи, которые позволяет найти быстрое решение и на более слабых компьютерах. Этот алгоритм и есть изюминка статьи.

      • 10
        Нет аватара elron
        11.06.1610:11:39

        тут, скорее всего, дело даже не в численном алгоритме, а в лучшей математике. потому как вряд ли численная оптимизация увеличит скорость в 10^4-10^5 раз. что, кстати, показательно --- численной оптимизацией в мире могут заниматься (с переменным успехом) десятки тысяч человек, а создать именно математически лучший алгоритм могут максимум сотни.

        и, это, не надо избыточного пиетета перед Журналами С Именем --- и там тоже всякая фигня попадается.

        • 3
          OptimoPrincipi OptimoPrincipi
          13.06.1608:29:21

          Фактически речь идет о том, что авторы смогли переформулировать научную задачу таким образом, чтобы скормить её хорошему игровому компу с графическим акселератором. В игрушках важно быстро перерабатывать графическую информацию, управляющую пикселами экрана — то есть крутить большой 2D матрицей. Свою физическую задачу исследователи переформулировали в виде большой двумерной матрицы, акселератору то пофиг что обрабатывать — матричную информацию, поступающую от пиксел экрана, или квантовомеханическую матрицу, полученную при научных расчетах.

          То есть достижение авторов заключается в том, что

          1. они обратили внимание на схожесть задач с т.з. математической постановки.

          2. блестящей адаптации своей научной задачи под игровой комп с графическим акселератором.

          3. потрясающий эффект ускорения расчетов был достигнут дешевыми средствами.

          Не могу не отметить, что важное достижение произошло из-за нашей бедности — очевидно у парней не было доступа к суперкомпьютеру. Хотя вроде в МГУ он есть (кластер «Ломоносов»)? Не от хорошей же жизни они занялись этим делом.

          P. S. Про журналы. Конечно, проходную туфту тоже печатают, кто спорит. Однако, при независимом рецензировании и повышении импакт-фактора журнала процент туфты стремится к минимуму.

          Отредактировано: OptimoPrincipi~10:35 13.06.16
          • 2
            megajob megajob
            13.06.1620:49:00

            Ммм вам знакомо выражение «все гениальное — просто»?     Вообще российский гений пестрит именно таким «бедным» решением, но почему то достигающим того об что «богатые» или бьются головой от «нерешаемости» или многократно переплачивают. Кстати если грубо то это — достижение превосходства в Производительности (не техники, а вообще научного направления).

            На самом деле данные факты в очередной раз показывают что мы (чюловеки) на столько зажрались что перестали, как в начальные годы компьютеризации, заниматься «вылизыванием» софта. И все из-за того что доступные «мощности» просто избыточны, вон какую задаче решают. И по этому новые программы пишут на старых наработках, языках, накапливая недоработки и огрехи, компенсируя их все более и более мощным железом.

            Вспоминается история с российскими космическими двигателями, купив и разобрав америкосы удивленно увидили «в железе» то что они считали НЕВОЗМОЖНЫМ!!!    Или недавно прочитанную информацию про американскую «опупею» с обогащением урана    : когда всякие пакистаны и с.корее освоили центрифужный метод (на много более дешевый) а «Лидеры ВСЕЯ Мира» эпично облажались и скоро последний свой газодиффузный завод обогащения остановят.    

            Подводя итог: если кто-то для решения задачи тратит на порядки больше времени и денег чем его «бедный сосед», то он не «богатей», а Идиот.

          • 0
            A S A S
            13.06.1621:51:13

            Не могу не отметить, что важное достижение произошло из-за нашей бедности — очевидно у парней не было доступа к суперкомпьютеру. Хотя вроде в МГУ он есть (кластер «Ломоносов»)? Не от хорошей же жизни они занялись этим делом.

            Там не просто кластер — а гибридные ноды. Каждая нода представляет из себя CPU+GPU (Tesla K40X). Так что у них там 5 или 6 шкафов набитых GPU с 56G интерконнектом.

            Отредактировано: Антон Смоленский~23:53 13.06.16
    • 12
      Юрий Липатов
      11.06.1608:08:02

      Одно дело болтать языком, другое сделать! Попробуйте!

  • 4
    Нет аватара Maggey
    11.06.1607:22:38

    Круто. Получается уже не нужны громоздкие суперкомпьютеры для этих целей.

    • 8
      Нет аватара Curiouscat
      11.06.1608:06:12

      Maggey, не нужны во многом. Причем существуют практические коммерческие решения прямо сейчас. Скажем ваша биллинговая компания содержит rac суперкомпьютер со штатом DBA для BI аналитики и платит уйму средств и времени на это плюс сутки на подготовки новых срезов данных или генерацию индексов. Вполне типичная задача для всяких монстров вроде Билайн, мтс и т. д. Вместо этого есть SQream. Причем даже не надо покупать железки, у них есть и облако. Запихал туда свой контент за десять лет работы балк експортом и можешь напускать BI запросы любого рода без утомительной подготовки и совещаний с весьма высокооплачиваемыми спецами. Пр сути революция на корпоративном рынке баз данных.

      • 0
        Юрий Липатов
        11.06.1608:38:24

        Вы имели в виду SQLstream?

        • 2
          Нет аватара Curiouscat
          11.06.1609:31:12

          Yury Lipatov, разве он на GPU? Sqream дот ком, почитайте. Возможно есть и более известные альтернативы, я не знаю, не моя специализация в компании, просто слышу в курилке обсуждают big data аналитику на дешевых GPU решениях. так сказать BI для бедных .

          With SQream the power of a full-rack database machine is condensed into a single standard server, delivering the most cost-effective performance for Big Data. SQream DB is a no-hassle solution: no data modeling is needed, no new DBA is required, and no new skills need to be acquired. Third party ETL and BI tools may be connected via standard ODBC/JDBC connections

      • 0
        shigorin shigorin
        12.06.1621:13:31

        rac суперкомпьютер

        HPC и HA -- ортогональные вещи, если не противонаправленные.

  • 0
    Tuck Trucker Tuck Trucker
    11.06.1612:26:13

    Все современные суперкомпьютеры оснащены ускорителями на базе видеокарт либо ускорителями Intel Xeon Phi. Так что новые алгоритмы актуальны и для экономии времени на суперкомпьютерах.

  • 5
    Е.Юрий Е.Юрий
    11.06.1613:30:01

    Отличная новость! Молодцы, очень рад за наших ученых. Быть может это подтолкнет Ангстрем и МЦСТ и других к разработке собственных графических процессоров.

  • 5
    Антон Валерьевич Антон Валерьевич
    11.06.1618:03:48

    Вот это я понимаю оптимизация!

  • 1
    Анна Марчук ( Спрожецкая) Анна Марчук ( Спрожецкая)
    11.06.1619:30:26

    фермы для биткоинтов тоже на графических процессорах делают — хорошо считают.

    • 0
      shigorin shigorin
      12.06.1621:14:04

      Разве не на ASIC?

      • 1
        A S A S
        12.06.1623:33:37

        Есть и то и то.

        Я знаю какие-то парни уже 3 или 4 ЦОД развернули (последний в Грузии) — чисто для биткоинов.

        И ASIC тоже есть под это заточенные.

        Видимо реально выгодно раз кто-то в это вкладывает серьезные средства.

        P. S. Парней зовут BitFury.

        Отредактировано: Антон Смоленский~01:36 13.06.16
  • -1
    A S A S
    11.06.1620:00:49

    Это очень глупая и странная публикация.

    Я имею в виду не работу «Fast GPU-based calculations in few-body quantum scattering».

    А именно вот эту вот статью, опубликованную тут. Мне кажется она является плодом того, что журналисты/маркетологи просто не поняли того, о чем и говорили ученые — и породили такое вот… Я бы советовал стереть ее и не позориться.

    Отредактировано: Антон Смоленский~22:18 11.06.16
    • 1
      OptimoPrincipi OptimoPrincipi
      13.06.1608:17:01

      Эта статья — перепечатка с официальной странички НИИ Ядерной физики им. Скобелицына при МГУ. Смотрите по ссылке под статьей. Наверняка текст согласован с авторами статьи. Так что ничего глупого в тексте нет.

      • 0
        A S A S
        13.06.1611:57:24

        Эта статья — перепечатка с официальной странички НИИ Ядерной физики им. Скобелицына при МГУ.

        Я знаю — и это меня удивляет еще сильнее.

        Насчет «согласован с авторами статьи» — по собственному опыту могу сказать — далеко не факт. Написали так, как по чьему-то мнению будет лучше для имиджа. Видимо написать как есть — про оптимизацию алгоритмов расчета под GPU — не круто. А написать чушь про то что «персоналка быстрее BLUEGENE» — круто.

        Отредактировано: Антон Смоленский~13:59 13.06.16
  • 1
    Нет аватара nik.f
    12.06.1605:58:10

    И зачем этим делиться со всеми? Ну и считали бы дальше себе тихо, а конкуренты пусть тратят на это куда больше времени и средств    

    • 0
      A S A S
      12.06.1613:48:02

      Это так не работает. Если Вы не делитесь — то и с Вами не делятся. Тут вопрос в другом — когда делиться. Есть вещи, которыми можно и сразу поделиться, а есть — с которых можно сначала денег выжать.

  • 0
    Николай Бирюков Николай Бирюков
    13.06.1617:26:06

    А ещё через некоторое время они ещё что-нить оптимизируют, и научат решать эти задачи калькулятор Электроника МК-61, причём быстрее, чем суперкомпьютер и обычный ПК…

  • 0
    Нет аватара de-solitudine
    14.06.1617:02:50

    Знакомый не один год участвует в проекте распределенных вычислений Folding@home, рассказывал, что там в принципе вычисления «заточены» под GPU, и выполняются куда быстрее чем на центральном процессоре. Вики подтверждает:

    «Наиболее перспективными платформами для проекта являются графические процессоры (GPU). Особенность данной платформы в том, что в графическом процессоре параллельно выполняется множество потоков, благодаря чему достигается превосходство в скорости расчётов над самыми современными CPU от Intel и AMD. По информации организаторов проекта, современные графические процессоры имеют ограничения по выполняемым вычислениям, связанные с их более узкой специализацией, поэтому полностью заменить обычные процессоры в проекте они не в состоянии. Однако в тех расчётах, где они применимы, организаторы проекта говорят о 40-кратном преимуществе GPU над «средним» процессором Intel Pentium 4, а практические результаты первых дней работы бета-версии клиента показали примерно 70-кратное преимущество данной платформы над «средним» процессором, принимающим участие в проекте."

    Так что в самом открытии бытовой видеокарты как специализированного чисто вычислительного процессора нового ничего нет уже давно, главное понимать их возможности и писать софт, умеющий использовать эти возможности. Просто все уже отвыкли, что на обычной «персоналке» можно именно расчетами заниматься, а не гонять игрушки да ржаки с ютуба… что говорить, современный смартфон имеет больше вычислительной мощности, чем компьютеры, считавшие раньше полеты в космос    

  • 0
    Anton Baula Anton Baula
    16.06.1616:46:22

    Мы хотим организовать что-то наподобие учебных курсов, где исследователи самых разных научных направлений из периферийных университетов, не имеющие доступа к суперкомпьютерам, смогли бы научиться делать на своих «персоналках» то же самое, что делаем мы

    Ну, вот опять. Запатентовать и продавать нужно решение.

Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,