MAX
Подпишись
стань автором. присоединяйся к сообществу!

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: sdelanounas.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 2
    Нет аватара nesk16.12.15 12:31:23

    да! точно.

    Интересно посмотреть время выполнения программы для Эльбруса без оптимизации и с оптимизацией -O2

    Что бы оценить на сколько эффективно отрабатывает компилятор, какой он дает вклад (на VLIW с явным параллелизмом — это критически важно)

    PS Хотя, если мы получили корреляцию с частотой, то можно предположить, что лучше оно уже не параллелится.

    Отредактировано: nesk~13:43 16.12.15
    • 3
      Нет аватара guest16.12.15 13:23:24

      То -O2 не это -O2, и не -O2 у gfortran.

      Смотреть надо время выполнения критических кусков кода, для ifc x86_64 это так:

      ifort -pg -O2 -o test main79.f pythia-6.4.28.f && ./test && gprof ./test gmon_out

      ^^^ в gmon_out '_' надо заменить на '.'

      P.S.

      Для Xeon L5640 gfortran-4.4 -O2 -march=core2 -mtune=core2 генерит в ~2 раза более медленный код (120 сек / 1e4 событий), чем ifort -O2 -march=core2 -mtune=core2 (70 сек / 1e4 событий). Так что Интел что-то знает за свои машины, чего не знает gcc.

      P.P.S.

      Вывод gprof после ifort более осмысленный. Ожидаемо время тратится на вычисление медленно сходящихся логарифмов.

      см. gmon* под hermes(dot)ihep(dot)su(colon)8001/pool/atlas/p6/

      Отредактировано: vx8400 .~15:21 16.12.15