Лого Сделано у нас
43

СуН на «Эльбрусе» :)

читать полностью

Читайте также...

Вступайте в наши группы и добавляйте нас в друзья :)

Подпишитесь на наш канал в Яндекс.Дзен и сделайте вашу ленту объективнее!
  • 2
    Нет аватара nesk
    16.12.1512:31:23

    да! точно.

    Интересно посмотреть время выполнения программы для Эльбруса без оптимизации и с оптимизацией -O2

    Что бы оценить на сколько эффективно отрабатывает компилятор, какой он дает вклад (на VLIW с явным параллелизмом — это критически важно)

    PS Хотя, если мы получили корреляцию с частотой, то можно предположить, что лучше оно уже не параллелится.

    Отредактировано: nesk~13:43 16.12.15
    • 3
      vx8400 . vx8400 .
      16.12.1513:23:24

      То -O2 не это -O2, и не -O2 у gfortran.

      Смотреть надо время выполнения критических кусков кода, для ifc x86_64 это так:

      ifort -pg -O2 -o test main79.f pythia-6.4.28.f && ./test && gprof ./test gmon_out

      ^^^ в gmon_out '_' надо заменить на '.'

      P.S.

      Для Xeon L5640 gfortran-4.4 -O2 -march=core2 -mtune=core2 генерит в ~2 раза более медленный код (120 сек / 1e4 событий), чем ifort -O2 -march=core2 -mtune=core2 (70 сек / 1e4 событий). Так что Интел что-то знает за свои машины, чего не знает gcc.

      P.P.S.

      Вывод gprof после ifort более осмысленный. Ожидаемо время тратится на вычисление медленно сходящихся логарифмов.

      см. gmon* под hermes(dot)ihep(dot)su(colon)8001/pool/atlas/p6/

      Отредактировано: vx8400 .~15:21 16.12.15
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,