Лого Сделано у нас
43

СуН на «Эльбрусе» :)

читать полностью

Читайте также...

Вступайте в наши группы и добавляйте нас в друзья :)

Подпишитесь на наш канал в Яндекс.Дзен и сделайте вашу ленту объективнее!
  • 2
    vx8400 . vx8400 .
    16.12.1512:09:19

    real 16.80

    То есть масштабируется с частотой ~ 800/1600.

    • 2
      Нет аватара nesk
      16.12.1512:31:23

      да! точно.

      Интересно посмотреть время выполнения программы для Эльбруса без оптимизации и с оптимизацией -O2

      Что бы оценить на сколько эффективно отрабатывает компилятор, какой он дает вклад (на VLIW с явным параллелизмом — это критически важно)

      PS Хотя, если мы получили корреляцию с частотой, то можно предположить, что лучше оно уже не параллелится.

      Отредактировано: nesk~13:43 16.12.15
      • 3
        vx8400 . vx8400 .
        16.12.1513:23:24

        То -O2 не это -O2, и не -O2 у gfortran.

        Смотреть надо время выполнения критических кусков кода, для ifc x86_64 это так:

        ifort -pg -O2 -o test main79.f pythia-6.4.28.f && ./test && gprof ./test gmon_out

        ^^^ в gmon_out '_' надо заменить на '.'

        P.S.

        Для Xeon L5640 gfortran-4.4 -O2 -march=core2 -mtune=core2 генерит в ~2 раза более медленный код (120 сек / 1e4 событий), чем ifort -O2 -march=core2 -mtune=core2 (70 сек / 1e4 событий). Так что Интел что-то знает за свои машины, чего не знает gcc.

        P.P.S.

        Вывод gprof после ifort более осмысленный. Ожидаемо время тратится на вычисление медленно сходящихся логарифмов.

        см. gmon* под hermes(dot)ihep(dot)su(colon)8001/pool/atlas/p6/

        Отредактировано: vx8400 .~15:21 16.12.15
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,