Добрый день!
Встал вопрос: какими критериями следует оперировать при выборе карты для расчётов на GPU в Ansys Mechanical? И каков вес(важность) каждого из критериев для расчётов в Mechanical?
На сколько я понял, такими критериями являются :
- производительность в операциях с плавающей запятой двойной точности (fp64/Double-precision performance)
- объём памяти карты (Adequate graphics memory)
- пропускная способность памяти (memory bandwidth)
Для примера рассмортрим два варианта: Tesla K10 и Tesla M2090 (http://www.gpuzoo.com/Compare/NVIDIA_Tesla_M2090__vs__NVIDIA_Tesla_K10/)
Double Precision performance___ | 190.72 GFLOPS | 665.6 GFLOPS |
Memory size_________________ | 8192 MB | 6144 MB |
Memory bandwidth____________ | 320 GB/s | 177.6 GB/s |
Как видно fp64 у K10 в 3.5 раз мешьше, чем у m2090. С другой стороны памяти больше в 1.3 раза и в 1.8 раза больше пропускная способность. Но стоимость K10 в 3-5 раз больше.
Какая из этих карт будет считать быстрее в Mechanical? Стоит ли вообще рассматриваить K10?
В статье
http://www.nvidia.ru/object/nvidia-tesla-k10-gpu-accelerator-20120516-ru.html
Пауло Соуза (Paulo Souza), разработчик из Geophysical Technology Group, Petrobras RTM заявляет: "Мое приложение работает в 1.8 раза быстрее на K10, чем на GPU Tesla M2090, при том же уровне потребления энергии. Эта революционная технология значительно ускорит нашу работу по обнаружению и безопасному доступу к залежам нефти и газа, так как 90% нашей вычислительной мощи приходится на графические процессоры". Интересно, что результат совпал с преимуществом в пропускной способности.
Добавить комментарий