Уважаемые коллеги, не сталкивались ли вы со следующей ситуацией: Синий экран смерти вылетает во время запуска задачи на расчет. все железо в норме и прошло проверки на перегруз, пегревов и прочего нет, драйвера в порядке. Однако, когда ставим на расчет (причем любом модуле CFD, Mechanical и т.д.) через произвольный промежуток времени вылетает синий экран смерти. (скрин из журнала во вложении). Наши сис. Админы не смогли понять причину и соответственно, как бороться с ней не знают. Очень надеюсь что у кого нибудь был опыт по решению таких проблем.
p.s. Процессор Intel® Xeon® 6142 класса Gold 2 камня (по 32 ядра), 192 гб ОЗУ,
Операционка Windows server 2016 standart
Выключается по-разному, может минут 5 считать и потом вылететь в синий экран, а может только часа через 3, но код в ошибки один и тот же. Такая ситуация только с Ансисом =(
Было похожее, замечено что температура ЦП резко возрастала в процессе расчета и вызывало перегрузку ядра и приводило к рестарту. Решилось установкой более качественного охлаждения. Какая температура ПЦ в режиме простоя?
Да мы тоже первым делом подумали что перегрев, замеры сделали в режиме простоя 20 градусов в во время расчета и выключения максимальная температура достигла 75.
Возможно в настройках BIOS стоят настройки экстренного отключения при достижении температурного показателя, это так сказать первая идея. Получает при запуске расчета у вас накапливаются процессы, которые затем переходят в бесконечный цикл, возможно и такое, в результате процессор экстренно завершает работу
Всем добрый день, кому интересно проблема решилась выключением гипертрейдинга. Видимо 2 процессора в одном системнике с гипертредингом не уживаются с расчетами в ансис, потому что все другие тестирования проходили отлично.
Здравствуйте! Спасибо, что отписались, и прошу прощения, что не успел подключиться в рамках техподдержки. Вообще гипертрединг желательно отключать на расчетных машинах, но подобных сбоев он не должен вызывать. Возможно, стоит обновить BIOS и провести тестирование оперативной памяти. Кстати, если какие-то модули, запущенные из под каких-то версий MPI будут падать при запуске, отключите в биосе NUMA (настройки называются по-разному, что-то типа NUMA Group size optimization = flat или Node interleaving = enable).
Что такое гипертрейдинг? Как его отключить?
Эта опция отключается в BIOS, для процессоров intel так и называется hyperthreading. Отвечает за разделение физических ядер на потоки, что не поддерживается Ansys. Так что отключение этой опции даст увеличение производительности
Интересный и неожиданный для меня результат эксперимента с опцией Hyperthreading в BIOS.
Процессор Intel Xeon 10-ти ядерный. С включенной вышеозначенной опцией это 20 потоков. При выборе во Флюенте для расчета свыше 4-х потоков расчет рано или поздно вылетал и компьютер выключался.
При отключенной опции Hyperthreading (остается только 10 ядер, как таковых), расчет идет стабильно.
Но есть одно НО.
В первом случае я использовал 4 потока или 20% вычислительной мощности процессора, во втором случае я делал расчет на 8-ми ядрах, т.е. 80% вычислительной мощности процессора.
Так вот, во втором случае производительность вычислений была выше всего на 8-10% - я сравнил количество произведенных итераций при решении одной и той же задачи за час. В первом случае было произведено 13 итераций, во втором 15.
Прямо скажу, не ожидал такого малого прироста производительности..
Добавить комментарий