Перед началом работы настоятельно рекомендуем ознакомиться с правилами форума.

Аварийные перезагрузки сервера в процессе расчетов

Rebellion
Аватар пользователя Rebellion

Уважаемые коллеги, не сталкивались ли вы со следующей ситуацией: Синий экран смерти вылетает во время  запуска задачи на расчет.  все железо в норме и прошло проверки на перегруз, пегревов и прочего нет, драйвера в порядке. Однако, когда ставим на  расчет (причем любом модуле CFD, Mechanical и т.д.) через произвольный промежуток времени вылетает синий экран смерти. (скрин из журнала во вложении). Наши  сис. Админы не смогли понять причину и соответственно, как бороться с ней не знают.  Очень надеюсь что у кого нибудь был опыт по решению таких проблем.

 

p.s. Процессор Intel® Xeon® 6142 класса Gold  2 камня (по 32 ядра), 192 гб ОЗУ,

Операционка Windows server 2016 standart

Выключается по-разному, может минут  5  считать и потом вылететь  в синий экран, а может только часа через  3, но код в ошибки один и тот же. Такая ситуация только с Ансисом =(

 

 

Ivan007
Аватар пользователя Ivan007

Было похожее, замечено что температура ЦП резко возрастала в процессе расчета и вызывало перегрузку ядра и приводило к рестарту. Решилось установкой более качественного охлаждения. Какая температура ПЦ в режиме простоя?

Rebellion
Аватар пользователя Rebellion

Да мы тоже первым делом подумали что перегрев, замеры сделали в режиме простоя 20 градусов в во время расчета и выключения максимальная температура достигла 75.

Ivan007
Аватар пользователя Ivan007

Возможно в настройках BIOS стоят настройки экстренного отключения при достижении температурного показателя, это так сказать первая идея. Получает при запуске расчета у вас накапливаются процессы, которые затем переходят в бесконечный цикл, возможно и такое, в результате процессор экстренно завершает работу

Rebellion
Аватар пользователя Rebellion

Всем добрый день, кому интересно проблема решилась выключением гипертрейдинга. Видимо 2 процессора в одном системнике с гипертредингом не уживаются с расчетами в ансис, потому что все другие тестирования проходили отлично.

dvolkind
Аватар пользователя dvolkind

Здравствуйте! Спасибо, что отписались, и прошу прощения, что не успел подключиться в рамках техподдержки. Вообще гипертрединг желательно отключать на расчетных машинах, но подобных сбоев он не должен вызывать. Возможно, стоит обновить BIOS и провести тестирование оперативной памяти. Кстати, если какие-то модули, запущенные из под каких-то версий MPI будут падать при запуске, отключите в биосе NUMA (настройки называются по-разному, что-то типа NUMA Group size optimization = flat или Node interleaving = enable).

Добавить комментарий

Войдите или зарегистрируйтесь, чтобы отправлять комментарии
Приложить файл

Максимальный размер файла: 128 МБ.
Допустимые типы файлов: txt doc docx xls xlsx pdf rar zip 7zip tar.