Доброго времени суток.
Столкнулся с проблемой следующего характера:
Имеем задачу, тяжёлую для персоналки под windows, в связи с чем стартуем расчет на компактной суперэвм о 64х2 процах 256 оперативки, на на sl 6.2
Закидываем распараллеленный файл на компьютер, имеем следующие варианты(описаны сокращённо):
Вариант 1.
/host/username/ansys_inc/..autodyn.190 -I ./admodel_0.ad
Starting autodyn...
Ident ./admodel not found.
##./admodel - подразумевается адрес к файлу задачи. Он там есть, точно. Под пользователем и рутом расклад одинаковый.##
Вариант 2.
Закидывание parallel.cfg в соответствии с заветами мануалов в папку с расчетом.
Starting adslave on host....
Rank 0:13: MPI_Init_thread: didn't find active interface/port
Rank 0:13: MPI_Init_thread: Can't initialize RDMA device
Rank 0:13: MPI_Init_thread: Internal Error: Cannot initialize RDMA protocol MPI Application rank 13 exited before MPI_Init() with status 1
Решение пишут разное - снять ограничения на выделенную память - сняли ограничения с 256 Гб оперативки на анлим - не помогло.
Дописать всяких .rules - уже есть, не пашет все равно.
Куда копать?
З.ы.
Ансис установлен из под пользователя не являющегося рутом, ибо всякое другое на машине тоже работает со своими настройками. Чтоб не загубить так сказать.
Добавить комментарий