Bonjour,
je suis entrain de faire tourner des plans de simulations sur 5 ordinateurs :
-11520 simus sur celui de Sigrid
-4950 sur celui de Youen
-8640 sur celui de Steph
-11520 sur celui d'EMH
-3840 sur Acoustica
Les 3 prmeiers plans de simus se sont arrêtés cette nuit, le plan sur EMH tourne sur 7 coeurs sur 10, et celui sur Acoustica continue sans encombre.
Pour Sigrid (environ 1760 simus ont tourné), Youen (neviron 1920) et EMH, j'ai les mêmes symptômes :
-une fenêtre pop-up "unable to create new native thread"
-suivie de ce message : java.lang.OutOfMemoryError: unable to create new native thread
at java.lang.Thread.start0(Native Method)
at java.lang.Thread.start(Thread.java:717)
at java.util.concurrent.ThreadPoolExecutor.addWorker(ThreadPoolExecutor.java:957)
at java.util.concurrent.ThreadPoolExecutor.processWorkerExit(ThreadPoolExecutor.java:1025)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1167)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Pourtant avec la commande df -h, dans tous les cas, je remarque que la mémoire est loin d'être pleine (ici je travaille sur dev/sda7, il me reste 14G) :
Sys. de fichiers Taille Utilisé Dispo Uti% Monté sur
udev 16G 0 16G 0% /dev
tmpfs 3,2G 9,3M 3,2G 1% /run
/dev/sda7 68G 51G 14G 80% /
tmpfs 16G 64M 16G 1% /dev/shm
tmpfs 5,0M 4,0K 5,0M 1% /run/lock
tmpfs 16G 0 16G 0% /sys/fs/cgroup
/dev/sda2 100M 9,8M 90M 10% /boot/efi
/dev/sda3 725G 450G 276G 63% /media/Windows
cgmfs 100K 0 100K 0% /run/cgmanager/fs
//nantes/echange 1,6T 1,3T 320G 81% /media/echange
//nantes/discard 1,6T 1,3T 320G 81% /media/discard
//lorient/echantil 1,2T 727G 474G 61% /media/echantil
//lorient/credo 1,2T 727G 474G 61% /media/credo
tmpfs 3,2G 52K 3,2G 1% /run/user/1001
/dev/sda8 4,5G 806M 3,5G 19% /media/youyou/34ffe439-1750-4588-bfb5-ff01136b3346
Sur le PC de Steph (environ 1075 simus), je n'ai aucun message d'erreur, mais rien ne tourne, et de même, la mémoire n'est pas pleine.
Je ne peux pas faire suivre les debugs, ils font des dizaines de Go.
Quel autre paramètre à surveiller pour éviter que ça ne se reproduise?
Audric