PS : j'ai une AS de 4 simus lancée ce matin entrain de tourner, donc on peut effectivement aller voir ce qui se passe. Elles ont un walltime de 10h donc peut-être que cette fois-ci elles vont arriver à leur terme. Le 07/03/2014 09:19, Loic GASCHE a écrit :
Salut Eric,
Alors après m'être connecté à caparmor :
qstat -u lgasche pour trouver mes jobs
qstat -f jobID\[numeroSimu\] pour trouver sur quel node caparmor la simu est entrain de tourner (ligne exec_node).
Une fois qu'on connait le node, soit aller sur :
http://caparmor-admin2.ifremer.fr/ganglia/?r=hour&s=descending&c=
et sélectionner son rack puis son node dans la liste jusqu'à trouver celui qu'on veut.
Ou alors faire ssh numNode (ex ssh r2i2n2)
Puis on peut faire top pour savoir le numero des simus ISIS sur ce node.
Enfin on peut faire strace -p numSimNode -f, par exemple strace -p 29006 -f pour avoir les infos sur la simu.
Par contre il y a énormément d'infos donc il faudrait les écrire dans un fichier à part pour pouvoir les lire correctement. Comment faire ça facilement ?
A première vue comme le disait Tina il y apleins de "futex..."
Voilà, c'est ce que j'ai ressorti des mails de Tina, ça a l'air de marcher.
Loïc
Le 06/03/2014 16:18, Eric Chatellier a écrit :
Tina n'est pas là en ce moment.
J'avais fait un mail à Denis Croizé-Fillon qui s'occupe aussi de caparmor, au début il penchait plus pour un "problème" ISIS à priori vu qu'il m'avait indiqué de voir avec vous.
On en a brièvement rediscuté ce matin, il n'avait toujours pas l'air de penser que ça venait de caparmor.
Je vais essayer d'en remettre une couche, mais je ne pense pas que ça donne grand chose. En fait, ce qu'il faudrait, c'est les statistiques des simulations lentes et pas lentes pour savoir quoi chercher, sinon, on ne va faire que se renvoyer la balle. Tu as les commandes de tina pour avoir les stats utilisations disque /
Le 06/03/2014 16:11, Loic.Gasche@ifremer.fr a écrit : processeurs ?