Crash debian 64bits répétitifs

Le
Patrick Begou
Bonjour,

Cela fait quelques temps que sur mes deux serveurs HA j'ai des crash
bruteaux de mon systeme debian 64 bits sarge. J'ai verifié les disques
système, la mémoire, changé une CM, changé l'alimentation rien n'y
fait. Les machines sont ondulées sur 2 onduleurs différents.

J'ai cru un instant que l'activité des cron daily y était pour quelque
chose (ca crashait toujours à ce moment) et j'ai desactivé la plus-part
des scripts. J'ai gagné un peu mais pas la guerre! Là cela vient de
crasher sans relation avec les cron daily.

Le fait que les 2 serveurs crashent(config similaire) mais pas au même
moment, me fait penser a un problème vraiment lié au système d'exploitation.

Les messages sur la console ne me paraissent pas d'un grande aide.
Comment analyser la situation, trouver des pistes pour résoudre le
problème ? J'ai bien exploré les logs mais sans succès.

Merci de votre aide.

Patrick
--

| Equipe M.O.S.T. | http://most.hmg.inpg.fr |
| Patrick BEGOU | |
| LEGI | mailto:Patrick.Begou@hmg.inpg.fr |
| BP 53 X | Tel 04 76 82 51 35 |
| 38041 GRENOBLE CEDEX | Fax 04 76 82 52 71 |



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
  • Partager ce contenu :
Vos réponses
Trier par : date / pertinence
Julien Valroff
Le #9514541
Le jeudi 25 janvier 2007 à 15:41 +0100, Patrick Begou a écrit :
Bonjour,

Cela fait quelques temps que sur mes deux serveurs HA j'ai des crash
bruteaux de mon systeme debian 64 bits sarge. J'ai verifié les disques
système, la mémoire, changé une CM, changé l'alimentation... rien n'y
fait. Les machines sont ondulées sur 2 onduleurs différents.

J'ai cru un instant que l'activité des cron daily y était pour quelque
chose (ca crashait toujours à ce moment) et j'ai desactivé la plus-part
des scripts. J'ai gagné un peu mais pas la guerre! Là cela vient de
crasher sans relation avec les cron daily.

Le fait que les 2 serveurs crashent(config similaire) mais pas au même
moment, me fait penser a un problème vraiment lié au système d'exploitation.

Les messages sur la console ne me paraissent pas d'un grande aide.
Comment analyser la situation, trouver des pistes pour résoudre le
problème ? J'ai bien exploré les logs mais sans succès....



Juste au cas où, un article a été aujourd'hui même sur d-a.org :
http://www.debian-administration.org/articles/492

Il semble que tu aies déjà épuisé au moins quelques unes des pistes
indiquées, mais cela peut peut-être toujours être utile...

@++
Julien



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Thierry Leurent
Le #9514531
As-tu des messages sur l'écran de la console ? Lesquels ?
Quel est l'usage de ces machines ?
Quel système de disque utilisent-elles ?

Bien à toi,

Patrick Begou a écrit :
Bonjour,

Cela fait quelques temps que sur mes deux serveurs HA j'ai des crash
bruteaux de mon systeme debian 64 bits sarge. J'ai verifié les disques
système, la mémoire, changé une CM, changé l'alimentation... rien n'y
fait. Les machines sont ondulées sur 2 onduleurs différents.

J'ai cru un instant que l'activité des cron daily y était pour quelque
chose (ca crashait toujours à ce moment) et j'ai desactivé la plus-part
des scripts. J'ai gagné un peu mais pas la guerre! Là cela vient de
crasher sans relation avec les cron daily.

Le fait que les 2 serveurs crashent(config similaire) mais pas au même
moment, me fait penser a un problème vraiment lié au système
d'exploitation.

Les messages sur la console ne me paraissent pas d'un grande aide.
Comment analyser la situation, trouver des pistes pour résoudre le
problème ? J'ai bien exploré les logs mais sans succès....

Merci de votre aide.

Patrick
--
============================================================== > | Equipe M.O.S.T. | http://most.hmg.inpg.fr |
| Patrick BEGOU | ------------ |
| LEGI | mailto: |
| BP 53 X | Tel 04 76 82 51 35 |
| 38041 GRENOBLE CEDEX | Fax 04 76 82 52 71 |
============================================================== >

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact







--
Thierry Leurent
Phone : +32 476/20.23.98
E-mail :
Website (en developpement) : http://www.asgardian.be


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Patrick Begou
Le #9514511
Thierry Leurent wrote:
As-tu des messages sur l'écran de la console ? Lesquels ?



Pas vraiment des choses utilisables. Des rafales de codes en héxa que je
ne sais interpréter puis un "console shuts up"

Le début des messages (non affiché) pourrait être interressant mais
j'ignore comment les récupérer (rien dans les logs qui ressemble à ces
messages)

Quel est l'usage de ces machines ?



Serveur stratégique! DNS, SMTP, POPs, LDAP, NFS pour les homedir.
Pas d'utilisateur dessus.
C'est une configuration HA avec un serveur redondant. Réplication par
drbd, basculement par heartbeat, surveillance des services par mon.
Généralement les services sont répartis (LDAP/NFS sur l'un, DNS, SMTP,
POPs sur l'autre) mais là ils étaient sur le même serveur.

Très peu de charge P4-640 avec 2Gb RAM pour 10 utilisateurs accédant à
ces services!

Quel système de disque utilisent-elles ?



sur chaque serveur:
Système: c'est de l'IDE.
Datas: 2 disques SATA en RAID 1 (logiciel)


J'ai redémarré sur une Kaella et sauvegardé les fichiers de log. Mais je
n'ai rien vu de spécial....

J'ai rebooté pour ré-activer le système HA (je ne bosse pas demain et je
ne veux pas laisser ce système sans redondance tout le weekend)

Il faut que je trouve un système pour tracer le problème et l'identifier
mais je n'ais pas d'idée.

Bien cordialement

Patrick
--
============================================================== | Equipe M.O.S.T. | http://most.hmg.inpg.fr |
| Patrick BEGOU | ------------ |
| LEGI | mailto: |
| BP 53 X | Tel 04 76 82 51 35 |
| 38041 GRENOBLE CEDEX | Fax 04 76 82 52 71 |
==============================================================

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Patrick Begou
Le #9514491
Merci pour le lien. Je vais essyer d'activer netconsole entre les
serveurs (chacun envoyant l'information à l'autre).

Patrick
--
============================================================== | Equipe M.O.S.T. | http://most.hmg.inpg.fr |
| Patrick BEGOU | ------------ |
| LEGI | mailto: |
| BP 53 X | Tel 04 76 82 51 35 |
| 38041 GRENOBLE CEDEX | Fax 04 76 82 52 71 |
==============================================================

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
raboo1
Le #9514451
Le Thu, 25 Jan 2007 15:41:15 +0100,
Patrick Begou
Bonjour,

Cela fait quelques temps que sur mes deux serveurs HA j'ai des crash
brutaux de mon système debian 64 bits sarge. J'ai vérifié les
disques système, la mémoire, changé une CM, changé l' alimentation...
rien n'y fait. Les machines sont ondulées sur 2 onduleurs diffé rents.



Salut, quand vous avez changé la CM, vous avez changé le
micro-processeur aussi?
Je demande ça car ce genre de crash (intermittent et impossible à
relier à un évènement logiciel particulier) est typique d'un problème
matériel. Surtout lorsqu'il y a de longue période entre 2 crash
(plusieurs jours).
Patrice Karatchentzeff
Le #9514371
Le 25/01/07, Patrick Begou
Bonjour,

Cela fait quelques temps que sur mes deux serveurs HA j'ai des crash
bruteaux de mon systeme debian 64 bits sarge. J'ai verifié les disques
système, la mémoire, changé une CM, changé l'alimentation... rien n'y
fait. Les machines sont ondulées sur 2 onduleurs différents.



J'ai la même chose avec des AMD64 : sur toute version de Debian et Ubuntu .

AMHA, le support des derniers AMD est vraiment minable (j'ai un 32
bits récents qui fait des siennes aussi).

Regarde, j'ai initialisé un fil sur le sujet sur fcolc.

Il y a une amélioration récente avec la dernière Ubuntu. Mais bon, de s
uptimes de 15 jours, il n'y a qu'un Windowsien que cela emballe.

PK

--
| _,,,---,,_ Patrice KARATCHENTZEFF
ZZZzz /,`.-'`' -. ;-;;,_ mailto:
|,4- ) )-,_. , ( `'-' http://p.karatchentzeff.free.fr
'---''(_/--' `-'_)
Gabriel Moreau
Le #9514071
> Le fait que les 2 serveurs crashent(config similaire) mais pas au même
moment, me fait penser a un problème vraiment lié au système
d'exploitation.



Est ce que les serveurs crashent en dé-activant la HA, mon, drdb... J'ai
déjà eu des pannes de ce type mais sur i386, une fois à cause de la
mémoire et l'autre à cause d'une carte RAID que les outils de détection
du vendeur ne détectait pas...

As tu aussi essayé de mettre un noyau de base non optimisé ? Ou un autre
noyau. Dans les backports, il y a différentes version du noyau.

gaby


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Poster une réponse
Anonyme