Bonjour à tous et à toutes,
Je suis webmaster d'un parc informatique composé d'une quinzaine de serveurs. Ces serveurs sont disposés en deux endroits distincts :
- Une dizaine (les serveurs primaires) sont dans un data center et branchés sur fibre optique. Bien qu'ils soient à plusieurs kilomètres d'où je suis, j'ai la main sur eux via un logiciel de prise en main à distance.
- Quatre serveurs (les serveurs secondaires) sont dans nos locaux et également branchés sur fibres optique
Quasiment tous les serveurs sont sous Windows Server 2003. Si la plupart sont des serveurs web, certains sont des serveurs de mails et d'autres des serveurs de streaming.
Mon problème est le suivant :
Parfois un ou plusieurs de mes serveurs primaires sont HS pour diverses raisons (coupure d'électricité, attaque DoS, "out of memory"...) et je dois alors basculer sur les serveurs secondaires le temps de réparer la panne sur les primaires. Le problème c'est, déjà que je ne me rends pas forcément compte de la panne (la plupart du temps, ce sont nos "clients" qui nous appellent en disant que leur site est HS. Ça la fout un peu mal ), ensuite je dois migrer manuellement les bases de données des sites sur nos serveurs secondaires et enfin rediriger les visiteurs vers nos serveurs secondaires, le temps de la maintenance sur les serveurs primaires.
Je voudrais donc savoir si vous connaissiez une manière "automatique" (un logiciel, un script...) pour :
Détecter en temps réel si le serveur fonctionne ou non
Copier les différentes bases de données des serveurs primaires vers les secondaires
Rediriger les visiteurs des serveurs primaires vers les secondaires le temps de régler la panne, puis, une fois la panne réglée, des serveurs secondaires vers les primaires
le tout le plus rapidement possible de façon à ce que ce soit le plus transparent possible pour les visiteurs.
Je sais que beaucoup de serveurs (à commencer par ceux de Google), pour répartir la charge, redirigent les visiteurs sur d'autres serveurs et ce en totale transparence; j'imagine que si ça existe (une procédure, un logiciel...) pour répartir la charge, ça doit exister si le serveur "tombe", non ?
Un grand merci par avance pour vos réponses.