Version complète: sur le forum Webmaster Hub : Panne de courant sur Redbus
Webmaster Hub > Accueil > Annonces du Hub
Pages: 1, 2, 3, 4, 5
R. Lyès
Mon serveur n'est plus disponible sad.gif

:gueule:
Théo B.
Oui.
A mon avis, ils effectuent les "opérations de maintenance".
Après ça, ça reviendra à la normale (du moins on espère)...
Amibien
A vos sauvegardes je sents que la nuit va être chaude et que demain matin certains auront la gueule de bois... whistling.gif
Cariboo
Les miens sont toujours "up"...

Il semble que la manip de ce soir 20h00 ne faisait pas courir de risques supplémentaires aux machines... Les manip suivantes oui.

Donc le vrai risque c'est pour entre 21h et 22H, au moment de la bascule des UPS sur les générateurs...
iOlivier
Chez IKOULA tout est down. C'est finalement pas plus mal plutot que de croiser les doigts.

Au moins on a eu le temps de prévenir les clients
Dan
CITATION(NiCoS @ lundi 27 mars 2006, 20h10)
C'est Redbus l'hébergeur d'hébergeurs, pas sivit  wink.gif
*

C'est ce qu'on appelle un "lapsus", bien évidemment. Je corrige mon post wink.gif
Merci pour ce correctif !

Dan
smile
Ne pas s'inquieter pour le moment, c'est sans doute le passage à la source d'EDF
Dan
Dernier Message d'OVH sur la ML:
CITATION(Octave Klaba (OVH))
L'intervention de 20h va consister au demontage et à la réparation du disjoncteur EDF. Le disjoncteur étant isolé, il n'y aura normalement pas d'incident.

A 21h ou 22h environs, lorsque le disjoncteur sera réparé, les onduleurs seront basculés sur les générateurs qui fournissent actuellement le courant sur Redbus. Cette manipulation avait échoué à deux reprises hier suite à une défaillance d'un des onduleurs.
L'onduleur en question a été réparé mais le risque existe tout de même.

Suite à cette manipulation, les onduleurs seront injectés dans le circuit entre les generateurs et les clients. Le courant sera donc régulé.

10h plus tard les batteries des onduleurs seront pleinement chargées.
Il sera alors techniquement possible de repasser sur l'alimentation EDF. Le basculement sera fait à une date et une heure non communiquée pour le moment.
smile
En effet Sivit a stoppé ces machines afin de proteger ces installations electriques,
donc normalement pas de risque au niveau des serveurs enfin d'après ce qu'on m'en dit mais c'est à verifier tout cela smile.gif
R. Lyès
Pour info...
Lu sur le chat IRC de SIVIT :

<myster0> «21:43:22» {@mozvip} le remplacement de cette piece va durer
encore 45 minutes
<myster0> «21:43:23» {@mozvip} après ça, ils vont tester la pièce : 5
minutes
<myster0> «21:43:43» {@mozvip} si ok : il faut attendre 12 minutes pour
que les ups s'arme
<myster0> «21:44:06» {@mozvip} si ok : le courant electrique est basculé
sur cette source d'energie
<wilk> myster0: le réel problème c'est quand y a plusieurs coupures en
suivant, si la deuxième coupure arrive au moment du fsck, sinon c pas
bien génant
<myster0> «21:44:43» {@mozvip} si ya le moindre non ok : retour sur
groupe electrogene avec un plan de secours non definie à part remettre
ça à un autre jour avec un nouveau plan selon le diag établie
manitou
Selon la ML d'OVH :

CITATION
La première partie a été realisée sans problème.

D'ici 15 minutes les techniciens attaquent la seconde phase qui consiste à brancher les onduleurs sur les groupes electrogene. C'est la partie qui est actuellement la plus dangeureuse.


Espérons....
clems365
Ca dure, ca dure cela n-inaugure rien de bon tout ca.... de toute facon selon les dire d´Amen j´ai tout perdu... donc au point ou j'en suis au moins....
Jok
C'est là qu'on voit tous les sites qui dépendent de RedBus, tout HS smile.gif
manitou
" La phase 2 prends finalement un peu plus de temps. Ils l'estiment à 45 minutes à partir de maintenant."
Soit une fin prévue vers minuit au plus tôt....
Spidetra
Une petite co........erie avant d'aller me coucher :

Au tout début, en 1969, Arpanet est né en reliant quatre ordinateur dans quatre centres universitaires différents.
Ce réseau, civil au départ, a intéressé le secteur militaire. Un tel réseau distribué pouvait potentiellement résisté à une attaque nucléaire !

37 ans plus tard, Arpanet devenu Internet, n'est pas capable, en France en tout cas, de résister à une simple coupure électrique :gueule:

Juste par curiosité :
Il existe d'autres centres aussi névralgiques que RedBus en France ?
iOlivier
C'est clair que ca amène à réfléchir à tout centraliser. Mais bon, pour les interconnexion réseau, pas trop le choix. On va pas tirer des cables dans tous les sens...
manitou
CITATION(anorci @ lundi 27 mars 2006, 23h32)
Ce réseau, civil au départ, a intéressé le secteur militaire. Un tel réseau distribué pouvait potentiellement résisté à une attaque nucléaire !

37 ans plus tard, Arpanet devenu Internet, n'est pas capable, en France en tout cas, de résister à une simple coupure électrique  :gueule:

Le réseau résiste bien, la preuve on est en train de poster là (je te dis pas ce que les routeurs en france on du faire de MAJ avec la suppresion de tout ça et le nombre de paquets perdus dans le réseau).

Bien entendu, si le global résiste bien, localement c'est merdique !!
invader-u
C'est la galere ce truc, c'est toujours quand on a besoin de trouver des infos que les sites sont pas en ligne.

En tout cas, c'est bien que le hub soit pas chez redbus !
iOlivier
Dernier Message d'OVH:

CITATION
Les onduleurs sont connectés.
Les baies sont passées sur le réseau ondulé.

On se retrouve donc alimentés par les generateurs mais en étant protegé par les onduleurs.

Les onduleurs rechargent pendant 10h. Demain soir, à 20h, le basculement vers EDF sera fait.

Au niveau des generateurs il y a actuellement 50 000 litres de fuel (le plein a été fait aujourd'hui à 17h). Demain matin 13 000 litres seront ajoutés (plus que la consommation prevue pour cette nuit).

La situation reste comme ça jusque demain 20h.
Loupilo
Fini !

Vous pouvez rallumer vos serveurs smile.gif
f_trt
CODE
11:54pm  up 1 day,  3:33,  1 user,  load average: 0.00, 0.00, 0.00
60 processes: 59 sleeping, 1 running, 0 zombie, 0 stopped
CPU states:  0.1% user,  0.3% system,  0.0% nice, 99.4% idle
Mem:   254436K av,  235456K used,   18980K free,       0K shrd,   65984K buff
Swap:  136512K av,   24544K used,  111968K free                  113236K cached


J'ai pas eu d'ordre de couper mon serveur de la part de NFRANCE alors j'ai croisé les doigts et j'ai surveillé minutes par minutes et je ne comprend rien car depuis hier jusqu'a maintenant pas de coupure.

A+
clems365
Pour l'instant pas grand chose de nouveau toujours le black out sur tous mes sites et sur pas mal d'autres aussi angry.gif
rportal
IMSTP2.gif mes sites sont up
bigben
Moi aussi c'est up!
(depuis 23h50 apparement)

J'espère qu'on va enfin être tranquille pour un bon moment!!!!!
iOlivier
CITATION
J'ai pas eu d'ordre de couper mon serveur de la part de NFRANCE alors j'ai croisé les doigts et j'ai surveillé minutes par minutes et je ne comprend rien car depuis hier jusqu'a maintenant pas de coupure.


un peu risqué de jouer à la roulette de leur part. Il y a avait un risque évident de cramer le serveur ou endommager le disque

Mes serveurs ikoula, sagement stoppés, sont UP IMSTP2.gif IMSTP2.gif
smile
revenu aussi smile.gif

Il en reste pas moins que l'image de Redbus en prend un coup.
Billyboy
meme pendant le crash leur site restait up mais pourtant regarder en bas de cette page smile.gif
http://www.redbus.fr/legales.htm
manitou
Problème sur mon serveur : il ping bien mais impossible de s'y connecter (port 22 non ouvert, de même que ftp, http)....
On y a accés par l'ip et pas par le nom de domaine.

Une idée ? Quelqu'un d'autre est concerné ? (je suis chez ikoula)
iOlivier
CITATION(manitou @ mardi 28 mars 2006, 00h08)
Problème sur mon serveur : il ping bien mais impossible de s'y connecter (port 22 non ouvert, de même que ftp, http)....
On y a accés par l'ip et pas par le nom de domaine.

Une idée ? Quelqu'un d'autre est concerné ? (je suis chez ikoula)
*



Fait un mail tout de suite a ikoula_AT_ikoula.com en précisant IP du serveur et login pass root.

Ils sont ultra réactifs et te laisseront pas plus d'une heure.
petit-ourson
Comme quoi ... Y'a certainement plus d'avenir dans l'electricité que dans l'informatique ;o)

Le jour où les électriciens seront mécontents, les informaticiens ne seront plus grands choses lol
manitou
Fait.
Quelle nuit en perspective.....
Espérons que demain la même merde n'arrivera pas à nouveau.

C'est bon tout marche à nouveau. Vraiment rapide.
Ouf, dodo maintenant.
clems365
Chez Amen c'est toujours le foutage de gu**le...

CITATION
Bonjour,

Nous vous informons que l'incident qui perturbait une partie de notre infrastructure réseau est terminé.

Nous vous prions de bien vouloir nous excuser si vous avez observé des ralentissements ou une indisponibilité de votre service.

L'Equipe Technique Amen.


Alors qu'en ce qui me concerne rien ne marche... les sites sont toujours down tout comme le serveur. angry.gif angry.gif angry.gif angry.gif angry.gif
Cariboo
Tout n'est pas encore terminé...

Pour l'instant, ils ont juste rétabli les onduleurs entre les groupes électrogènes et nos serveurs... Les a-coups produits par les générateurs sont écrêtés maintenant par les onduleurs, donc c'est une bonne nouvelle pour le matériel qui a horreur de ça.

Maintenant, il faut repasser (enfin) sur le réseau EDF ce qui devrait être fait ce soir vers 20h00...

Normalement, avec les onduleurs en "tampon", cette manip' est gérée de manière transparente, et ne produit pas d'interruption de l'alimentation. Mais là, il est probable que certaines mesures seront prises pour éviter les problèmes, notamment les hébergeurs qui préfèreront arrêter leurs machines au cas où...
Dan
Est-ce que cela veut dire que certains hébergeurs pourront à nouveau recommander de couper les machines ce soir ?

Ca commence à faire beaucoup de coupures...
Cariboo
Certains ont semble-t'il prévu effectivement de "prendre leurs précautions".

Ceci-dit, la bascule d'hier soir s'est bien passé parait-il (sans vraies coupures), donc maitenant, si les onduleurs font leur boulot, à l'inverse, d'autres vont peut-être prendre le risque de laisser leur machine up pendant la manip'.
wullon
CITATION(Billyboy @ mardi 28 mars 2006, 00h52)
meme pendant le crash leur site restait up mais pourtant regarder en bas de cette page smile.gif
http://www.redbus.fr/legales.htm
*

Le site est hébergé sur le datacenter redbus de Londres.


Par contre, faut arrêter d'être impressioné par cette coupure.

Ce n'est pas la première fois que ça arrive, surement pas la dernière, et comme l'a dit manitou, globalement, cette coupure était quasiment imperceptible (étant donné que les gros sites ont des replicats sur plusieurs DC).

C'est grave et embêtant certes, mais ce n'était pas la fin du monde.

Pour ce soir, faut espérer qu'il n'y aura pas de coupures (parce que sinon ça aura été très con de laisser les serveurs allumés ce soir et de les avoir éteint hier happy.gif).
smile
Tes sites sont inaccessibles, les tiens ils ont oubliés de les remettre en route laugh.gif
Modibo
Pareil pour moi depuis ce matin je crois huh.gif
Arlette
CITATION(Modibo @ mardi 28 mars 2006, 16h00)
Pareil pour moi depuis ce matin je crois huh.gif
*

Non, le premier dans ta signature est accessible smile.gif Je viens d'y accéder. Par contre les deux autres non sad.gif
Loupilo
Bonne nouvelle, l'intervention a été repoussée à 4h du matin, et durera approximativement 2 heures. Autant dire que l'impact sur la fréquentation de vos sites si il y a un incident sera minime smile.gif

Aucune coupure... n'est prévue laugh.gif
chiquita463
CITATION(chiquita463 @ lundi 27 mars 2006, 20h01)
je voudrais juste savoir a titre indicatif quels sont les concurents de Redbus.
*

C'est juste par rapport aux cours de la bourse. Ce n'est pas pour quitter redbus (je sais que je ne peux pas). Merci de vos réponses.
j_b007
CITATION
Bonjour,
Comme vous le savez, un de nos partenaires, RedBus, a connu une série de coupures électriques majeures dimanche après-midi. Ces coupures ont malheureusement endommagé la plateforme vz3.amenworld.com hébergeant votre service (sites web inaccessibles, dysfonctionnements du service de mails etc...).

Notre équipe technique a donc été contrainte de recréer le serveur de votre pack avec ses paramètres par défaut sur une nouvelle plateforme. Il n'a malheureusement pas été possible de récupérer les données sur l'ancien serveur. Vous devez donc recréer les domaines et les comptes email et refaire la publication du site web.

Le nouveau serveur devrait être disponible très prochainement pour que vous puissiez reinstaller vos données.

Nous vous prions de bien vouloir nous excuser pour la gène occasionnée, indépendante de notre volontée.


C'est un message d'Amen. Ne trouvez vous pas scandaleux qu'ils annoncent cela tranquilement sans expliquer l'absence de sauvegardes ?

Ya t'il qqchose à faire



evil.gif evil.gif evil.gif
iOlivier
si tu lis ton contrat, dans les petites lignes, à mon avis, ils doivent annoncer un truc du genre "nous nierons avoir eu tout contact avec vous dans certains cas que nous vous annoncerons le moment venu".

il faut toujours s'occuper de ses backups. Faut pas laisser ca aux autres.

je compatis
AvenueDuWeb
CITATION(j_b007 @ mardi 28 mars 2006, 20h03)
C'est un message d'Amen. Ne trouvez vous pas scandaleux qu'ils annoncent cela tranquilement sans expliquer l'absence de sauvegardes ?

Ya t'il qqchose à faire
evil.gif  evil.gif  evil.gif
*


Même si c'est dommage pour toi, en règle générale les hébergeurs ne sont pas responsables des données et précisent que c'est à toi de t'occuper des sauvegardes, après certains en font et les remettent en place en cas de problème mais ils n'ont pas réellement d'obligation à ce niveau-là (sauf si c'est stipulé le contraire dans les CGV). Bref même si ton hébergeur dispose de sauvegarde, il est toujours préférable d'en faire une soi-même au moins une fois par semaine. Mieux vaut prévenir que guérir comme on dit. Par contre étonnant tout de même que le serveur n'ait pas déjà été remis en place (même vide). @+
Dan
Bien évidemment, les sauvegardes ont encore cruellement manqué aux webmasters.

Certains hébergeurs prennent la peine de mettre quelque chose en place (p.ex. OVH) mais trop souvent cela n'est même pas exploitable.

Les webmasters oublient trop souvent qu'un site n'est pas immortel et négligent de sauvegarder celui-ci.
Si nous avions pensé de même, le Hub serait reparti à zéro à deux reprises suite à une casse disque. Et croyez-moi, Redbus n'y était pour rien. smile.gif

C'est une des raisons pour laquelle le Hub a proposé à ses clients infogérés de prendre en charge la sauvegarde des serveurs, offre sur laquelle s'est ruée la majorité d'entre-eux. Pour cette raison aussi, nous avons jugé préférable d'opter pour une architecture RAID.

Un disque peut casser... un serveur peut rendre l'âme, et la cause peut-être totalement indépendante d'une alimentation électrique défaillante. Un disque a un MTBF (Mean Time Between Failures) variant de quelques milliers d'heures à quelques dizaines de milliers selon les constructeurs, les modèles et les lots de fabrication. Une année compte plus de 8700 heures pendant lesquelles votre disque tourne sans arrêt... donc il peut tomber en panne durant cette période parce que le M de MTBF signifie "Moyen(ne)" (Temps Moyen Entre Pannes).
Le MTBF couramment observé étant de 20 000 heures, donc moins de 2 ans et demi. Durant cette période vous avez statistiquement une chance sur 2 de tomber en panne de disque... mais cela peut arriver durant le premier mois

C'est tout aussi valable pour les disques de vos PC... avec en plus les contraintes thermiques (arrêt-redémarrage) qui font viellir le matériel plus vite.

Donc pour moi une seule règle: "pas d'informatique sans sauvegarde !" smile.gif

Dan
smile
C'est vrai qu'un backup journalier est primordial, mais je pensais que tous les hébergeurs proposaient un service de sauvegarde en options, apparement pas tous vu ce qui arrive pour certains, OVH le fait, Sivit aussi pour un coût supplèmentaire très raisonnable, et du raid en soft.

En tous les cas, c'est evident que de se passer de backup n'est pas très conseillé, les évènements de ces derniers jours ne vont pas me contredire malheureusement :nono:
iOlivier
evil.gif
INCROYABLE !!

Dans 2 interviews donné par le PDG de RedBus celui ci affirme ouvertement que :

(1) Les DataCenters saturent en raison du nombre de forte demande d'hébergement de serveurs. Les serveurs ont besoins de plus en plus de jus. Nos datacenter datent de 5 ans.

(2) Il faut donc investir et donc AUGMENTER les tarifs !!

J'ai envie de lui répondre

(1) Il s'agit donc de NEGLIGENCE car ils savaient que vu le nombre de clients qu'ils ont, que ca allait craquer. Il le reconnait ouvertement dans l'interview ! Il reconnait aussi ("vieux de 5 ans") que le matériel est inadapté. Ca ne lui empéche pas d'acceuillir jusqu'a la semaine dernière des clients avec garantie 100 % sans panne EDF

(2) Il rigole ? Ils se remplissent les poches car ils n'ont pas investit dans l'architecture du datacenter, et quand il faut améliorer, il faut payer

INADMISSIBLE
Modibo
Allé je vais cherche un autre hébergeur... courant Avril...
Tant pis j'aimais bien Sivit et j'était un bon client (ou bon payeur pour eux)
AvenueDuWeb
CITATION(Modibo @ mercredi 29 mars 2006, 00h32)
Allé je vais cherche un autre hébergeur... courant Avril...
Tant pis j'aimais bien Sivit et j'était un bon client (ou bon payeur pour eux)
*


C'est dommage de changer d'hébergeur si tu en étais content jusque là. Je sais que le client s'en fout de savoir que le fournisseur de l'hébergeur a un problème, que lui n'a pas de lien avec Redbus, mais dans ce milieu-là et dans ce genre de cas-là, l'hébergeur ne peut pas grand chose. Alors bien sûr ils peuvent choisir mieux leurs fournisseurs, mais aucun datacenter n'est réellement à l'abri de ce type de panne bien que tout soit fait en sorte pour que cela n'arrive pas. Personnellement je me dis que Redbus n'a plus le droit à l'erreur et va donc certainement bétonner ses installations car si une nouvelle panne comme celle-ci devait à nouveau arriver dans les 2-3 prochains mois (voire même dans l'année en cours), il y a fort à parier que Redbus perdrait toute crédibilité (bien qu'elle soit déjà bien entamée) et sans doute énormément de clients (il semblerait que l'exil soit déjà de rigueur chez les hébergeurs). Bref à ta place je ne changerai pas d'hébergeur si tu en étais content jusque là. @+
Mutos
Bonjour à tous,



Pas cité jusqu'à présent, la coopérative Ouvaton, dont un serveur est apparemment mort ce week-end et un autre a dû être reconstruit sur les spares... Heureusement, les sauvegardes ayant été faites ont pu être remontées et tout est reparti cahin-cahan. Maintenant le service est normal. Plus d'infos sur http://www.ouvaton.info/

Effectivement, changer d'hébergeur est certainement un peu prématuré. D'une part, beaucoup d'hébergeurs sont chez Redbus. D'autre part, des solutions vont sans doute être trouvées, soit par Redbus, soit par des hébergeurs qui vont déménager ou mettre des redondances sur d'autres datacenters.

Au fait, quelqu'un aurait une idée globale des conséquences ? Nombre de sites impactés, nombre d'hébergeurs, nombre de serveurs, switches et autres matos cassés ? J'entends toujours "une proportion notable des hébergeurs français" sans avoir pu dénicher jusqu'à présent des chiffres... Il y a bien une dizaine de datacenters de ce type en France, non ?

Ce qui est sûr est que çà va provoquer des remous dans le milieu des datacenters, car je pense qu'il y en a pas mal, voire tous, qui vont remettre à plat leurs installations et leurs contrats...
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.