Guten Morgen, liebe Sorgen…
Um 03:31 kam eine kurze aber schmerzvolle SMS: ein komplettes Rack ist nicht erreichbar. Schlaftrunken habe ich noch 5 Minuten abgewartet, ob Nagios die Sache sich nicht doch nochmal überlegt (Fehlmessung), aber dem war leider nicht.
Also Techniker im RZ angerufen (das sind die Momente in denen ich die 24/7-Rufbereitschaft vor Ort schätze) und gebeten einen Blick ins Rack zu werfen. Diagnose: Schranksicherung draußen
Der Techniker hat den Strom anschließend wieder eingeschalten, und gegen 03:45 waren fast alle Systeme wieder da. Fast. Ein Rechner blieb stumm - aller Voraussicht nach hat’s bei dem das Netzteil zerschossen und bei der Gelegenheit die Sicherung geworfen. Als klar war daß ein echter Hardwaredefekt vorliegt habe ich dem Techniker Bescheid gegeben daß ich dann wohl in Kürze mal vorbeischauen werde. Genial fand ich dann dessen Kommentar: “Dann setz’ ich schonmal ‘nen Kaffee auf.”
Also umgezogen, ins Auto gesetzt und losgefahren. Natürlich hat es dann auch gleich zu regnen begonnen, aber eine runde halbe Stunde später stand ich schon vor dem Rack. Die Reparatur gestaltete sich etwas unschön - für dieses alte Board hatte ich kein passendes Ersatznetzteil da, daher habe ich spontan die Platten & Controller in einen komplett neuen Server umgebaut und die Gelegenheit somit gleich für ein Hardware-Upgrade genutzt.
Zum Abschluß gab’s dann noch einen Kaffee (kurz nach Sonnenaufgang).
Am 12. Mai 2007 um 08:34 Uhr
na dann wünsche ich Dir einen schönen guten Morgen und das das Wochenende ruhig bleibt.
Am 12. Mai 2007 um 08:59 Uhr
Vielen Dank!
Ich schlürfe nun einen riesigen Milchkaffee und genieße es mal so früh auf den Beinen zu sein…
Am 12. Mai 2007 um 09:27 Uhr
Gut dass du gestern abend nicht gefeiert hast und betrunken im Bett lagst als das Handy piepste
Am 12. Mai 2007 um 09:44 Uhr
Gestern Abend war ein Kollege zu Besuch bei uns (Lasagne und ein paar Gläser Wein), ich bin erst gegen halb zwei ins Bett gekommen.
Im Zweifelsfall hätte ich dann halt jemand anderen aus dem Bett geklingelt und losgeschickt. Aber spätestens zur Erlanger Bergkirchweih finden sich immer überraschend wenige “Freiwillige” für Bereitschaftsdienst
Am 12. Mai 2007 um 12:55 Uhr
Jaja, das kommt mir irgendwie bekannt vor
Netzteile, die sich in Luft auflösen und dabei das ganze Rack mitreissen… das hatten wir auch schon.
Gruß,
Marcel.
Am 12. Mai 2007 um 15:16 Uhr
Zumindest nur _ein_ Rack
Wobei es schon schade ist - auch dieser Server hing an einer APC RackMount PDU - wäre schon gewesen wenn die intern an jedem Ausgang eine entsprechende Schaltsicherung hätte…