KPN: Single point of failure

Wanneer is het beter om problemen te voorkomen? Dat hangt af van de het risico.  Als er een klein risico is dan heeft het geen zin om maatregelen te nemen om problemen te voorkomen. Zo heeft het in Nederland geen zin om maatregelen te nemen tegen aardebevingen. Maar het heeft wel  zin maartregelen te nemen tegen hoog water. De impact van beide gebeurtenissen is heel groot, maar de kans in Nederland op een aardbeving is veel kleiner dan de kans op hoog water. Risico = kans x impact.

Als de impact van een storing groot is op de operatie, bijvoorbeeld de productie van goederen of de veiligheid van een regio, dan wordt het systeem dat deze storing kan krijgen een bedrijfskritisch systeem en de bijbehorende software een bedrijfskritische applicaties genoemd.

Les één bij het ontwerpen van een bedrijfskritisch systeem is dat deze een minimaal aantal, liefst geen, deelsystemen bevat die als enige een specifieke cruciale functie kunnen vervullen. Zijn deze er wel en bepalen ze daarmee het functioneren van het gehele systeem dan spreken we over een single point of failure (SPOF). In Jip-en-janneketaal: als het hier fout gaat, dan heb je de poppen aan dansen.

Vandaag zijn de poppen aan het dansen:

Volgen nu.nl heeft een storing bij de KPN een grote impact:

“De Veiligheidsregio Rotterdam Rijnmond ‘schaalde op’ naar een zogenoemde grip 4, de hoogste staat van paraatheid. ”We hebben dat vooral gedaan omdat onduidelijk is hoe lang het nog gaat duren en wat de impact is op de maatschappij”, aldus een woordvoerster.”

Blijkbaar is onze veiligheid afhankelijk van één leverancier en is daarmee KPN een single point of failure geworden en dat is verbazingwekkend omdat:

  1. er meerdere leveranciers van netwerkdiensten zijn.
  2. de KPN heel veel ervaring heeft met netwerken.

Als u problemen heeft met uw computer, dan ligt niet het gehele internet plat. Netwerken hebben de eigenschap dat ze ontworpen zijn om altijd beschikbaar te zijn. En dat bij problemen in een onderdeel van het netwerk, de rest van het netwerk de functies overneemt. Goed ontworpen netwerken hebben geen single point of failure.

Update: het was een kastje (nu.nl):

“Een kapot ‘cross-connectkastje’ is de oorzaak van de storing in het communicatienetwerk van de hulpdiensten in Rotterdam-Rijnmond en Zuid-Holland Zuid van woensdagochtend. Dat heeft telecommaatschappij KPN gemeld.Het kastje maakt deel uit van de KPN-centrale in de Rotterdamse Waalhaven. Op dit knooppunt komen 6200 lijnen bij elkaar. Door het falende kastje vielen verbindingen weg en daarmee communicatiesystemen uit. Van de kastjes bestaat geen back-up.”

Deel:
  • Print
  • Digg
  • StumbleUpon
  • del.icio.us
  • Facebook
  • Twitter
  • Google Bookmarks
  • LinkedIn
  • Live
  • PDF
  • RSS
  • Google Buzz
Dit bericht is geplaatst in probleemoplosproces. Bookmark de permalink.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *