Der IT-Supergau?

Der Weltuntergang

Erstellt mit Microsoft Designer - Prompt “IT Supergau”

Am vergangenen Freitag brach die Welt zusammen. Oder zumindest will uns die Regenbogenpresse das glauben lassen. Was ist passiert?

Windows-Computer fielen massenweise aus. Ein Update vom Sicherheitsanbieter CrowdStrike hat sie lahmgelegt. Grund genug für die lustigeren Vertreter der Presse gleich viel Meinung mit ganz wenig Ahnung zu kombinieren:

ZDNet titelte „Störung bei Microsoft betrifft Fluglinien, Banken und Unternehmen weltweit“ – (absichtliche Missinformation oder schon Fake News?)

Insgesamt waren alle sehr schnell mit „wichtigen“ Infos: AndoridAuthority veröffentlichte einen redaktionellen Erguss, der sich gleich so weit aus dem Fenster lehnte, dass man klar „Microsoft die Schuld“ gibt, weil „Die eine Software programmiert haben, die so etwas überhaupt zulässt“.

Unübertroffener Blödsinn, der jeden ernsthaften Entwickler auf die Palme bringt: Security-Software muss zwangsläufig im Kernel-Mode laufen und hat damit so tiefgreifenden Systemzugriff, dass Microsoft so ziemlich überhaupt nichts tun kann, wenn sie Amok läuft.

Am schönsten von allen Patzern: BSI-Chefin Plattner will stärker auf „Qualität von Produkten achten“. Es wäre schön, wenn Frau Plattner stärker auf die Qualität ihrer Aussagen achten würde.

Wo liegt mein Problem?

Ganz einfach: wer ein wenig Erfahrung mit Programmierung hat, weiß, dass moderne Software mittlerweile einen Komplexitätsgrad erreicht hat, der massive Qualitätskontrollen, Unittests und hochpräzises Arbeiten unumgänglich macht.

CrowdStrike hat Mist gebaut – keine Frage. Aber: Wer täglich auf des Messers Schneide balancieren muss, schneidet sich leider manchmal.

Ein Security-Anbieter kann es sich nicht leisten, monatelange Qualitätstests zu machen; auf einer repräsentativen Anzahl Rechner zu testen: Ein bekannt gewordener Exploit muss innerhalb von Stunden behandelt werden – da kann man nicht mal kurz das Update erst an einen kleineren Kreis verteilen und wochenlang testen, ob alles einwandfrei funktioniert. Natürlich gibt es bei CrowdStrike Sicherheitsmechanismen, Qualitätsmanagement und hoch qualifizierte Mitarbeiter, die alles tun, damit so etwas nicht passiert – aber das ist alles kein Garant.

Versagt haben an dieser Stelle ganz andere. Jeder auf seine Art und – allen voran Frau Plattner, weil sie diesen einfachen Fakt nicht erkannt hat:

Mittlerweile ist bekannt, dass der „globale Ausfall der Fluglinien, Banken uvm. lahmlegt“ tatsächlich 8,5 Millionen Windows-Computer betroffen hat. Wie viele Computer es insgesamt gibt, lässt sich nicht so genau herausfinden – aber es sind „Milliarden“. Rechnen wir konservativ mit 1 Milliarde, bedeutet das, dass das Problem maximal 0,085% aller Windows-Rechner betroffen hat. Wenn 0,085% aller Rechner ein weltweites Chaos auslöst, ist das Problem nicht schlampige Programmierung bei CrowdStrike - dann ist das Problem, dass die ganzen Fluglinien, Banken und co. zwar garantiert keinen einzigen Server ohne gespiegelte Festplatten und redundanten Netzteile betreiben, aber leider nicht daran gedacht haben, beim Security-Anbieter ebenfalls auf Zweigleisigkeit zu setzen.

Wer so große, so kritische Umgebungen betreibt, sollte es nicht für eine übertriebene Forderung halten, beim Schutz zwei völlig unterschiedliche Lösungen parallel einzusetzen – für die eine Hälfte der Systeme Lösung A, für die anderen Hälfte Lösung B. Mit dieser einfachen Maßnahme hätte der CrowdStrike-Fehler nur die Hälfte der Umgebungen lahmgelegt. Simple Risikostreuung und gesunder Menschenverstand statt wilden Schuldzuweisungen und Forderungen hilft oft mehr. 

Getreu dem Untertitel „Meinung|ungefiltert“ verzichte ich auf Befindlichkeiten aufgrund Herstellerbindungen, dem üblichen Geschäftsgebaren und sonstiger Konventionen.
Damit einher geht, dass dieser Blog meine persönliche Meinung widerspiegelt und nur diese - Euer Marc Winter.

Zurück
Zurück

Updates? Nerviger Mist, der alles kaputtmacht

Weiter
Weiter

Was ist „Places“ und braucht man das?