Generic filters
FS Logoi

CrowdStrikes Update-Panne

Dr.-Ing. Thomas Tauchnitz, Chefredakteur Industry des atp magazins, überlegt, was wir aus der Update-Panne von CrowdStrike lernen können.

von | 12.08.24

Am 19. Juli veröffentlichte das US-amerikanische Cybersecurity-Unternehmen CrowdStrike ein fehlerhaftes Update seiner Software „Falcon Sensor“.
Foto: rdomino - stock-adobe.com

Dr.-Ing. Thomas Tauchnitz, Chefredakteur Industry des atp magazins, überlegt, was wir aus der Update-Panne von CrowdStrike lernen können.

Was ist passiert?

Am 19. Juli veröffentlichte das US-amerikanische Cybersecurity-Unternehmen CrowdStrike ein fehlerhaftes Update seiner Software „Falcon Sensor“. Diese Software dient dem Schutz von Windows-Systemen vor Cyberattacken, indem sie Bedrohungen erkennt und verhindert. Solche Updates werden bei Falcon – wie bei solchen Systemen üblich – regelmäßig eingespielt. Doch leider enthielt das Update vom 19. Juli eine unvollständige Datei, die zu einem „Ungültige-Seite-Fehler“ führte. Die Folgen waren dramatisch: 8,5 Millionen Windows-Systeme konnten nicht hochgefahren werden, mehr als 5000 Flüge fielen aus, mehrere Flugplätze wurden geschlossen, Bargeldautomaten streikten, Börsen mussten ruhen und selbst Supermarktketten machten zu, die US-amerikanische Notrufnummer 911 fiel in vielen Bundesländern aus und Krankenhäuser verschoben Operationen. Der Gesamtschaden wir auf 25 Milliarden USD geschätzt.

Aber es gab auch Glück im Unglück: In weniger als sechs Stunden gab es ein weiteres Update und die Systeme konnten – wenn auch teilweise mit manuellen Aktivitäten – wieder hochgefahren werden. Bei einer bösartigen Attacke wäre das wohl nicht so schnell gegangen. Und da CrowdStrike „nur“ 24000 Kunden hatte, waren nur wenige Promille der Windows-Systeme betroffen. Gar nicht auszudenken, welche Schäden sonst entstanden wären.

Fehlerkaskade

Wie so oft beim Auftreten von Problemen gab es nicht einen einzelnen Fehler, sondern eine ganze Kaskade von Fehlern:

  • Irgendjemand hat einen Fehler beim Erstellen des Updates gemacht: ein menschlicher Fehler.
  • Das Update wurde nicht ordnungsgemäß getestet: Vermutlich ebenfalls ein menschlicher Fehler.
  • Das Update wurde nicht schrittweise ausgerollt, mit Pilotkunden oder ähnlichem, sondern gleich flächendeckend: ein klarer organisatorischer Fehler.
  • Der Updater hätte erkennen müssen, dass die neue Version nicht funktioniert und es abbrechen müssen: ein technischer Fehler.
  • Beim Neustart wurde erneut unmittelbar versucht, das Update zu installieren, statt den Rechner mit dem alten Stand zu starten oder den Updateversuch nach einigen Minuten zu wiederholen, so dass ein Mensch hätte eingreifen können: Ein konzeptioneller Fehler.

Weitere Diskussionspunkte

Ich sehe drei weitere diskussionswürdige Punkte:

  • CrowdStrikes Falcon ist ein „Endpoint Detection and Response-Programm“, das nicht nach bekannter Schadsoftware sucht, sondern Auffälligkeiten identifizieren und direkt unterbinden will. Dazu braucht Falcon Zugriffsrechte auf Systemebene – und genau das war das Problem. Hat jemand den erwarteten Nutzen mit dem damit verbundenen Risiko abgewogen, bevor er zusätzlich zum Virenschutz und anderen Maßnahmen auch noch diese fortschrittliche Lösung dazugepackt hat? Wie schon mein Vater sagte: „Was nicht dran ist, kann auch nicht kaputtgehen.“
  • Die Informationssicherheit hat drei wichtige Schutzziele: Vertraulichkeit, Integrität und (!) Verfügbarkeit. Security ist kein Selbstzweck. Wenn eine Sicherheitssoftware die Verfügbarkeit ernsthaft verringert, ist sie unbrauchbar.
  • Der Hersteller haftet nur in Höhe seiner Lizenzgebühren. Niedlich! Und unglaublich. Natürlich wäre jede Softwarefirma sofort bankrott, wenn sie für alle Folgeschäden haften würde, aber dann hätte sie mit Sicherheit ihre Tests und Updateprogramme besser im Griff gehabt und Best Practices wie ein schrittweises Ausrollen nicht sträflich vernachlässigt.

Übertragung auf die Automatisierung

Es geht mir mit diesem Beitrag nicht darum, mit dem Finger auf die IT zu zeigen, sondern ich will uns Automatisierer zum Nachdenken anregen: Menschliche Fehler machen wir auch – stellt die Organisation ein hinreichend vorsichtiges Testen und Ausrollen sicher? Steht bei unseren Systemen die Verfügbarkeit ausreichend im Fokus? Haben wir die Ressourcen und Kompetenz, bei Fehlern innerhalb von Stunden zu reagieren.

Glücklich, wer zu allen drei Fragen „ja“ sagen kann!

Dr.-Ing. Thomas Tauchnitz
Chefredakteur Industry atp magazin
atp@TAUTOMATION.consulting

Bildquelle, falls nicht im Bild oben angegeben:

Jetzt Newsletter abonnieren

Brennstoff für Ihr Wissen, jede Woche in Ihrem Postfach.

Hier anmelden

Halbleiterversorgung: TU München stellt EU-weit ersten 7-Nanometer-Chip her
Halbleiterversorgung: TU München stellt EU-weit ersten 7-Nanometer-Chip her

An der TU München (TUM) ist der EU-weit erste KI-Chip mit moderner 7-Nanometer-Technologie entstanden. Prof. Hussam Amrouch entwickelte den neuromorphen Chip auf Grundlage des Standards des weltweit führenden Chip-Produzenten TSMC. Künftig will der Professor für KI-Prozessor-Design zusammen mit seiner Forschungsgruppe jährlich mindestens drei neue Designs entwerfen, die ab 2028 von der European Semiconductor Manufacturing Company (ESMC) in Dresden gefertigt werden sollen.

mehr lesen
Klimaneutrale Chemie: Versorgung mit nachhaltigem Kohlenstoff ist möglich
Klimaneutrale Chemie: Versorgung mit nachhaltigem Kohlenstoff ist möglich

Kohlenstoff ist ein zentraler Rohstoff in der Chemieindustrie – stammt aber heute noch überwiegend aus fossilem Öl, Gas oder Kohle. Die Verfügbarkeit nachhaltiger Kohlenstoffquellen ist für die klimaneutrale Transformation der Branche daher entscheidend. Das nun von der Initiative IN4climate.NRW veröffentlichte Diskussionspapier „Kohlenstoff – aber nachhaltig!” zeigt: Die Kohlenstoffbedarfe der deutschen Chemieindustrie lassen sich nachhaltig decken. Importe sind dafür nicht zwingend erforderlich, wohl aber besteht dringender politischer Handlungsbedarf. Das Diskussionspapier steht zum kostenfreien Download bereit.

mehr lesen
Neue VDI-Richtlinie für die Qualität von Längenmessungen erschienen
Neue VDI-Richtlinie für die Qualität von Längenmessungen erschienen

Ob in der Fertigungstechnik und Qualitätssicherung, im Maschinen- und Anlagenbau, in der Automatisierungs- und Prüftechnik oder Instandhaltung: Taktile Längenmesseinrichtungen mit analoger Messwerterfassung kommen überall dort zum Einsatz, wo kleinste Längenänderungen zuverlässig erfasst und weiterverarbeitet werden müssen. Damit diese Messdaten verlässlich bleiben, sind regelmäßige Prüfung und Kalibrierung unverzichtbar. Genau hier setzt die neue Richtlinie VDI/VDE/DGQ/DKD 2618 Blatt 14.1 an. Sie beschreibt praxisnah, wie Messtaster mit analoger Messwerterfassung fachgerecht geprüft und kalibriert werden.

mehr lesen

atp weekly

Der Newsletter der Branche

Ihr kostenfreier E-Mail-Newsletter für alle Belange der Automatiserung.

Sie möchten das atp magazin testen

Bestellen Sie Ihr kostenloses Probeheft

Überzeugen Sie sich selbst: Gerne senden wir Ihnen das atp magazin kostenlos und unverbindlich zur Probe!

Finance Illustration 03