Perché i test di scenari catastrofici oltre la produzione sono essenziali per la sicurezza delle infrastrutture critiche

L'interruzione senza precedenti della FAA che ha comportato la messa a terra di tutti i voli nazionali ha fatto porre domande a tutti:

Come è successo?

Chi è responsabile?

Come possiamo evitare che qualcosa di simile si ripeta?

Questa interruzione ci ha messo in guardia, evidenziando che anche i sistemi che consideriamo i più sicuri, affidabili e convalidati possono fallire.

Mentre questo tipo di interruzione che raggiunge il livello di consapevolezza pubblica è raro, quando si verifica in un sistema critico per la vita può portare a una valanga di risultati catastrofici che incidono sulla sicurezza, sulla protezione e sull'economia. Lo stiamo vedendo ora con l'interruzione dei trasporti e le conseguenze del sovraccarico dei servizi web/app inondati da migliaia di passeggeri che si affrettano a raggiungere le loro destinazioni.

Mentre l'odierna interruzione della FAA è considerata un errore di sistema, è stato un normale errore di degrado. Ciò significa che, fortunatamente, non sono stati provocati decessi dal guasto e il sistema si è effettivamente spento prima che si verificassero ulteriori danni.

Questo è fortunato, ma non incoraggiante.

I test sono sempre stati utilizzati nella produzione per rilevare i difetti: la simulazione dei guasti, ad esempio, era un metodo per "rompere" artificialmente un dispositivo per vedere se i test diagnostici avrebbero rilevato e isolato i guasti fino alla loro causa principale. Durante la progettazione del software, agli ingegneri viene insegnato a progettare secondo le specifiche di ciò che dovrebbe fare funzionalmente. Molto meno sforzo è stato dedicato alla ricerca di scenari catastrofici o di una "tempesta perfetta" di condizioni che devono verificarsi e che portano al guasto del sistema. Anticipare queste condizioni può aiutarci a creare in modo proattivo meccanismi per rilevare e prevenire in modo proattivo guasti catastrofici.

Prevenzione di interruzioni future e altri guasti dell'infrastruttura critica

Con la proliferazione del cloud computing e delle soluzioni di intelligenza artificiale, ora disponiamo di una potenza di calcolo sufficientemente efficiente per valutare milioni di scenari operativi per rilevare quali casi potrebbero portare a scenari catastrofici.

Per la FAA, ora dovrebbe essere possibile analizzare in modo proattivo le condizioni e i dati di tutti gli aeroporti nazionali, aeromobili in volo e a terra, nonché quelli programmati per un utilizzo futuro, comunicazioni della torre di controllo e relative infrastrutture, passeggeri, meteo, e la sicurezza per evitare scenari che potrebbero causare guasti al sistema.

Se si considera la complessità delle interazioni e delle interdipendenze di questo sistema, è chiaro che è una proposta scoraggiante guardare a tutti i punti deboli.

L'intelligenza artificiale può aiutare ad analizzare questa enorme quantità di dati per cercare in modo proattivo modelli e comportamenti che potrebbero rappresentare una sfida per i sistemi FAA.

Questo non è senza precedenti, poiché l'intelligenza artificiale è stata utilizzata per esaminare meglio i modelli di traffico per una pianificazione e una logistica ottimizzate.

La tecnologia può anche essere implementata come un potente meccanismo di difesa per fornire il rilevamento tempestivo di attacchi informatici e/o comportamenti anomali nei sistemi. La chiave per implementare efficacemente tali sistemi sarà isolare quei valori e condizioni specifici in modo che possano essere controllati da esperti umani.

Ci sono molte lezioni da imparare dall'interruzione della FAA e col tempo avremo un quadro più chiaro di ciò che è accaduto. Ma, per ora, è evidente che le tecnologie emergenti, come l'intelligenza artificiale, che consentono il rilevamento proattivo dei guasti del sistema e di altre sfide che possono sorgere, hanno un ruolo di primo piano da svolgere nel modo in cui manteniamo la nostra infrastruttura critica in futuro.

Fonte: https://www.forbes.com/sites/karenpanetta/2023/01/11/the-perfect-storm-of-the-faa-outage-why-catastrophic-scenario-testing-beyond-manufacturing-is- essenziale-per-la-sicurezza-delle-infrastrutture-critiche/