Scimmia del caos e catena di approvvigionamento di Netflix

Di recente ho avuto una conversazione con Carlos Crespo, Chief Operating Officer della società madre di Zara Inditex, in cui ha menzionato uno strumento software creato da Netflix oltre un decennio fa per istituzionalizzare la resilienza del sistema. Il nome è accattivante e per i leader della catena di approvvigionamento che cercano di reinventare le proprie reti di approvvigionamento per tempi turbolenti, è irresistibile. Eppure, un GoogleGOOG
la ricerca di "scimmia del caos della catena di approvvigionamento" ha prodotto esattamente una citazione, da 2012.

Perché non applichiamo questa idea alla resilienza della supply chain?

Cos'è la Scimmia del Caos?

È una strumento softwaree, più in generale, un principio ingegneristico che spegne in modo casuale parti di un sistema complesso costringendo gli operatori a riprendersi in tempo reale. Una sorta di esercitazione antincendio a sorpresa, ma quotidiana e in modi e luoghi casuali. L'idea è che diventare bravi a risolvere rapidamente i problemi del sistema sia un processo di apprendimento che dovrebbe beneficiare di una curva di apprendimento sempre più ripida.

Il retroscena riguarda il modo in cui Netflix ha ridimensionato la propria attività di streaming su Amazon Web Services durante la transizione dalla spedizione di DVD alle porte dei clienti. A prima vista, è un approccio logico alla pianificazione della ridondanza del sistema, come quello che ti aspetteresti dalla NASA, ma in pratica sfrutta una norma culturale di Netflix che consente ai singoli contributori di risolvere i propri problemi. Come raccontato in “Ingegneria del caos” un libro del 2020 di Casey Rosenthal e Nora Jones che hanno aperto la strada alla pratica di Netflix, si riduce a cinque principi:

  • Costruisci un'ipotesi sul comportamento in stato stazionario
  • Varia gli eventi del mondo reale
  • Eseguire esperimenti in produzione
  • Automatizza gli esperimenti per l'esecuzione continua
  • Ridurre al minimo il raggio dell'esplosione

La miscela di cultura e processo in Netflix è importante perché ha promosso e sfruttato un approccio alla risoluzione dei problemi open source, mentre girando sistematicamente la ruota degli arresti casuali si accelera l'apprendimento in tutto il team esteso.

Resilienza della catena di approvvigionamento e ingegneria del caos

Trasformazione digitale nella catena di approvvigionamento è stato caldo quest'anno perché aiuta le catene di approvvigionamento a supportare nuovi modelli di business e guidare verso operazioni sostenibili (vedere lo studio BCG X), ma anche perché promette “resilienza”. Sfortunatamente, le applicazioni pratiche della trasformazione digitale per la resilienza della supply chain si riducono ancora generalmente a piattaforme per una migliore "visibilità", supportate da una serie di tattiche tradizionali come il buffering dell'inventario e il dual sourcing. Alla base di questo approccio c'è un altro livello di lavoro analitico su tempo di recupero di David Simchi-Levi al MIT e un'ondata di simulazioni che utilizzano i gemelli digitali. Sembra tutto fantastico, ma ciò che manca è un modo sistematico di sperimentare il vero fallimento della catena di approvvigionamento per imparare il modo migliore per recuperare nella pratica.

Applicazione di Chaos Monkey alle catene di approvvigionamento

I medici prestano il giuramento di Ippocrate prima di aprirci, incluso il famoso "prima non fare del male". Non è una cattiva idea per chiunque applichi i principi di Chaos Monkey alle catene di approvvigionamento, il che comporta lo spegnimento casuale di una vera macchina da qualche parte. Questo non è banale e, per quanto ne so, non sta ancora accadendo da nessuna parte.

  • Il primo principio sopra citato dice di concentrarsi sugli output del sistema piuttosto che sugli attributi interni. Verificare che il sistema funzioni invece di cercare di capire perché funziona.
  • Il secondo principio dice di rompere varie cose in modi realistici. Non c'è bisogno di simulare una guerra termonucleare globale, basta spegnere un interruttore o perdere un ordine e scoprire quale soluzione funziona meglio.
  • Il terzo principio dice che il posto migliore per imparare è nella produzione. Imparare facendo è meglio che imparare attraverso la simulazione, ovvero i gemelli digitali sono fantastici, ma potrebbero non essere sufficienti per costruire una cultura della resilienza.
  • Il quarto principio istituzionalizza i principi della scimmia del caos perché consente di ridimensionare il processo di sperimentazione, che ti porta a una curva di apprendimento più ripida. Usa la scienza dei dati nella lotta agli incendi.
  • Infine, minimizza il raggio dell'esplosione. Questo significa "non nuocere" e si traduce in una sorta di buffering (inventario, tempi di consegna, spedizione accelerata) per proteggere i clienti dal sentire il tuo esperimento. Impara a gestire le esplosioni controllate.

Si potrebbe sostenere che negli ultimi tre anni di Covid, guerra, disordini sindacali, e le turbolenze economiche sono state una grande corsa all'asciutto per tutti. La lezione di Netflix è stata che questo tipo di crisi non è solo qualcosa da pianificare, ma qualcosa da padroneggiare come un fatto permanente della vita.

La tempesta perfetta potrebbe non finire mai, quindi forse dovremmo imparare a conviverci.

Fonte: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/