L’analisi di rischio nell’ottimizzazione di Operations & Maintenance

Impostare un piano efficace riduce il rischio fino al 40% rispetto all’originario con abbassamento dei costi del 10-15%

  • Febbraio 12, 2020
  • 234 views
  • Tabella 1 – Livelli di consequence per la categoria di rischio “sicurezza”
    Tabella 1 – Livelli di consequence per la categoria di rischio “sicurezza”
  • Figura 1 – Tipiche modalità di guasto. Fonte: normativa SAE JA1012
    Figura 1 – Tipiche modalità di guasto. Fonte: normativa SAE JA1012
  • Figura 2 – Intervallo P-F nell’accadimento di un guasto. Fonte: normativa SAE JA1012
    Figura 2 – Intervallo P-F nell’accadimento di un guasto. Fonte: normativa SAE JA1012
  • L’analisi di rischio nell’ottimizzazione di Operations & Maintenance
    L’analisi di rischio nell’ottimizzazione di Operations & Maintenance

In un impianto industriale, la gestione di alcuni asset può avere un grande impatto economico, per il loro costo o per la produzione ad essi correlata. Le turbomacchine sono spesso considerate beni di alto valore, per cui massimizzarne le attività di Operations & Maintenance può avere un forte ritorno.

I produttori di tali beni (detti anche Original Equipment Manufacturer - OEM) forniscono assistenza post-vendita, che può prevedere contratti decennali o interventi su richiesta, con lo scopo di supportare il cliente nel mantenere negli anni adeguati livelli di efficienza, affidabilità e disponibilità dei macchinari.

Gli sforzi dell’industria, nell’interazione tra OEM come detentori del know-how e operatori di impianto, si stanno concentrando sulla manutenzione predittiva on-condition, in cui si agisce in modo mirato sui componenti più critici sulla base del loro stato, opportunamente monitorato o predetto.

In questo scenario, la presenza di un servizio, o prodotto, di Monitoraggio e Diagnostica (M&D), in cui si utilizzino i dati del macchinario in monitoraggio unitamente ai dati (e relative esperienze) di altre macchine simili, può supportare se non alimentare l’esecuzione della manutenzione predittiva.

Centri di M&D sono consolidati tra gli OEM di turbomacchine; possono avere anche esperienza decennale, con flotte sotto monitoraggio di migliaia di macchinari, in crescita ogni anno. È segno del focus che gli operatori hanno su digitalizzazione e Internet of Things, anche in un settore più tradizionale come quello dell’oil & gas.

Il tipico modello M&D prevede l’emissione di raccomandazioni operative al gestore d’impianto, a fronte di anomalie funzionali rilevate sui dati acquisiti. Sull’intera flotta, si acquisiscono milioni di segnali, tra temperature, pressioni, logici del sistema di controllo ecc., e si utilizzano centinaia di algoritmi per processarli e rilevare anomalie.

Per orientare ancora di più il supporto verso la manutenzione predittiva, al modello standard M&D si affiancano anche processi che includano analisi di rischio sugli asset.

Utilizzo dell’analisi di rischio nella manutenzione predittiva

L’analisi di rischio implementata in questa esperienza ha un duplice scopo:

  • revisionare il piano manutentivo del macchinario o impianto in essere, di tipo time-based;
  • prioritizzare le raccomandazioni operative di M&D in base alla criticità dei componenti coinvolti, misurata o stimata con approccio ingegneristico.

C’è poi un terzo elemento, che riguarda l’adattamento continuo della strategia manutentiva sulla base e dell’analisi di rischio e dei dati operativi / manutentivi.

L’analisi di rischio si compone di due fasi successive:

  • Asset Criticality Analysis (ACA), applicata su tutti i componenti soggetti a manutenzione per individuare quelli “critici”, analizzando la loro peggiore condizione di guasto;
  • Failure Modes and Effects Analysis (FMEA), eseguita solo sulle parti critiche (di solito il 20-30%), dettaglia tutte le possibili modalità di guasto, il relativo rischio associato ed eventuali raccomandazioni per mitigarlo.

Fondamenti dell’analisi di rischio

In maniera di fatto simile a un servizio/prodotto di M&D, anche il risultato dell’analisi di rischio è rappresentato da un insieme di raccomandazioni.

Lo sviluppo di un’analisi di rischio prevede il coinvolgimento di più profili professionali che lavorino a stretto contatto. Inoltre, considerando che lo scopo è la manutenzione, è cruciale avere una rappresentazione effettiva di quali siano le attività manutentive condotte in cantiere rispetto a quelle eseguite fuori, di risorse e attrezzature disponibili, pezzi di ricambio a magazzino e così via.

A tal fine, se necessario, eseguire un’indagine insito. Il rischio stimato, sia esso in ambito ACA o FMEA, è suddiviso in quattro categorie: sicurezza, ambiente, produzione, finanziario. Se la stima di almeno una di queste categorie è superiore a una certa soglia, il componente è etichettato come “critico” e sarà oggetto di FMEA. Per ciascuna categoria:

risk = consequence * occurrencedove consequence,

di solito un numero intero (1, 10, 100, 500, 1000), è l’impatto del guasto, occurrence è la frequenza di guasto espressa in eventi di avaria per anno. L’analisi è semi-quantitativa: i livelli di consequence e occurrence sono discreti e definiti in una matrice di rischio.

Il setup di una matrice di rischio è un passaggio cruciale per l’analisi. Mentre i livelli afferenti a sicurezza e ambiente sono abbastanza standardizzati e concordati dall’industria, quelli per produzione e finanziario devono essere definiti considerando la specifica missione dell’impianto e il relativo segmento di business. Ad esempio, la fermata straordinaria di una turbina a gas per due ore al mese, può essere considerata accettabile per una stazione di compressione gas, o richiedere azioni di mitigazione per un impianto di Gas Naturale Liquefatto (GNL), dato il ben più alto impatto economico.

In tabella 1 si riporta un esempio della categoria di rischio sicurezza.

L’impatto sulla produzione dipende dal tempo di fermata, in maniera anche non lineare; si pensi ad un’acciaieria, dove il fermo prolungato dell’altoforno comporta enormi costi di rimessa in funzione. La consequence finanziaria è invece la somma di due contributi: il valore della Loss Of Production (LOP) e costi di manutenzione. In questi ultimi rientrano il costo dei pezzi di ricambio, la necessità di attrezzature speciali, la consulenza o intervento di specialisti e, ovviamente, il tempo per eseguire le riparazioni (Time To Repair), a sua volta influenzato dalle operazioni da eseguire, il numero di lavoratori e relativi turni.

Risulta perciò evidente come la bontà del modello finanziario dipenda da disponibilità e accuratezza di informazioni sulle effettive politiche e pratiche manutentive, che possono variare da cantiere a cantiere. Questi dati possono essere recuperati, oltre che dalla citata indagine in sito con responsabili e operatori di manutenzione, anche dagli ordini di lavoro del CMMS, il software comunemente utilizzato per gestire la manutenzione.

Come richiesto dal protocollo dell’analisi di rischio, l’occorrenza di un predetto scenario di guasto è stimata considerando che nessuna azione manutentiva venga eseguita sui componenti in analisi. È quindi valutata principalmente in maniera teorica, considerando valutazioni degli esperti, e anche dati reali, come i tassi di guasto riportati nei manuali di affidabilità e la storia degli ordini di lavoro del cantiere.

FMEA: approccio metodologico

I passaggi principali della FMEA, eseguita sui componenti critici da ACA, sono: identificazione delle modalità di guasto, descrizione degli effetti del guasto e calcolo del rischio non mitigato, scelta delle azioni di mitigazione e calcolo del rischio mitigato (residuo). Alle modalità di guasto applicabili, si associano due importanti attributi:

  • il modello di avaria, selezionato tra quelli tipici mostrati in figura 1, che guida il tipo di azioni manutentive efficaci (ad esempio, sostituire un pezzo in base alla sua età è utile se il modo di guasto è di tipo “C”, inutile se di tipo “E”);
  • una stima dell’intervallo P-F, il tempo che intercorre tra il potenziale guasto P e il punto F al quale lo stesso si deteriora in anomalia funzionale. Indica quanto tempo si ha a disposizione per intervenire prima di osservare impatti sul processo produttivo, ed è essenziale per elaborare una strategia predittiva.

Successivamente, si analizzano gli effetti di ciascuna avaria, qualitativamente descrivendo lo scenario di guasto e i potenziali danni secondari, quantitativamente usando la stessa matrice di rischio e metodologia adottate per la ACA. Si calcola così una stima del rischio non mitigato per le quattro categorie di sicurezza, ambiente, produzione e finanziario. Il rischio totale è una combinazione di questi, ad esempio il massimo. Se tale rischio è sopra una certa soglia, è necessario prevedere azioni di mitigazione che lo riducano ad un livello accettabile, il rischio mitigato.

Le raccomandazioni FMEA appartengono alle seguenti categorie:

  • on condition/monitoring: con intervallo P-F adeguato, è possibile monitorare lo stato del componente, disponendo azioni manutentive solo quando necessarie.
  • discard/restore: tipico nell’approccio time-based, consiste nel sostituire o revisionare un pezzo. L’azione è efficace solo per failure pattern di tipo A, B, C (figura 1).
  • failure finding: comuni per i dispositivi di protezione, dove si simulano le condizioni di attivazione e si verifica la corretta risposta del dispositivo.
  • redesign: l’ultima chance, quando tutte le azioni precedenti non sono efficaci.
  • corrective: aggiungiamo questo tipo di azioni, comunemente non incluse in una FMEA, per guidare gli operatori nella risoluzione del guasto dopo che si è verificato.

Per ciascuna raccomandazione, si aggiunge anche un’analisi di dettaglio sui costi dell’azione, che consideri i pezzi di ricambio, TTR, LOP, ore uomo, attrezzature speciali. Così facendo è possibile valutare l’efficacia delle azioni di mitigazione, in base a quanto rischio rimuovono e al loro costo intrinseco, ottenendo il ROI:

Se il rischio si riduce agendo sulla sola occurrence, come di solito accade, corrisponde al costo degli effetti dell’avaria Kfe per la differenza di occurrence degli scenari di guasto, non mitigato e mitigato.

Benefici gestionali e punti critici

Si utilizza l’analisi di rischio e il suo set di raccomandazioni per compararlo con il piano manutentivo esistente e progettare, così, un nuovo piano ottimizzato risk-oriented. Si identificano tre casistiche:

  • extra manutenzione su asset a basso rischio, su cui poter razionalizzare e ridurre i costi;
  • meno manutenzione su componenti ad alto rischio, forse perché non percepiti come critici, su cui eseguire specifiche raccomandazioni in più che riducano il rischio totale;
  • attività pianificate su elementi il cui degrado può essere misurato e monitorato, adottando manutenzione on-condition e ottimizzando i costi.

Usando questo approccio, si arriva ad un nuovo piano ottimizzato che riduce il rischio fino al 40% di quello originario con abbassamento dei costi del 10-15%. Questo confronto assume più valenza se c’è disponibilità e accuratezza dei dati di manutenzione, e in un quadro su più anni che includa almeno una revisione generale.

Nel processo M&D integrato con l’analisi di rischio, almeno per gli item critici, le azioni raccomandate possono essere ispirate, se non recuperate direttamente, da quelle della FMEA.

Si possono così includere tutte le informazioni dell’analisi di rischio, dando uno specchio più circostanziato e una valutazione economica che permetta scelte in piena consapevolezza.

Tuttavia, lo sviluppo di ACA e FMEA può essere dispendioso, anche considerando che deve conformarsi al sito produttivo per essere efficace.

Questa problematica si può affrontare con strumenti di scalabilità, al fine di creare una nuova analisi di rischio con risorse ragionevoli.

Analogamente, c’è grande influenza della qualità dei dati del CMMS, che non tutti gli operatori di impianto utilizzano in modo sistematico e puntuale. Ulteriori opportunità si aprono con l’utilizzo dell’intelligenza artificiale unitamente ai classici strumenti di ottimizzazione, per alimentare in maniera dinamica il piano manutentivo e il monitoraggio dello stato dei componenti utilizzando le esperienze passate e il know-how di OEM e gestori, distillato, ad esempio, sotto forma di analisi di rischio.

 

Stefano Terzi, Services Technology Leader, Baker Hughes

Ilaria Parrella, Managed & Advanced Services Manager, Baker Hughes

Matteo Iannitelli, Lead Data Scientist, Baker Hughes