Introduzione
Produzione di beni ed erogazione di servizi sono alla base del benessere delle attuali società avanzate, affrancate, seppur parzialmente, dalle fatiche immani e dalle penurie di cibo che assillavano l’uomo del passato e che, ancora oggi, assllano un porzione notevole dell’umanità. Il merito di aver superato le carenze perenni del passato dipende senz’altro da parecchi fattori, uno tra i quali è l’aiuto fornito all’uomo dalle macchine che lui stesso ha costruito.
Purtroppo, queste non funzionano sempre e comunque, ma sono soggette a comportamenti anomali e al guasto. In tali casi vengono meno, parzialmente o totalmente, i beni e i servizi di cui si è detto sopra.
L’anomalia di funzionamento e il guasto di una macchina sono dunque dei “disturbi” al normale svolgimento della attività di una società. Sulla base di ciò, tecnici e ingegneri, ma anche altri privi di specializzazione, si dedicano a progettare macchine non passibili di guasto o, quantomeno, scarsamente soggette a guasto. Parallelamente alla rincorsa di tale ambizione, ne corre un’altra: la prevenzione del guasto, in modo da poter intraprendere opportune misure affinché esso non accada o, perlomeno, il suo verificarsi non procuri effeti gravi. La manutenzione preventiva, e in particolare quella predittiva, si è sviluppata notevolmente negli anni recenti, tuttavia senza mai compiere un significativo balzo in avanti, ma progredendo regolarmente, senza discontinuità.
Oggi invece siamo in procinto di compiere un netto miglioramento nella predizione del guasto, utilizzando tecniche di intelligenza artificiale e anche di machine learning e deep learning; sono tecniche che richiedono l’elaborazione di vaste moli di dati, solitamente di diversa natura e di software in grado di modificare loro stessi perfornire soluzioni sempre aderenti al reale.
Nel presente articolo è esposto un caso studio in cui si sono applicate tecniche predittive non convenzionali, ricorrendo a due algoritmi statistici di applicabilità assolutamente generale.
Contesto generale
Sulla base dell’analisi degli standard di settore e dell’esperienza maturata, il metodo generale sviluppato per supportare l’implementazione di soluzioni IT di Fault Diagnosis e Prognostic HealthManagement richiede, in generale, quanto segue.
1. La corretta pianificazione delle attività nel rispetto di criteri di applicabilità ed efficacia opportunamente definiti nel contesto operative considerato. Questi criteri sono tali da garantire la selezione dei sistemi rilevanti in termini di rischio e costi sul ciclo vita per i quali siano applicabili tecniche avanzate di diagnosi e prognosi.
Questo presuppone, ad esempio:
- l’implementazione di un processo sistematico per la valutazione delle tipologie di manutenzione ottimali (in relazione al rischio, al danno correlato alle diverse modalità di guasto dei componenti degli equipment considerati e ai costi a essa associati);
- l’individuazione dei segnali e/o le loro combinazioni da utilizzarsi per monitorare lo stato di funzionamento del sistema e/o dei componenti che lo costituiscono ove siano verificati i criteri di applicabilità ed efficacia del monitoraggio su condizione (periodico e/o continuo);
- la selezione della tipologia e del posizionamento dei sensori necessari;
- la classificazione delle diverse condizioni di funzionamento e dei valori che ne definiscono quelle ottimali da cui discendono le soglie preliminari per l’attivazione di una notifica/allarme.
2. L’acquisizione dei dati selezionati, lo sviluppo di modelli di diagnosi e prognosi e la loro validazione. Normalmente sono utilizzati:
- metodi di diagnosi basati sui dati e sui relativi algoritmi, ad esempio (non esaustivo): l’analisi statistica dei dati osservati (mono e/o multidimensionale) e/o di dati elaborati (aggregati in relazione ai sintomi legati alle diverse modalità di guasto); i metodi di regressione logica per la costruzione dimodelli di regressione per la stima della probabilità che un certo evento si verifichi sulla base di uno o più condizioni tra di loro indipendenti.
- Metodi “Knowledge Based” basati sostanzialmente sulla realizzazione di un modello analitico del sistema e dei suoi componenti che consenta di formulare ipotesi relative a possibili malfunzionamenti in caso di deviazioni dei valori misurati da quelli nominali.
Questi metodi sono finalizzati alla diagnosi avanzata e alla prognosi di condizioni di guasto incipiente e/o della performance di un equipment e richiedono la stima del tempo al “guasto” (più in generale, violazione dello standard di performance atteso), cioè la stima della vita utile residua in un certo intervallo di fiducia.
3. L’utilizzo dei modelli sviluppati, la gestione delle informazioni e la loro corretta e fruibile comunicazione all’utilizzatore finale a supporto dei processi decisionali di natura operativa e manutentiva.
Questo permette di assicurare le informazioni necessarie per selezionare le azioni proattive utili all’ottimizzazione delle attività e al loro continuo miglioramento e richiede la realizzazione di architetture e strumenti HW e SW che consentano sia la trasmissione d’informazioni a supporto delle attività sia la gestione e l’analisi dei dati per la revisione dei database a intervalli pianificati e/o il continuo affinamento delle soglie e degli eventi che determinano l’allarme e/o la notifica.
Caso studio
Introduzione
L’oggetto dello studio è un motore endotermico operante in un impianto di cogenerazione asservito ad uno stabilimento produttivo. Le problematiche riscontrate sono, in estrema sintesi:
- incremento degli eventi di guasto dei componenti del sistema iniezione legati alla presenza di residui di combustione da cui conseguono trafilamenti e/o rotture degli stessi.
- Sporcamento del riduttore catalitico (da cui aumento della contropressione), del Turbocompressore e relativi ugelli di immissione (da cui fenomeni di pompaggio del TC) con: degrado del funzionamento del riduttore catalitico e riduzione della performance ambientale con alte concentrazioni di inquinanti nelle emissioni; spegnimenti non pianificati del motore a seguito di: fenomeni di pompaggio dovuti alla variazione della geometria degli ugelli di immissione a causa di sporcamento eccessivo e formazione di depositi; innalzamento della contropressione al motore e/o delle temperature dei gas esausti.
L’obiettivo dell’attività consiste nell’identificare le possibili azioni correttive per incrementare la performance del motore. Nello specifico di questo lavoro sono descritte quelle finalizzate a ottmizzare la performance manutentiva con l’identificazione preventiva delle problematiche in essere e della vita utile residua dei componenti del sistema iniezione (preliminare).
I dati operativi e manutentivi utilizzati per le analisi si riferiscono ad un anno di funzionamento. Per la definizione dei training set dei modelli di riferimento sono stati considerati i dati operativi relativi al semestre precedente.
Fasi ed attività principali
Il flow chart riportato in figura 1 sintetizza il metodo generale sviluppatoper supportare l’implementazione di soluzioni IT di Fault Diagnosis e Prognostic Health Management al caso industriale studiato. Si distinguono due riquadri: il primo relativo ad attività eseguite (Fase 1) ed il secondo (Fase 2) a quelle attese (ad oggi) nel periodo successivo alla stesura di questo documento.
I paragrafi successivi descrivono, in estrema sintesi, per ciascuna delle principali attività relative alla Fase 1: obiettivi, risultati, tecniche utilizzate.
Dati dal campo: valutazioni generali e analisi
Obiettivo
Analisi preliminari dei dati relativi ai guasti rilevati e stima delle principali grandezze affidabilistiche dei sistemi che costituiscono il motore e di alcuni componenti del sistema iniezione (pompe olio combustibile e valvoleiniezione).
Risultati
Le analisi hanno permesso di evidenziare:
- la scarsa efficacia della strategia manutentiva in essere (programmata), come dimostrano sia per la predominanza di interventi di manutenzione correttiva rispetto a quelli di manutenzione preventiva sia per l’elevato numero di guasti sui componenti dei sistemi iniezione del motore.
- L’incremento molto rapido del numero di guasti, con distribuzioni differenti sulle due bancate del motore, nel periodo di riferimento accompagnato da un incremento altrettanto rapido del numero di componenti sostituiti preventivamente nel corso di attività di manutenzione straordinaria.
- La sostanziale modifica del piano di manutenzione con una forte riduzione della durata degli intervalli di manutenzione previsti con importanti conseguenze sulla disponibilità operativa.
Le analisi affidabilistiche dei dati raccolti dal campo evidenziano:
- guasti infantili che avvengono in tempi estremamente ridotti a valle di interventi di sostituzione pianificata con componenti revisionati;
- incremento di un ordine di grandezza del rateo di guasto delle valvole iniezione rispetto a periodi di buon funzionamento;
- i ratei di guasto dei diversi componenti elevati e tali da far prevedere un numero atteso di guasti non accettabile in relazione agli intervalli di manutenzione previsti dal piano in essere.
Quanto sopra giustifica la scelta di ricorrere a soluzioni avanzate di monitoraggio, diagnosi e prognosi per la prevenzione e la gestione degli eventi di guasto (in assenza di soluzioni applicabili per l’eliminazione delle cause che li determinano).
Analisi dei dati operativi: trend e normalizzazione dei dati
Obiettivo
Raccolta dei dati operativi e organizzazione degli stessi. Definizione dei trend di lungo periodo ed analisi dei trend di dati normalizzati con la funzione z-score.
In base alle analisi effettuate si evidenzia che:
- I fenomeni di forte instabilità delle deviazioni standard delle temperature dei gas esausti non accompagnate da instabilità della potenza generata rilevati ad inizio del periodo di riferimento si amplificano e tendono a determinare andamenti ciclici delle condizioni di funzionamento con frequenza mensile e, inoltre, determinano instabilità nella potenza generata.
- Il transitorio legato a problematiche relative a malfunzionamenti/trafilamenti di una pompa olio combustibile ha una durata di circa 24 ore ed è caratterizzato da un calo della temperatura di circa 40 °C benapprossimabile con un andamento lineare.
- Il transitorio legato a problematiche relative a malfunzionamenti/guasti delle valvole di iniezione (ad eccezione delle rotture improvvise) ha una durata di qualche ora (circa 4) ed è caratterizzato da un calo sensibile delle temperature dell’ordine dei 30 °C approssimabile con un andamento lineare a gradiente superiore di quello precedente (pompe OC).
- I fenomeni di incremento delle temperature sono legati a fenomeni di sporcamento dei componenti a valle dei cilindri con conseguenti aumenti del carico termico dei cilindri stessi (legato alla variazione di portata dell’aria comburente) e/o a fenomeni di sporcamento del riduttore catalitico.
Le immagini riportano alcuni dei trend di cui sopra (Complessivo temperature periodo di riferimento).
Attività
Raccolta ed analisi preliminare dei dati relativi alla potenza generata ed alle temperature dei gas esausti misurati dal sistema di controllo del motore nel periodo considerato. I campionamenti sono effettuati dal sistema di controllo con frequenza oraria per quanto riguarda la potenza generata e con cadenza di 40 secondi per quanto riguarda le temperature.
Elaborazione dei dati:
- allineamento temporale dei campioni (circa 300.000 misure);
- eliminazione eventuali anomalie dovute a strumenti di misura (outlier);
- raggruppamento dei dati considerati in relazione alla potenza prodotta.
Definizione dei trend di lungo periodo relativi a:
- temperatura media dei gas esausti,
- temperature medie dei gas esausti delle due bancate,
- temperature dei gas esausti di ciascun cilindro,
- potenza generata.
Analisi dei trend di cui sopra in relazione agli eventi di guasto delle valvole iniezione e delle pompe OC del motore sulla base delle raccolte di dati dal campo ed identificazione della durata dei transitori di guasto. Normalizzazione dei dati con la funzione z-score ed ulteriore analisi in relazione ai dati di guasto: trasformazione delle distribuzioni di valori delle variabili considerate in distribuzioni normali a media nulla e varianza/deviazione standard unitaria; valutazione dello scarto (in numero di deviazioni standard) dal valore unitario per i valori considerati.
Continua sul numero di febbraio 2019
Paolo Tarasco, Partner, MT3
Graziano Perotti Referente Area “Competenze in Manutenzione”, CTS Manutenzione T&M; Direttore Master in manutenzione e gestione degli asset, Festo Academy