Articoli

Affidabilità vo’ cercando

25/08/2012

La redazione

 

Per quante ore all’anno deve funzionare un sistema di sicurezza? La risposta, alla luce di un rapido calcolo, dovrebbe essere 8.760, ovvero tante quante sono le ore in un anno. È infatti difficile accettare, a priori, che la propria infrastruttura non garantisca un’adeguata copertura per un certo arco temporale. Eppure, dati alla mano, nessun fornitore di apparecchiature e nessun installatore è in grado di garantire un affidabilità al 100%, ovvero un sistema in grado di funzionare sempre ininterrottamente. Per questa ragione vengono accettati, con una certa soddisfazione, contratti che garantiscono il funzionamento, soprattutto a livello di rete di trasmissione, con un’affidabilità del 99%. Un valore che, ad una prima analisi, appare decisamente tranquillizzante. Eppure, ancora una volta, con un semplice calcolo matematico possiamo scoprire che un’affidabilità del 99% equivale, in un anno, a un down time superiore a 87 ore. Il che corrisponde a tre giorni e mezzo senza un’adeguata copertura del sistema di sicurezza. Questo significa che, per un simile lasso di tempo, gli allarmi potrebbero non scattare e le immagini, anche se riprese, non raggiungerebbero i sistemi di registrazione e visualizzazione. Si tratta di valori decisamente preoccupanti, che impongono una riflessione sulla tante volte decantata affidabilità al 99%.

 

Chi si occupa di sicurezza, oltre ad individuare soluzioni in grado di tutelare i beni o le persone affidate alla sua responsabilità, deve anche riuscire a minimizzare il down time, ovvero il tempo in cui l’infrastruttura di sicurezza non è in grado di svolgere il proprio compito. Il verificarsi di un guasto, ma anche di un “ banale” malfunzionamento, implica una serie di conseguenze che devono essere analizzate e valutate preventivamente, per evitare rischi o l’interruzione di specifici servizi. Massimizzare la disponibilità, in particolare, risulta sempre più difficile a causa dell’impiego dei sistemi informatici, il cui delicato equilibrio si regge su parametri molto precisi. Al punto che può essere sufficiente un piccolo scostamento, rispetto ai valori ottimali, per mettere in crisi un sistema privo di accorgimenti in grado di aumentarne l’affidabilità.

 

Emblematico, a questo proposito, il fatto che, come emerge da studi realizzati nel settore, oltre il 40% delle perdite di dati sia provocato dai soli problemi di alimentazione. Anche per tale ragione è importante conoscere la differenza fra due termini caratterizzati da un suono molto simile: resistenza e resilienza. Nel primo caso, infatti, viene identificata la capacità di un sistema di prevenire rotture provenienti da specifiche sollecitazioni esterne, che possono essere di natura anche diversa. La resilienza, invece, parte dal presupposto che, in un sistema, possa guastarsi un componente, ma tale sistema deve essere in grado di fronteggiare questa situazione e garantire il corretto funzionamento dell’intero impianto anche a fronte di problemi localizzati.

 

Affidabilità o disponibilità?

 

Un’altra coppia di termini, spesso usati erroneamente, sono affidabilità e disponibilità. L’affidabilità, in inglese Reliability, esprime infatti la capacità di un determinato sistema a svolgere le proprie funzioni, per un certo tempo, nelle condizioni stabilite. In questo ambito sono tre i parametri da prendere in considerazione:

 

  • MTTF (Mean Time To Fault - tempo medio di manifestazione del guasto): un simile indice permette di evidenziare il tempo atteso di operatività di un sistema prima del manifestarsi del primo guasto;
  • MTTR (Mean Time To Repair - tempo medio per riparare o sostituire un’entità guasta, riportandola quindi alla sua normale operatività): un simile parametro assume un’importanza significativa perché consente di comprendere, in modo obiettivo, per quanto tempo non sarà disponibile un determinato sistema, esprimendo così il grado di ripristinabilità dello stesso o dei suoi componenti;
  • MTBF (Mean Time Between Fault - tempo medio tra due guasti): dato dalla somma tra MTTF e MTTR, permette di esprimere la qualità dei sistemi riparabili.

 

L’analisi di tali indici non può essere limitata ai singoli elementi, ma occorre prendere in considerazione la globalità del sistema stesso. Ogni componente, infatti, è collegato agli altri in una sorta di “catena”, in cui è l’elemento più debole a definire l’affidabilità dell’intero impianto. È infatti sufficiente il guasto di un elemento per interrompere il meccanismo di funzionamento. L’affidabilità di un sistema dipende dipende quindi dall’affidabilità del suo elemento più debole. Una corretta progettazione non può quindi prescindere da un’attenta analisi dei cosiddetti single point of failure, ovvero singoli punti di guasto, il cui malfunzionamento ha ripercussioni sull’intero sistema. A differenza dell’affidabilità, la disponibilità (availability) è espressa dal rapporto tra il tempo medio tra due guasti successivi (MTBF) e il tempo medio al ripristino del sistema stesso (MTTR).

 

Disponibilità a regime del sistema:

 

A= MTTF / (MTTF + MTTR)

 

Occhio “mortalità infantile”

 

I valori sopra elencati fanno sempre riferimento a parametri medi che, come tali, devono essere considerati solo dal punto di vista statistico. Anche perché le apparecchiature, in particolare quelle elettroniche, soffrono la cosiddetta “mortalità infantile”. Il tasso di guasto è particolarmente elevato nelle prime fasi di vita, durante le quali possono emergere eventuali difetti o errori. Tale valore decresce poi progressivamente, per rimanere sostanzialmente stabile. In questo periodo, infatti, i guasti si presentano casualmente e indipendentemente dalle imperfezioni di fabbricazione. Solo con l’invecchiamento, infine, si entra nella terza regione, quella in cui si ha un andamento crescente nel tempo, a causa della naturale usura dei componenti.

 

Messa in sicurezza

 

Alla luce di questi valori, i progettisti sono chiamati a utilizzare sistemi basati su soluzioni in grado di garantire un’adeguata affidabilità nel corso della vita utile di un impianto di sicurezza. Anche se, è utile sottolinearlo, si tratta sempre di fattori statistici e, per molti versi, imprevedibili. Per tale ragione l’unico modo per garantire una disponibilità davvero prossima al 100% consiste nel ridondare l’intero impianto, rendendolo così sufficientemente resiliente per continuare a funzionare anche a fronte di uno o più guasti contemporanei. Un esempio significativo di questo fenomeno può essere rappresentato dai moduli di alimentazione. Ad esempio, se per ottenere una potenza di 40 kW si utilizzano 5 moduli da 10 kW, si dispone di una ridondanza pari a N+1. Questo significa che, anche se un modulo dovesse guastarsi, gli altri quattro sarebbero in grado di garantire il necessario apporto di energia. Di contro, se in un simile sistema si desidera disporre di una ridondanza pari a N+2, è necessario installare 6 moduli da 10 kW, permettendo al sistema può funzionare anche quando due moduli si guastano contemporaneamente. Una scelta che, ovviamente, non può prescindere dall’investimento economico necessario per garantire un simile risultato.


pagina precedente