Articoli

Compressione, CompreNsione: una N che fa la differenza

15/02/2012

di Luca Algeri Sistemi Informatici e Servizi di FGS Brescia. Si ringrazia Simone De Titta, Amministratore Delegato di Technoaware.

La videoanalisi è una tecnologia che sta progredendo velocemente e che già oggi è in grado di fornire soluzioni di enorme valore: è un canale importante nel mercato della videosorveglianza. E' necessario però avere consapevolezza di cosa sia la vera videoanalisi e di cosa ci dobbiamo aspettare, senza farci ingannare dalle improbabili aspettative che un mercato troppo spregiudicato sta offrendo. C'è infatti molta confusione nel mercato della videoanalisi e purtroppo ad alimentare questa confusione è spesso proprio l'offerta troppo "audace" di molti produttori. Non ci dobbiamo far ingannare dalla fantascienza cinematografica (CSI, Matrix,…), che stuzzica molto spesso i desideri dell'utente finale, spingendolo a credere in assurde ed improbabili offerte di mercato. La realtà è ancora molto lontana e questo deve essere spiegato con molta chiarezza ed onestà.

Oggi possiamo paragonare l'evoluzione della video analisi a quella dei computer della metà degli anni '80. Il valore funzionale al tempo era enorme rispetto alle tecnologie esistenti, ma naturalmente non ci si potevano né ci si dovevano aspettare prestazioni e funzionalità quali le attuali. Idem si può dire di "taluni" nel mercato della videoanalisi: vendono "Computer degli anni 60" spacciandoli per mainframe di ultima generazione. A peggiorare la situazione c'è anche il fatto che, ad oggi, manca uno standard riconosciuto per la misura delle prestazioni di un modulo di video analisi: ognuno può scrivere quel che vuole. Quando si leggono percentuali di prestazioni, bisogna chiedersi rispetto a cosa sono state comparate. Non esistendo una scala di valutazione, è evidente che gli attuali numeri sono inventati, non possono rispecchiare l'effettiva validità del prodotto e servono solo ad aumentarne le performance nominali. Il rischio è quello di confondere la realtà con la fantasia, il motion detection con la video analisi. Meglio quindi fare qualche distinzione lessicale.

Motion Detection

Il motion detection è una tecnologia che nasce con l'obiettivo di fare compressione di flussi video, non comprensione di ambiente. Il meccanismo di base del motion detection generalmente si basa sul confronto di pixel in immagini consecutive e/o con una immagine considerata di fondo. Solo i pixel cambiati nell'immagine corrente rispetto alla precedente vengono trasmessi, mentre per gli altri è sufficiente trasmettere l'informazione che non sono variati, con conseguente riduzione dei dati da trasmettere e senza perdere qualità dell'informazione. E' quindi corretto dire che il motion detection rileva il cambiamento quando una persona entra in una scena, perché questa evidentemente cambia i pixel relativi all'immagine di sfondo; ma cosa succede quando ci troviamo in ambienti esterni, con pioggia, neve, vento, alberi che si muovono, fontane, riflessi di luce, piccoli animali? Tutti questi movimenti vengono inevitabilmente rilevati dal motion detection, che si limita a riconoscere le sole differenze...provocando centinaia di falsi allarmi. Sembra che con il motion detection si riesca a fare miracoli, ma il motion detection non è la videoanalisi: è semplicemente uno tra le decine di algoritmi base che costituiscono un robusto modulo di videoanalisi.

Video analisi

La videoanalisi è tutta un'altra cosa e si basa su un approccio scientifico completamente diverso, perché ha un altro obiettivo, molto più complesso: quello di comprendere il contenuto dinamico di una scena. Non basta sapere se un pixel è cambiato per capire il contenuto di una scena, ma occorre studiare frame per frame come è cambiato, la sua dinamica ed il suo comportamento nel tempo. La video analisi si basa sullo studio continuo del comportamento di ogni singolo pixel e sull'individuazione di modelli matematici dinamici che siano in grado di approssimare frame per frame questo comportamento. Non ha importanza dunque rilevare ciò che si muove, ma rilevare ciò che si muove in maniera anomala rispetto al normale comportamento atteso. Si tratta di funzioni matematiche molto articolate, in grado di approssimare anche le dinamiche più complesse, come appunto quelle in ambienti esterni. Si parla quindi di algoritmi basati su Self Learning Background Modelling, ovvero metodi in grado di osservare ed imparare frame per frame in continuo il comportamento della scena e di adattarsi dinamicamente al suo variare, accorgendosi di alterazioni anomale.

Stop alla confusione

Allora come fidarsi e a chi credere? Come riconoscere chi spaccia il motion detection per videoanalisi? Innanzitutto non fidiamoci di chi promette la luna e leggiamo attentamente i data sheet dei prodotti. Come detto, le funzioni matematiche che vengono utilizzate nella vera video analisi sono necessariamente molto più complesse di una semplice differenza di immagini. 6-8 flussi in risoluzione CIF a 10-12 frame per secondo con un processore da 2,8-3GHz: questo è l'onere computazionale corretto di un buon algoritmo di vera video analisi. Diffidiamo da chi propone algoritmi velocissimi in grado di processare decine di flussi ad alta risoluzione con poca CPU. Chi dichiara di essere molto più veloce, evidentemente fa pochi conti e non mette in campo la vera videoanalisi! E' bene affidarsi a chi può dimostrare di avere la competenza necessaria per conoscere a fondo la materia. E' bene fidarsi di chi ha investito anni in ricerca nel campo dell'intelligenza di ambiente. FGS Brescia opera da oltre 15 anni nel mondo della sicurezza; cura il presente ma guarda al futuro e intuisce che la videoanalisi fornirà soluzioni a sempre maggior valore: per questo ha stretto una forte partnership con un operatore esperto come Technoaware.


pagina precedente