Le tecnologie di Industria 4.0: i Big Data

Laptop e grafici

Secondo pilastro della quarta rivoluzione industriale, e di molti aspetti della vita futura anche negli ambiti quotidiani, sono i “Big Data” cioè l’enorme quantità di informazioni che vengono prodotte ed elaborate ogni giorno. Vediamo, attraverso un esempio elementare, come e perché questi dati sono prodotti e come possono essere utilizzati.

Abbiamo discusso nell’articolo precedente  di come dei dispositivi (dagli Smartphone alle stampanti) possano creare un ecosistema quando sono connessi in rete: ogni singolo oggetto non ha più bisogno di tecnologie specifiche e su misura per comunicare con un altro oggetto ma è sufficiente collegarsi alla rete per scambiarsi informazioni. Pensiamo alla possibilità di visualizzare sul nostro Smartphone le immagini riprese da una telecamera: possiamo monitorare cosa succede in casa anche quando siamo in vacanza, basta usare telecamere connesse ad internet (cosiddette telecamere IP) ed avere una connessione sul telefono. In altri tempi, se non impossibile, sarebbe stato comunque difficile realizzare un collegamento fra telecamere (o qualunque altro sistema presente in casa, dall’apri-cancello alla caldaia) e telefono.
Fin qui, però, parliamo sempre di oggetti connessi che si scambiano dati “fra di loro”, nel senso che i dati sono utilizzati solo per compiere determinate azioni (accendere il riscaldamento quando si è in prossimità dell’abitazione, aprire il cancello senza telecomando, ecc.), restando nell’ambito IoT. Ma cosa succede se i dati prodotti da tutti i dispositivi connessi sono in qualche modo “archiviati” da qualche parte? Si possono utilizzare per estrapolare informazioni utili? Se si, come? Sono tutte domande che sono emerse nel corso degli ultimi anni nel momento in cui ci si è trovati con una grande mole di informazioni in qualche modo disponibile: si pensa che il 90% dei dati esistenti sia stato prodotto negli ultimi due anni [fonte: datamanager ] quindi quanto prodotto dalla preistoria ad oggi è solo il 10% di tutti i dati disponibili (di fatto è una crescita esponenziale).

I BIG DATA

Tutti questi dati sono fra loro eterogenei per natura (dati “fisici”, informazioni “personali”, ecc.) e per tipo di rappresentazione (non tutti sono nello stesso “formato”: si va da dati binari a file di testo o xml, ecc.), pertanto è impensabile trattarli con i consueti DBMS (Data Base Management Systems) relazionali ed occorrono nuovi strumenti in grado di operare su dati “non strutturati” (i cosiddetti Data Base NoSQL).
Il termine “Big Data” è stato coniato proprio per indicarne non solo la quantità (enorme) ma anche l’eterogeneità e, quindi, l’impossibilità dell’uso delle note soluzioni DMBS.

Cerchiamo di rispondere alle domande che ci siamo posti.
Riprendendo l’esempio delle stampanti in rete (per restare in ambito più office/industria che non personal/domotico, ma in linea di principio le cose sono equivalenti) possiamo dotare la stampante di sensori per misurarne i consumi (carta, toner, elettricità), gli orari di utilizzo e quanlunque altra grandezza possa essere di interesse. Questi dati sono trasferiti “sulla rete” ad un apposito server, cui giungono anche le informazioni degli altri computer (chi ha stampato, quanto e quanto, ad esempio). Ripetiamo la domanda: cosa possiamo farne di questi dati? Possiamo monitorare i consumi e, soprattutto, farne delle analisi: se il consumo varia significativamente rispetto alla media, a parità di pagine stampate potrebbe esserci un malfunzionamento (o l’avvicinarsi di un guasto) e potrebbe essere necessario far intervenire la manutenzione (in questo caso si parla di manutenzione predittiva). La decisione potrebbe essere presa da un umano responsabile che si avvale dei numeri per decidere (si parla si “Sistemi di Supporto alle Decisioni“) oppure far partire in automatico la richiesta (il vero punto di arrivo della tecnologia).
Il monitoraggio dei dati potrebbe essere utilizzato, oltre che per determinare lo stato della macchina ed effettuare manutenzione solo quando serve (e non, come ora, ad intervalli regolari, ma probabilmente inutili, oppure a guasto avvenuto) anche per realizzare ogni forma di analisi (dei consumi, dell’impiego) per ottimizzare l’uso di tutto il parco macchine di un ufficio/edificio ecc.

IL CLOUD

Una cosa da sottolineare: quando dico che i dati sono inviati “alla rete” o ad un server intendo dire che non c’è un computer ben definito, da contattare (ad esempio tramite l’indirizzo IP) perchè è sufficiente accedere ad un “servizio” (un database web, un sito, ecc.) di cui si conosce l’url. Che questo servizio sia su un computer della nostra LAN o su un server virtuale che gira su calcolatori posti anche a distanza fra loro, per l’utente finale non conta: si parla, in gergo, di “Cloud Computing” proprio per indicare che la capacità di elaborazione è distribuita “nella rete” come se fosse “nelle nuvole” e non “a terra” su un computer specifico.

 

CONCLUSIONE

Abbiamo visto alcuni esempi di come si generano grandi quantità di dati e come possono essere sfruttati per estrarre informazioni utili. Avete da proporre altri esempi? Ci sono aspetti che vorreste approfondire? Lavorate con i Big Data e volete condividere le vostre esperienze? Scrivete nei commenti!
Se vi è piaciuto l’articolo condividetelo sul social che preferite.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Pin It on Pinterest