Big Data: cosa sono, come utilizzarli ed esempi applicativi

Condividi
6 min lettura
Data

Sapevi che i Big Data costituiscono un’enorme ricchezza per le aziende? La loro analisi, in relazione con altri set di dati può fornire risposte sorprendenti a chi si occupa di sviluppo di prodotto o di marketing. Vediamo insieme cosa sono e come trasformarli in valore.

Cosa sono i Big Data?

Il termine Big Data è usato comunemente per indicare un volume enorme di dati strutturati e non strutturati, difficile da elaborare e gestire avvalendosi di un database e di un software.

In genere il volume dei dati è troppo grande, si aggiorna troppo velocemente o supera la capacità di elaborazione presente nei computer aziendali per poterne gestire l’analisi.

Wie wird man Frontend Entwickler?

Un esempio di Big Data? Tutte le nostre attività quotidiane producono dati: un acquisto online, una immagine, un messaggio di testo, la nostra attività di ricerca sul web e sui nostri Social network contribuiscono a sviluppare quotidianamente grandi quantità di dati, che possono essere conservati, elaborati e monetizzati. I volumi dei Big Data sono talmente grandi che si misurano in Petabyte, o PB, ognuno dei quali valle 1.000 terabyte. Per intenderci, per riempire un PB sarebbero necessari ben 1,5 milioni di CD-ROM.

 

Tipologie di Big Data

I Big Data si presentano in genere in tre modalità:

 

Dati strutturati

Si tratta di tutti i dati che si presentano in forma uguale. Possono essere archiviati, consultati ed elaborati. Le dimensioni possono arrivare a essere misurate in zettabyte – uno Zettabyte corrisponde a 180 milioni di volte i documenti conservati nella Biblioteca del Congresso di Washington ed è pari a 1 milione di Petabyte – ma l’analisi è facilitata dal fatto che i dati sono classificati. I dati strutturati sono ad esempio quelli memorizzati in formato Excel o SQL.

 

Dati semi strutturati

Appartengono a questa categoria i dati raccolti in modo non conforme ai modelli di dati strutturati ma che contengono etichette e marcatori che permettono in ogni caso di individuare una gerarchia. Per dati semi strutturati si può intendere, ad esempio quelli in formato HTML. Non esistono in questo caso tabelle, ma il linguaggio è comunque interpretabile e classificabile.

 

Dati non strutturati

I dati non strutturati sono quelli privi di una struttura conosciuta. Oltre alla dimensione, i dati non strutturati pongono grandi difficoltà al momento dell’elaborazione per ricavarne valore. Un tipico esempio di dati non strutturati è un’origine dati eterogenea che contiene una combinazione di semplici file di testo, immagini, video e altri formati.

 

Caratteristiche dei Big Data

I Big data rispondono a caratteristiche specifiche. Vediamo insieme le principali:

 

A) Volume

Il nome Big Data stesso è correlato alla dimensione, che è enorme. La dimensione dei dati gioca un ruolo cruciale nel determinarne il valore, essi sono veramente preziosi solo se il set di dati ha un volume veramente grande. Altrimenti si parla di Small Data o semplici database.

 

B) Varietà

Un altro aspetto dei Big Data è la loro varietà, riferita a fonti eterogenee e alla natura dei dati, sia strutturati che non strutturati. Pochi anni fa i fogli di calcolo e i database erano le uniche fonti di dati, elaborabili dai più diffusi software. Attualmente i dati sono reperibili attraverso email, foto, video, dispositivi di monitoraggio, PDF, audio e testo.

 

C) Velocità

Il termine “velocità” si riferisce alla velocità di generazione dei dati. La velocità con cui i dati vengono acquisiti ed elaborati per soddisfare le richieste, ne determina il potenziale reale. La Big Data Velocity è un parametro che riguarda la velocità con cui i dati arrivano da fonti come processi aziendali, registri delle applicazioni, reti e siti di social media, sensori, dispositivi mobili, transazioni finanziarie e molto altro, con flusso imponente e continuo.

 

D) Variabilità

Questo aspetto si riferisce all’incoerenza dei dati. I flussi possono essere inconsistenti ma presentare picchi periodici. Gestire picchi su base giornaliera, stagionale o generati a causa di singoli eventi è una grande sfida. In caso di dati non strutturati è tutto ancora più complesso.

 

Perché i Big Data sono utili: ecco alcuni esempi

Nessuna organizzazione, sia un’azienda o una istituzione pubblica, può fare a meno dei Big Data. Ecco alcuni utilizzi pratici dei Big Data, elaborati con i canoni della Data Science.

 

1. Conoscenza e targeting degli utenti

Questo è l’utilizzo più rilevante dei Big Data. Conoscere gli utenti, i propri clienti effettivi e potenziali, i loro comportamenti e le loro preferenze significa creare prodotti o erogare servizi di successo, perché disegnati sul cliente e i suoi bisogni.

Le aziende coinvolte in un processo di trasformazione digitale chiedono di ampliare i propri set di dati tradizionali – database aziendali gestiti da un CRM, con i dati dei clienti e delle vendite – con i dati dei social media, i registri dei motori di ricerca, l’analisi del testo e i dati economici, come quelli sulle transazioni delle carte di credito, per ottenere un quadro più completo dei propri clienti e profilarli secondo le loro caratteristiche. Il grande obiettivo, in molti casi, è creare modelli predittivi basati sui comportamenti, sullo stile di vita e le esigenze dei consumatori. Un’azienda data driven, nella quale ogni decisione strategica è basata sui dati, trova nella loro elaborazione e analisi elementi essenziali per lo sviluppo del proprio business.

Attualmente le aziende possono sapere in anticipo e con precisione quando una delle loro clienti aspetta un bambino e quali saranno i prodotti più richiesti. Allo stesso modo una società finanziaria può prevedere il tasso di insolvenza e una compagnia di assicurazioni conoscere lo stile di guida e dunque il profilo di rischio del cliente, personalizzando così i premi di polizza.

Anche le stazioni sciistiche utilizzano i dati per monitorare e indirizzare i loro clienti. Attraverso le etichette RFID inserite nei biglietti delle seggiovie è possibile analizzare i modelli di traffico sulle piste e ridurre i tempi di attesa sulle piste più popolare, a seconda dell’ora del giorno. I parchi divertimento, attraverso i dati del WiFi,  possono rilevare in tempo reale le aree con maggiore concentrazione di persone e potenziare i servizi e gli operatori, o far passare con maggiore frequenza carrettini con gelato e pop corn.

In politica le campagne elettorali sono sempre più personalizzate rispetto al profilo dell’elettore. Ci si avvale dell’analisi dei Big Data, analizzando il sentiment delle persone e individuando quali sono i problemi di cui parlano maggiormente gli elettori, per indirizzare i contenuti dei post sui social e le affermazioni dei candidati nei dibattiti televisivi.

 

2. Conoscenza e ottimizzazione dei processi aziendali

I Big Data vengono sempre più utilizzati per ottimizzare i processi aziendali. Qualche esempio? Il settore della grande distribuzione è in grado di ottimizzare le scorte sulla base di previsioni generate da dati sui social media, tendenze della ricerca web e previsioni del tempo. Un settore particolare sta trovando grandi benefici dalla Data Science, si tratta della ottimizzazione della supply chain e della logistica in generale. La rilevazione GPS della posizione geografica e i sensori di identificazione a radiofrequenza vengono utilizzati per tracciare merci o veicoli e ottimizzare i percorsi integrando i dati sul traffico in tempo reale.

Anche nell’ambito delle HR i processi aziendali vengono migliorati utilizzando l’analisi dei Big Data. Essa è utile per l’ottimizzazione dell’acquisizione di talenti attraverso attività di scouting automatizzato, così come la misurazione del clima aziendale e dell’impegno del personale utilizzando strumenti legati ai dati. Attraverso i sensori dei badge dei dipendenti è  possibile rilevare le dinamiche sociali sul posto di lavoro: i badge riportano i movimenti dei dipendenti nel luogo di lavoro, rilevano con chi parlano e persino il tono di voce che usano quando comunicano. Un tracciamento un po’ inquietante, ma già adottato da alcune imprese.

 

3. Quantificazione personale e ottimizzazione delle prestazioni

I Big Data non sono utili soltanto ad aziende e governi, ma anche ai singoli. I siti di dating utilizzano algoritmi che analizzano grandi quantità di dati per suggerire i potenziali partner più appropriati.

E in casa? Anche domotica, IoT e assistenti vocali permettono di gestire l’abitazione e i suoi impianti o elettrodomestici, rintracciare le chiavi di casa, gli occhiali da lettura o il cellulare e controllare tutti i parametri che rendono l’abitazione più confortevole.

In questo caso si parla di Small Data, dati di dimensioni assolutamente inferiori ai Big Data, relativi all’utilizzo di un singolo prodotto, come i sensori inseriti nelle scarpe da running e i tracker per lo sport. L’Internet of Things consentirà presto grandi miglioramenti in alcuni ambiti come la logistica e l’assistenza sanitaria. Al momento siamo ancora incapaci di prevedere la portata di questa tecnologia. Siamo in una fase simile a quella in cui si usava  l’elettricità solo per alimentare le lampadine.

 

Conclusioni

L’utilizzo dei Big Data è sempre più pervasivo, indispensabile per conoscere meglio i comportamenti, le passioni, il sentiment degli utenti e prevedere le loro scelte in ambito commerciale, politico e turistico. Interfacciare i dati interni a un’organizzazione, relativi ai clienti già conquistati o a quelli potenziali significa possedere un patrimonio di dati che, messo in relazione con i big data sociografici, psicografici e transazionali rende possibile effettuare analisi predittive.

Sapere in anticipo cosa vuole il cliente o il cittadino, migliorare quindi prodotti e servizi offrendo esperienze sempre più vicine ai gusti del pubblico significa ottenere un vantaggio competitivo sul mercato e poter rispondere al meglio ai bisogni dell’utente.