Guida completa all’analisi dei dati per il tuo business

Condividi
11 min lettura
Data

Big Data, Small Data, decisioni data driven… si parla ovunque dei dati raccolti dal web come del nuovo petrolio di questi anni. Perché? Con l’aiuto dei dati si determinano strategie vincenti. L’intuizione di Manager, Progettisti, Sviluppatori e Marketer può trovare finalmente un fondamento solido perché scientifico, legato ai dati.

 

Come si generano i dati: big data, small data e dataset

Ogni uomo del mondo occidentale è un enorme creatore di dati, legati ai comportamenti che adotta sul web e nella vita di relazione. Post sui social network, utilizzo del GPS, viaggi e transazioni con carte di credito sono solo alcuni dei momenti in cui i nostri comportamenti possono essere tracciati sul web, producendo una quantità di dati colossale.

 

Cosa sono i big data e gli small data

I big data consistono in grandi quantità di dati che occupano molto spazio di archiviazione, nell’ordine dei Terabyte, il cui simbolo è TB, ognuno dei quali corrispondente a 1.048.576 megabyte. Si tratta dunque di dati che ruotano nel web o sono raccolti in enormi banche dati, gestite dai motori di ricerca, dai social network, dai siti di ecommerce o dalle compagnie telefoniche, solo per fare qualche esempio. Esistono poi banche dati di dimensioni meno rilevanti, gli small data, che contengono informazioni che provengono molto spesso da database interni all’azienda. Si tratta di dati con attributi specifici, che possono fornire informazioni più dettagliate e granulari rispetto a quelle raccolte attraverso i big data.

 

Esistono dataset di big data che riguardano elementi demografici, in genere reperibili su banche dati pubbliche relative alla composizione della popolazione, big data sociografici, che classificano la popolazione in base alle fasce di reddito, alla composizione delle famiglie ed elementi che connotano il profilo sociale. Infine è possibile acquisire big data psicografici, che forniscono elementi certi sugli interessi, le abitudini e le passioni, oltre a banche dati più specifiche, relative ai più vari aspetti della vita sociale.

 

L’integrazione dei big data con gli small data è la sfida di questi tempi nell’ambito della data analysis.

 

Cosa fare dei dati: l’attività di Data Mining

Nell’ambito della business intelligence l’attività di data mining consiste nell’estrarre informazioni da grandi dataset, con la finalità di renderli disponibili per la data analysis, utile ai manager aziendali e ai responsabili marketing per assumere decisioni data driven, guidate cioè da dati, che sono elementi certi e misurabili.


I dati non parlano da soli: è compito del data scientist saper individuare le categorie di dati più significative rispetto al business e stabilire i pattern, le relazioni più corrette tra i dati più diversi. Potrà accadere di scoprire correlazioni non previste tra i vari set di dati e di dare significato a informazioni estremamente specializzate, alla base delle strategie di marketing, di sviluppo di prodotto e delle scelte strategiche. Al Data Manager spetta poi il compito di curare la data visualization – i dati devono essere esposti chiaramente per essere fruibili in azienda – e la gestione dei dati, nel rispetto del regolamento GDPR, della sicurezza dei dati e della data privacy.

 

La big data analysis

La funzione dei dati è quella di fornire la migliore rappresentazione della realtà. È infatti  necessario adottare metodi di verifica, pulizia e controllo per ottenere un set di dati che rappresenti verosimilmente la composizione e i comportamenti degli utenti, individui nuovi target e permetta di realizzare prodotti e campagne di marketing che pongano il cliente al centro.

 

La data analysis viene in genere suddivisa in quattro tipologie, ognuna delle quali ha specifiche finalità:

– Descriptive Analytics

L’analisi descrittiva è effettuata avvalendosi di tool che aiutano a rappresentare e descrivere graficamente gli aspetti numerici di specifiche situazioni o processi. Nelle aziende la descriptive analysis riguarda la rappresentazione di risultati nell’ambito delle vendite, nelle attività di digital marketing e dei processi online, come campagne di lead generation o azioni di marketing automation.

 

– Predictive Analytics

L’analisi predittiva è una delle funzioni più interessanti della data strategy. Una corretta analisi dei dati, effettuata da un Data Scientist, è in grado di prevedere scenari di sviluppo nel futuro. Le attività di predictive analytics si avvalgono di modelli matematici. Un esempio sono le previsioni del tempo o l’analisi dei titoli di borsa, basate sui dati storici e sul calcolo delle probabilità.

 

– Prescriptive Analytics

L’analisi prescrittiva consiste nell’effettuare l’analisi dei dati finalizzati a supportare processi decisionali. L‘attività di prescriptive analytics è effettuata mediante tool che elaborano i dati e generano indicazioni strategiche che derivano dal processo di analisi descrittiva e di analisi predittiva.


– Automated Analytics

Si tratta di tool in grado di effettuare in modo automatizzato un’azione condizionata dal risultato delle analisi. Le piattaforme di automated analytics attivano azioni programmate sulla base del verificarsi di specifiche condizioni. In sostanza è possibile modificare automaticamente un prezzo online o determinare il modello di email da inviare in automatico. Legate all’AI, le automatic analytics sono in grado di guidare un’automobile senza bisogno di un autista.

 

Il processo di data analysis e il big data management: le 5V

I dataset contenenti big data hanno caratteristiche specifiche, che vengono comunemente ricondotte alle 5V, che fanno riferimento a:

Velocità: i big data devono poter essere analizzati in tempo reale. Questo processo è già realtà. Milioni di transazioni effettuate con carta di credito o sistemi di pagamento online vengono analizzati in millisecondi per individuare eventuali comportamenti fraudolenti, i post sui social media possono diventare virali in qualche secondo ma vengono analizzati da piattaforme di sentiment analysis. La tecnologia di registrazione dei big data effettua l’analisi dei dati prima che questi siano salvati nei database.

Volume: i set di big data sono composti da enormi quantità di dati, dai 10 miliardi di post giornalieri di Facebook, ai contenuti digitali, caratteristica dei big data è che essi occupano uno spazio di archiviazione di dimensioni fuori dal comune.


Varietà: questa caratteristica fa riferimento alle diverse tipologie di dati che vengono gestiti.  
Si tratta di contenuti multimediali, database di ogni genere, dati provenienti dai social network e testi, con le specifiche caratteristiche di ciascuno. Per Instagram, ad esempio, si tratta di immagini collegate ad hashtag, like e geolocalizzazione, mentre per Twitter si registrano elementi di testo e hashtag.

Variabilità: i dati variano di significato a seconda del contesto in cui vengono reperiti. È quindi necessario contestualizzare il dataset per verificare se sia utile o meno all’attività di data analysis.

Viralità: i dati si diffondono molto velocemente. Il Data Scientist è chiamato a individuare le fonti di dati più affidabili e attinenti alla ricerca e cogliere la diffusione di concetti che, con un hashtag diventato improvvisamente virale, possono cambiare un risultato elettorale o il processo di acquisto.

 

Le figure professionali che si occupano di data analysis: il Data Scientist

Il Data Scientist, o Data Analyst, è una figura professionale poliedrica, in grado di gestire il processo di data analysis. Si tratta di un professionista con forte approccio multidisciplinare per dominare gli advanced analytics, che riguardano un’insieme di tecniche tra le quali la predictive analysis, il data mining, il machine learning e la sentiment analysis. Il Data Scientist ha competenze digitali e deve saper vedere oltre i dati, individuando i pattern su basi statistiche e matematiche. Egli deve poi sapersi relazionare con il management aziendale per presentare i risultati dell’analisi e le indicazioni che emergono rispetto al modello di business.

 

Cosa fa il Data Analyst

Sono molte le funzioni svolte dall’analista dei dati, perché la gestione e interpretazione dei dataset riguarda la mappatura, pulizia e controllo delle fonti di dati, la creazione dei flussi di acquisizione e la trasformazione dei dati in informazioni, attraverso lo studio e l’individuazione degli elementi di valore per ogni area aziendale.

 

Il Data Scientist collabora anche con i Marketing Manager nella misurazione della customer experience e dei dati relativi alla clientela, per individuare opportunità di sviluppo del marketing strategico. Egli conosce elementi di informatica e programmazione, matematica e analisi statistica, conoscenza del business aziendale e della elaborazione di report e grafici. Alle competenze specifiche vanno affiancate alcune soft skill, come la capacità di gestire le relazioni e di lavorare in team.

 

L’analisi dei dati è davvero utile? Un caso di studio: Lego

Non è troppo difficile raccogliere i dati, lo è molto di più analizzarli per trasformarli in valore per l’azienda. Un case study particolarmente interessante è quello che riguarda il brand Lego. Il calo delle vendite dei famosi mattoncini è iniziato nel 2004, generato dalla concorrenza con giochi elettronici e da esperienze negative nello sviluppo del prodotto. L’attività di analisi che Lego ha avviato nel 2002, ha tuttavia portato i Manager a individuare strategie basandosi su un clamoroso errore strategico. Lego decise infatti di aumentare la dimensione dei mattoncini, sulla base di un’analisi dei dati che imputava la flessione delle vendite alla mancanza di gratificazioni istantanee e del tempo a disposizione per dedicare uno spazio adeguato al gioco manuale da parte di bambini e adolescenti. Il 2003 registrò invece un ulteriore calo delle vendite del 35%.

Quando la data analysis fornisce un quadro errato della realtà

L’analisi dei dati effettuata da Lego, fondata su sondaggi, interviste a stakeholder e analisi di mercato aveva quindi fornito una rappresentazione errata della realtà, che aveva a sua volta orientato il management verso scelte aziendali sbagliate. I Manager Lego hanno quindi adottato una tecnica diversa: i dati provenienti dal web sono stati incrociati con quelli derivanti da analisi offline e visite alle case dei consumatori. Il dato che si è rivelato dirompente fu raccolto nella camera da letto di un bambino tedesco. Alla richiesta di individuare l’oggetto del quale il teenager andava più orgoglioso il ragazzo, appassionato di Lego e di skateboard, mostrò un paio di scarpe di un noto brand americano, logore ma piene di significato per la sua attività di skater. I Marketer Lego hanno compreso che i bambini raggiungono la considerazione sociale quando il gioco mette in evidenza le loro specifiche abilità.

 

L’analisi dei big data, da sola, aveva mostrato una realtà fatta di nativi digitali non più interessati al prodotto Lego, ma gli small data raccolti dall’azienda hanno reso più realistica la rappresentazione della realtà e fornito indicazioni per l’innovazione di prodotto, come avviene nel processo di Digital Transformation. Lego ha chiuso il 2015 con il miglior risultato operativo di sempre pari a 5,2 miliardi di dollari.

 

Attualmente errori del genere sono più rari perché tra le fonti di dati sono ricompresi anche quelli relativi ai comportamenti dei singoli clienti, che indicano comunque una direzione ai Manager aziendali e, incrociati con set di dati di maggiori dimensioni, offrono una chiave di lettura della realtà e delle tendenze.

 

Praticare l’analisi dei dati

La data analysis non è un’attività che è possibile svolgere senza competenze specifiche. Tuttavia il web rende disponibili strumenti per l’analisi dei dati che possono fornire risultati interessanti.

 

I migliori tool per la data analysis

Tra i tool per l’analisi dei dati sono molto diffusi:

Tableau

Tableau è un software di data analytics molto efficace. Il tool si connette a diverse tipologie di fonti di dati, sia locali che in cloud, e propone un’interfaccia intuitiva che permette di combinare i dati, analizzarli e presentarli al meglio. Tableau utilizza tecnologie di integrazione delle app, attraverso le API e JavaScript e può essere integrato nelle più diffuse piattaforme gestionali delle aziende.

 

sito: https://www.tableau.com/

 

Rapidminer

RapidMiner è una piattaforma integrata per l’analisi dei dati che svolge analisi predittive, attività di data mining e analisi visiva e del testo. Si avvale del machine learning per migliorare la precisione dell’analisi. RapidMiner può essere integrato con qualsiasi tipo di fonte di dati, in formato Access, Excel, Microsoft SQL, dati Tera, Oracle, Ingres e MySQL. Lo strumento è molto potente e genera velocemente report sui risultati delle analisi svolte dalla piattaforma.

 

sito: https://rapidminer.com/

 

I migliori software per la data analysis

Non solo tool per l’analisi dei dati: esistono linguaggi di programmazione particolarmente adatti per analisi statistiche, gratuiti e multipiattaforma. I più noti sono:

 

Python

Python è un linguaggio di scripting orientato agli oggetti piuttosto semplice da apprendere, con licenza open source e multipiattaforma. Python è particolarmente adatto all’analisi statistica e offre molte librerie gratuite. Si tratta di un linguaggio di programmazione dalle grandi potenzialità per l’analisi statistica, insegnato nelle università.

 

Linguaggio R

R è tra i più noti strumenti di analisi, utilizzato in ambito statistico e per la modellazione dei dati. R è un linguaggio multipiattaforma e open source. Il software dispone anche di strumenti di analisi statistica programmati e consente di crearne di personalizzati. R si sta affermando in ambiente accademico e tra i professionisti della data analysis. R dispone di quasi 12.000 pacchetti e permette di sfogliare i pacchetti per categorie. R fornisce anche strumenti per l’installazione automatica di tutti i pacchetti secondo le esigenze dell’utente, e analizza anche dataset di Big data.

 

sito: https://www.r-project.org/

 

I libri per apprendere l’analisi dei dati

Una buona lettura su temi così specifici come la data analysis è sempre consigliabile. Il libro, per definizione, è consultabile più volte e permette di approfondire in qualche ora aspetti che un solo articolo o un video non sempre riescono a trattare compiutamente. Ecco alcuni tra i migliori libri per l’analisi dei dati:

 

Big Data Analytics. Il manuale del Data Scientist – di Alessandro Rezzani. Edizioni Apogeo

Il testo analizza la figura del Data Scientist, che possiede competenze trasversali. Si tratta di una guida completa relativa alla gestione e analisi dei dati. Non si tratta di un libro troppo specialistico, che offre dettagli su algoritmi, procedure o tecniche, ma fornisce un adeguato quadro d’insieme sui problemi e sugli strumenti a disposizione

 

Principles of Data Mining (Adaptive Computation and Machine Learning) by David J. Hand , Heikki Mannila e Padhraic Smyth. Edizioni Bradford Books

Un testo interdisciplinare sul data mining. I diversi aspetti del data management vengono spesso affrontati in modo specifico da statistici, analisti aziendali e marketer. Questo testo tratta invece tutti gli aspetti legati all’informatica e alla statistica. Tre le sezioni del testo: la prima fornisce una panoramica sui principi con cui operano gli algoritmi per il data mining, la seconda descrive gli algoritmi elaborati per creare specifiche analisi e la terza sezione è di carattere applicativo e tratta della gestione e analisi dei dati nel mondo reale.

 

Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPython, di Wes Mckinney – Edizioni Jupiter

Il libro fornisce istruzione complete per la ricerca, l’elaborazione, la pulizia e la correlazione di set di dati in Python. La guida è ricca di casi di studio che mostrano come risolvere efficacemente alcuni problemi nell’analisi dei dati. È molto utile agli analisti che si avvalgono di Python.

Smart data – di Alessandro Chessa – Egea

Dai social alle reti complesse questo libro è una finestra sul mondo che cambia, per comprendere le mutazioni che stiamo vivendo e decodificare i concetti chiave del mondo dei dati: Cloud, Governace, Artificial Intelligence e Internet of Things, e molto altro.

Le risorse online per l’analisi dei dati

Sono numerosi i siti che offrono risorse online, articoli aggiornati e casi di studio sull’analisi dei dati. Eccone alcuni particolarmente utili:

 

Big Data4Innovation

Si tratta di un portale molto curato, in lingua italiana, che presenta articoli aggiornati frequentemente e propone link a risorse esterne di valore. L’iscrizione alla newsletter permette di non perdere i contenuti pubblicati. Il focus del sito riguarda principalmente big data e data science.  

 

sito: https://www.bigdata4innovation.it/

 

Data Science Central

Data Science Central è una delle più note risorse online per i professionisti dell’analisi dei dati. I contenuti trattano di data analysis, integrazione dei dati e loro visualizzazione. Si tratta di una piattaforma editoriale che offre anche interazione sui social, supporto tecnico attraverso il forum, articoli su tecnologia, strumenti e tendenze del settore.

 

sito: https://www.datasciencecentral.com/

IBM – Fondamenti di Data Science

Sul web sono presenti anche corsi gratuiti, come quelli di IBM, che eroga formazione online attraverso il suo portale, Cognitive Class. Questo corso tratta di analisi dei dati, metodologia, applicazioni pratiche, programmazione in R e gli strumenti open source. Il corso è di circa 20 ore.

 

sito: https://cognitiveclass.ai/learn/data-science/

 

 

Leggi anche: Data Visualization: i tool che devi assolutamente conoscere