L’importanza della qualità
Sempre più aziende stanno puntando verso un approccio data-driven della loro gestione. Questo significa che le decisioni vengono prese basandosi su dati, tradotti in informazioni e fatti oggettivi, e non sensazioni; più corrette e precise saranno queste informazioni migliori saranno di conseguenza le decisioni.
Ed è proprio da questo attuale contesto, caratterizzato da un’inarrestabile crescita dei volumi dei dati, dalla loro varietà sempre meno omogenea e dai data needs sempre più rapidi, che emerge l’esigenza delle aziende di avere un dato certificato realmente: qui nasce la Data Quality.
Nonostante l’implementazione di processi di Data Integration, Data Warehouse, Data Lake ecc. che riconducano i dati a un tracciato definito, non c’è la sicurezza che i dati siano corretti e di qualità. E come è ben risaputo, dati di qualità portano alle aziende una serie di benefici:
- decisioni migliori,
- maggiori introiti,
- risparmio di tempo,
- maggior confidenza nei sistemi analitici,
- minori costi,
- maggior customer satisfaction.
Le misure della qualità dei dati
Ma in base a che cosa viene valutata la qualità dei dati? Al fine di elaborare degli standard per la Data Quality è stato introdotto in Horsa un framework che consente di misurare la qualità dei dati attraverso 6 dimensioni:
- Completezza: la percentuale di dati di qualità rispetto al totale
- Tempestività: quanto i dati rappresentano la realtà nel momento richiesto
- Validità: i dati sono conformi alla sintassi (formato, tipo, intervallo) della loro definizione?
- Unicità: nessuna entità unica verrà salvata più di una volta nei sistemi
- Accuratezza: i dati descrivono correttamente il “mondo reale”?
- Consistenza: c’è differenza, quando si confrontano due o più rappresentazioni di un’entità con la loro definizione?
Se prendiamo ad esempio il campo “indirizzo” nella base dati di un’azienda che fa consegne e questo campo manca di alcune delle informazioni fondamentali (completezza), o non è aggiornato (tempestività) o contiene il civico al posto del CAP (validità), ne conseguiranno delle consegne sbagliate e tutti i relativi problemi collegati.
La Data Quality come processo
Il tema della Data Quality è una questione di processo iterativo e continuo, che fa da cappello a tutto quello che è la Data Governance, intesa come governo del dato comprensivo di obblighi normativi e individuazione di una platform che consenta di gestire ruoli, metadati, regole di business, regole di quality e infine la tecnologia. Dunque, non è un processo strettamente tecnologico, ma iterativo e fatto soprattutto di persone e di coinvolgimento continuo, dove alla base ci sono la definizione di ruoli e processi aziendali.
Conclusioni
La Data Quality rappresenta quindi un ambito di fondamentale importanza all’interno di un’azienda. Necessita di attenzione e investimenti in quanto primo step verso la garanzia della bontà delle informazioni aziendali, base per fare decision making in modo più efficiente.