Data quality: perché avere i dati non basta. Come renderli utili e disponibili

Gartner riporta che “ogni anno, una scarsa data quality costa alle organizzazioni in media 12,9 milioni di dollari”. Una cifra eclatante che mostra chiaramente cosa voglia dire non usare dati di qualità nelle decisioni di business. L’ulteriore conferma arriva sempre da Gartner: “A parte l’impatto immediato sulle entrate, dati di scarsa qualità aumentano la complessità degli ecosistemi di dati e portano a decisioni sbagliate. Invece, i dati di qualità forniscono migliori lead e migliorano la comprensione e le relazioni con i clienti. La qualità dei dati è un vantaggio competitivo”.


Cos’è la data quality e perché bisogna prevederla nelle aziende

Ma cosa vuol dire data quality? È un concetto che va oltre la qualità dei dati in sé e riguarda tutto l’insieme di processi atti a monitorare e incrementare, attraverso l’analisi e il miglioramento di tutti i dati aziendali, le caratteristiche che incidono sulla capacità dei dati stessi di soddisfare bisogni dichiarati o impliciti per l’azienda. Come sostiene ancora Gartner, “i leader di D&A (Data & Analytics) devono intraprendere azioni pragmatiche e mirate per migliorare la qualità dei dati aziendali se vogliono accelerare la trasformazione digitale delle loro organizzazioni”. Dati sparsi, ridondanti o non corretti creano disordine e inefficienze all’interno delle aziende, perché non permettono di prendere decisioni corrette e nemmeno di agire nei tempi giusti. E questo riduce le opportunità di possibili introiti.


La data quality in due esempi

Vediamo nel concreto cosa significa avere dei dati di qualità. Prendiamo per esempio l’anagrafica cliente, un tipo di dato presente pressoché in tutte le aziende e che ingloba diverse informazioni relative a email, partita Iva, indirizzo e simili. Immaginiamo di essere un’azienda e-commerce che ha la necessità di inviare via e-mail informazioni promozionali o di spedire prodotti all’indirizzo di un cliente. Se i dati nell’anagrafica non sono stati compilati correttamente o se, per qualche motivo, all’interno dei processi c’è qualcosa che li “sporca”, li elimina o li modifica, si avranno una perdita di efficacia sulle campagne marketing o lamentele da parte del cliente perché non riceve i prodotti.

Immaginate ora di avere un sistema su cui sono attivi vari processi, tramite cui vengono contabilizzati tutti gli ordini, le spedizioni, i resi, i costi e i ricavi dei prodotti. Immaginate di dover prendere delle decisioni in base all’andamento di tali processi e che a un certo punto notate un comportamento anomalo. Vi accorgete che c’è una diminuzione di uno o più dei predetti fattori e non riuscite a spiegarvi il motivo. Nel frattempo, vi viene chiesto di stimare la pianificazione della produzione da raggiungere nei prossimi mesi. Per soddisfare la richiesta, dovrete capire cosa è successo, se la variazione dipende da un problema sui dati oppure da un calo di mercato. Ma se è un problema sui dati, quanto tempo impiegherete a trovare la causa e a risolvere tutto?

La data quality serve a prevenire tali problematiche, e nel caso in cui esse si presentino, a rendere più semplice l’individuazione e la risoluzione, grazie a una migliore percezione e conoscenza dei processi. Non è dunque uno strumento utile solo a monitorare i dati, ma anche i processi che li producono.


Un processo strutturato non delle “toppe”

Da quanto visto, appare chiaro come la data quality sia un tassello fondamentale per le aziende che operano in ottica di un decision making data-driven ed è destinata a diventare uno strumento indispensabile per tutte le aziende che hanno intenzione di crescere e migliorarsi in tale prospettiva.

Gartner prevede che entro il 2022, il 70% delle organizzazioni monitorerà rigorosamente i livelli di qualità dei dati, migliorandoli del 60% in modo da ridurre significativamente i rischi operativi e i costi.

Spesso, però, alcune aziende cercano di risolvere il problema della data quality tramite attività di manutenzione estemporanee, eseguite in fase di sintesi del dato e supportate da mappature in Excel o altri strumenti di revisione manuali.

Tali attività comportano un impegno costante e non indifferente da parte del personale nel tenerle sempre aggiornate, con tutti i rischi di errori “umani” che possono verificarsi. Ma soprattutto non sono altro che toppe sui processi che vanno a risolvere momentaneamente un problema, per poi spesso andare a finire nel “dimenticatoio aziendale”, provocando ulteriori problemi ai processi e dunque compromettendo nuovamente la data quality. Inoltre, tanto più sono presenti questi tipi di “toppe” tanto più costoso e difficile sarà manutenerle nel tempo: tutto ciò senza ottenere minimamente i benefici e la longevità di un processo strutturato.


Come monitorare il processo di data quality

Il processo di data quality viene monitorato attraverso la pianificazione e messa a punto di indicatori sintetici, che permettono di ottenere una valutazione oggettiva dello stato qualitativo delle basi dati e dei relativi ambiti informativi. Tali risultati vengono solitamente rappresentati con strumenti analitici come dashboard, permettendo dunque il controllo continuo del grado di affidabilità delle risorse dati in azienda.

Affinché la data quality porti risultati tangibili è quindi importante considerare due aspetti fondamentali: il monitoraggio della qualità dei dati e l’identificazione delle azioni correttive da intraprendere per la qualità stessa, che devono essere inserite in una scala di priorità di risoluzione.


Non uno standard, ma adattato all’azienda

Il processo di data quality è costruito sulla base di regole standard di monitoraggio (che valutano i dati attraverso criteri di Consistenza, Completezza, Coerenza, Accuratezza, Copertura, Stabilità). Tuttavia, è necessario creare altre regole e metriche sulla base delle caratteristiche di business del dato che si analizza e sulle necessità dell’azienda. Per questo è bene affrontare tali tematiche supportati da specialisti D&A che sappiano guidarci nel percorso, per permettere all’azienda di investire in un processo che darà benefici tangibili, oltre a spingerla verso un più consapevole uso e interpretazione del dato.

Uno studio approfondito sulle dinamiche funzionali e di gestione del dato da parte di esperti D&A, supportati dalle varie funzioni aziendali, permette di creare algoritmi di controllo ad hoc. Questo si traduce in una maggiore tranquillità per l’azienda nelle scelte fatte sulla base dei dati che consulta tutti i giorni.

Infine, l’attività D&A in ambito data quality non si limita soltanto al monitoraggio, ma alla creazione di dashboard data quality che riflettono anche l’impatto delle attività di miglioramento effettuate sui KPI aziendali. È dunque parte essenziale del processo dare un riscontro in termini di benefici sul business e sui ricavi ottenuti a seguito di tali miglioramenti, che giustificheranno le spese inizialmente sostenute.

Uno degli strumenti che risponde ad una parte di tali esigenze è il Data Catalog, spesso utilizzato a supporto del processo di Data Quality, che aiuta ad avere una visione d’insieme dei dati e delle loro relazioni, oltre ad essere uno strumento di studio del dato i cui i risultati e le analisi sono condivisibili con tutti coloro che ne hanno accesso, permettendo di individuare possibili problematiche da risolvere e monitorare.

 

 

New call-to-action

Tag