Sempre più spesso oggi la crescita dei dati all’interno delle aziende avviene secondo una modalità che potremmo definire “Data chaos” piuttosto che tramite un percorso organico, scalabile e sostenibile. Una delle soluzioni a questa problematica, che ha peculiarità sia tecnologiche che di processo, è il Data Catalog.
Le aziende e la difficoltà nella ricerca ed accesso ai dati
Negli ultimi anni la Digital Transformation, e l’inarrestabile ascesa di tutti gli scenari ad essa correlati, hanno fatto crescere in maniera esponenziale il volume dei dati trattati dalle aziende ed anche l’eterogeneità dei sistemi informatici che li producono e li consumano. Molto spesso, a questa crescita impetuosa, non corrisponde un percorso evolutivo organico e sostenibile (sia dal punto di vista architetturale che di processo) che la vada ad affiancare. Ci si può quindi ritrovare, ad un certo punto, di fronte ad una matassa di fili difficile da districare. Si pensi a:
- Conoscenza non completa e capillare di:
- Patrimonio informativo
- Architettura dei sistemi
- Decentralizzazione dei dati (assenza di Master Data)
- Conseguente difficoltà nel comprendere chi sono i Data Owner.
- Incapacità di recuperare il Lineage tecnico (dei dati) e di Business (dei flussi tra i processi).
- Assenza di un’orchestrazione di tali flussi
- Difficoltà nel segregare i dati per profilo di visibilità
- Incapacità di comprendere in quale punto della supply chain del dato si siano generati degli errori
In scenari di questo tipo, e senza un’azione mirata e tarata sulla singola situazione aziendale, anche la semplice operazione di ricerca ed accesso ai propri dati può diventare molto difficoltosa. Si pensi per estremizzare a quanto diventi complesso, sotto queste condizioni, raggiungere l’obiettivo data driven che ogni azienda moderna deve porsi.
Data Catalog: perché aiuta ad orientarsi tra i dati aziendali
Un Data Catalog è sostanzialmente l’inventario aziendale dei dati, dei metadati e delle entità ad essi correlate. È la bussola che permette ad un’azienda di navigare tra i suoi dati e soprattutto di iniziare ad andare della direzione data driven.
Una soluzione Data Catalog infatti permette di raggiungere i seguenti obiettivi:
- Accentrare i dati: l’esistenza del catalogo dei dati, di per sé, rappresenta un traguardo perché si ha la mappa del patrimonio informativo aziendale.
- Definizione di Business Glossary aziendale e dell’interpretazione personale sul significato di dati, logiche di Business ecc.
- Documentazione architetturale e delle relazioni tra le componenti.
- Implementazione delle tecniche di Lineage su dati, flussi di processo ecc. e conseguente documentazione (anche dei metadati).
- Supporto (via AI e ML) alla Data Quality, così da intercettare per tempo problematiche sulla qualità del dato, e più in generale su tutti gli automatismi che possano portare valore alla catena del dato.
- Segregazione logica dei dati: il Data Catalog permette l’automazione delle politiche di masking dei dati abbinate ad una gestione della profilazione degli stessi che vada di pari passo con la Data Governance aziendale.
- Supporto alla Data Governance anche attraverso la definizione dei profili che vanno in relazione diretta coi ruoli previsti (appunto) da una politica di Data Governance.
Data Catalog: possibili pattern implementativi
L’adozione di un Data Catalog, che va di pari passo con quella di una Data Governance aziendale, può spesso spaventare perché sembra essere un processo lungo, complesso e che coinvolge persone, processi e tecnologie differenti. Come in ogni data journey efficace, l’adozione di un Data Catalog dev’essere vista come un insieme di step propedeutici al raggiungimento del traguardo finale. Quest’iniziativa, inoltre, rientra all’interno dell’adozione del più ampio processo di Data Governance che ogni azienda data driven deve intraprendere. Diventa essenziale dunque, per capire quali sono gli step che la tua azienda deve fare, comprendere essenzialmente a che punto l’azienda è oggi.
Si rimanda a tal proposito al webinar sotto riportato in cui abbiamo raccontato come adottare un percorso di Data Governance in una realtà aziendale italiana e, per estensione, come approcciare questo percorso alla parte di Data Catalog.