Data Catalog: come ottenere il controllo dei dati

I dati aziendali, provenienti da fonti sempre più numerose ed eterogenee, rappresentano, se ne sfruttiamo il potenziale, un fattore abilitante per la strategia delle organizzazioni. Ma spesso una scarsa conoscenza e capacità di controllo ne limitano una piena espressione in termini di valore. Come colmare questo gap? Con il Data Catalog.

Perché è necessario un Data Catalog per la maturità aziendale

Non è semplice definire il concetto di “maturità aziendale”: ad essa, infatti, concorrono parametri diversi, e può essere misurata secondo numerose modalità. In linea generale, potremmo dire che più un’azienda è “matura”, più è in grado di far lavorare in maniera efficace i fattori della produzione. In questo senso, la maturità di un’azienda si misura secondo la sua capacità di essere efficiente, veloce, ma anche consapevole. La maturità aziendale si può raggiungere in diversi ambiti (alcuni prima di altri); in questo articolo prendiamo in considerazione la maturità che esprimono le aziende nell’uso dei dati.

Per ottenere un buon grado di maturità aziendale nell’utilizzo dei dati, bisogna innanzitutto prestare attenzione a queste due tensioni:

  • la capacità di farsi le domande giuste;
  • la capacità di selezionare il minimo set di informazioni con le quali le persone debbano relazionarsi

Il numero giusto deve essere comunicato quando serve, a chi ne ha bisogno e per soddisfare una precisa necessità informativa.

La qualità è sempre più importante della quantità: è preferibile infatti avere dati distillati, piuttosto che una mole di informazioni poco sfruttate, non categorizzate e di bassa o (peggio) sconosciuta qualità. Per ridurre la quantità e organizzare correttamente la supply-chain del dato, è sempre più necessario procedere all’adozione di un Data Catalog.

Esso rappresenta infatti uno strumento imprescindibile per raggiungere lo stato di “azienda matura”. Un Data Catalog è uno strumento di Governance che organizza le informazioni sotto il punto di vista logico per profilare e sintetizzare, comprendere e distribuire. Un’azienda matura è, infatti, quella che riesce ad affrontare la complessità e usa i dati come elemento per comprenderla e anticiparla.

Data Catalog: cos’è e perché migliora i tuoi dati

La quantità di dati necessari ad un’azienda deve essere gestita ed ordinata in modo da ricavare informazioni sintetiche e strategicamente utili. Il compito principale di un Data Catalog è questo: facilitare la lettura dei dati, ordinarli, osservarli, capirne il ciclo di vita.

Un Data Catalog, quindi, non è che un moderno e potente inventario per censire tutti i data asset di un’impresa e le entità ad essa connesse. Uno strumento indispensabile per ottenere informazioni chiare, ordinate e utili sotto il punto di vista strategico ed operativo, che deve necessariamente avere queste caratteristiche:

  • capacità di mettere a disposizione i dati aziendali in modo assistito e controllato;
  • possibilità di digerire, determinare le specifiche caratteristiche e organizzare in un modello strutturato di metadati le fonti informative più disparate
  • supportare le tecniche di Data Lineage e Impact Analysis, come gestione del lineage di business (flussi di informazioni tra processi), lineage tecnico (flussi di dati fisici tra sistemi IT) e lineage verticale (identificazione dei data asset IT che rappresentano fisicamente le informazioni del business);
  • supportare lo sviluppo, la gestione e la manutenzione dei workflow a supporto dei processi data intensive;
  • farsi carico e facilitare i processi di Data Governance e compliance normativa;
  • abilitare automatismi, anche basati su logiche di AI e Machine Learning

I metadati che compongono un Data Catalog sono così organizzati in modo che si possa facilmente sapere dove risiedono i dati, capirne la semantica, valutarne la qualità e consentirne l’accesso in modo agevole e controllato agli attori interessati. Ogni persona autorizzata può, attraverso il Data Catalog, individuare un set di informazioni rilevanti, comprenderne il significato, determinarne le relazioni con altre informazioni per sostenere il valore d’impresa.

Tutti i vantaggi del Data Catalog

La mancanza di uno strumento di catalogazione, governance e controllo come il Data Catalog spinge, ancora oggi, le aziende ad effettuare una segregazione fisica dei dati per proteggerli e garantirne la sicurezza. Si ricorre generalmente ad una scelta hard, secondo cui soltanto alcuni reparti possono accedere a determinate informazioni.

Il Data Catalog, in questo senso, permette di segregare logicamente i dati: in questo modo si può decidere chi può vedere quali informazioni, limitando l’accesso, abilitando il masking dei dati o l’anonimizzazione (pseudonimizzazione) e garantendo la sicurezza.

Altra caratteristica del Data Catalog è quella di gestire la condivisione della conoscenza: una volta che le informazioni sono state aggregate ed ordinate, al punto di poter esprimere valore dalla loro analisi, si può condividere l’exploit con tutta l’organizzazione in modo che il dato diventi patrimonio diffuso.

Il Data Catalog è dunque un luogo per gestire e favorire l’uso dei dati, ma non solo. Esso parte dall’organizzazione di quest’ultimi, per arrivare all’isolamento di eventuali problemi e bug, identificandoli e risolvendoli rapidamente. In questo modo, anche la Data Quality viene nettamente migliorata.

ebook Data Strategy HORSA

Tag