Oggi più che mai i dati aziendali rappresentano una fonte strategica di informazioni per il business.
Ma per ottenere indicazioni davvero utili occorre sapere interpretare tali dati in modo opportuno con strumenti adatti, come un data warehouse. Si tratta di un sistema centralizzato dove sono raccolte informazioni di varia natura e che permette all’azienda di avere i numeri necessari ad analizzare il proprio business. All’interno di un data warehouse si possono far confluire più database, che vengono analizzati per ricavare informazioni di importanza strategica nella pianificazione dei processi aziendali.
Un data warehouse permette di soddisfare necessità di data governance e di decision making attraverso una reportistica flessibile e analisi dettagliate. Per ottenere questi risultati è bene stabilire anzitutto una roadmap degli obiettivi che si vogliono raggiungere. A tale scopo dovrebbe essere implementata un’architettura semplice ma versatile, che possa scalare ed essere ottimizzata in funzione delle esigenze, che offra la possibilità, quando necessario, di integrare sistemi di terze parti e che permetta di realizzare nuovi e più specifici report.
Un data warehouse non dovrebbe essere una struttura monolitica ma uno strumento capace di evolvere e di adattarsi alle necessità operative per migliorare il business nel suo insieme.
I data warehouse sviluppati seguendo queste best practice abilitano efficaci servizi di business intelligence e l’impiego di quelle capacità analitiche che trasformano un’organizzazione in una vera e propria data driven company.
Come si costruisce un data warehouse
Creare un data warehouse non significa dover introdurre nuovi dati all’interno del sistema informativo aziendale, quanto invece riorganizzare quelli già presenti per sfruttarli al meglio.
Ma allora quando è importante poter disporre di un data warehouse? Quando si ritiene che si possa trarre un vantaggio strategico dall’analisi delle prestazioni di business nel tempo. Proprio per questo, ancor prima di definire la struttura che avrà il data warehouse, è opportuno stabilire una precisa strategia analitica da implementare su uno o più temi della data driven strategy aziendale. La definizione di tale strategia è basilare perché permette di disegnare un data warehouse che possa scalare in funzione delle necessità che via via si verranno a creare e che quindi si possa facilmente adattare a sviluppi futuri.
L’acquisizione dei dati può essere poi effettuata tramite processi ETL (Extract-Transformation-Load), che permettono di attingere da fonti remote omogenee o eterogenee svariati tipi di informazioni e di farle passare attraverso un processo che le arricchisce e le trasforma in un formato relazionale gestibile dal data warehouse.
Il progetto del data warehouse dovrebbe poi tenere conto del tipo di query che è necessario supportare. In questo senso, si deve considerare chi sarà fruitore di tali query: se si tratta del personale di business si potranno prevedere query ad hoc o di service BI, mentre se si prevede che saranno effettuate analisi da parte dei data scientist bisognerà prevedere l’impiego di strumenti specifici che possano includere l’impiego del machine learning.
Un altro punto da valutare è la scelta di un data warehouse on premise o su cloud. Anche in questo caso, la scelta ricadrà su una o sull’altra opzione a seconda delle esigenze e risorse specifiche presenti nel contesto aziendale. Va però sottolineato che le soluzioni basate su cloud oggi offrono vantaggi innegabili in termini di flessibilità, scalabilità e ottimizzazione dei costi.
Infatti, un data warehouse in cloud consente analytics più rapidi e insights più utili perché mette a disposizione le risorse giuste al momento giusto: quando ne servono di più si attivano quelle da integrare e si disattivano quando non sono più necessarie (questo processo può essere anche impostato perché avvenga in automatico). Il tutto senza dover acquistare né apparecchiature né applicazioni, ma avendo la sicurezza che hardware e software utilizzati siano sempre aggiornati e basati sulle tecnologie più attuali.
Più è blindato, più è veloce
L’obiettivo del data warehouse dovrebbe essere quello di ottimizzare le attività di specifiche unità aziendali, come per esempio la produzione, il customer care o la logistica, per migliorare il business nel suo insieme. Per ottenere questo risultato si può strutturare il data warehouse come un sistema a blocchi.
Tali blocchi sono chiamati data mart e, in pratica, si possono assimilare a dei sottoinsiemi di dati “estratti” dal database globale che consentono di avere rapido accesso alle informazioni inerenti specifiche unità aziendali. Per via della sua struttura, questo approccio si definisce “blindato”. Ma non ci si lasci ingannare dal nome: è il migliore per consentire di avere un time to deliver più corto e avere risultati in tempi rapidi.
Una visione a lungo temine
Progettare un data warehouse basato su data mart implica la definizione di una roadmap di distribuzione per capire quali saranno i processi coinvolti e quando verranno rilasciati all’interno del data warehouse. Ma impone anche di fare una stima delle eventuali evoluzioni che il sistema avrà nel tempo.
Un punto fondamentale dello sviluppo del data warehouse è infatti che il sistema non deve essere pensato solo per quello che si analizza oggi. Si dovrebbe invece avere una visione più a lungo termine, se possibile anche di qualche anno, che ipotizzi la direzione che potrebbe prendere l’azienda o il business e quindi prevedere quali processi potrebbero essere potenzialmente coinvolti nel data warehouse e nelle analisi.
Per far sì che il data warehouse sia un sistema che duri nel tempo con determinate caratteristiche di performance e una gestione ottimizzata, devono essere poi previsti un monitoraggio dell’intero sistema e precise procedure di ottimizzazione. In questo caso, sono le soluzioni su cloud a permettere una maggiore flessibilità.
Una considerazione conclusiva
La scelta di implementare un data warehouse deve nascere dalla consapevolezza di introdurre in azienda una strategia di data management.
Le componenti di successo passano da diversi fattori, non solamente tecnologici, tutti orientati alla “cultura del dato” che deve essere condivisa in azienda, per trasformare tutti i settori e i livelli di un’organizzazione. La definizione di linee guida strategiche su come gestire e organizzare i dati permette di creare un data warehouse capace di evolversi nel tempo, seguendo i cambiamenti dell’organizzazione o di variabili esterne, in modo da fornire al business insight sempre nuovi.
Tutto questo deve essere supportato da un lato da risorse con rilevanti competenze funzionali di processo e tecniche di gestione dei dati, e dall’altro dalla tecnologia, scegliendo una piattaforma che dia garanzie di flessibilità e scalabilità che oggi sono sostenibili solo dal cloud.