Il mondo dei dati è cambiato profondamente, in particolare con l’introduzione dell’IoT, i Big Data e il cloud e più di recente con l’intelligenza artificiale. Sono aumentate le sorgenti dati, con nuove interfacce e formati, ma allo stesso tempo sono cambiate anche le destinazioni, con l’introduzione dei Data Lake ed altri servizi di Analytics. È cambiata anche l’esigenza della fruibilità del dato, con la necessità di eseguire trasformazioni e movimentazioni sempre più real-time o near real-time. È per questo motivo che si rendono necessarie piattaforme “moderne” di analisi dati: le Modern Data Platform.
Molte organizzazioni si trovano a dover gestire una nuova ricchezza informativa, data dalla proliferazione delle sorgenti dati. Il nuovo scenario comporta un cambiamento nel sistema di analisi delle aziende: le Data Platform devono evolversi, esattamente come è successo con il traditional data warehouse, diventato modern data warehouse.
Cos’è una modern data platform?
Per descrivere la modern data platform partiamo confrontandola con il traditional data warehouse. Uno dei primi aspetti riguarda la tipologia dei dati: invece di essere incentrata principalmente sull’elaborazione dei dati, come facevano i primi data warehouse, la versione “moderna” si basa sull’archiviazione di molti dati da più fonti, in vari formati, e sull’acquisizione di insights sufficientemente utili da guidare le decisioni aziendali.
Un altro aspetto importante di confronto è la gestione dei volumi di dati: al contrario delle modern data platform, i traditional data warehouse in genere hanno difficoltà a tenere il passo con le crescenti sfide di grandi volumi di dati, che si tratti di dati strutturati e non strutturati gestiti in locale o dati basati su cloud ospitati da terze parti.
Nel tempo, per rispondere alle necessità di analisi sempre più evolute, a fianco delle piattaforme tradizionali sono stati introdotti i Data Lake, repository che accettano dati da più origini e possono archiviarli in qualsiasi formato, legati principalmente sui casi d’uso della data science. Rimanevano però due ambienti di analisi separati, e c’era la necessità di trovare un modo per unificarli. Da qui nasce il concetto di modern data platform: con essa si ha la possibilità di unire in un unico ambiente tutte le necessità di analisi e si possono gestire adeguatamente i dati multi-strutturati in un’unica piattaforma. La modern data platform è sia una piattaforma di analisi completa che un “warehouse” organizzato dei dati, e a differenza di un Data Lake esalta i concetti di governance e certificazione del dato.
Cosa puoi fare con una modern data platform
La modern data platform semplifica, ottimizza e migliora il lavoro in diversi ambiti.
- Puoi gestire origini dati relazionali e non relazionali, come Hadoop: è il data management and processing. La modern data platform può gestire i dati in tempo reale utilizzando soluzioni di streaming in real-time. Può facilmente uniformare i dati interni on-premise con i dati cloud e, infine, fornisce un motore analitico per l’analisi predittiva e l’esplorazione interattiva di dati aggregati da diverse prospettive.
- La modern data platform arricchisce i dati con le funzionalità ETL e li prepara attraverso tecniche di big data (ELT o INGESTION). Fornisce inoltre un modo per interrogare facilmente i dati relazionali e non relazionali attraverso un singolo servizio di query federato (linguaggio SQL). È il cosiddetto data enrichment and federated query.
- Parlando più in generale di funzionalità di business intelligence e data science, possiamo dire che il sistema deve supportare tutti gli strumenti che le organizzazioni possono utilizzare per ottenere informazioni dai dati. Ciò include strumenti self-service che semplificano l’analisi da parte degli analisti aziendali dei dati con strumenti di BI che in azienda già si conoscono. Gli utenti aziendali hanno bisogno di un modo per creare analisi in un ambiente condiviso e su differenti dispositivi. La modern data platform deve inoltre supportare una nuova generazione di analisi, dove i data scientist eseguono sperimentazioni sui dati con modelli analitici predittivi e forniscono assistenza nel processo decisionale in tempo reale.
I vantaggi di una modern data platform
Esistono diversi aspetti positivi nell’introdurre o migrare verso una soluzione di modern data platform:
- Ottimizzazione dei tempi. Per quanto riguarda gli utilizzatori e gli amministratori, si potranno notare dei miglioramenti nei tempi di gestione; in particolare avremo una riduzione nei tempi di preparazione dei dati e quindi più tempo da dedicare per introdurre funzionalità di analisi avanzate.
- Riduzione dei costi. L’organizzazione potrà avere in tempi brevi una riduzione dell’overall cost of ownership e potrà aumentare la produttività degli analisti.
- Una architettura che permette di coprire tutti gli ambiti di analisi. Si avrà a disposizione una piattaforma sempre disponibile per le analisi e scalabile, per sostenere grandi volumi di dati e un numero elevato di utenti concorrenti. Sarà inoltre possibile definire diversi livelli di caricamento ed aggiornamento dei dati sia in modalità batch che in real-time.
Conclusioni: perché adottare una modern data platform
Adottare una soluzione di modern data platform permette alle organizzazioni di avere una piattaforma di analisi completa, dove tutti gli utilizzatori possono avere sempre a disposizione tutti i dati e le informazioni utili per generare gli insights di business.
Infine, una nota sul tipo di piattaforma da adottare. Un ruolo importante spetta al cloud, che offre maggiore scalabilità delle risorse e flessibilità nella gestione dei costi operativi, mantenendo un alto livello di servizio sia in termini di disponibilità che di performance. Inoltre, la flessibilità e la scalabilità ricoprono un ruolo importante nel mantenere un ambiente di analisi sempre al passo con le mutevoli esigenze del business e del mercato, rendendo costante nel tempo il livello delle performance richieste e potendo aggiungere funzionalità in qualsiasi momento, quando se ne ha necessità, senza dover rimettere in discussione l’architettura adottata.