Tags

, , , , , , , , , , , , , , , , , , ,


Segovia 20th December 2025

Il Data Warehouse è morto. Lunga vita al Data Warehouse.

Nel 1992, Bill Inmon coniò il termine “data warehouse”. Definì quattro regole sacre: orientato al soggetto, integrato, non volatile, e variabile nel tempo. Era il modello per una fortezza della verità, costosa, on-premise, elaborata in batch e assolutamente indispensabile. Facciamo un salto in avanti di tre decenni. La fortezza è stata sostituita da qualcosa che assomiglia a una piattaforma cloud iperscalabile. Questa piattaforma può gestire contemporaneamente i tuoi modelli di intelligenza artificiale e la dashboard del tuo CEO. Benvenuti al data warehouse nel 2025.

La trasformazione è stata tettonica. Quelli che un tempo erano rack di hardware ronzanti in uno scantinato sono ora piattaforme completamente gestite e serverless. Scalano elaborazione e storage in modo indipendente. Queste piattaforme ti fanno pagare solo per ciò che usi effettivamente. Ti permettono di acquisire petabyte di dati in streaming senza alcuna fatica. Snowflake, Google BigQuery, Amazon Redshift, Microsoft Fabric. Questi sono i nuovi nomi in circolazione. Stanno riscrivendo le regole. Nel frattempo, conservano silenziosamente quelli vecchi.

I volumi di dati sono esplosi. Metà dei dati è in formato JSON o Parquet semi-strutturato. L’altra metà è sempre più destrutturata e richiede a gran voce l’integrazione di vettori. I leader aziendali non aspettano più fino a domani mattina per i numeri di ieri; vogliono informazioni prima che il caffè sia freddo. E il cloud computing ha trasformato l’infrastruttura a costo fisso in un’utilità che si può regolare come un termostato.

Il risultato è un data warehouse moderno. Appare molto diverso dalla visione originale di Inmon. Tuttavia, obbedisce ancora ai comandamenti fondamentali di Inmon.

È ancora orientato all’oggetto. I dati sono organizzati in base a domini aziendali come clienti, vendite e inventario. Questa organizzazione utilizza schemi a stella, schemi a fiocco di neve o livelli semantici. Questi livelli sono creati con strumenti come dbt e Looker.

È ancora integrato. Pipeline ETL/ELT, cataloghi di dati e framework di governance garantiscono che fonti diverse diventino un’unica fonte di verità. Alcuni esempi includono Snowflake Horizon e BigQuery Data Catalogue.

È ancora una variabile temporale. Le tabelle con timestamp e le dimensioni di Tipo 2 che cambiano lentamente ne sono un esempio. Funzionalità come TIME TRAVEL di Snowflake o SYSTEM_TIME di BigQuery permettono di chiedersi “cosa sapevamo il 15 marzo?”.

Ed è ancora non volatile, almeno per la maggior parte. Le transazioni ACID ora consentono aggiornamenti ed eliminazioni controllati. (Ciao, GDPR.) Tuttavia, il nucleo analitico rimane di sola aggiunta o con tracciamento delle modifiche. Preserva la cronologia in modo sacro come sempre. Gli adattamenti sono ciò che fa la differenza. Lo streaming in tempo reale (connettori Kafka, Snowflake Streams, BigQuery Streaming) sostituisce i processi batch notturni. Il machine learning e la ricerca vettoriale in-database potenziano le applicazioni di intelligenza artificiale senza spostare i dati. I livelli semantici self-service consentono agli utenti aziendali di esplorare i dati senza dover implorare l’IT per un nuovo report. Storage ed elaborazione sono disaccoppiati. È possibile archiviare exabyte a basso costo. È possibile avviare migliaia di query simultanee senza dover riscrivere il budget.

Quindi, il data warehouse moderno segue ancora i principi di Inmon? Sì. Inequivocabilmente. Lo spirito sopravvive, anche se il corpo è stato ricostruito da zero.

Il problema è che questa evoluzione ha reso la scelta della piattaforma più importante che mai. Se si sceglie male, ci si ritrova vincolati a un unico fornitore cloud. Si rischia di ritrovarsi con costi imprevedibili. Si potrebbe anche ritrovarsi con un sistema incapace di tenere il passo con i carichi di lavoro dell’intelligenza artificiale di domani. Scegliendo la piattaforma giusta, si ottiene una piattaforma che offre prestazioni di livello enterprise. Offre una governance ferrea e prezzi prevedibili. Rimane accessibile a tutti, dai data engineer al team di marketing.

Nel 2025/2026, il data warehouse non è morto. È solo rinato come qualcosa di più veloce, economico e molto più potente di quanto Inmon avrebbe potuto immaginare. Le vecchie regole sono ancora valide. Le nuove sono semplicemente molto più divertenti.