Tags
Perché il Data Warehousing è il futuro noioso, brutale e meraviglioso dei dati
Martyn Rhisiart Jones
A Coruña, 12/05/2025
Il moderno data stack si è trasformato in un sistema idraulico cyberpunk: tubi infiniti che alimentano altri tubi, strati sovrapposti come l’ampliamento di un loft costruito da qualcuno che ha imparato la falegnameria su TikTok. Da qualche parte un CTO insiste ancora sul fatto che il data lake “genererà valore aziendale da un trimestre all’altro”, con la stessa calma di qualcuno che sta negoziando con il proprio rapitore.
Le conferenze sui Big Data sono diventate tende da revival che predicano la salvezza attraverso più nodi, mentre nell’angolo il data warehouse rimaneva silenzioso: noioso, prevedibile e fastidiosamente competente.
Questa è la storia di come abbiamo scambiato il caos per innovazione e del perché stiamo tornando all’architettura che ha sempre funzionato.
La grande bugia dei Big Data
I Big Data hanno venduto l’idea che se avessimo raccolto ogni clic, registro e starnuto, le informazioni sarebbero apparse magicamente. Era la versione tecnologica di buttare tutte le ricevute in un cassonetto e chiamarlo “contabilità”. Hadoop si diffuse rapidamente, ma non produsse grandi risultati. Le aziende non si concentrarono sui dati; divennero ossessionate dalle infrastrutture, bruciando denaro e insistendo sul fatto che il problema non fosse abbastanza pressante. Dopo un decennio di scalabilità a tutti i costi, solo le bollette del cloud riuscirono a scalare davvero.
Data Lake: il cassetto dei rifiuti digitali
I data lake avrebbero dovuto essere spazi neutrali, flessibili e aperti. Invece divennero discariche aziendali: il posto in cui tutti potevano nascondere qualcosa che avrebbero “sistemato in seguito”. Lo schema in lettura divenne lo schema in rimpianto. I data lake si trasformarono in paludi piene di file Parquet dimenticati e secchi ricordati a metà. Promettevano possibilità e portavano confusione.
Lakehouse: costruire un capannone su una palude
Lakehouse ha cercato di recuperare la metafora: “E se costruissimo un magazzino sopra la palude?” È una casa di cura a metà strada, troppo complessa per essere semplice, troppo fragile per essere affidabile. È una tecnologia progettata come un programma di ristrutturazione in cui tutti ignorano educatamente il fatto che le fondamenta siano di cartone bagnato.
Data Mesh: una commedia sul posto di lavoro trasformata in horror
Data Mesh è meraviglioso in teoria: ogni team è proprietario dei propri prodotti dati. In pratica, presuppone che ogni reparto sappia scrivere contratti, gestire la governance, mantenere le pipeline e mantenere la calma. La maggior parte dei team fa fatica a reimpostare una password. Aspettarsi che gestiscano una mini piattaforma dati è un ottimismo al limite della negligenza. È sociologia travestita da architettura.
The Warehouse: l’adulto nella stanza
Mentre l’hype continuava a crescere, il magazzino continuava a fare l’unica cosa che funziona costantemente: imporre una struttura. Impone decisioni, rimuove ambiguità e rifiuta assurdità. Non insegue le tendenze; fornisce risposte. I magazzini sono noiosi come i ponti sono noiosi: ingegneria solida che rimane in piedi.
Perché il warehousing vincerà nel prossimo decennio
Gli architetti moderni stanno riscoprendo semplici verità:
Dati puliti sono meglio di molti dati.
Dati strutturati sono meglio di flessibilità arbitraria.
Dati corretti sono meglio di “lo ripuliremo più tardi”.
L’intelligenza artificiale non vuole la tua palude. Vuole informazioni affidabili e gestite. I modelli addestrati sui fanghi di lago si comportano come parenti rumorosi ma sicuri di sbagliarsi a Natale. I magazzini producono la coerenza di cui l’intelligenza artificiale ha effettivamente bisogno.
Il futuro: noioso e fiero di esserlo
Dopo anni di parole d’ordine, diagrammi intricati e marketing mascherato da innovazione, siamo tornati all’architettura che ha funzionato fin dall’inizio. La struttura è scalabile; il caos non lo è mai stato. Il magazzino ha sempre avuto ragione.
Le aziende che vinceranno saranno quelle che sceglieranno la chiarezza al posto del caos: una brutta notizia per le organizzazioni la cui strategia dati attualmente assomiglia a un dipinto di Jackson Pollock.
La grande rivelazione degli anni ’20? Il futuro appartiene alla tecnologia noiosa che funziona.
Buona fortuna a venderla in una slide di presentazione.
Grazie mille per la lettura!
https://goodstrat.com/2025/11/14/top-10-technology-trends-for-2026/
https://goodstrat.com/2025/11/07/the-good-data-bible-set-theory/
https://goodstrat.com/2025/11/05/energy-variable-renewables-cut-costs-long-term/
https://goodstrat.com/2025/12/02/how-agentic-ai-is-reshaping-work-and-life-balance/
https://goodstrat.com/2025/11/14/top-10-technology-trends-for-2026/
https://goodstrat.com/2025/11/02/pearls-of-ai-wisdom/
https://goodstrat.com/2025/12/04/agentur-ki/
https://goodstrat.com/2025/12/04/les-risques-de-lia-dagence-entre-autonomie-et-ethique/
https://goodstrat.com/2025/12/04/la-ia-agencial/
https://goodstrat.com/2025/12/03/an-abridged-guide-to-agentic-ai-with-a-side-of-existential-dread/