Tags

, , , , , , , , , , , , , , ,


Segovia 20th December 2025

El almacén de datos ha muerto. ¡Viva el almacén de datos!

En 1992, Bill Inmon acuñó el término “almacén de datos” y estableció cuatro reglas sagradas: orientado al sujeto, integrado, no volátil y variable en el tiempo. Era el modelo para una fortaleza de la verdad, costosa, local, con procesamiento por lotes y absolutamente indispensable. Tres décadas después, la fortaleza ha sido reemplazada por algo similar a una plataforma en la nube a hiperescala. Esta plataforma puede ejecutar simultáneamente tus modelos de IA y el panel de control de tu director ejecutivo. Bienvenido al almacenamiento de datos en 2025.

La transformación ha sido tectónica. Lo que antes eran racks de hardware zumbando en un sótano ahora son plataformas totalmente administradas y sin servidor. Escalan la computación y el almacenamiento de forma independiente. Estas plataformas te cobran solo por lo que realmente usas. Te permiten ingerir petabytes de datos en streaming sin esfuerzo. Snowflake, Google BigQuery, Amazon Redshift, Microsoft Fabric. Estos son los nuevos nombres del mercado. Están reescribiendo las reglas. Mientras tanto, conservan discretamente los antiguos.

El volumen de datos se ha disparado. La mitad de los datos son JSON semiestructurados o Parquet. La otra mitad está cada vez más desestructurada y necesita incrustaciones vectoriales. Los líderes empresariales ya no esperan hasta mañana por la mañana para ver los números de ayer; quieren información antes de que se enfríe el café. Y la computación en la nube ha convertido la infraestructura de coste fijo en una utilidad que se puede ajustar al alza o a la baja como un termostato.

El resultado es un almacén de datos moderno. Parece muy diferente de la visión original de Inmon. Sin embargo, sigue obedeciendo a los principios fundamentales de Inmon.

Sigue estando orientado a temas. Los datos se organizan en torno a dominios empresariales como clientes, ventas e inventario. Esta organización utiliza esquemas en estrella, esquemas de copo de nieve o capas semánticas. Estas capas se construyen con herramientas como dbt y Looker.

Sigue estando integrado. Las canalizaciones ETL/ELT, los catálogos de datos y los marcos de gobernanza garantizan que las distintas fuentes se conviertan en una única fuente de verdad. Algunos ejemplos son Snowflake Horizon y BigQuery Data Catalogue.

Sigue siendo variable en el tiempo. Las tablas con marca de tiempo y las dimensiones de tipo 2 que cambian lentamente son ejemplos. Funciones como TIME TRAVEL de Snowflake o SYSTEM_TIME de BigQuery permiten preguntarse “¿qué sabíamos el 15 de marzo?”.

Y sigue siendo no volátil, al menos en su mayor parte. Las transacciones ACID ahora permiten actualizaciones y eliminaciones controladas. (¡Hola, RGPD!). Sin embargo, el núcleo analítico sigue siendo de solo anexión o con seguimiento de cambios. Conserva el historial con la misma confidencialidad que siempre. Las adaptaciones marcan la diferencia. La transmisión en tiempo real (conectores de Kafka, Snowflake Streams, BigQuery Streaming) reemplaza los trabajos por lotes nocturnos. El aprendizaje automático en la base de datos y la búsqueda vectorial impulsan las aplicaciones de IA sin mover datos. Las capas semánticas de autoservicio permiten a los usuarios empresariales explorar los datos sin tener que pedirle al departamento de TI un nuevo informe. El almacenamiento y la computación están desacoplados. Se pueden almacenar exabytes a bajo costo. Se pueden generar miles de consultas simultáneas sin reescribir el presupuesto.

Entonces, ¿el almacén de datos moderno sigue los principios de Inmon? Sí. Sin lugar a dudas. Su espíritu perdura, incluso si el cuerpo ha sido reconstruido desde cero.

El problema es que esta evolución ha hecho que la elección de la plataforma sea más importante que nunca. Si elige mal, quedará atado a un único proveedor de nube. Podría tener que asumir costes impredecibles. También podría quedarse con un sistema incapaz de seguir el ritmo de las cargas de trabajo de IA del futuro. Elija la opción correcta y obtendrá una plataforma que ofrece un rendimiento de nivel empresarial. Ofrece una gobernanza férrea y precios predecibles. Sigue siendo accesible para todos, desde los ingenieros de datos hasta el equipo de marketing.

En 2025/2026, el almacén de datos no ha muerto. Simplemente ha renacido como algo más rápido, más económico y mucho más potente de lo que Inmon podría haber imaginado. Las viejas reglas siguen vigentes. Las nuevas son simplemente mucho más divertidas.

Many thanks for reading.


Discover more from GOOD STRATEGY

Subscribe to get the latest posts sent to your email.