Tags
AI, Analytics, Artificial Intelligence, azure, cloud, data mesh, Data Warehouse, data-lakehouse, llm, medallion-architecture, technology
Martyn Rhisiart Jones
Segovia, 21st December 2025

מחסן הנתונים מת. יחי מחסן הנתונים.
בשנת 1992, טבע ביל אינמון את המונח “מחסן נתונים” וקבע ארבעה כללים קדושים: מונחה נושא, משולב, לא נדיף, משתנה בזמן. זו הייתה תוכנית אב למבצר של אמת, יקר, מקומי, מעובד באצווה, וחיוני לחלוטין. קפיצה קדימה של שלושה עשורים. המבצר הוחלף במשהו שדומה לפלטפורמת ענן בקנה מידה גבוה. פלטפורמה זו יכולה להריץ בו זמנית את מודלי הבינה המלאכותית שלך ואת לוח המחוונים של המנכ”ל שלך. ברוכים הבאים לאחסון נתונים בשנת 2025.
השינוי היה טקטוני. מה שהיה פעם מדפי חומרה מזמזמים במרתף הוא כיום פלטפורמות מנוהלות במלואן, ללא שרתים. הן מגדילות את המחשוב והאחסון באופן עצמאי. פלטפורמות אלה גובות ממך רק עבור מה שאתה משתמש בפועל. הן מאפשרות לך לבלוע פטה-בייטים של נתונים זורמים מבלי להתאמץ. Snowflake, Google BigQuery, Amazon Redshift, Microsoft Fabric. אלה השמות החדשים בעיר. הם כותבים מחדש את הכללים. בינתיים, הם משמרים בשקט את הישנים.
נפחי הנתונים התפוצצו. מחצית מהנתונים הם JSON או Parquet חצי-מובנים. החצי השני יותר ויותר לא מובנה וצועק להטמעות וקטוריות. מנהיגים עסקיים כבר לא מחכים עד מחר בבוקר למספרים של אתמול; הם רוצים תובנות לפני שהקפה קר. ומחשוב ענן הפך תשתית בעלות קבועה לכלי שירות שניתן לכוון למעלה או למטה כמו תרמוסטט.
התוצאה היא מחסן נתונים מודרני. הוא נראה שונה מאוד מהחזון המקורי של Inmon. עם זאת, הוא עדיין מציית למצוות הליבה של Inmon.
הוא עדיין מכוון נושא. הנתונים מאורגנים סביב תחומים עסקיים כמו לקוחות, מכירות ומלאי. ארגון זה משתמש בסכמות כוכבים, סכמות פתית שלג או שכבות סמנטיות. שכבות אלה בנויות בעזרת כלים כמו dbt ו-Looker.
הוא עדיין משולב. צינורות ETL/ELT, קטלוגי נתונים ומסגרות ממשל מבטיחים שמקורות שונים הופכים למקור אמת יחיד. דוגמאות כוללות את Snowflake Horizon ו-BigQuery Data Catalogue.
הוא עדיין משתנה בזמן. טבלאות עם חותמת זמן וממדים מסוג 2 המשתנים לאט הן דוגמאות. תכונות כמו TIME TRAVEL של Snowflake או SYSTEM_TIME של BigQuery מאפשרות לך לשאול “מה ידענו ב-15 במרץ?”
והיא עדיין לא נדיפה, לפחות לרוב. פעולות ACID מאפשרות כעת עדכונים ומחיקות מבוקרים. (שלום, GDPR.) עם זאת, הליבה האנליטית נותרה מבוססת על הוספות בלבד או מעקב אחר שינויים. היא שומרת על ההיסטוריה בצורה קדושה כתמיד. ההתאמות הן שעושות את ההבדל. סטרימינג בזמן אמת (מחברי Kafka, זרמי Snowflake, סטרימינג של BigQuery) מחליף משימות אצווה בן לילה. למידה חישובית וחיפוש וקטורי בתוך מסד הנתונים מפעילים יישומי בינה מלאכותית מבלי להעביר נתונים. שכבות סמנטיות בשירות עצמי מאפשרות למשתמשים עסקיים לחקור נתונים מבלי להתחנן ל-IT לדוח חדש. אחסון וחישוב מנותקים. ניתן לאחסן אקסה-בייטים בזול. ניתן לייצר אלפי שאילתות בו זמנית מבלי לכתוב מחדש את התקציב.
אז, האם מחסן הנתונים המודרני עדיין פועל לפי עקרונותיו של Inmon? כן. חד משמעית. הרוח ממשיכה לחיות, גם אם הגוף נבנה מחדש מהיסוד.
המלכוד הוא שהאבולוציה הזו הפכה את בחירת הפלטפורמה למשמעותית יותר מאי פעם. אם תבחרו בצורה שגויה, תישארו נעולים לספק ענן יחיד. ייתכן שתיאלצו עלויות בלתי צפויות. ייתכן גם שתיתקעו עם מערכת שלא תוכל לעמוד בקצב עומסי העבודה של הבינה המלאכותית של המחר. בחרו את הנכונה, ותקבלו פלטפורמה המספקת ביצועים ברמה ארגונית. היא מספקת ממשל ברזל ותמחור צפוי. היא נשארת נגישה לכולם, החל ממהנדסי נתונים ועד לצוות השיווק.
בשנת 2025/2026, מחסן הנתונים לא מת. הוא פשוט נולד מחדש כמשהו מהיר יותר, זול יותר וחזק בהרבה ממה שאינמון אולי דמיין. הכללים הישנים עדיין בתוקף. החדשים פשוט הרבה יותר מהנים.
תודה רבה שקראתם.
The 100 most recent articles on goodstrat
Discover more from GOOD STRATEGY
Subscribe to get the latest posts sent to your email.