La Modern Data Stack (MDS) et l'utilisation des #datalakes n'ont pas sonné le glas de la modélisation des données, mais ont plutôt catalysé son évolution. Loin de disparaître, la modélisation s'est adaptée aux nouveaux paradigmes, passant d'une approche préalable rigide à une méthodologie plus souple, appliquée à la demande. Cette transformation reflète la flexibilité accrue offerte par les technologies modernes, où le schéma-on-read supplante le schéma-on-write, permettant le stockage de données brutes et non structurées. Cette nouvelle ère apporte son lot de défis, notamment la gestion de volumes de données plus importants et plus variés, ainsi que la nécessité de concevoir des modèles adaptés au machine learning et à l'intelligence artificielle. Malgré ces changements, l'importance de la modélisation demeure incontestable. Elle reste cruciale pour garantir l'intégrité et la cohérence des données, tout en étant essentielle à leur utilisation efficace dans l'analyse et la prise de décision. Face à ces enjeux, des approches hybrides émergent, combinant habilement méthodes traditionnelles et modernes. Ces nouvelles stratégies permettent d'adapter les modèles aux besoins spécifiques de chaque couche de données, de la source brute aux insights finaux. Ainsi, la modélisation des données, loin d'être obsolète, se réinvente pour répondre aux nouvelles exigences, offrant une flexibilité et une adaptabilité accrues aux besoins évolutifs des entreprises dans un paysage data en constante mutation ! 👉 Rejoignez-nous (online) le Jeudi 30 janvier 2025 à 17h pour en parler !
Rejoignez-nous pour un débat en ligne captivant sur la modélisation des données : Kimball vs. One Big Table (OBT) vs Inmon 👉 La modélisation Kimball, bien établie depuis 1996, repose sur l'utilisation de tables de faits et de dimensions, offrant une gouvernance des données améliorée. Cependant, des études récentes montrent que l'approche OBT, qui favorise une table dénormalisée unique, peut offrir des performances supérieures dans des environnements modernes comme Redshift, Snowflake et BigQuery. Avantages de l'OBT : ● Simplification des requêtes sans jointures complexes ● Accès rapide aux données avec des temps de réponse améliorés Inconvénients : ● Risque de désorganisation si les colonnes ne sont pas bien structurées ● Moins compatible avec certains outils BI comme Power BI ou Tableau 👉 La question se pose : Doit-on abandonner complètement le modèle Kimball au profit de l'OBT ? Ce débat est crucial pour les #datascientists et les #dataengineers qui cherchent à équilibrer créativité et rigueur. Une approche hybride pourrait-elle être la solution ? Participez à notre discussion pour explorer ces enjeux et partager vos expériences ! Ismael Goulani, Stéphane Heckel, Willis Nana, Axel TIFRANI