FORMATIONS BI:

Cours : #BI-2D - DW Hybrid : clé pour réduire significativement votre TCO DW d'entreprise (2 jours).

Un peu daté (avant l'ère du Big Data) mais le cours couvre toutes les notions requises et reste d'actualité puisqu'il décrit à quoi devrait ressembler la zone de consommation d'un Lake House. Cliquez ici pour une description de l'architecture LakeHouse (à venir)

Nous avons créé une architecture DW hybride (ITA&S-H) pour essentiellement:

  • Réduire la quantité de mouvements de données des sources vers EDW vers les datamarts
  • Augmenter l'agilité
  • Réduire les coûts (la réduction du coût total de possession provient de la réduction drastique du nombre de tables, ce qui se traduit par une réduction majeure de la quantité d'ETL et donc des coûts
  • Être en mesure de construire certains des entrepôts de données en temps quasi réel (le temps réel est simplifié car il n'y a qu'un seul ensemble de processus ETL/ELT à exécuter, ce qui est possible car il n'est pas nécessaire de charger d'abord l'EDW puis de charger le Datamarts)

L'architecture ITA&S-H ressemble à une constellation de flocons de neige avec l'ajout de structures de données normalisées conventionnelles (appelées extensions EDW). Il s'agit donc d'un hybride de l'architecture EDW et Datamarts fusionné en un seul modèle de base de données avec une série d'améliorations telles que:

  • Enregistrements d'ajustements de faits via un enregistrement d'inversion et un nouvel enregistrement
  • Dimension conforme avec le principe du niveau le plus bas
  • Plusieurs points d'ancrage dans une dimension
  • Refonte dimensionnelle automatisée Flocons de neige dénormalisés

Nous avons utilisé avec succès l'approche ITA&S-H :

  • Pour les projets BI traditionnels (plusieurs fois)
  • Pour les lacs de données sur Hadoop (plusieurs fois)
  • Pour Lake Houses sur Azure (plusieurs fois)