Fermer

octobre 7, 2022

Plongez dans les concepts d’entrepôt de données.. !


Qu’est-ce qu’un entrepôt de données ?

L’entrepôt de données est une base de données relationnelle conçue pour les besoins analytiques. C’est l’acte d’organiser et de stocker des données de manière à rendre leur récupération efficace et perspicace. On l’appelle aussi le processus de transformation des données en informations. Son fonctionnement est basé sur OLAP (traitement analytique en ligne). Il s’agit d’un emplacement central où les données consolidées provenant de plusieurs emplacements (bases de données) sont stockées.

L’entrepôt de données est une combinaison de données provenant de plusieurs sources dans une base de données qui peut être utilisée pour la création de rapports et l’analyse.

Caractéristiques de l’entrepôt de données :

  • Orienté sujet
  • Intégré
  • Variante temporelle
  • Non volatile

Architecture de l’entrepôt de données :

Nous organisons les données et stockons les données dans un entrepôt de manière à ce que vous puissiez accéder aux données ultérieurement et cet accès doit être des données significatives, elles ne doivent pas être identiques aux données d’une base de données.

Voir l'image source

Notre compréhension: –

  1. Nous avons nos données dans une source de données différente et ces données sont transférées dans un entrepôt de données.
  2. Maintenant, comment pouvons-nous transférer nos données dans l’entrepôt de données, donc, il y a une couche intermédiaire, nous pouvons l’appeler comme une zone de transit.
  3. Il existe une base de données intermédiaire qui est un stockage temporaire.
  4. L’acte d’obtenir des données de la source à la base de données intermédiaire ou à la zone intermédiaire est effectué par le processus ETL (Extract, Transform, Load).
  5. Une fois qu’il s’agit du stockage temporaire, le processus d’ETL transformera les données en entrepôt de données.
  6. Une fois les données saisies dans l’entrepôt de données, elles doivent être divisées en :
    • Données bruteslignes ou colonnes ou données réelles que nous transférerons, il s’agit donc essentiellement de données indésirables.
    • MétadonnéesLes métadonnées sont les données sur les données brutes.
  1. Une fois les données dans notre entrepôt de données, votre utilisateur final peut utiliser ces données pour effectuer une analyse en exécutant des requêtes.
  2. L’acte d’effectuer des requêtes sur l’entrepôt de données est appelé traitement analytique en ligne.
  3. Data marts : – Les data marts ne sont pas entièrement différents, ils ne sont qu’une partie de l’entrepôt de données. Les utilisateurs finaux peuvent effectuer des requêtes sur l’entrepôt de données ou les data marts. Il comprend également les données sur un domaine particulier.

Concepts d’entrepôt de données : –

OLAP (traitement analytique en ligne) –

  • OLAP est un moyen flexible pour vous d’effectuer une analyse complexe de données multidimensionnelles.
  • DWH (entrepôt de données) est calqué sur le concept d’OLAP. Les bases de données sont modélisées sur le concept d’OLTP (Online Transaction Processing).
  • Les systèmes OLTP utilisent des données stockées sous la forme de tableaux bidimensionnels, avec des lignes et des colonnes. Par exemple. Feuilles Excel (qui comprennent des lignes et des colonnes).

Avantages d’OLAP par rapport à OLTP –

  • Ouvre de nouvelles vues de l’examen des données.
  • Prend en charge le filtrage/tri des données.
  • Les données peuvent être affinées.

Dimension : –

  • Les tableaux qui décrivent les dimensions concernées sont appelés tableaux de dimension.
  • La division d’un projet d’entrepôt de données en dimensions fournit des informations structurées pour l’analyse et la création de rapports

Faits et mesures : –

  • Un fait est une mesure qui peut être additionnée, moyennée ou manipulée.
  • Une table de faits contient 2 types de données : une clé de dimension et une mesure.
  • Chaque table dimensionnelle est liée à une table de faits.

Schémas : –

  • Un schéma donne la description logique de l’ensemble de la base de données.
  • Il donne des détails sur les contraintes placées sur les tables, les valeurs clés présentes et comment les valeurs clés sont liées entre les différentes tables.
  • Une base de données utilise un modèle relationnel, un concept de clé primaire et étrangère, nous utilisons un modèle relationnel d’entité, tandis qu’un entrepôt de données utilise un schéma de constellation d’étoiles, de flocons de neige et de faits.

Types de schémas : –

  1. Schéma en étoile: – Un schéma en étoile est une structure organisationnelle de base de données optimisée pour une utilisation dans un entrepôt de données ou de business intelligence. Il est appelé schéma en étoile car la table de faits se trouve au centre du diagramme logique et les petites tables dimensionnelles se ramifient pour former les points de l’étoile. Chaque base de données de schéma en étoile n’a qu’une seule table de faits.

Voir l'image source

  1. Schéma en flocon: – Le schéma Snowflake est une variante du schéma en étoile. Ici, la table de faits centralisée est connectée aux multiples dimensions. Les dimensions sont présentes sous une forme normalisée dans plusieurs tables liées.

Voir l'image source

  1. Schéma de galaxie: – Le schéma Galaxy est également connu sous le nom de schéma de constellation de faits. Il contient plusieurs tables de faits et ces multiples tables de faits partagent les mêmes tables de dimension. Les dimensions partagées sont appelées dimensions conformes. La disposition des tables de faits et des tables de dimension ressemble à une collection d’étoiles dans le modèle de schéma de galaxie. Ce schéma est difficile à maintenir en raison de sa complexité.

Voir l'image source

  • Cela nous amène à la conclusion sur les concepts d’entreposage de données. Cet article nous a appris ce qu’est l’entrepôt de données, ses fonctionnalités et son architecture, les concepts d’entrepôt de données comme OLAP, les faits et les mesures, les dimensions, les schémas et ses types.
  • Nous avons maintenant une meilleure idée des concepts d’entrepôt de données.
  • Veuillez partager vos réflexions et suggestions dans l’espace ci-dessous, et je ferai de mon mieux pour y répondre dans la mesure du temps disponible.

Continue d’apprendre…!!!!!






Source link

octobre 7, 2022