Fermer

février 17, 2019

Power BI + Azure Data Lake = Vélocité et adaptation à vos analyses


Contexte – Rassemblez des données provenant de diverses sources de données Web, sur le cloud et sur site et créez rapidement des informations. Le plus grand défi auquel sont confrontés les analystes métier et les développeurs BI est la nécessité d'ingérer et de traiter régulièrement des ensembles de données de moyenne à grande taille. Ils passent le plus de temps à rassembler les données plutôt qu’à les analyser.

Power BI Dataflow, le logiciel Azure Data Lake Storage Gen 2 rend cet exercice très intuitif et axé sur les résultats. Avant Power BI, la préparation des données de flux de données était limitée au bureau Power BI.

Power BI Desktop

Les utilisateurs de Power BI Desktop utilisent Power Query pour se connecter aux données, ingest transformez-le avant de se retrouver dans le jeu de données.

La préparation des données de Power BI Desktop est soumise à certaines limites

  • Les données pertinentes sont contenues dans des jeux de données individuels.
  • Difficulté de réutilisation. logique de transformation des données – limitée au jeu de données en cours de préparation.
  • Impossibilité de définir des transformations pour les charges de données incrémentielles – car elles ne font que transformer les données.
  • Possibilité d'effectuer le chargement de données à l'échelle.
  • L'approche Open Data réalisée en déplaçant les données vers le compte de stockage du locataire, qui donne accès à plusieurs services basés sur Azure pour aider les analystes et les scientifiques des données.

Le diagramme ci-dessous montre comment Dataflows aide les analystes métier à intégrer des données dans le système. Az Data Lake Storage Gen2 et peut ensuite exploiter tous les autres services auxquels il a accès. Comment est-ce possible? La réponse courte est Modèle de données commun .

Modèle de données commun . 19659003] Le Common Data Model (CDM) fournit un langage de données partagé que les applications commerciales et analytiques peuvent utiliser. Le système de métadonnées CDM assure la cohérence des données et leur signification dans les applications et les processus métier (tels que PowerApps, Power BI, Dynamics365 et Azure), qui stockent les données conformément au MDP.

[1965916]

Le diagramme ci-dessus illustre une approche bidirectionnelle de l'analyse d'entreprise en nuage.

Approche Low Code

Le côté gauche montre l'approche Low Code. où les analystes de données de différents secteurs d'activité peuvent accéder, préparer et gérer des ensembles de données pour leurs besoins d'analyse – création de contenu analytique

  • Ils peuvent également exploiter le contenu chargé dans Data Lake par les ingénieurs de données d'entreprise dans leurs rapports Power BI
  • Cette approche nécessitera une gouvernance des données et des garde-corps.
    • Les analystes de données auront un dossier CDM dédié auquel ils auront accès pour se connecter à l'espace de travail.
    • Les analystes de données n'écriront pas dans un dossier CDM dans lequel les ingénieurs de données écrivent mais auront un accès en lecture.
    • Limiter l'utilisation des flux de données vers la préparation des données – uniquement pour les analystes qui utilisent les données pour créer des jeux de données destinés à prendre en charge l'analyse d'entreprise.
  • Pour faciliter l'échange de données, Power BI enregistre les données dans de ADLSg2 dans un format standard (fichiers CSV) et dans un fichier de métadonnées détaillé décrivant les structures de données et la sémantique . ].

Les flux de données Power BI vous permettent d’acquérir des données dans le formulaire MCD à partir de diverses sources telles que Dynamics 365, Salesforce, Base de données SQL Azure, Excel ou SharePoint. Une fois connecté, préparez les données et chargez-les en tant qu'entité personnalisée au format CDM dans Azure Data Lake Storage Gen2.

Approche des workloads d'entreprise (Enterprise Data Workloads)

Le côté droit montre les divers Services Azure susceptibles de tirer parti des ingénieurs de données d'entreprise pour gérer des charges de travail analytiques.

Conclusion and Insight

Les détails décrits dans ce blog permettent une analyse rapide des données d'entreprise. Cette approche favorise l'adoption et établit des normes qui orientent les projets d'analyse durables utilisant Power BI. Cela permet également d’accéder aux données classées et cataloguées. La standardisation sémantique améliore le niveau de langage et propulse l'intelligence artificielle sur la plate-forme.

Le Magic Quadrant Gartner pour l'analyse et la BI, publié en février 2019, désigne Microsoft Power BI comme le leader du quadrant d'analyse. L’un des facteurs déterminants est la vision globale du produit de Microsoft. Il attire l'attention sur le modèle de données commun et ouvert, AutoML, les services de texte comme Cognitive, l'analyse des sentiments via Power BI. J'ai essayé d'attirer l'attention sur la même chose dans ce blog et de le simplifier.




Source link