Fermer

Data

Déverrouiller la valeur cachée des dark data

Les responsables informatiques qui cherchent à tirer une valeur commerciale des données que leurs entreprises collectent sont confrontés à une myriade de défis. La moins bien comprise est peut-être l’occasion manquée de ne pas tirer parti des données qui sont créées et souvent stockées, mais avec lesquelles on n’interagit que rarement. Ces soi-disant « données obscures », du nom de la matière noire de la physique, sont des informations collectées de manière routinière dans le cadre de la conduite des affaires : elles sont générées par les employés, les clients et les processus commerciaux. Il est généré sous forme […]

août 11, 2022

Lire l'article

Flux de données dans Azure Data Factory

Aperçu: Les flux de données sont l’une des fonctionnalités d’Azure Data Factory qui permet aux ingénieurs de données de développer une logique de transformation de données dans une approche graphique sans écrire de code. Les flux de données résultants peuvent ensuite être exécutés en tant qu’activités dans les pipelines Azure Data Factory qui utilisent des clusters Spark scale-out. Vos flux de données s’exécuteront sur votre propre cluster d’exécution pour un traitement de données évolutif. ADF gère en interne toute la traduction du code, l’optimisation des étincelles et l’exécution de la transformation. Les activités de flux de […]

août 4, 2022

Lire l'article

Fonctionnalités clés récemment rendues disponibles dans Oracle Enterprise Data Management

La version la plus récente des nouvelles fonctionnalités d’Oracle Enterprise Data Management contient des fonctionnalités intéressantes. Continuez à lire ci-dessous pour en savoir plus! Interrogation de point de vue La possibilité de rechercher des nœuds dans Oracle EDM a été considérablement améliorée avec l’ajout récent de Viewpoint Queries. Désormais, les utilisateurs peut facilement trouver des nœuds dans un point de vue où les propriétés correspondent aux critères spécifiés. Vous trouverez ci-dessous quelques considérations importantes pour les utilisateurs qui souhaitent utiliser cette fonctionnalité. Tous les nœuds de n’importe quel point de vue ou uniquement ceux situés sous […]

août 3, 2022

Lire l'article

Voici les salaires moyens des data scientists en Europe en 2022

Cette article a été initialement publié sur .cult par Louis Minvielle. .culte est une plate-forme communautaire basée à Berlin pour les développeurs. Nous écrivons sur tout ce qui concerne la carrière, réalisons des documentaires originaux et partageons des tas d’autres histoires inédites de développeurs du monde entier. Si vous vous souvenez de nos enquêtes et analyses passées, vous vous souviendrez peut-être d’un curieux postulat que nous avons avancé : même si leurs talents sont très demandés, il peut être difficile pour les data scientists, développeurs, et les ingénieurs de données pour connaître leur valeur. C’est presque comme […]

juillet 30, 2022

Lire l'article

Filtrage, fusion et ajout d’une nouvelle colonne dans Azure Data Factory

Usine de données Azure est un outil ETL puissant, avec la capacité de créer des pipelines ETL en utilisant une approche low code/no code. Ceci peut être réalisé en utilisant « Activités”. Les activités sont les tâches exécutées sur les données d’un pipeline. Dans cet article, je démontre un processus ETL qui copie des données d’une source à une autre et effectue certaines tâches sur les données à l’aide de Activités dans Azure Data Factory comme suit : Extrait les fichiers avec une sous-chaîne spécifique dans leurs noms de fichier à partir d’un pool de fichiers de […]

juillet 26, 2022

Lire l'article

Mappages de colonnes en tant que contenu dynamique dans Azure Data Factory

Dans cet article, j’aimerais vous expliquer l’approche par laquelle nous pouvons fournir les mappages de colonnes en tant que contenu dynamique dans les activités de copie de données dans Azure Data Factory à l’aide d’une table placée dans une base de données. Pourquoi est-il nécessaire de fournir les mappages de colonnes en tant que contenu dynamique ? Nous pouvons utiliser l’option « Import Schemas » sous Mapping pour récupérer les colonnes source et cible et les mapper manuellement, ce qui est utile lors de l’utilisation de l’activité de copie de données pour une seule table. Cependant, lorsque nous utilisons […]

juillet 21, 2022

Lire l'article

Pipelines et activités dans Azure Data Factory et Azure Synapse Analytics

Aperçu: Une usine de données ou un espace de travail Synapse peut avoir plusieurs pipelines. Les pipelines sont des groupes d’activités qui exécutent ensemble une tâche spécifique. L’intégration de données et les services ETL (Extract, Transform and Load) dans le cloud fonctionnent ensemble pour orchestrer le mouvement des données et transformer les données en toute simplicité. Certains workflows peuvent ingérer des données provenant de sources de données disparates (appelées pipelines) que vous pouvez créer et planifier. Un processus ETL complexe peut être construit visuellement avec des flux de données ou avec des services de calcul tels […]

juillet 14, 2022

Lire l'article

Réussir l’examen Microsoft Certified Power BI Data Analyst

Je partagerai mon expérience personnelle avec l’apprentissage de Power BI et la réussite de l’examen PL-300 (anciennement appelé DA-100). J’espère que cela aidera les autres candidats. Je ne compromettrais pas la NDA signée ; par conséquent, aucune question ne sera divulguée dans cet article. À propos de l’examen : PL-300 : Analyste de données Microsoft Power BI L’analyse des données avec Microsoft Power BI (PL-300) est l’exigence de la certification Microsoft Data Analyst Associate. Power BI est l’un des outils de Business Intelligence et de visualisation de données les plus utilisés. Dans ce monde axé sur les données, cette […]

juillet 13, 2022

Lire l'article

La valeur de Data Fabric pour l’entreprise

Lorsque vous travaillez dans l’informatique, vous constatez directement à quel point l’appétit croissant des entreprises pour les données met à rude épreuve les systèmes existants, et même les transformations numériques en cours. Vous êtes chargé de gérer un écosystème de données tentaculaire qui nécessite probablement une maintenance coûteuse, et en même temps, vos analystes ne peuvent pas trouver les données dont ils ont besoin ou pire, construisent leurs conclusions sur des données médiocres. Si tel est le cas, vous n’êtes pas seul. Seuls 25 % des responsables informatiques déclarent que leur technologie maximise la productivité des employés. […]

juillet 13, 2022

Lire l'article

Top 5 des points à retenir de Databricks Data – AI Summit 2022

Le Data and AI Summit 2022 a fait d’énormes annonces pour la plateforme Databricks Lakehouse. Parmi ceux-ci, il y avait plusieurs améliorations exaltantes à Flux de travail Databricksle service d’orchestration entièrement géré qui est profondément intégré à la plate-forme Databricks Lakehouse et Tableaux Delta Live aussi. Avec ces nouvelles efficacités, Flux de travail permet aux ingénieurs de données, aux data scientists et aux analystes de créer des flux de données, d’analyse et de ML fiables sur n’importe quel cloud sans avoir à gérer une infrastructure complexe. Voici les 5 annonces passionnantes et les plus importantes pour […]

juillet 11, 2022

Lire l'article