Ce ne sont pas vos données. C’est la façon dont vous l’utilisez. Libérez la puissance des données et construisez les fondations d’une organisation axée sur les données

Les données ont toujours été fondamentales pour les entreprises, mais à mesure que les organisations continuent de migrer vers des environnements basés sur le cloud couplés aux avancées technologiques telles que le streaming et l’analyse en temps réel, la création d’une entreprise axée sur les données est l’une des clés du succès.
Une organisation axée sur les données possède de nombreux attributs. Deloitte répertorie ces comme:
- Créer et façonner une base de données commune.
- Définir et utiliser des points de données uniques à des fins multiples.
- Construire une couche sémantique décrivant les définitions unifiées des activités et des rapports.
- Libérer la valeur des données avec des analyses avancées approfondies, en se concentrant sur la fourniture d’informations commerciales détaillées.
- Fournir une plate-forme pour les rapports de gestion factuels et exploitables, les prévisions algorithmiques et les tableaux de bord numériques.
La société australienne de recherche et de conseil Adapt identifie la capacité d’une organisation à exécuter une stratégie basée sur les données comme l’un des 12 compétences clés, identifié à partir de 30 000 conversations s’étalant sur trois ans avec des entreprises et des services informatiques de premier plan.
Étude mondiale sur la suite C d’IBM, 2021 est d’accord, affirmant qu’il existe des preuves solides que les organisations axées sur les données surpassent leurs pairs sur le plan financier, en matière d’innovation et de conduite du changement culturel. Ils sont également 91 % plus susceptibles d’avoir la confiance des clients.
Mais il y a de nombreux défis à relever pour devenir une organisation réussie axée sur les données. Les organisations doivent faire face à des données héritées et à des volumes croissants de données réparties sur plusieurs silos. Ils doivent ingérer, stocker et gérer efficacement les énormes volumes de « nouvelles » données générées dans un environnement hyper-connecté, et ils doivent être en mesure d’appliquer l’analyse de données pour extraire la valeur réelle de ces données, en temps quasi réel tout en garantissant il est sécurisé et conforme aux exigences de gouvernance.
Pour répondre à ces demandes, de nombreuses équipes informatiques se retrouvent en tant qu’intégrateurs de systèmes, devant trouver des moyens d’accéder à de gros volumes de données et de les manipuler pour de multiples fonctions commerciales et cas d’utilisation. Il ne suffit pas de déplacer certaines charges de travail vers le cloud. Sans une stratégie de données claire et alignée sur les besoins de leur entreprise, être véritablement axé sur les données sera un défi.
Ceci est le premier article d’une série de trois sur les organisations axées sur les données. La seconde se concentrera sur la croissance du volume et du type de données devant être stockées et gérées, et sur les façons dont la valeur peut être extraite des données. Le troisième examinera les défis liés à la réalisation de cette valeur, les attributs d’une organisation réussie axée sur les données et les avantages qui peuvent en être tirés.
LA CROISSANCE DES DONNÉES
Selon une enquête IDG MarketPulse, les volumes de données des organisations augmentent de 63 % par mois, en moyenne, et de 100 % ou plus par mois dans 10 % des organisations. Aujourd’hui, les données transactionnelles, qui incluent les flux de données et les flux de données, sont le principal contributeur à ces volumes de données.
L’enquête a révélé que le nombre moyen de sources de données par organisation était de 400 et que plus de 20 % des entreprises interrogées s’appuyaient sur 1 000 sources de données ou plus pour alimenter les systèmes de veille économique et d’analyse.
Il a également révélé que seulement 37 % des données organisationnelles sont stockées dans des entrepôts de données cloud et 35 % encore dans des entrepôts de données sur site. Cependant, plus de 99 % des personnes interrogées ont déclaré qu’elles migreraient les données vers le cloud au cours des deux prochaines années.
L’Internet des objets (IoT) est un énorme contributeur de données à ce volume croissant, Estimations iotaComm il y a 35 milliards d’appareils IoT dans le monde et qu’en 2025, tous les appareils IoT combinés généreront 79,4 zettaoctets de données. Aujourd’hui, les données transactionnelles constituent le segment le plus important, qui comprend le streaming et les flux de données.
EXTRAIRE DE LA VALEUR DES DONNÉES
L’un des plus grands défis posés par la présence de volumes massifs de données non structurées disparates est l’extraction d’informations et d’informations utilisables. L’analyse de données, appliquée efficacement, peut fournir des conseils extrêmement précieux pour identifier les tendances et éclairer la prise de décision commerciale, mais les données doivent être accessibles à ces outils d’analyse de données s’ils doivent fournir des informations exploitables.
En outre, il existe un besoin croissant d’analyses en temps quasi réel pour soutenir la prise de décision à l’aide de l’apprentissage automatique et de l’intelligence artificielle, ce qui nécessite une ingestion et un traitement des données en temps quasi réel.
Ces défis peuvent être résumés comme suit.
- Veiller à ce que toutes les données pertinentes nécessaires à l’aide à la décision soient collectées et mises à disposition pour analyse.
- Veiller à ce que toutes les analyses d’alimentation en données soient exactes et complètes (une omission importante peut sérieusement fausser les résultats de toute analyse).
- Pression pour fournir des résultats et des idées d’analyse qui peuvent dépasser la portée de ce que les données disponibles peuvent fournir.
- Recours à l’intervention humaine pour fournir les données nécessaires à l’analyse.
- Avoir des systèmes capables d’évoluer pour gérer les volumes de données à analyser.
FONDEMENTS D’UNE ORGANISATION MODERNE DRIVED DATA
La fondation qui permet à une organisation d’afficher tous ces attributs a toujours été un entrepôt de données efficace. Cependant, ce concept a évolué en fonction des exigences croissantes des organisations matures et sophistiquées axées sur les données, et avec l’utilisation et la sophistication accrues des services de cloud computing.
451 Recherche dit avoir identifié l’émergence d’une nouvelle catégorie de produits dans le secteur de l’analytique : l’Enterprise Intelligence Platform, qui « combine l’intégration de données, le stockage et le traitement de données, et des fonctionnalités d’analytique dans une offre unique conçue pour répondre aux besoins des opérateurs de données et des consommateurs de données ».
Il soutient que les entreprises doivent adopter un processus en trois étapes qui nécessitait traditionnellement trois produits distincts (historiquement de trois fournisseurs distincts) pour exécuter l’analyse efficacement et pour :
- ingérez et intégrez des données à partir d’applications d’entreprise, généralement à l’aide d’outils d’extraction, de transformation et de chargement (ETL).
- stocker et traiter les données, généralement dans un entrepôt de données, où les données sont modélisées et le schéma appliqué.
- analyser les données, à l’aide d’outils d’intelligence d’affaires, de visualisation ou de science des données.
Un exemple de technologie moderne de gestion unifiée des données est le Plate-forme de données Cloudera (CDP). Il prend en charge la prise de décision basée sur les données en connectant facilement, rapidement et en toute sécurité l’ensemble du cycle de vie des données dans un environnement sécurisé.
Il répond aux défis auxquels les organisations sont de plus en plus confrontées dans la gestion et l’extraction de la valeur maximale de leurs données en garantissant une capacité de traitement en temps réel suffisante pour les gros volumes de données, en facilitant l’analyse en libre-service pour une collaboration plus interfonctionnelle et en permettant aux organisations d’augmenter ou de réduire les charges de travail. par conséquent.
CDP est le premier cloud de données d’entreprise du secteur. Il permet aux organisations de gérer, d’analyser et d’expérimenter des données dans des environnements hybrides et multi-cloud pour obtenir des informations commerciales plus rapides. Il applique le traitement de flux en temps réel, l’entreposage de données, la science des données et l’apprentissage automatique itératif sur les données partagées pour prendre en charge les cas d’utilisation commerciale les plus complexes. Dans le même temps, il permet aux organisations de se conformer aux exigences de confidentialité et de conformité des données avec un modèle de sécurité commun couvrant le cloud public, privé et hybride.
LA PLATEFORME DE DONNÉES CLOUDERA (CDP) EN ACTION
Les organisations de divers secteurs ont bénéficié de décisions commerciales plus rapides et basées sur les données depuis la mise en œuvre du CDP dans leurs organisations. Voici quelques exemples concrets de la façon dont CDP aide à résoudre les vrais problèmes de données.
Recherche pharmaceutique
Les organisations des sciences de la vie collectent et analysent des données provenant de sources multiples et diverses et appliquent l’apprentissage automatique dans leur recherche de nouveaux traitements. Ces sources peuvent inclure : des données provenant de laboratoires et d’essais cliniques, des notes de médecins, des ordonnances, des examens IRM et des interventions chirurgicales. Une grande partie de ces données personnelles sont très sensibles et sont soumises à des réglementations strictes en matière de confidentialité et de sécurité.
Une entreprise pharmaceutique déployée CDP en combinaison avec sa propre technologie d’intelligence artificielle pour augmenter la vitesse et la qualité de sa découverte de médicaments et de son pipeline de vaccins, accélérant ainsi la mise sur le marché de médicaments sûrs. Dans un cas, le temps requis pour l’analyse a été réduit de 80 ans à quelques semaines. De plus, toutes les données de recherche ont été rendues plus facilement accessibles à un groupe plus large de chercheurs, donnant aux scientifiques la possibilité d’approfondir l’analyse pharmaceutique.
Assurance
Une compagnie d’assurance mondiale a utilisé CDP pour fournir un apprentissage automatique, créant une expérience utilisateur cohérente pour l’analyse en libre-service tout en s’adaptant à tout type de charge de travail. Les capacités d’opérations d’apprentissage automatique de Cloudera ont permis à l’entreprise d’automatiser le déploiement, la surveillance et la gestion des modèles d’apprentissage automatique en production de manière évolutive et gouvernée. Tout cela est exécuté dans un environnement sécurisé avec une gouvernance centralisée des données sur site et dans le cloud public, protégeant les données personnelles de plus de 10 millions de clients.
En plus d’être en mesure de gérer des charges de travail informatiques beaucoup plus importantes, tout en réduisant les coûts, l’entreprise a réduit les coûts et construit une « usine d’IA » qui peut être utilisée par toutes les équipes. De nouveaux data scientists peuvent alors être intégrés plus facilement et plus efficacement.
Pétrole et gaz
Une multinationale pétrolière et gazière souhaitait créer un lac de données de fabrication pour conserver les données de raffinerie, historiques et de capteurs et obtenir une vue globale de ses opérations. Ce lac de données était destiné à prendre en charge son application d’analyse de journaux utilisée pour ingérer des données provenant de plusieurs environnements et générer des alertes en temps réel sur des événements dans toute l’organisation. Cependant, les données étaient générées à un rythme supérieur à celui que les bases de données relationnelles pouvaient gérer et le lac de données initial a été créé pour une seule application. L’entreprise devait réduire ses coûts en déplaçant certaines données vers un lac de données moins coûteux pour le stockage tout en évitant la dépendance vis-à-vis d’un fournisseur. Il avait également besoin d’un pipeline de flux de données pour collecter, traiter et distribuer les données entre les applications. De plus, la sensibilité des données clients traitées par l’entreprise justifie la nécessité de sécuriser leur ensemble de données opérationnelles.
En déployant CDP Public Cloud dans un environnement hybride multi-cloud, l’entreprise a pu ingérer en temps réel les données de journaux de 130 000 PC situés dans le monde et sur plusieurs plates-formes pour fournir des données unifiées en aval utilisées par une multitude d’applications d’analyse. L’entreprise a réalisé une augmentation de 55 % des performances de recherche, une réduction de 2 millions de dollars des coûts de licence sur cinq ans et une réduction de 30 % des coûts d’infrastructure. Un résultat critique du projet est le temps de réponse accru pour détecter les menaces de cybersécurité, le ramenant de 70 minutes à sept minutes.
Source link