3 problèmes de qualité des données susceptibles d'influer sur votre jugement

6 min de lecture
Les opinions exprimées par les contributeurs de Entrepreneur sont les leurs.
Google « big data », et la saisie semi-automatique pour la recherche raconte toute l'histoire: « Le Big Data est l'avenir. Le Big Data est le nouveau pétrole.»
Celles-ci sont des déclarations passionnantes, mais ce qui est souvent perdu dans la conversation sur le big data, c'est le coût élevé des mauvaises données.
Si votre entreprise se targue de prendre des décisions basées sur les données il est important de reconnaître que ces décisions ne seront jamais aussi bonnes que vos données. La mauvaise qualité des données coûte à l'économie américaine 3,1 billions de dollars par an et cela crée une crise de foi dans de nombreux secteurs.
Selon un récent rapport Gartner , plus de la moitié des principaux responsables marketing sont déçus des résultats qu'ils ont vus des investissements dans l'analyse de données . En conséquence, seulement 54% de leurs activités sont influencées par les données. D'ici 2023, Gartner prévoit que les directeurs marketing réduiront leurs équipes d'analyse en raison d'attentes non satisfaites. ne peut pas être surestimé, mais souvent les dirigeants ne savent pas où leur collecte et leur analyse de données se terminent. Voici trois problèmes de qualité des données dont vous n'êtes peut-être pas au courant …
Les anomalies deviennent plus difficiles à gérer sous forme de bulles de données
Souvent, les données ne suivent pas un modèle logique. Cela ne signifie pas nécessairement que vos données ne sont pas exactes, mais les valeurs aberrantes (telles que les fluctuations saisonnières) doivent être prises en compte.
Si vous possédez une entreprise de vêtements qui constate une forte demande de pulls rouges à l'approche de Noël, vous pouvez facilement identifier la cause profonde et la gérer de manière appropriée. Cependant, supprimer complètement vos valeurs aberrantes n'est pas la solution, car certains services peuvent avoir besoin de ces informations aberrantes, telles que vos équipes d'approvisionnement et de mise en marché.
Cela devient beaucoup plus compliqué à mesure que votre entreprise commence à collecter et à utiliser davantage de données. Chaque nouvelle statistique aura ses propres tendances et anomalies, et vous ne pouvez pas rechercher et ajuster manuellement toutes ces valeurs aberrantes. Comme Vincent Yates, Chief Data Officer de Credera, l’a dit dans un article de blog: «La classification des anomalies dans les données est un art et pratiquement aucune organisation ne dispose d’un mécanisme pour codifier ces annotations à l’échelle mondiale.»
Au fil du temps, le problème des jeux de données inexacts crée un effet boule de neige. Ces données ne peuvent pas être utilisées pour prévoir la demande future avec une précision quelconque, ce qui érode la confiance de l'organisation dans les données.
Related: Walking With AI: Comment repérer, stocker et nettoyer les données dont vous avez besoin
Les modèles de données se décomposent avec le volume
Tout comme les valeurs aberrantes non gérées peuvent fausser les données au fil du temps, de nombreux modèles de données commencent à se décomposer à mesure que le volume de données augmente. Cela ne signifie pas que les modèles de données cessent soudainement de fonctionner. La plupart des problèmes de qualité des données au sein d'une organisation existent dès le départ, mais ils ne deviennent apparents que lorsqu'ils atteignent une certaine échelle.
Cela est particulièrement pertinent maintenant, car les commandes au domicile ont fait sécher les données de détail du jour au lendemain . Une fois les restrictions levées, il est peu probable que le comportement des consommateurs soit exactement comme avant. Les clients peuvent dépenser moins ou commander plus de produits en ligne. De nombreuses entreprises constateront que leurs anciennes données ne sont plus pertinentes.
«Même les entreprises qui avaient amassé de grands volumes de données clients avant Covid-19 se retrouvent dans la même position de démarrage à froid que les entreprises s'aventurant sur des marchés inconnus», w par rote le professeur de l'université de Stanford, Angel Evan .
Presque toutes les entreprises réévalueront leurs données dans les années à venir. Ils devront mettre à jour leurs modèles pour tenir compte des changements de comportement des consommateurs.
Différents services utilisent les mêmes données à des fins différentes
Aujourd'hui, les entreprises produisent de plus en plus de données, et ces données sont utilisées pour informer l'entreprise décisions à tous les niveaux. Les indicateurs clés de performance (KPI) générés par une équipe de commerce électronique peuvent être utilisés par le service marketing pour cibler un nouveau segment de clientèle. Ou, ces mêmes données peuvent être utilisées aux plus hauts niveaux pour construire des modèles autour de la performance financière afin d'éclairer les décisions d'embauche.
Le problème est que les personnes qui créent ces données n'ont généralement aucune idée de qui les utilise ou comment elles sont utilisées. On ne sait pas qui est responsable de l’exactitude et de la gestion de ces données. Cela devient problématique lorsqu'il est utilisé pour orienter la prise de décision.
Comment maîtriser la qualité des données
Tout comme de nouveaux défis surgissent lorsque vous faites évoluer une entreprise, vous devez réévaluer votre approche à mesure que vous mettez vos données à l'échelle. Voici trois bonnes pratiques pour améliorer la qualité des données:
1. Nommer un responsable des données. Le directeur des données (CDO) sera chargé de créer un plan pour gérer les données de l'entreprise et maintenir la qualité des données au fur et à mesure de votre croissance. Il ou elle doit être un expert pour tirer des enseignements des données et les contextualiser afin que le reste de votre équipe puisse utiliser ces informations.
2. Créez une stratégie de données. Les données ne sont plus seulement un sous-produit utile des activités de marketing et de vente. Les données sont un atout. Comme tout autre bien, il doit être continuellement protégé et géré .
Malheureusement, la plupart des entreprises conservent leurs données et leurs activités de données en silo dans différents départements. Bien qu'ils puissent avoir de vives discussions sur la qualité des données ou la protection des données il n'y a pas de stratégie globale sur la façon dont ces données devraient être gérées ou utilisées. Cela peut conduire à d'énormes quantités de données sombres et à une dégradation des données.
Une solide stratégie de données établit comment votre entreprise gérera et partagera les données au sein de l'organisation afin qu'elles puissent être utilisées pour son plus grand bénéfice. Cette stratégie doit être évolutive et reproductible.
3. Mettez à jour les modèles de données à mesure que vous évoluez. Au fur et à mesure que votre clientèle grandit et que vous commencez à collecter plus de données, vous ou votre CDO devez continuellement réévaluer les modèles que vous utilisez pour donner un sens à ces données. Il est important de se demander ce qui a changé depuis que vous avez initialement développé ce modèle et si certaines statistiques sont encore pertinentes. Cela vous permettra d’obtenir une image plus claire au fur et à mesure que vous calculerez les chiffres.
Related: Principaux défis de la gouvernance des données
Nous ne pouvons pas revenir à une époque antérieure au big data, et nous ne devrions pas nous. Les mégadonnées nous ont aidés à faire d'énormes progrès dans tout, des voitures autonomes aux résultats pour les patients . Dans l'année à venir, il nous dira dans quelle mesure les vaccins Covid-19 fonctionnent et sur quels groupes ils fonctionnent le mieux. Mais pour rendre le Big Data durable, vous devez d'abord être proactif dans l'amélioration de la qualité des données au sein de votre organisation.
Source link