Fermer

avril 26, 2021

Déduplication: meilleures pratiques pour éviter ou corriger les données client en double


La duplication des données ne réduit pas seulement l'exactitude des informations commerciales, mais elle compromet également la qualité de votre expérience client. Bien que les conséquences de la duplication de données soient confrontées à tous – responsables informatiques, utilisateurs métier, analystes de données -, cela a le pire impact sur les opérations marketing d’une entreprise. Étant donné que les spécialistes du marketing représentent les offres de produits et de services de l'entreprise dans le secteur, des données médiocres peuvent rapidement altérer la réputation de votre marque et conduire à des expériences client négatives. Les données en double dans le CRM de l'entreprise se produisent pour diverses raisons.

D'une erreur humaine à des clients fournissant des informations légèrement différentes à différents moments dans la base de données de l'organisation. Par exemple, un consommateur indique son nom comme Jonathan Smith sur un formulaire et Jon Smith sur l'autre. Le défi est exacerbé par une base de données croissante. Il est souvent de plus en plus difficile pour les administrateurs de garder une trace de la base de données et de suivre les données pertinentes. Il devient de plus en plus difficile de s'assurer que la base de données de l'organisation reste exacte. »

Natik Ameen, expert en marketing chez Canz Marketing

Dans cet article, nous examinerons les différents types de données en double, et quelques-unes utiles stratégies que les spécialistes du marketing peuvent utiliser pour dédupliquer ses bases de données d'entreprise.

Différents types de données en double

Les données en double sont généralement expliquées comme une copie de l'original. Mais il existe différents types de données en double qui ajoutent de la complexité à ce problème.

  1. Doublons exacts dans la même source – Cela se produit lorsque les enregistrements d'une source de données sont transférés dans une autre source de données sans tenir compte des techniques de correspondance ou de fusion. Un exemple serait la copie d'informations du CRM vers un outil de marketing par e-mail. Si votre client s'est abonné à votre newsletter, alors son enregistrement est déjà présent dans l'outil de marketing par e-mail, et le transfert de données du CRM vers l'outil créera des copies en double de la même entité.
  2. Doublons exacts dans plusieurs sources – Les doublons exacts dans plusieurs sources surviennent généralement en raison d'initiatives de sauvegarde de données dans une entreprise. Les organisations ont tendance à résister aux activités de purge des données et sont enclines à stocker toutes les copies des données dont elles disposent. Cela conduit à des sources disparates contenant des informations en double.
  3. Des doublons variables dans plusieurs sources – Des doublons peuvent également exister avec des informations variables. Cela se produit généralement lorsque les clients changent de nom, d'intitulé de poste, de société, d'adresse e-mail, etc. Et comme il existe des différences notables entre les anciens et les nouveaux enregistrements, les informations entrantes sont traitées comme une nouvelle entité.
  4. Non-exact doublons dans la même source ou dans plusieurs sources – Un doublon non exact se produit lorsqu'une valeur de données signifie la même chose, mais elle est représentée de différentes manières. Par exemple, le nom Dona Jane Ruth pourrait être enregistré comme Dona J. Ruth ou DJ Ruth. Toutes les valeurs de données représentent la même chose, mais lorsqu'elles sont comparées à l'aide de techniques simples de mise en correspondance des données, elles sont considérées comme non concordantes.

La déduplication peut être un processus très complexe car les consommateurs et les entreprises modifient souvent leurs données de contact au fil du temps. Il y a des différences dans la façon dont ils saisissent chaque champ de données – à partir de leur nom, adresse (s) e-mail, adresse résidentielle, adresse professionnelle, etc.

Voici une liste de 5 bonnes pratiques de déduplication de données que les spécialistes du marketing peuvent commencer à utiliser aujourd'hui. [19659005] Stratégie 1: avoir des contrôles de validation lors de la saisie de données

Vous devez avoir des contrôles de validation stricts sur tous les sites de saisie de données. Cela implique de s'assurer que les données d'entrée sont conformes au type et au format de données requis et se situent entre des plages acceptables. Cela peut grandement contribuer à rendre vos données complètes, valides et exactes. En outre, il est essentiel que votre flux de travail de saisie de données ne soit pas seulement configuré pour créer de nouveaux enregistrements, mais qu'il recherche d'abord et trouve si l'ensemble de données contient un enregistrement existant qui correspond à celui entrant. Et dans de tels cas, il recherche et met à jour uniquement, plutôt que de créer un nouvel enregistrement. De nombreuses entreprises ont intégré des contrôles pour que le client résolve également ses propres données en double.

Stratégie 2: Déduplication à l'aide d'outils automatisés

Utilisez un logiciel de déduplication de données en libre-service qui peut vous aider à identifier et nettoyer les enregistrements dupliqués. Ces outils peuvent normaliser les données trouver avec précision des correspondances exactes et non exactes, et ils réduisent également le travail manuel consistant à parcourir des milliers de lignes de données. Assurez-vous que l'outil prend en charge l'importation de données à partir d'une grande variété de sources telles que des feuilles Excel, une base de données CRM, des listes, etc.

Stratégie 3: utiliser des techniques de déduplication spécifiques aux données

En fonction de la nature des données, la déduplication des données est effectuée différemment. Les spécialistes du marketing doivent être prudents lors de la déduplication des données, car la même chose peut signifier quelque chose de différent pour divers attributs de données. Par exemple, si deux enregistrements de données correspondent à une adresse e-mail, il y a une forte probabilité qu'ils soient des doublons. Mais si deux enregistrements correspondent à l'adresse, il ne s'agit pas nécessairement d'un doublon, car deux personnes appartenant au même ménage pourraient avoir des abonnements distincts dans votre entreprise. Assurez-vous donc de mettre en œuvre les activités de déduplication, de fusion et de purge des données en fonction du type de données que contiennent vos ensembles de données.

Stratégie 4: Atteindre le record d'or grâce à l'enrichissement des données

Une fois que vous avez déterminé la liste des correspondances existantes dans votre base de données, il est essentiel d'analyser ces informations avant de prendre des décisions de fusion ou de purge des données. Si plusieurs enregistrements existent pour une seule entité et que certains représentent des informations inexactes, il est préférable de purger ces enregistrements. D'un autre côté, si les doublons sont incomplets, la fusion des données est un meilleur choix car elle permettra l'enrichissement des données, et les enregistrements fusionnés peuvent ajouter plus de valeur à votre entreprise.

Quoi qu'il en soit, les spécialistes du marketing devraient s'efforcer d'obtenir une vue unique de leurs informations marketing, appelée le golden master record .

Stratégie 5: Surveiller les indicateurs de qualité des données

Un effort continu pour conserver votre le nettoyage et la déduplication des données est le meilleur moyen d'exécuter votre stratégie de déduplication des données. Un outil qui offre des fonctionnalités de profilage des données et de gestion de la qualité peut être d'une grande utilité ici. Il est impératif pour les spécialistes du marketing de garder un œil sur la précision, la validité, l'exhaustivité, l'unicité et la cohérence des données utilisées pour les opérations marketing.

Alors que les organisations continuent d'ajouter des applications de données à leurs processus métier, elles sont devenues nécessaire pour que chaque spécialiste du marketing ait mis en place des stratégies de déduplication des données. Les initiatives telles que l'utilisation d'outils de déduplication des données et la conception de meilleurs flux de travail de validation pour la création et la mise à jour des enregistrements de données sont des stratégies cruciales qui peuvent permettre une qualité fiable des données dans votre organisation.

About Data Ladder

Data Ladder est une plate-forme de gestion de la qualité des données qui aide les entreprises à nettoyer, catégoriser, normaliser, dédupliquer, profiler et enrichir leurs données. Notre logiciel de correspondance de données à la pointe de l'industrie vous aide à trouver des enregistrements correspondants, à fusionner des données et à supprimer les doublons à l'aide d'algorithmes intelligents de correspondance floue et d'apprentissage automatique, quel que soit l'endroit où se trouvent vos données et dans quel format.

Téléchargez un essai gratuit des données de Data Ladder Logiciel correspondant




Source link