Data cleansing

La mise en place de processus efficaces autour de vos clients passe par la propreté des données clients.


Le nettoyage des données est un élément important de toute initiative de qualité des données. Initiale, en First Time Right ou en Data Maintenance. En effet, les données erronées ou incohérentes sont à l'origine d'une multitude de problèmes dans la gestion opérationnelle et stratégique des clients.
 

N'hésitez pas à nous contacter

data-cleansing_header.png

Le nettoyage des données joue un rôle important dans de nombreux scénarios : lors du nettoyage des anciens systèmes ou des données de base, lors de projets de migration, dans la gestion des risques ou lorsqu'il s'agit de conformité. Les données nettoyées sont également très importantes pour la fidélisation de la clientèle ou le marketing direct et de dialogue. Mieux encore : les données nettoyées sont la clé du succès.

 

Quand le nettoyage des données est-il important ?


Bien que les données clients soient essentielles pour le succès de l'entreprise, elles sont souvent négligées, voire insuffisamment prises en compte et gérées, mais en aucun cas de manière appropriée. Cela se traduit par une qualité insuffisante des données, qui a à son tour des conséquences négatives importantes, telles que des processus inefficaces, des coûts accrus, des pertes de chiffre d'affaires et des clients mécontents, voire perdus. Les signes d'une qualité insuffisante des données sont les suivants :

  • Les informations de contact importantes des prospects et des clients sont erronées ou manquantes.
  • Le même client est créé plusieurs fois dans le système ou les informations sont réparties sur plusieurs systèmes.
  • Les collaborateurs passent beaucoup de temps à rechercher les informations sur les clients.
  • Nombre élevé de retours après les envois de mailings.

Différents scénarios de nettoyage des données

Le nettoyage des données n'est pas une 'action ponctuelle'.


Tous les nettoyages de données ne se valent pas. En effet, la phase dans laquelle vous vous trouvez avec vos données et leur qualité détermine le moment où un nettoyage des données doit avoir lieu dans votre processus pour obtenir le résultat souhaité. Les priorités respectives des mesures peuvent également varier. Les scénarios sont les suivants :

Nettoyage initial des données
Veillez à ce que les données soient propres dès le début de votre projet de qualité des données, mais aussi lorsque vous travaillez avec des données tierces ou au début d'une migration de données.
First Time Right
Après le nettoyage initial, veillez en permanence à la propreté des données en vous assurant que les nouvelles données introduites dans un système ne soiennt intégrées qu'après validation.
Data Maintenance
Empêchez le vieillissement de vos données en les nettoyant périodiquement, par exemple pour suivre les déménagements ou les changements de nom, de rue ou de ville.

Nettoyage initial des données. Votre entrée en matière pour des données propres.


Lors du nettoyage initial des données, l'ensemble de vos données est contrôlé et nettoyé automatiquement dans la mesure du possible. Les erreurs qui ne peuvent pas être corrigées automatiquement sont marquées afin que les utilisateurs ou votre Data Steward puissent les corriger. Les doublons doivent être consolidés sous forme de "Golden Record". Si vous avez de nombreuses sources de données différentes et/ou si vos données proviennent de différents pays, vos activités initiales de nettoyage des données seront un peu plus complexes. Mais au bout du compte, vous obtiendrez un ensemble de données actualisé, exhaustif, correct et unique, avec lequel vous pourrez immédiatement travailler.

Dans l'idéal, vous vous êtes préparé au nettoyage initial des données en effectuant une évaluation des données. Lors d'une telle analyse initiale, vos données sont analysées en fonction des critères de qualité centraux pour les données - actualité, exhaustivité, exactitude et recoupement. C'est la base idéale pour le nettoyage initial. Car vous savez d'avance où le bât blesse vraiment. Et vous pouvez planifier vos mesures d'amélioration de la qualité de manière ciblée dès le début.

Les éléments typiques d'un nettoyage initial des données sont les suivants :

  • Les données sont converties dans un format uniforme.
  • Les éléments du nom sont analysés.
  • Un contrôle des adresses est effectué.
  • Déménagement sont mises à jour.
  • Les adresses sont enrichies d'informations supplémentaires.
  • Les doublons sont identifiés et des 'Golden Records' sont créés.

First Time Right. Des données propres dès le départ.


Les bases de données ne sont pas des collections statiques de données clients, elles sont vivantes. Il y a des changements permanents, par exemple de nouvelles données sont ajoutées ou des données existantes sont complétées. C'est pourquoi le Data Quality Firewall précède le nettoyage initial. Il empêche que les bases initialement clarifiés ne se salissent insidieusement en raison du trafic dynamique des données, car des données erronées, incomplètes ou double, voire multiples entrent à nouveau dans le système.

C'est le scénario en temps réel du nettoyage des données. Rien n'entre dans le système sans être vérifié. Concrètement, cela signifie que lorsqu'un nouvel enregistrement est introduit dans le système, on vérifie d'abord s'il existe déjà et s'il est même correct. Cela se fait grâce à une détection des doublons entièrement automatisée, très précise et tolérante aux erreurs. S'il n'est pas clairement établi qu'il s'agit d'un doublon ou non, le DQ Firewall peut indiquer des alternatives possibles. Dans un centre d'appel ou dans un service, c'est un avantage inestimable.

Souvent, des erreurs et des contaminations sont introduites dans le système lors de la saisie des données. En particulier lorsque plusieurs services sont impliqués et qu'ils ont des exigences et des attentes différentes vis-à-vis des données ou que le client final lui-même participe à la saisie. Les fautes d'orthographe, les fautes de frappe, les lettres ou mots entiers manquants, les erreurs d'audition ainsi que les abréviations typographiques causent souvent des problèmes lors de la création ou de la modification de données. En implémentant des contrôles de qualité des données de bout en bout, directement aux endroits où les données entrent dans le système, il est possible d'éviter la pollution "insidieuse" des données.

Avantages First Time Right:

  • Des données de référence clients correctes dès le départ - quelle que soit la source des données ou la personne qui les a saisies - est la manière la plus économique de garantir la qualité des données.
  • Des données de qualité permettent des processus efficaces, et ce dès le début. Les corrections ultérieures des données sont coûteuses et ainsi évitées.
  • Certaines erreurs ne peuvent être rattrapées, par exemple en marketing : il n'y a pas de deuxième chance pour la première mauvaise impression. Les erreurs ne peuvent pas être corrigées par la suite. Cela peut être évité avec First Time Right.
  • Vous gérez les données de référence clients avec au moins autant d'attention que les autres actifs précieux de l'entreprise.

Maintenance des données. Empêcher le vieillissement des données.


Malgré toutes les précautions prises, il est utile de vérifier et de nettoyer 'périodiquement' un stock de données dans des délais déterminés. En effet, les données sont malheureusement soumises à un processus de vieillissement quotidien. Il convient d'y remédier par des mesures appropriées de qualité des données. Ainsi, il faudrait par exemple vérifier régulièrement l'exactitude des adresses, des numéros de téléphone et des adresses e-mail. Ce n'est qu'ainsi que l'on peut déterminer si des erreurs se sont glissées dans les données suite à des changements extérieurs ou à des modifications internes. Il est également important de vérifier régulièrement que les enregistrements n'ont pas été créés deux fois par erreur, par exemple, afin de garantir la qualité des données clients à long terme.

 

La règle du 1-10-100

„It takes $1to verify a record as it´s entered, $10 to cleanse and de-dupe it and $100 if nothing is done, as the ramifications of the mistakes are felt over and over again.“

Quelle: SiriusDecisions/Forrester

Raisons du vieillissement des données :

 

  • Les déménagements : Chaque jour 25.000 personnes en moyenne déménagent, en Allemagne. Cependant, toutes n'informent pas de leur nouvelle adresse, comme les banques, les assurances et autres partenaires commerciaux. Or, sans adresse actuelle, le contact avec les clients est perdu, par exemple pour l'envoi de courrier important.
  • Les changements de nom : Chaque année, 45 000 noms de rues et 2 000 noms de lieux changent en Allemagne, en raison de l'incorporation de communes, de changements de noms ou de nouvelles zones de construction. Ces changements doivent également être suivis en permanence dans les bases de données, faute de quoi l'adresse correcte n'est plus disponible.
  • Doublons : ils sont comme un "faux jeton" et réapparaissent tôt ou tard malgré toute la prudence. Il est donc recommandé de rechercher périodiquement les doublons et les doublons multiples dans l'ensemble des données et de les consolider ensuite afin de ne pas perdre de précieuses informations.

Les plus grandes entreprises font confiance à Uniserv

citroen-kunden-uniserv.svg
deutsche-bank-kunden-uniserv.svg
dpd-kunden-uniserv.svg
ebay-kunden-uniserv.svg
eon-kunden-uniserv.svg
kind-kunden-uniserv.svg
lufthansa-kunden-uniserv.svg
otto-kunden-uniserv.svg
siemens-kunden-uniserv.svg
tui-kunden-uniserv.svg
vw-kunden-uniserv.svg
wundw-kunden-uniserv.svg

Nous sommes là pour vous.

Contactez-nous via le formulaire ou appelez-nous directement.

Cela pourrait aussi vous intéresser :

Migration des données SAP S/4HANA
Dans le cadre de la Customer Vendor Integration, le passage à S/4HANA exige le nettoyage et la consolidation de vos données sur la nouvelle base centrale de partenaires commerciaux. Préparez vos données pour un système SAP performant.
Qualité des données
Des données de qualité optimisées sont une condition essentielle pour le succès de votre entreprise. Comprenez, gérez, normalisez, nettoyez, validez, dédupliquez, exploitez, protégez et surveillez vos données à toutes les étapes de leur cycle de vie.
Déduplication
Trouvez et nettoyez les enregistrements double et multiple de vos clients et prospects, avec une identification de précision tolérante aux erreurs, fondée sur des bases de connaissances spécifiques à chaque pays et obtenez ainsi un système propre et sans doublons.