Qualité des données

———————————————————————————

Parce que la donnée reste et restera toujours l’énergie de la relation Client, elle participe activement au capital de l’entreprise.

MAIS ATTENTION…, LA QUALITE  D’UNE  DONNEE  SE  MERITE…

Les sources de production de données sont multiples. Les modes de collecte de données sont divers, les supports de collecte également. Il peut s’agir de formulaires papier ou web, de communications téléphoniques, de bons de commande …les modalités de saisie varient avec le contexte. Les facteurs de dégradations associés sont, par conséquent très nombreux.

Les données collectées seront exploitées et enrichies à travers les différents environnements de l’entreprise :

  • Relation Client, Connaissance Client (Datamining),
  • Reporting et Connaissance Business (Business intelligence),
  • Communication directe multicanal,
  • Logistique,
  • Programme de fidélité, …

Les risques de dérive, les sources de dégradation associés à toute production de données sont multiples, sournois, imperceptibles….

Mais la sentence est là :

Pas de résultat cohérent, sans donnée cohérente

Garbage in   –>   Garbage out


Le coût généré par une donnée fausse, déformée, inexacte, invalide est difficile à mesurer, il peut être très lourd.

Parce que chaque entreprise est unique, seule une analyse du processus de production de données permet d’identifier les risques, faiblesses et causes de dégradation. C’est à partir de ces travaux que seront élaborés des solutions adaptées et cohérentes avec l’activité de l’entreprise

La « non qualité » génère coûts et risques


 

 

COMMENT ? NOTRE METHODE

Une règle : Concentrer les efforts de mise aux normes sur ce qui est important et de se débarrasser des données polluantes.

 

Des étapes claires:

1 – Définition du périmètre d’observation

Celui-ci dépend directement de la problématique d’optimisation

  • S’agit de dédupliquer des fichiers de personnes ?
  • S’agit-il de rendre cohérentes des communications personnalisées ?
  • S’agit-il d’optimiser un scoring ?

2 – Lister les données concernées,

avec origine/source, stockage, traitement …

et, définition d’une grille de lecture des données suivant x dimensions :

i.La source

ii.Le mode de collecte

iii.L’utilisation et le mode de mise à jour

Sur chaque dimension et pour chaque donnée, on définira un score « risque »/utilisation en différenciant risque interne et risque externe

3 – Exemple d’éléments d’appréciation

  • A chaque type d’erreurs correspond une solution plus ou moins onéreuse ou efficace.
  • Ainsi pour chaque champ à traiter, des scores de correction seront valorisés selon des critères tels que le coût, l’efficacité, l’urgence
  • Certaines erreurs pourront être traitées automatiquement par une nouvelle règle de gestion à développer puis implémenter.
  • D’autres erreurs ont peu d’importance, elles n’affectent pas le résultat. Sera proposé alors, l’effacement du champ erroné.
  • Certaines erreurs bloquantes peuvent nécessiter des solution plus élaborées.

4 – Mise en œuvre des corrections

  • Il peut s’agir de traitements batch, on line, standards ou sur mesure,
  • Il peut s’agir d’enrichissements ponctuels ou récurrents…/…

5 – Mise en œuvre d’indicateurs

Il est important de disposer d’un moyen de diagnostic simple

Evaluer régulièrement l’état des données permettra d’ajuster les traitements…

6 – Définition des récurrences

Ce sujet est traité environnement par environnement.

VOTRE BENEFICE

Gagner en qualité, fiabilité et donc en efficacité

L’analyse de chaque processus de production de données permettra d’identifier les dysfonctionnements et leurs causes. Pour chacune des causes, une solution adaptée sera proposée.

 

  • Identifier les risques
  • Identifier les causes
  • Les hiérarchiser
  • Disposer d’indicateurs clairs
  • Se donner les moyens de les corriger