On l’a vu, la qualité de la donnée est un enjeu de performance.
Mais il n’est pas évident à traiter d’autant que de nombreux éléments déterminent cette qualité de la donnée.
J’en ai compté 6 que je vous expose ci-dessous.
La qualité de la donnée est liée à son cycle de vie
Les deux aspects sont pour moi indispensables. On ne peut pas traiter de la qualité de la donnée sans s’intéresser à son cycle de vie. Quand la donnée est-elle créée, modifiée et quand devra-t-elle être supprimée? Et enfin par qui?
En effet, toute donnée se transforme et évolue. Elle est mouvante, presque vivante.
D’ailleurs, de nombreuses personnes vont être amenées à travailler sur une même donnée et à la modifier.
C’est pourquoi, la connaissance du cycle de vie va déterminer trois éléments primordiaux de la qualité de la donnée:
- La fraîcheur de la donnée : Avoir une donnée ancienne, voire dépassée (surtout si je ne le sais pas) ne sert pas à grand chose. Dès lors, des données à jour, rafraîchies régulièrement, voire en continu ou même en temps réel, permettent d’avoir les éléments pour prendre une bonne décision. La fréquence de mise à jour est une question qu’il faut systématiquement se poser sur un projet. Elle détermine directement les types d’intégration et de collecte que l’on met en place.
- Le délai de mise à disposition des données est lié à cette notion de fraîcheur. Si mon système contient rapidement les données mais qu’il faut des heures (voire des semaines dans certains cas) pour que l’utilisateur y accède, cela perd de son charme… La disponibilité des informations déterminera bien souvent l’utilisation qui peut en être faite.
- La traçabilité de la donnée est très importante également. Le but est ici de pouvoir expliquer et décortiquer les transformations qui sont faites sur la donnée brute. On veut ainsi suivre la donnée de sa « capture » jusqu’à sa restitution. Cela rejoint une problématique plus large de Data Gouvernance. Là encore c’est le cycle de vie qui doit être observé pour s’assurer qu’on sait à tout moment justifier des traitements que la donnée « subit ».
La qualité de la donnée ne peut donc se mesurer qu’à « l’instant t » et en fonction de l’utilisation que l’opérationnel devra en faire.
La donnée vise à décrire la réalité
Autrement dit, il faut que mes informations soit conformes à cette réalité!
On retrouve dès lors deux autres éléments importants :
- La véracité des données. Globalement il s’agit de s’assurer que les données soient exactes, précises et donc… fiables! Mes données sont-elles correctes ou au contraire sont-elles erronées? Si je dois passer du temps à vérifier une donnée… Si j’ai un doute sur le fait que je peux utiliser les données fournies, alors… il n’y pas de doute: autant m’en passer! Imaginez que vous conduisiez une voiture mais que le tableau de bord indique en permanence 20km/h quelle que soit la pression exercée sur l’accélérateur… ça ne vous sert pas à grand chose.
- La complétude détermine également la qualité de la donnée et surtout son utilisabilité. L’information est-elle complète? exhaustive? L’ensemble des champs sont-il remplis? Avoir une fiche client, ça me permet de contacter mon interlocuteur à bon escient, mais si au moment voulu, je dois aller chercher son numéro de téléphone dans 2 ou 3 autres systèmes, c’est qu’on a clairement un problème d’efficacité, mais aussi de la qualité de la donnée !
Ces éléments détermineront directement la fiabilité de la donnée et au final l’adoption ou non des outils et tableaux de bord proposés.
Qualité de la donnée et sécurité de l’accès
Enfin, dernier élément à garder à l’esprit : les autorisations d’accès aux données.
Nous sommes à une époque où les fuites d’information peuvent être dramatiques en terme d’image. Or les experts nous expliquent que la plupart des fuites ne viennent pas d’attaques externes mais de négligences internes… Dès lors, il faut s’assurer que les bonnes personnes ont accès aux bonnes informations et pas plus.
Si tout le monde accède à la donnée, c’est sans doute que n’importe qui la modifie… Il faut donc surveiller de près l’accès à la donnée pour garantir une niveau minimum de la qualité de la donnée.
C’est pour cela qu’il faut mettre en place quelques bonnes pratiques autour de la qualité de la donnée, voire des outils et une réelle démarche d’entreprise.
(Merci à Jean-Luc qui a co-écrit cet article!)
Les sujets qui m’intéressent le plus sont Data, Organisation et Temps Réel !
N’hésitez pas à me faire un retour sur cet article ou à me contacter sur LinkedIn pour partager nos actualités!
Andrea