Infostat-Marketing édite des données géolocalisées depuis près de 25 ans. Elles constituent une base pour des études, des projets d’évolution d’entreprises ou d’institutions de toutes sortes. Leur collecte et leur facilité d’usage par ces dernières nécessite une phase d’harmonisation incontournable pour une exploitation basée sur leur fiabilité et leur qualité.
Pourquoi harmoniser (standardiser) les données géolocalisées ?
Infostat-Marketing édite des données géolocalisées depuis près de 25 ans. Celles-ci constituent une base pour des études, des projets d’évolution d’entreprises ou d’institutions de toutes sortes. Leur collecte et leur facilité d’usage par ces dernières nécessite une phase d’harmonisation incontournable pour une exploitation basée sur leur fiabilité et leur qualité.
Le point fort d’un système d’information géographique est de permettre une analyse conjointe, spatialisée et temporelle de différentes couches de données. L’homogénéisation des données devient alors inéluctable pour que celles-ci ne perdent pas de leur intérêt et de leur pertinence.
L’harmonisation des données s’inscrit donc dans le parcours classique de la qualité de la data auquel Infostat-Marketing s’astreint:
- précision et exactitude
- actualisation
- complétude côté client
- homogénéité
- validité, respect des normes
- opportunité en lien avec le client
Les avantages de l’harmonisation des données
Les grandes étapes de l’harmonisation des données
L’harmonisation illustrée
Prenons deux villes X et Y dont la population s’élève à 50 000 habitants chacune pour l’année 1. Les données suivantes de l’année 5 nous indiquent que la ville X est passée de 50 000 à 55 000 habitants quand la ville Y accueille sur ce même référentiel temporel 60 000 citoyens. La population de la ville X a évolué de +10% et celle de Y de +20% par rapport à l’année 1.
Ceci pourrait être exact, excepté le fait qu’un autre facteur est venu s’intercaler, facteur dans ce cas précis qui suppose une harmonisation des données : la ville Y a fusionné avec la ville Z qui comprenait, elle, 7 000 habitants lors de l’année 1.
Les données brutes à l’année 5 sont donc biaisées si ce facteur n’est pas pris en compte. L’harmonisation des données consiste à établir un standard : normer les données sur les mêmes référentiels géographiques et temporels.
C’est le cas d’Annecy par exemple qui comptait 51 000 habitants en 2016 et 131 000 en 2017 après sa fusion avec 5 communes.
Les données sont-elles comparables ? Elles le deviennent dès lors qu’elles sont harmonisées aux mêmes référentiels géographiques et temporels.
Derrière cet exemple simple voire simpliste, se cachent de nombreuses analyses utiles aux acteurs économiques quels qu’ils soient. Pourrait-on en effet développer des études, bâtir des conclusions sur des vérités illustrées par des chiffres si le socle sur lequel elles reposent n’est pas comparable ? Projets de transport, infrastructures, logement, commerces, développement de zones d’activités, emploi, etc. ne peuvent objectivement s’élaborer sans des données fiables et solides. Il semble évident – même si encore fois cela est simpliste – qu’une ville de 51 000 habitants n’est pas comparable dans son évolution passée ou future avec une autre de 131 000.
Quelles que soient les données, si tant est que les référentiels soient comparables, leur harmonisation relève d’un schéma de construction qui contribue au final à un gain de temps et à une qualité des données pour tout acteur souhaitant les exploiter ces données.
Infostat-Marketing dispose d’une base de données géolocalisées globale de 17 000 variables multithématiques (geoCube). Toutes ces données sont harmonisées afin de vous permettre de les exploiter immédiatement. Contactez-nous pour en savoir plus.
0 commentaires