Les clés pour comprendre l’harmonisation des données géolocalisées

Infostat-Marketing édite des données géolocalisées depuis près de 25 ans. Elles constituent une base pour des études, des projets d’évolution d’entreprises ou d’institutions de toutes sortes. Leur collecte et leur facilité d’usage par ces dernières nécessite une phase d’harmonisation incontournable pour une exploitation basée sur leur fiabilité et leur qualité.

Image Désert

Pourquoi harmoniser (standardiser) les données géolocalisées ?

Infostat-Marketing édite des données géolocalisées depuis près de 25 ans. Celles-ci constituent une base pour des études, des projets d’évolution d’entreprises ou d’institutions de toutes sortes. Leur collecte et leur facilité d’usage par ces dernières nécessite une phase d’harmonisation incontournable pour une exploitation basée sur leur fiabilité et leur qualité.

 L’open data et ses périmètres juridiques ont permis de casser les barrières techniques aux échanges de données géolocalisées. De fait, une prise de conscience sur l’exploitation de ces données se fait jour petit à petit. Cependant cette exploitation implique de disposer de temps pour « préparer » la donnée. Temps dont ne disposent pas toutes les entreprises et institutions. En effet, les données en open data ne disposent pas toutes du même socle de référence et il est souvent difficile de « marier » ces variables.

 L’une des difficultés auxquelles font face les acteurs qui ont besoin de données géolocalisées est l’usage d’indicateurs selon les besoins du moment et sans normalisation. D’où la réglementation sur l’open data et leur utilisation pour les établissements publics qui fait état d’une normalisation. Malheureusement, l’open data au niveau public peine encore à décoller.

Le point fort d’un système d’information géographique est de permettre une analyse conjointe, spatialisée et temporelle de différentes couches de données. L’homogénéisation des données devient alors inéluctable pour que celles-ci ne perdent pas de leur intérêt et de leur pertinence.

 C’est pourquoi il est nécessaire d’harmoniser, de standardiser les données géolocalisées. Vulgairement, on ne pourrait comparer des pommes avec des poires. Notre travail consiste à produire cette homogénéisation des données existantes, si nécessaire dans le but de les rendre exploitables. Elles le sont seulement si elles sont compréhensibles, réutilisables, cohérentes avec leurs référentiels géographique et temporel.

 L’usage de ces données harmonisées a deux avantages majeurs : d’une part, c’est la garantie en interne pour les clients de travailler sur un même socle de référence fiable et de qualité, réutilisable à dessein et d’autre part de gagner un temps loin d’être négligeable. Il s’agit là de la minimisation du temps et du coût de traitement des données pour les entreprises. Ainsi l’harmonisation des données est au cœur de la Data Gouvernance (vision globale sur les données recueillies, mise à disposition de ces dernières auprès des différents services de l’organisation, cohérence des informations, facilité de localisation).

 Le schéma technique simplifié de l’homogénéisation consiste tout d’abord en un formatage (normalisation) qui garantit la lisibilité de la donnée puis d’un « nettoyage » qui consiste à supprimer tout le superflu ou les erreurs dans les jeux de données et a contrario de « combler les trous », ce que nous appelons la « donnée manquante », afin que les jeux de données répondent aux mêmes standards (harmonisation). Ce qui est appelé communément l’interopérabilité, à savoir l’échange de données idoines en interne ou auprès de partenaires n’en est que facilité.

L’harmonisation des données s’inscrit donc dans le parcours classique de la qualité de la data auquel Infostat-Marketing s’astreint:

  1. précision et exactitude
  2. actualisation
  3. complétude côté client
  4. homogénéité
  5. validité, respect des normes
  6. opportunité en lien avec le client

Les avantages de l’harmonisation des données

Les grandes étapes de l’harmonisation des données

L’harmonisation illustrée

Prenons deux villes X et Y dont la population s’élève à 50 000 habitants chacune pour l’année 1. Les données suivantes de l’année 5 nous indiquent que la ville X est passée de 50 000 à 55 000 habitants quand la ville Y accueille sur ce même référentiel temporel 60 000 citoyens. La population de la ville X a évolué de +10% et celle de Y de +20% par rapport à l’année 1.

Ceci pourrait être exact, excepté le fait qu’un autre facteur est venu s’intercaler, facteur dans ce cas précis qui suppose une harmonisation des données : la ville Y a fusionné avec la ville Z qui comprenait, elle, 7 000 habitants lors de l’année 1.

Les données brutes à l’année 5 sont donc biaisées si ce facteur n’est pas pris en compte. L’harmonisation des données consiste à établir un standard : normer les données sur les mêmes référentiels géographiques et temporels.

C’est le cas d’Annecy par exemple qui comptait 51 000 habitants en 2016 et 131 000 en 2017 après sa fusion avec 5 communes.

Les données sont-elles comparables ? Elles le deviennent dès lors qu’elles sont harmonisées aux mêmes référentiels géographiques et temporels.

Derrière cet exemple simple voire simpliste, se cachent de nombreuses analyses utiles aux acteurs économiques quels qu’ils soient. Pourrait-on en effet développer des études, bâtir des conclusions sur des vérités illustrées par des chiffres si le socle sur lequel elles reposent n’est pas comparable ? Projets de transport, infrastructures, logement, commerces, développement de zones d’activités, emploi, etc. ne peuvent objectivement s’élaborer sans des données fiables et solides. Il semble évident – même si encore fois cela est simpliste – qu’une ville de 51 000 habitants n’est pas comparable dans son évolution passée ou future avec une autre de 131 000.

 

Quelles que soient les données, si tant est que les référentiels soient comparables, leur harmonisation relève d’un schéma de construction qui contribue au final à un gain de temps et à une qualité des données pour tout acteur souhaitant les exploiter ces données.

Infostat-Marketing dispose d’une base de données géolocalisées globale de 17 000 variables multithématiques (geoCube). Toutes ces données sont harmonisées afin de vous permettre de les exploiter immédiatement. Contactez-nous pour en savoir plus.

Tout sur le géocodage (ou presque)

Toute analyse géospatiale nécessite une étape nommée GEOCODAGE. Elle implique précision et qualité des données. On vous explique tout (ou presque).   Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées pour le secteur bancassurance,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 7, la communication

Une infographie qui retrace la septième des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 6, l’analyse

Une infographie qui retrace la sixième des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 5, intégrer les données

Une infographie qui retrace la cinquième des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 4, préparer la data

Une infographie qui retrace la quatrième des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 3, le géocodage

Une infographie qui retrace la troisième des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 2, la collecte de la data

Une infographie qui retrace la deuxième des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise se géolocalisation

Le projet géomarketing/géodata : étape 1, le brief

Une infographie qui retrace la première des 7 étapes essentielles d'un projet géomarketing. Un chemin du brief à la communication en passant par les étapes techniques, qui vous conduira sans doute vers l'efficacité grâce à un cadre précis.Entre collecte, traitement,...
Balise de géolocalisation

Géolocalisation : 5 utilisations remarquables faites grâce aux données géolocalisées

La géolocalisation est partout. Elle fait parfois débat. La morale et l'éthique entrent de temps en temps en jeu. Il existe cependant des utilisations remarquables qui valent le détour même si aujourd'hui la géolocalisation est entrée dans les mœurs et qu'elle peut...
boutique dans zone urbaine

Commerce : définir sa zone de chalandise, les bases incontournables

Définir sa zone de chalandise est primordial à plus d'un titre lors de l'implantation d'un commerce ainsi qu'après celle-ci. Potentiel client, zones de cannibalisation, zones concurrentielles, tout est important.Infostat-Marketing, éditeur de données géolocalisées...

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée.