Infostat-Marketing édite des données géolocalisées depuis près de 25 ans. Elles constituent une base pour des études, des projets d’évolution d’entreprises ou d’institutions de toutes sortes. Leur collecte et leur facilité d’usage par ces dernières nécessite une phase d’harmonisation incontournable pour une exploitation basée sur leur fiabilité et leur qualité.

Image Désert

Pourquoi harmoniser (standardiser) les données géolocalisées ?

Infostat-Marketing édite des données géolocalisées depuis près de 25 ans. Celles-ci constituent une base pour des études, des projets d’évolution d’entreprises ou d’institutions de toutes sortes. Leur collecte et leur facilité d’usage par ces dernières nécessite une phase d’harmonisation incontournable pour une exploitation basée sur leur fiabilité et leur qualité.

 L’open data et ses périmètres juridiques ont permis de casser les barrières techniques aux échanges de données géolocalisées. De fait, une prise de conscience sur l’exploitation de ces données se fait jour petit à petit. Cependant cette exploitation implique de disposer de temps pour « préparer » la donnée. Temps dont ne disposent pas toutes les entreprises et institutions. En effet, les données en open data ne disposent pas toutes du même socle de référence et il est souvent difficile de « marier » ces variables.

 L’une des difficultés auxquelles font face les acteurs qui ont besoin de données géolocalisées est l’usage d’indicateurs selon les besoins du moment et sans normalisation. D’où la réglementation sur l’open data et leur utilisation pour les établissements publics qui fait état d’une normalisation. Malheureusement, l’open data au niveau public peine encore à décoller.

Le point fort d’un système d’information géographique est de permettre une analyse conjointe, spatialisée et temporelle de différentes couches de données. L’homogénéisation des données devient alors inéluctable pour que celles-ci ne perdent pas de leur intérêt et de leur pertinence.

 C’est pourquoi il est nécessaire d’harmoniser, de standardiser les données géolocalisées. Vulgairement, on ne pourrait comparer des pommes avec des poires. Notre travail consiste à produire cette homogénéisation des données existantes, si nécessaire dans le but de les rendre exploitables. Elles le sont seulement si elles sont compréhensibles, réutilisables, cohérentes avec leurs référentiels géographique et temporel.

 L’usage de ces données harmonisées a deux avantages majeurs : d’une part, c’est la garantie en interne pour les clients de travailler sur un même socle de référence fiable et de qualité, réutilisable à dessein et d’autre part de gagner un temps loin d’être négligeable. Il s’agit là de la minimisation du temps et du coût de traitement des données pour les entreprises. Ainsi l’harmonisation des données est au cœur de la Data Gouvernance (vision globale sur les données recueillies, mise à disposition de ces dernières auprès des différents services de l’organisation, cohérence des informations, facilité de localisation).

 Le schéma technique simplifié de l’homogénéisation consiste tout d’abord en un formatage (normalisation) qui garantit la lisibilité de la donnée puis d’un « nettoyage » qui consiste à supprimer tout le superflu ou les erreurs dans les jeux de données et a contrario de « combler les trous », ce que nous appelons la « donnée manquante », afin que les jeux de données répondent aux mêmes standards (harmonisation). Ce qui est appelé communément l’interopérabilité, à savoir l’échange de données idoines en interne ou auprès de partenaires n’en est que facilité.

L’harmonisation des données s’inscrit donc dans le parcours classique de la qualité de la data auquel Infostat-Marketing s’astreint:

  1. précision et exactitude
  2. actualisation
  3. complétude côté client
  4. homogénéité
  5. validité, respect des normes
  6. opportunité en lien avec le client

Les avantages de l’harmonisation des données

Les grandes étapes de l’harmonisation des données

L’harmonisation illustrée

Prenons deux villes X et Y dont la population s’élève à 50 000 habitants chacune pour l’année 1. Les données suivantes de l’année 5 nous indiquent que la ville X est passée de 50 000 à 55 000 habitants quand la ville Y accueille sur ce même référentiel temporel 60 000 citoyens. La population de la ville X a évolué de +10% et celle de Y de +20% par rapport à l’année 1.

Ceci pourrait être exact, excepté le fait qu’un autre facteur est venu s’intercaler, facteur dans ce cas précis qui suppose une harmonisation des données : la ville Y a fusionné avec la ville Z qui comprenait, elle, 7 000 habitants lors de l’année 1.

Les données brutes à l’année 5 sont donc biaisées si ce facteur n’est pas pris en compte. L’harmonisation des données consiste à établir un standard : normer les données sur les mêmes référentiels géographiques et temporels.

C’est le cas d’Annecy par exemple qui comptait 51 000 habitants en 2016 et 131 000 en 2017 après sa fusion avec 5 communes.

Les données sont-elles comparables ? Elles le deviennent dès lors qu’elles sont harmonisées aux mêmes référentiels géographiques et temporels.

Derrière cet exemple simple voire simpliste, se cachent de nombreuses analyses utiles aux acteurs économiques quels qu’ils soient. Pourrait-on en effet développer des études, bâtir des conclusions sur des vérités illustrées par des chiffres si le socle sur lequel elles reposent n’est pas comparable ? Projets de transport, infrastructures, logement, commerces, développement de zones d’activités, emploi, etc. ne peuvent objectivement s’élaborer sans des données fiables et solides. Il semble évident – même si encore fois cela est simpliste – qu’une ville de 51 000 habitants n’est pas comparable dans son évolution passée ou future avec une autre de 131 000.

 

Quelles que soient les données, si tant est que les référentiels soient comparables, leur harmonisation relève d’un schéma de construction qui contribue au final à un gain de temps et à une qualité des données pour tout acteur souhaitant les exploiter ces données.

Infostat-Marketing dispose d’une base de données géolocalisées globale de 17 000 variables multithématiques (geoCube). Toutes ces données sont harmonisées afin de vous permettre de les exploiter immédiatement. Contactez-nous pour en savoir plus.

carte du taux de pauvreté en France

Données géolocalisées et pauvreté en France

Données géolocalisées et pauvreté en FrancePourquoi "géolocaliser la pauvreté" ? On peut légitimement se poser la question. On peut même se demander si cela est bien moral tant le sujet est sensible. Il suffit cependant de se pencher sur le sujet pour s'apercevoir que...
devanture d'une librairie des années 20-30

Librairies BD et données géolocalisées : 4 critères pour votre implantation de magasin

Disposer des bonnes données pour implanter votre magasin est un prérequis essentiel afin que votre projet puisse voir le jour et être pérenne. Chaque projet est unique. Cependant, des grandes lignes peuvent être définies sur lesquelles vous pouvez vous baser. Voyons...

Opendata : normalisation des jeux de données

La normalisation des jeux de données permet d’exploiter plusieurs jeux de données qui sont bâtis sur les mêmes normes.

Base de données OGRB

La data science au service des assureurs

La data science a largement trouvé sa place auprès des assureurs depuis plusieurs années. Les cas d'usage des données sont nombreux : risques climatiques, objets connectés, lutte contre la fraude, relations avec les assurés, compétitivité...Chez Infostat-Marketing,...
carte de densité de population en Europe

Géodonnées : 8 valeurs de plus. N° 7 et 8 : la densité et la répartition

L'une des 8 valeurs de la marguerite de données éditée par Infostat-Marketing est la densité. Datavisualiser une densité sur une carte est une formidable aide à la décision.   La carte ci-dessous permet de rendre visible la densité de population en Europe....
Normalisation des données géomarketing

Géodonnnées : 8 valeurs supplémentaires. N° 6 : la normalisation 

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées édite...
marguerite stylisée sur fond beige. Texte : la marguerite des données, 8 valeurs de plus pour les données géolocalisées

Géodonnées : 8 valeurs de plus. N° 4 et 5 : les prévisions et projections

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d’expérience dans les données géolocalisées édite...
données géolocalisées : 1 valeur de plus à ajouter à vos études : le rang

Données géolocalisées : 8 valeurs à ajouter à vos valeurs brutes. 3ème valeur : le rang

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées édite...

Données géolocalisées : 8 valeurs de plus. 2/8 : le « taux d’évolution »

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées édite...
Pack de données géolocalisées sur les métiers

Données géolocalisées : les packs métiers d’Infostat-Marketing

Spécialiste des données géolocalisées, nous éditons des packs thématiques par secteurs d'activité et métiers, utiles pour vos études et disponibles dans notre base de données géoCube.   Nos données sont normalisées et harmonisées. Elles sont disponibles sur...
carte du taux de pauvreté en France

Données géolocalisées et pauvreté en France

Données géolocalisées et pauvreté en FrancePourquoi "géolocaliser la pauvreté" ? On peut légitimement se poser la question. On peut même se demander si cela est bien moral tant le sujet est sensible. Il suffit cependant de se pencher sur le sujet pour s'apercevoir que...
devanture d'une librairie des années 20-30

Librairies BD et données géolocalisées : 4 critères pour votre implantation de magasin

Disposer des bonnes données pour implanter votre magasin est un prérequis essentiel afin que votre projet puisse voir le jour et être pérenne. Chaque projet est unique. Cependant, des grandes lignes peuvent être définies sur lesquelles vous pouvez vous baser. Voyons...

Opendata : normalisation des jeux de données

La normalisation des jeux de données permet d’exploiter plusieurs jeux de données qui sont bâtis sur les mêmes normes.

Base de données OGRB

La data science au service des assureurs

La data science a largement trouvé sa place auprès des assureurs depuis plusieurs années. Les cas d'usage des données sont nombreux : risques climatiques, objets connectés, lutte contre la fraude, relations avec les assurés, compétitivité...Chez Infostat-Marketing,...
carte de densité de population en Europe

Géodonnées : 8 valeurs de plus. N° 7 et 8 : la densité et la répartition

L'une des 8 valeurs de la marguerite de données éditée par Infostat-Marketing est la densité. Datavisualiser une densité sur une carte est une formidable aide à la décision.   La carte ci-dessous permet de rendre visible la densité de population en Europe....
Normalisation des données géomarketing

Géodonnnées : 8 valeurs supplémentaires. N° 6 : la normalisation 

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées édite...
marguerite stylisée sur fond beige. Texte : la marguerite des données, 8 valeurs de plus pour les données géolocalisées

Géodonnées : 8 valeurs de plus. N° 4 et 5 : les prévisions et projections

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d’expérience dans les données géolocalisées édite...
données géolocalisées : 1 valeur de plus à ajouter à vos études : le rang

Données géolocalisées : 8 valeurs à ajouter à vos valeurs brutes. 3ème valeur : le rang

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées édite...

Données géolocalisées : 8 valeurs de plus. 2/8 : le « taux d’évolution »

Infostat-Marketing a développé la marguerite de données : 8 valeurs à associer à vos valeurs brutes pour affiner vos études. Un véritable + et une aide à la décision indispensable.Infostat-Marketing, fort de ses 25 ans d'expérience dans les données géolocalisées édite...
Pack de données géolocalisées sur les métiers

Données géolocalisées : les packs métiers d’Infostat-Marketing

Spécialiste des données géolocalisées, nous éditons des packs thématiques par secteurs d'activité et métiers, utiles pour vos études et disponibles dans notre base de données géoCube.   Nos données sont normalisées et harmonisées. Elles sont disponibles sur...

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *