Traces (géo)numériques

La notion de trace peut être définie, a minima, comme l’empreinte ou la marque laissée par une action. Avec l’essor des objets communicants, à l’image des smartphones, et la généralisation de pratiques quotidiennes toujours plus connectées et géolocalisées, cette notion s’est élargie à la sphère numérique (Galinon-Mélénec et Zlitni, 2013). Les traces (géo)numériques désignent l’ensemble des empreintes laissées par des d’individus ou des objets connectés au cours de leurs interactions avec des dispositifs numériques ou des infrastructures de géolocalisation (Mericskay et al., 2018). Ces données d’un type particulier se caractérisent par des métadonnées spatio-temporelles (coordonnées GPS, identifiant de borne Wi-Fi, antenne de réseau mobile, nom d’un lieu…) qui permettent d’analyser les déplacements, les comportements et les usages d’individus et d’objets dans l’espace et dans le temps. Individuellement, ces traces peuvent sembler insignifiantes, mais une fois collectées, analysées et croisées, elles forment des ensembles de données exploitables à forte valeur ajoutée, notamment dans les domaines de l’analyse comportementale, du marketing, de l’aménagement ou du diagnostic territorial.
La notion de trace n’est pas nouvelle en sciences humaines et sociales, mais elle revêt depuis quelques années un caractère particulier dans les champs de la géographie ou des mobilités spatiales (Severo et Romele, 2017). Dans le contexte du développement des données massives, les traces (géo)numériques sont au cœur d’enjeux majeurs tant économiques, sociétaux que scientifiques (Boulier, 2015). En qualité de marqueurs d’activités individuelles, de par leur forme et leur volume, elles constituent un type de donnée très convoité et de nouvelles ressources informationnelles qui questionnent largement les pratiques scientifiques. Ces nouvelles données sont aujourd’hui au cœur d’importants enjeux pour les chercheurs car elles permettent de saisir et de donner à voir les spatialités des sociétés à des échelles spatio-temporelles très fines (Beaude, 2016). De multiples travaux ayant mobilisés ce type de données existent et permettent de mieux cerner les potentialités comme les limites de ces nouvelles ressources. On peut citer des travaux précurseurs autour de l’analyse des données de téléphonie mobile (Elissalde et al., 2011 ; Fen-Chong, 2012 ; Ratti et Claudel, 2016), de pratiques touristiques (Mondo, 2022) ou encore de plateforme de covoiturage (Mericskay, 2019).
Les traces (géo)numériques recouvrent une grande diversité de données, tant en ce qui concerne les phénomènes qu’elles modélisent, leur modalité de production que les acteurs impliqués dans leur collecte. Elles se déclinent en plusieurs catégories en fonction de leur source et de leur usage :
• Données issues des téléphones mobiles (Floating Mobile Data – FMD) : Collectées par les opérateurs de téléphonie mobile via les antennes de télécommunication, elles permettent de mesure la présence des individus et les flux de déplacement.
• Données de véhicules connectés (Floating Car Data – FCD) : Issues des véhicules équipés de GPS et de capteurs, elles renseignent sur position, la vitesse et la direction, contribuant à l’analyse du trafic, notamment en temps réel.
• Données de connexion aux bornes Wi-Fi : Traces laissées par les appareils lorsqu’ils se connectent à des réseaux Wi-Fi, souvent utilisées pour analyser la fréquentation des espaces.
• Données GPS issues de dispositifs embarqués et d’objets connectés : Provenant de smartphones, montres connectées ou applications de navigation et de sport, elles permettent de retracer des itinéraires et des historiques de déplacements.
• Données de billettique des opérateurs de transport en commun : Informations issues des titres de transport numériques, facilitant l’analyse des flux de passagers.
• Données des services de mobilité partagée : Traces générées par les systèmes de vélos en libre-service ou de free-floating, permettant d’évaluer leur usage et leur répartition spatiale.
• Données de réservation de transport : Informations issues des plateformes de réservation de voyages (train, bus, covoiturage), contribuant à la compréhension des mobilités.
• Traces issues des réseaux sociaux : Publications géolocalisées (Twitter, Instagram, Facebook), check-ins (Google Maps, Yelp, Foursquare) ou encore photos avec métadonnées GPS intégrées, témoignant des usages et des déplacements des individus.
Dans la pratique, les traces géonumériques peuvent renvoyer à deux grandes formes d’inscription spatiale, à savoir des traces sous formes de marques ou de flux (Steck, 2011). Alors que les traces-marques proposent une modélisation ponctuelle d’événements associés à un horodatage temporel (photo géolocalisée, check-in dans un lieu, location d’un vélo en libre services ou bornage à une antenne de téléphonie), les traces-flux offrent une modélisation linéaire, centrée sur les itinéraires et les trajectoires des individus ou des objets en mouvement (traces GPS d’un individu, d’un animal ou d’un véhicule).
La production des traces géonumériques peut aussi être abordée sous l’angle du degré de consentement des individus à leur enregistrement. D’un côté les traces volontaires (dans la lignée de l’information géographique volontaire) désigne des enregistrements où l’utilisateur est actif. Autrement dit, la personne qui produit la trace le fait de manière consciente (partage d’une trace de randonnée par exemple). A l’opposé, de nombreuses traces géonumériques sont produite de manière passive et involontaire par les individus dans leurs pratiques quotidiennes (validation d’un titre de transport, utilisation d’une application mobile, réservation d’un trajet…). L’activation automatique de différentes technologies de localisation (GPS, Wi-Fi, réseaux mobiles) au sein des dispositifs numériques permet de suivre les déplacements des utilisateurs en temps réel, souvent à leur insu, soulevant ainsi des enjeux majeurs en matière de confidentialité et de protection de la vie privée. De même que la collecte des données personnelles de géolocalisation à travers l’utilisation d’application tierces fait régulièrement l’objet de critiques.
Les traces (géo)numériques collectées sont mises à disposition sous deux principales formes : individuelles ou agrégées. La majorité des traces géonumériques disponibles sont proposées sous forme agrégée à différentes mailles (commune, IRIS, bâtiment, stations de métro, tronçons de route…) qui résultent du regroupement et du traitement statistique des données individuelles selon différentes méthodes. Cette pratique permet de protéger la vie privée des utilisateurs, en conformité avec des réglementations comme le Règlement Général sur la Protection des Données (RGPD) en France et en Europe. Les traces individuelles correspondent aux enregistrements générés par une seule personne ou un seul compte utilisateur. Ces données peuvent être nominatives, associées directement à une identité ou un pseudonyme, ou anonymisées afin d’être exploitées dans le respect des législations sur la protection des données. En revanche, les réseaux sociaux restent un cas particulier où les traces individuelles, bien que parfois anonymisées, peuvent souvent être directement attribuées à un utilisateur, notamment lorsque des publications sont géolocalisées ou associées à des comptes publics.
L’essor des traces géonumériques a profondément transformé les méthodes de recherche en aménagement du territoire et en géographie, offrant des opportunités inédites tout en soulevant des défis majeurs d’ordres techniques, méthodologiques et éthiques.
D’une part, les traces géonumériques sont produites en grands volumes, sous des formats variés et à des échelles spatio-temporelles hétérogènes. En termes de collecte de données par exemple, l’accès aux traces géonumériques dépend souvent d’acteurs privés (opérateurs télécoms, plateformes numériques, applications mobiles) et sont souvent payantes, ce qui limite leur disponibilité pour la recherche publique. En termes de stockage et gestion des bases de données, la manipulation de grandes masses de données nécessite des infrastructures de stockage adaptées et des protocoles sécurisés pour éviter toute fuite d’informations sensibles. Enfin en matière de traitement, l’analyse des traces exige des compétences en analyse de données, en analyse spatiale et en SIG ainsi que des outils adaptés pour gérer la spatialisation, la temporalité et la complexité des interactions observées.
L’usage des traces géonumériques en géographie et en aménagement suppose également une réflexion approfondie sur leur représentativité et leur interprétation. Ces données se caractérisent par un ensemble de biais et lacunes. En effet toutes les populations et tous les territoires ne génèrent pas de traces de manière équivalente. Certains groupes sociaux (personnes âgées, populations précaires) ou territoires (zones rurales, espaces non connectés) sont sous-représentés, ce qui peut fausser les analyses. De plus, la transformation de données individuelles en données agrégées (au sein de mailles définis) peut introduire des biais d’interprétation spatiaux et statistiques et un risque d’erreur écologique, impactant la fiabilité des analyses.
L’exploitation des traces numériques soulève enfin des questions éthiques, notamment en ce qui concerne la vie privée et la protection des données personnelles. Bien que des techniques d’anonymisation existent, certaines traces permettent aisément de ré-identifier des individus à travers leur domicile ou leur lieu de travail comme de loisirs. Enfin la collecte et la gestion de traces (géo)numériques dans le cadre de projet de recherche doit faire l’objet d’un plan de gestion de données pour assurer à la fois la protection et la sécurisation de données personnelles, potentiellement sensibles (Chardonnel et al., 2021).
Les traces géonumériques constituent une ressource précieuse pour les recherches en aménagement et en géographie. Toutefois, l’exploitation de ces données exige une approche rigoureuse, conciliant expertise technique, méthodologie adaptée et respect de principes éthiques. La mise en place de protocoles de collecte responsables, d’outils d’analyse transparents et de régulations adaptées est essentielle pour garantir une utilisation équilibrée de ces données dans la recherche et la prise de décision territoriale.

Boris Mericskay

 

-Beaude, B. (2016). From digital footprints to urbanity. Lost in transduction. A Cartographic Turn, 273-297.
-Boullier, D. (2015). Les sciences sociales face aux traces du big data. Revue française de science politique, 65(5), 805-828.
-Chardonnel, S., Depeau, S., Devogele, T., Mericskay, B., & Thibaud, J.-P. (2021). La trace : notion partagée pour une recherche interdisciplinaire sur la mobilité des enfants. EspacesTemps.net.
-Elissalde, B., Lucchini, F., & Freire-Diaz, S. (2011). Mesurer la ville éphémère. In D. Pumain et M.F. Mattei (dir.) Données Urbaines 6, Economica-Anthropos, pp. 105-122
-Fen-Chong, J. (2012). Organisation spatio-temporelle des mobilités révélées par la téléphonie mobile en Ile-de-France, thèse de doctorat, Université Panthéon-Sorbonne-Paris I.
-Galinon-Mélénec, B., & Zlitni, S. (2013). Traces numériques. De la production à l'interprétation. CNRS Éditions.
-Mericskay, B., Noucher, M., & Roche, S. (2018). Usages des traces numériques en géographie : potentiels heuristiques et enjeux de recherche. L'Information géographique, 82(2), 39-61.
-Mericskay, B. (2019). Potentiels et limites des traces (géo) numériques dans l’analyse des mobilités : l’exemple des données de la plateforme de covoiturage BlaBlaCar. Cybergeo: European Journal of Geography.
-Mondo, M. (2022). Traces numériques et dimensions spatiales des pratiques de la ville touristique, thèse de doctorat, Université de La Rochelle.
-Ratti, C., & Claudel, M. (2016). The city of tomorrow: Sensors, networks, hackers, and the future of urban life. Yale University Press.
-Severo, M., & Romele, A. (2017). Traces numériques et territoires. Presses des Mines via OpenEdition.
-Steck, B. (2011). Flux et territoires : de la trace à la marque, une question de distance. In B. Galinon-Mélénec (dir.), L’Homme trace : perspectives anthropologiques des traces contemporaines, CNRS Éditions, pp. 249-272.