aucun commentaire

Dessiner les frontières de l’interaction sociale

Les enregistrements numériques des interactions humaines couplés avec l’information géographique nous permettent de découvrir des «frontières sociales» dans les relations entre les groupes qui composent nos sociétés. Au-delà des frontières physiques et administratives, ces frontières invisibles émergent des échanges réels entre les usagers du mobile et fournissent un nouvel outil d’observation de la société. Ces frontières sont historiquement et socialement construites et résultent d’un large éventail de facteurs tels que l’infrastructure de transport, les différences culturelles, ou même les rivalités politiques, etc. Les grandes bases de données comportementales nous offrent la possibilité de mieux comprendre les formes d’interactions sociales et économiques dans les nations contemporaines et de suivre leur évolution.


Beaucoup de « frontières sociales » existantes sont bien connues car elles sont ancrées dans l’histoire de la construction des nations ou des particularités des développements régionaux. Prenons par exemple la Belgique, où une ligne de séparation nord-sud entre les néerlandophones du nord, la Flandre, et les francophones du sud, la Wallonie, est une ancienne ligne de partage au sein de ce petit pays, marquant une barrière entre les différents groupes régionaux et identités culturelles. Cette séparation linguistique peut être clairement observée à partir de modèles de communication entre les clients de téléphonie mobile dans le pays [1].

Dans ce billet, nous nous demandons si les divisions similaires peuvent être détectées dans d’autres pays européens comme la Grande-Bretagne, la France et l’Italie.

IDENTIFIER LES COMMUNAUTÉS DANS LE TRAFIC TÉLÉPHONIQUE

Dans cette étude, nous utilisons les données provenant des bases de facturation téléphonique de plusieurs opérateurs, afin de détecter et de cartographier les contours des communautés au sein de la Grande-Bretagne, de la France, de l’Italie et de la Belgique [2]. Notre protocole comporte deux phases : tout d’abord, nous observons les interactions téléphoniques en fonction des lieux d’échanges, puis nous y appliquons un algorithme de détection des communautés dans les réseaux sociaux reconstruits à partir de ces communications téléphoniques.

Ces réseaux sont construits en associant les différents lieux de communication sur la base de la durée cumulée de tous les appels ayant l’émetteur dans le premier lieu et le récepteur dans le second. Ce processus génère un graphe de communication pondéré (par la durée des appels) et orienté (de A vers B, de B vers A). Bien entendu, ce graphe est de fait basé sur les localités ou les zones utilisées pour localiser les communications dans le réseau de l’opérateur (le code postal du domicile du client ou les positions des antennes de téléphonie cellulaire).

Par exemple, si on regarde les communications qui partent d’une commune, nous allons observer beaucoup d’interactions entre les personnes de cette même localité, puis avec les municipalités voisines et une diminution de nombre des appels vers les autres au fur et à mesure que la distance augmente. Il est alors possible de calculer la probabilité de contact entre les habitants en fonction de la distance qui les sépare [3]. Cependant il reste difficile d’identifier les « frontières sociales » entre les ensembles de personnes qui peuplent un territoire national.

Pour répondre à cette question, des méthodes de détection des communautés ont été mises au point afin d’identifier, des groupes d’utilisateurs qui ont un degré d’interconnexion plus élevé (ici le volume d’échanges téléphoniques) par rapport à d’autres parties du réseau. À partir de notre graphe complet des communications, nous pouvons donc rechercher ces groupements en appliquant un algorithme qui cherche des groupes de lieux d’appel (ou « communautés ») qui ont des liens multiples et denses entre eux et des connexions plus éparpillées avec d’autres lieux (pour plus d’informations voir: [2]).

ANALYSER LES COMMUNAUTÉS DANS L’ESPACE GÉOGRAPHIQUE

Nous observons que toutes les communautés calculées (différentes couleurs) sont spatialement homogènes et leurs frontières coïncident bien avec les limites administratives existantes (en noir). Ce résultat est surprenant, étant donné que la méthode de partition ne prend pas en compte la géographie, ni ne fixe le nombre des membres d’une communauté. La topologie du réseau d’interactions téléphoniques permet de délimiter des régions en fonction des modes de communication quotidiens à l’échelle nationale et ces « régions téléphoniques » sont étonnamment similaires aux régions administratives existantes.

Figure1  Les résultats pour la France (1A) montrent que la carte des communautés suit les frontières administratives avec une précision frappante. Les deux principales exceptions sont les régions du Limousin et de l’Auvergne qui se confondent et Rhône-Alpes divisée en trois. Ceci indique que certaines parties du réseau de communication dans le sud de Rhône-Alpes sont mieux connectées aux régions voisines au sud et au sud-ouest qu’à leur région administrative.

En Grande-Bretagne (1C), la différence la plus évidente entre les groupements détectés et la carte administrative est que le Pays de Galles et, dans une moindre mesure, le Yorkshire, semblent avoir été incorporés dans les régions dominées par les grandes villes des régions de l’Ouest et de l’Est des Midlands. Nous avons également «trouvé» une nouvelle région qui s’étale à l’ouest de Londres.

La partition de l’Italie (1E) correspond aussi globalement à la division officielle du pays, mais un certain nombre de frontières se déplacent entre les régions voisines. Les écarts notables aux frontières administratives comprennent la ville de Vérone faisant partie de la région du Trentin-Haut-Adige, et la partie la plus orientale de la Ligurie, La Spezia, qui fusionne avec la Toscane. Des régions supplémentaires et dispersées apparaissent également sous forme des petites colonies dans la partie ouest de l’Emilie-Romagne, et la Sicile alors divisée en trois.

Ainsi, les réseaux d’interactions téléphoniques à l’échelle d’un pays créent des régions spatialement homogènes et généralement cohérentes avec le géo-partitionnement des grandes régions administratives. Il est possible d’aller plus loin encore en cherchant les communautés de second rang. L’application de l’algorithme fait alors apparaître un second niveau de partitions. Le réseau éclate en plus petites sous-régions. Les panneaux sur la droite dans la figure 1 (B, D, F) montrent que les communautés de deuxième niveau possèdent les mêmes propriétés générales que les partitions de premier niveau : toutes les communautés sont géographiquement homogènes.

Malgré les avancées des technologies ubiquitaires, les réseaux sociaux et les interactions quotidiennes continuent à s’organiser essentiellement autour des préoccupations locales. Les formes d’interaction sociales suivent un contexte local, loin de la prophétie du village planétaire. Plusieurs études  montrent qu’en général environ 80% des appels couvrent des distances inférieures à 50 km, ou que la probabilité que deux personnes soient reliées téléphoniquement est inversement proportionnelle au carré de la distance entre elles [3].

En outre, et cela n’est pas une surprise, les réseaux sociaux semblent encadrés par la distance géographique. La « géographie sociale » qui se dégage de nos communications quotidiennes renforce les lignes de partage politiques, culturelles ou administratives préexistantes à toutes les échelles.

TROUVER LES LIGNES DE FORCE MAJEURES

Considérant le cas de bipartition de la Belgique cité plus haut, nous pourrions rechercher à quoi une telle fracture ressemblerait en France, en Italie ou en Grande-Bretagne. Où passerait la frontière si nous demandions à l’algorithme de détection de communautés de construire seulement deux groupes? Prolongerait-elle une frontière culturelle, politique ou administrative bien connue ?

Figure2

Après l’exécution de l’algorithme de bipartition, nous pouvons observer une séparation presque parfaite des deux communautés selon le groupe linguistique, flamand ou wallon. Quelques résultats intéressants peuvent cependant être soulignés, comme l’inclusion de Bruxelles au territoire de la Flandre et l’apparition d’un petit couloir flamand au sud de Bruxelles (ci-contre). Seulement 3,5% de toutes les communications passent la « frontière linguistique ». De toute évidence, la bipartition belge est très solidement institutionnalisée. Les résultats d’application de l’algorithme de bipartition à d’autres pays sont présentés dans la figure ci-dessous.

Figure3

On remarque que la seconde division la plus forte de notre échantillon se trouve en France avec 5,7% des liens allant d’Ouest en Est. La division des interactions n’est plus liée à l’ancienne frontière linguistique de l’occitan – langues d’Oïl (Sud / Nord), mais longe les frontières occidentales de la Normandie, l’Ile-de-France, le Centre, le Limousin et Midi-Pyrénées.

En Italie, seulement 7,8% des communications traversent une ligne courant le long de la frontière nord de la région Emilie-Romagne qui sépare les métropoles industrielles et commerciales de Milan, Turin et la vallée du Pô de la partie sud du pays. Les données de télécommunications britanniques montrent que seulement environ 9,5% des communications franchissent une ligne à environ 150 km au nord de Londres.

POUR CONCLURE

En appliquant un algorithme de détection de communautés à ces masses de données provenant de 4 pays, nous avons pu montrer que les interactions téléphoniques recouvraient des communautés spatialement cohérentes qui correspondent remarquablement bien aux frontières administratives existantes. La technique employée ici s’est révélée pertinente sur les données collectées dans les pays différents. Elle permet des études multi-niveaux d’un pays, ainsi que la construction de modèles généralisables, comme le bi-partitionnement des pays présentés.

Les résultats obtenus fournissent une vision assez claire, bien que généraliste, de la façon dont nos échanges créent une cartographie sociale de l’espace national. Les frontières de ces interactions suivent souvent des frontières politiques, économiques ou administratives existantes. Le fait que ces « régions téléphoniques » soient dérivées des échanges entre individus offre l’occasion d’aborder des questions anciennes liées à la formation d’identités ou de politiques frontalières, et cela de façon à la fois plus objective et quantitative.

La neutralité d’observation des traces numériques passives d’un grand nombre de personnes a aussi son revers. Il est très difficile de construire les interprétations directes des raisons d’existence de ces communautés et de ces lignes de division. Découvrir les communautés sociales invisibles et des frontières sur une grande échelle ne signifie pas qu’on puisse comprendre les raisons ou les implications de ces frontières immédiatement.

En effet, une chose est de mettre en évidence ces frontières, et une autre est de les comprendre, apprécier et intégrer dans une meilleure compréhension du territoire. Cependant, notre recherche montre que grâce aux données comportementales massives, nous pouvons analyser d’une façon renouvelée les structures générales des sociétés contemporaines, leur géographie, afin de saisir leurs formes mais aussi, potentiellement, leur dynamique.

Laissez-nous votre commentaire