La simulation de l'occupation et de la localisation qui en découle occupe une partie prépondérante dans toutes simulations d'agents. La présence d'individus dans un lieu à une certaine tranche horraire est suffisante pour définir une transmission épidémiologique, nous ne modélisons donc pas
les déplacements à proprement parler. ICI utilise une méthode originale, basée sur la génération d'un cadre définissant les habitudes générales des individus transitant par la zone étudiée, puis la simulation particulière d'emplois du temps géolocalisés.
Un cadre général permet de fixer les habitudes de déplacement des individus au sein de notre zone d'étude. Il est composé de plusieurs parties: i) les entrées et sorties de la zone, ii) les probabilités de changement d'activités et iii) la localisation fine des individus. Ce cadre est
implémenté dans le langage java au sein du projet ici. Ce code-source sera libre sous une licence AGPL lorsqu'il aura fait l'objet d'une publication scientifique.
Flux d'individus hors de la zone
La modélisation de la présence d'individus à l'intérieur des bâtiments ne peut se limiter aux seuls individus modélisés dans notre zone d'étude. Des individus extérieurs sont donc modélisés de deux manières différentes : Les individus ayant une activité principale dans notre zone d'étude seront
modélisés dans le flux principal, les individus présent ponctuellement pour des activités précises seront modélisés dans un flux secondaire. La modélisation de ces flux se basent sur une modélisation de la population et de l'espace urbain, l'enquête globale de transport (EGT), une
enquête ménage déplacement spécialement réalisée sur l'Île-de-France, sur des données d'opérateur de téléphonie mobile, ainsi que sur le comptage de validation dans les stations de transport public ferrés. Les deux types de flux sont générés selon des processus particuliers.
Flux principal
Ce flux concerne la réalisation de la tache principale des individus (dénommé ultérieurement sous le terme "travail"), qui a pour caractéristique d'être réalisée de manière identique à chaque fois que l'activité principale est prévue dans l'emploi du temps.
Il est également connu sous le terme de flux pendulaire. Il concerne à la fois les individus habitant dans la zone d'étude et travaillant hors de cette zone, ainsi que les individus habitant hors de la zone et travaillant dedans. Ce flux est discrétisé en trois catégories de population
: les écoliers, les étudiants et les travailleurs, les écoliers ayant un processus simplifié.
Plus d'informations concernant les écoliers
Faisant l'hypothèse que les écoliers se déplacent peu hors de leurs zone d'étude pour aller étudier, nous ne créons pas à la fois un flux entrant et un flux sortant de notre arrondissement. Si le nombre d'écolier est supérieur au nombre de places au sein de notre zone, nous considérons que le
surplus d'écoliers iront à l'extérieur. À l'inverse, un flux d'écolier viendront peupler les places vacantes dans notre zone d'étude. Les cartes scolaires seront bientôt intégrés dans le simulateur afin de respecter au mieux les caractéristiques spatiales propres à la présence de cette
population.
Les stocks de personnes et de places au sein des établissements sont connus pour chacune de ces catégories (fig. 1) et son directement issus des modélisations de population synthétique et de l'intérieur des bâtiments décrites précédemment.
Personnes vivant dans la zone et travaillant à l'extérieur
La valeur de flux principale, de laquelle vont dépendre les autres, concerne les individus de notre zone d'étude allant travailler dans une autre zone. Nous devons capturer le nombre de personne quittant la zone dans la période de pic matinale, de 6h à 10h pour Paris. L'information représentant
un stock le moins approximatif est le nombre de validations dans les réseaux ferrées, disponible pour tous les jours depuis 2015. Ces fréquentations ne sont reliés à aucun profil socio-démographique, prennent en compte des personnes qui ne viennent pas d'Île de France.
Les données téléphoniques sont collectés lorsque l'utilisateur du réseau en question se connecte à internet. Les flux ainsi repérés sont donc loin d'être exhaustif. Également, les informations sur la destination ou l'origine peuvent être approximative et concerner un endroit où l'individu est
passé. Cette caractéristique nous empêche d'utiliser les données brutes pour ce sujet. Cependant, ces données nous permettent de déterminer une proportion de personnes ayant borné hors de l'Île de France, et donc devant être extraite de notre chaîne de traitements pour respecter les habitudes
recensées dans l'EGT.
L'EGT pourrait nous donner une estimation du nombre de personne partant pour travailler mais celle ci serait indépendant de la journée en question et ne permettrait pas de représenter les fluctuations de présence en fonction des différentes journées. Nous utilisons l'EGT pour déterminer le
ratio des utilisateurs du métro se rendant au travail. Nous en extrapolons le nombre de personne se rendant au travail en métro, ainsi que les étudiants se rendant sur leurs lieux d'étude en métro, pour déterminer le flux principal entrant chaque jour dans la zone.
Personnes
Flux Secondaire
Illustrations des flux entrant et sortant des arrondissements V, VI et VII à Paris selon l'EGT.
Transitions d'activités
Une chaîne de Markov a été modélisé afin de déterminer la probabilité qu'a un individu de changer ou non d'activité à chaque nouveau pas de temps. Cette chaîne est dite libre car il est possible de passer d'une activité à n'importe quelle autre, si la probabilité n'est pas nulle. Chaque
probabilité de transition est calculée grâce à l'enquête globale transport pour différents profils socio-démographiques. Cette approche permet une liberté dans la diversité des emplois du temps générés, tout en adoptant statistiquement les habitudes des
personnes sondées.
Quelques remarques peuvent être apportés à cette modélisation. Les individus ne disposent pas de mémoire sur leurs activités, ce qui signifie qu'il ne sera pas modélisé d'habitudes (par exemple, le travail de nuit est simulé dans les bonnes proportions en fonction des différentes classes
sociales, mais les personnes travaillant de nuit changeront tous les jours. De plus, la chaîne étant libre, il est possible que la personne travaillant de nuit ne le fasse que sur un unique créneau, alors qu'elle exercerait probablement son travail durant toute la nuit. La discrétisation en une
combinaison large de catégories socio-démographiques peut amener certains stocks de répondants à être statistiquement peu représentatif.
Localisation fine des activités
Les échelles des zones étudiés sont de la taille d'une ville moyenne ou d'un arrondissement d'une grande ville Française. Les individus sont affectés à des activités correspondant aux activités de leurs emplois du temps, mais aléatoirement tirées dans l'ensemble de la zone d'étude. Il est
toutefois possible de localiser plus finement où sera localisé cette activité. L'utilisation de matrices origines-destinations, basé sur des agrégats statistiques de taille variable, permet de calculer une probabilité de se rendre dans chaque agrégat depuis un agrégat d'origine. De telles
matrices peuvent être générées grâce à des données mobiles.
Simulation des déplacements
Lors de la simulation épidémiologique, Ces tirages aléatoires doivent être réalisés Cela représente une grande partie du temps de calcul de la simulation (environ 40%). On procède de la sorte :
Chargement et interprétation du framework.
Pour chaque jour simulé:
Génération d’un emploi du temps pour chaque individu.