Description de la génération de population synthétique
Cette partie fait actuellement l'objet de la rédaction d'un article scientifique, et est par ailleurs sujet à de fréquentes modifications.
Une nouvelle page sera écrite lorsque les méthodes seront fixées et la méthodologie publiée.
Description
Les générateurs de populations synthétiques proposent en général des données faiblement géolocalisés et avec une hiérarchie limitée (ménages pour quelques modèles seulement), et générant des marginales limitées et faiblement intégrées.
Le générateur développé dans le cadre du projet ICI apporte plusieurs innovations :
Il permet de générer une population synthétique hiérarchisée en quatre couches (logement – ménage – famille – individu).
Il est réaliste, c’est à dire respectant un nombre infini de statistiques et de contraintes, définies à diverses échelles. Ces statistiques et contraintes peuvent être dépendantes les unes des autres. Aussi, il agit à une résolution individuelle, soit il représente un individu pour chaque individu, contrairement à d’autre modèles qui font des échantillons.
Il est fortement géolocalisé. Tout objet généré (logement à individu) possède une géolocalisation dans le territoire et ses caractéristiques dépend de contraintes géolocalisés (IRIS, statistiques départementales ou régionales, etc.).
Application
Ce modèle a été déployé sur toute la France Métropolitaine, et pourrait sans difficulté technique être déployé sur les outre-mers.
Il pourrait être étendu à un contexte européen en intégrant les données EuroStat.
Validation
Plusieurs processus de validation seront présentés dans l’article. Nous nous assurons dors-et-déjà que les données générés respectent les statistiques d’entrés. Les graphiques suivants fournissent quelques exemples de face-validation, qui sera complété par des métriques permettant de mesurer la correspondance des populations simulés aux statistiques nationales.