Description de la modélisation de l'usage des bâtiments

Un article scientifique est en cours de review et le preprint est disponible ici et le code source ici.

Ce modèle permet de générer un Building Land-Use à échelle individuelle, soit un inventaire des usages et occupations diverses présentes dans chaque bâtiment.

Pour ce faire, l’objet bâtiment doit être redéfini afin de distinguer un bâtiment d’un autre non pas en se basant sur des des différences morphologiques, mais avec une définition axée sur une continuité fonctionnelle. Il est en effet possible qu’une même activité soit partagée entre plusieurs bâtiments distincts et non contigus.

La première étape de ce modèle est donc de procéder à des groupement de blocs de bâtiments grâce à des points communs administratifs (adresses communes, inclusion dans une parcelle cadastrale, etc.).

La modélisation des usages des bâtiments se fait ensuite en distinguant deux types d’espace : les logements et les activités. Les logements sont soit directement tirée des données (BD-Topo® via une fusion de données de la DGFiP), soit peut être ventilée avec un pro-rata du volume bâti et résidentiel par rapport à la somme de logements présents dans un agrégat statistique.

Les activités sont récoltés dans un nombre extensible de sources de données (pour notre exemple, SIRENE, BPE, OSM, ainsi que des acteurs locaux tels que l’APUR). Un système d’appariement et de fusion totalement automatique a été développé pour l’occasion. Un ensemble d’activités localisées fiable et exhaustif est donc attribué à chaque bâtiment.

La dernière étape de ce modèle est d’enrichir la description des entités grâce à des recoupements entre diverses informations (localisations et géométries des bâtiments, types d’activités, etc.) afin de déterminer divers caractéristiques (présence ou non d’un local dédié, superficie totale de ce local, ouverture au public, horaires d’ouverture, indice de fréquentation, etc.).

Aussi, ce modèle est historicisé, on considère ses résultats comme réalistes, il est complètement automatisé et flexible au nombre et à la qualité des données d’entrée.

Application

Ce modèle a été déployé sur toute la France Métropolitaine, et pourrait sans difficulté technique être déployé sur les outre-mers. Il pourrait être étendu à un contexte européen en intégrant les données EuroStat.

Validation

Plusieurs étapes de validation sont présentés dans l’article sus-mentionné :

Validation de la génération d’un nombre de logements avec uniquement des données statistiques.
Effets de l’utilisation de liens bâtiment-adresses vs sans aucun liens (inclusions des adresses et des parcelles).
Comparaison grâce à des données tierces entre les activités ayant de multiples adresses et les groupements de bâtiments.
Validation manuelle du matching entre activités.
Validation de l’historicisation des données en comparant les établissements considérés comme fermés par le modèle mais encore ouverts sur OSM. Lieu de la vérité terrain : Courbevoie.
Validation générale des résultat avec une vérité terrain. Une campagne de relevé terrain à visé à qualifier la ressemblance de ce qui a été modélisé sur trois IRIS du 19ème arrondissement de Paris. Les résultats ne sont pas mauvais mais relève quelques nécessités d’améliorations (tout dépend de l’usage qui en serait demandé).

Mise à disposition des données

Pour l’instant dans une base de données PostGIS hébergé localement, bientôt dans un Triple-store ? Prévoir une correction collaborative de ces données ?