Sujet de master 2 : apprentissage profond pour la segmentation automatique d'orthophotos

Mots-clés : apprentissage profond, GAN, traitement d'images, système d'information géographique, déficience visuelle

Contexte général

Ce stage se place dans les thématiques du LabEx Imobs 3 et du Challenge 2 « Services et Systèmes de Mobilité Intelligente » [1], qui a notamment pour objectif de concevoir et de développer des briques technologiques performantes et intelligentes répondant à des enjeux sociétaux de la mobilité des personnes.

Dans le sujet que nous présentons ici, il s'agit de proposer une approche originale à la collecte de données nécessaire aux outils d'assistance au déplacement ou au déplacement autonome dans l'espace urbain, en proposant une approche mixte, qui intègre à la fois des orthophotographies et de données structurées (OpenStreetMap, BD ORTHO de l'IGN). Ces données sont à la fois disponibles en qualité relativement homogène sur tout le territoire national, et peuvent faire l'objet d'une mise à jour localisée et rapide sur un territoire d'intérêt, pour affiner la qualité de l'information consolidée.

L'approche envisagée s'appuie sur le traitement par réseau de neurones profonds de données préparées, et constitue une problématique actuelle dans la communauté scientifique de la donnée géographique.

Contexte thématique

L'espace public urbain voit son usage très codifié : espaces de cheminements piétons, voies automobiles, pistes cyclables, passages piétons, îlots centraux, ... Ces informations sont essentielles à de nombreux usages, notamment pour concevoir des outils à destination des personnes en situation de déficience visuelle, comme nous l'explorons dans le projet Compas [2].

Il n'existe pas aujourd'hui de base de données publique qui collecte les informations géographiques à une précision suffisante pour en avoir une représentation utilisable. Que ce soit les cartes HD pour la voiture intelligente, ou le micromapping [3] chez OpenStreetMap, ces données sont soit partielles, soit confidentielles, et nécessitent un travail d'acquisition minutieux, utilisant par exemple les approches Lidar, ou la photogrammétrie.

D'un autre côté, les images aériennes (orthophotographies) de haute résolution mises à disposition par des acteurs publics tels que l'IGN permettent d'avoir une résolution de l'ordre de 20 à 50 cm. L'équipe Compas a récemment travaillé [4] à une technique utilisant l'apprentissage profond pour produire automatiquement une segmentation de l'espace urbain à partir d'orthophotos enrichies du tracé des voies automobiles issues d'OpenStreetMap.

Travail proposé

On propose dans ce stage de poursuivre les travaux initiés dans l'équipe, en reprenant l'approche déjà explorée, utilisant un GAN (Réseau Antagoniste Génératif) conditionnel [5] pour produire une segmentation automatique des orthophotographies.

La première étape consistera à produire une base de données d'entraînement à partir d'orthophotographies et des données structurées (OpenStreetMap, BD ORTHO de l'IGN) d'une part, et des données de segmentation telles que les emprises au sol proposées par la ville de Paris [6] d'autre part. On utilisera pour cela QGIS [7], un logiciel libre de référence pour le traitement des données géographiques.

L'entraînement d'un réseau de neurones dédié permettra d'étudier les données les plus pertinentes à tracer sur les orthophotographies, pour que la reconstruction soit efficace.

Parmi les problématiques intéressantes, on pourra s'interroger sur la construction du jeu de données initial (par exemple : les zones urbaines d'entraînement sont-elles ou non trop spécifiques pour traiter d'autres types de tissus urbains), la problématique des données manquantes (par exemple : OpenStreetMap peut avoir des informations manquantes) ou à la représentation hétérogène (par exemple : certains passages piétons sont décrits par un unique point, d'autres par un cheminement).

Profil de l'étudiant-e

Les compétences requises pour ce stage sont une curiosité scientifique et un intérêt pour les techniques d'apprentissage profond, un intérêt pour les thématiques de la mobilité douce, et une envie de se frotter à plusieurs outils techniques : Python/QGIS pour la préparation des données, Python/PyTorch pour l'apprentissage profond, et beaucoup d'automatisation de traitement pour la manipulation des fichiers et des données, en utilisant des briques libres existantes (shell, Python, ImageMagick ou équivalent).

Conditions

Le stage d'une durée de 5 à 6 mois se déroulera au LIMOS, au sein de l'équipe Compas, encadré par Jean-Marie Favreau (maître de conférence en informatique) et Jérémy Kalsron (doctorant en informatique et géomatique). L'équipe dispose de l'équipement informatique nécessaire à l'utilisation de réseaux de neurones, notamment de GPU puissants, et d'une expertise solide en traitement des données géographiques, en traitement d'images, et explore les possibilités de l'apprentissage profond depuis plusieurs années.

Compléments d'information

Le financement de cette proposition de stage n'est pas encore acquise, et dépend fortement de la pertinence du candidat qui se positionnera dessus. Pour toute information ou pour candidater, merci d'écrire à J-Marie.Favreau@uca.fr.

Références et liens

[1] http://www.imobs3.uca.fr/index.php/fr/menu-recherche/defi-2

[2] https://compas.limos.fr

[3] https://wiki.openstreetmap.org/wiki/Micromapping

[4] Gauthier Fillières-Riveau, Vincent Barra, Jean-Marie Favreau, Guillaume Touya. Enrichissement d'orthophotographie par des données OpenStreetMap pour l'apprentissage machine, SAGEO, Nov 2019, Clermont-Ferrand, France.

[5] https://phillipi.github.io/pix2pix/

[6] https://opendata.paris.fr/explore/dataset/plan-de-voirie-trottoirs-emprises/

[7] https://www.qgis.org/