Soutenance de thèse de Lukas DARGEL le 12 décembre

12 Décembre 2023 Recherche

Lukas DARGEL soutiendra publiquement ses travaux de thèse en Mathématiques mardi 12 décembre 2023 à 09h00 Auditorium 6.

Titre : "Modèles d'interaction pour l'analyse économétrique des données de géomarketing et de transport"

Directrices de thèse : Madame Christine THOMAS AGNAN et Madame Anne RUIZ-GAZEN

Pour assister à la conférence, merci de contacter le secrétariat Laurène MOTHE

Membres du jury :

  • Mme Christine THOMAS AGNAN - Toulouse School of Economics - Directrice de thèse
  • Mme Anne RUIZ-GAZEN - Toulouse School of Economics - Co-directrice de thèse
  • M. Jorge MATEU - Universitat Jaume I - Rapporteur
  • M. Peter FILZMOSER -  Vienna University of Technology - Rapporteur
  • M. Raja CHAKIR INRAE - AgroParisTech - Rapporteur
  • M. Arnaud REYNAUD TSE-R- INRAE - Examinateur

Résumé

L'objectif principal de cette thèse est d'améliorer l'applicabilité des modèles d'interaction, souvent utilisée pour expliquer et prédire les flux origine-destination (OD), pour l'analyse économétrique des transports et du géomarketing. Nos explorations et perspectives s'inspirent de et contribuent à deux branches particulières de la littérature : l'économétrie spatiale et l'analyse des données compositionnelles (CoDa). Pour la société de recherche et de conseil BVA, qui a parrainé cette thèse dans le cadre du programme CIFRE, les méthodologies en économétrie spatiale et en régression CoDa sont d'un grand intérêt, compte tenu de leurs activités dans les secteurs des transports, des télécommunications, du commerce ainsi que dans l'analyse des résultats d'élections. Plusieurs de ces applications concrètes illustrent les avancées méthodologiques de nos quatre principaux articles. Le modèle d'interaction économétrique spatiale (SEIM) s'accorde particulièrement bien avec les applications dans le secteur des transports. Cependant, la méthodologie actuelle présente des défis conceptuels et computationnels qui en limitent l'applicabilité. Nous approfondissons le travail de LeSage et Pace (2008) dont le modèle de flux OD intègre efficacement la dépendance spatiale dans le cadre gravitationnel traditionnel qui suppose de manière irréaliste des flux indépendants. Cependant la prémisse selon laquelle les listes des origines et des destinations coïncident exclue les applications de géomarketing de BVA. De plus, il gère mal les flux nuls et nécessite des flux observables entre toutes les paires OD envisageables. Cette exigence est souvent irréalisable, en particulier lors de la modélisation de vastes réseaux de transports ou de navettes domicile-travail à l'échelle nationale, avec des millions, voire des milliards, de paires OD. Le premier article améliore l'efficacité computationnelle du modèle dans un contexte de Big Data.
Le deuxième article élabore un modèle plus polyvalent, adapté aux scénarios où les listes d'origines et de destinations peuvent différer et où le nombre de flux observés peut être nettement inférieur au nombre de paires OD potentielles. Ces articles illustrent également les applications du SEIM aux flux de navettes domicile-travail à travers les communes françaises. Ces avancées sont implémentées dans un package de R nommé spflow. L'approche de régression CoDa est spécifiquement adaptée aux données de parts de marché et offre de nombreuses applications intéressantes pour BVA.
Le troisième article présente une application de géomarketing concernant les parts de marché des neuf plus grands centres commerciaux de Toulouse dans des quartiers de la ville. Le quatrième article modélise le résultat des élections présidentielles françaises de 2022. Dans les deux cas, la variable dépendante est un vecteur de parts avec des composantes non négatives de somme un. Les techniques de régression classiques rencontrent des difficultés face à ces contraintes. La méthode CoDa les surmonte grâce aux transformations par log-ratios, permettant même d'estimer les paramètres du modèle avec des techniques de régression linéaire multivariée classiques. Un défi de l'approche de régression CoDa réside dans l'interprétation des résultats dans l'espace originel des parts, plutôt que dans les espaces log-ratios difficiles à comprendre. La principale contribution théorique du troisième article est le développement formel de l'équivalence entre l'approche CoDa et les modèles d'interaction compétitive multiplicative (MCI) de Cooper et Nakanishi (1989), l'outil traditionnel du géomarketing. Cette prise de conscience souligne que la rigueur mathématique qui sous-tend la régression CoDa s'applique également aux modèles MCI et implique que les innovations des deux cadres se transposent mutuellement.
Le quatrième article, clairement ancré dans la littérature CoDa, fournit de nouveaux outils pour faciliter l'interprétation de ces modèles assez complexes