Jad Beyhum doctorant en mathématiques à UT1-TSE, soutiendra publiquement sa thèse le mardi 7 juillet 2020 à 9H30.
Sur le sujet : "Unobserved Heterogeneity and High-dimensional Statistics"
Directeur de thèse : Eric GAUTIER
Lien de connexion zoom pour assister à la soutenance :
https://zoom.us/meeting/register/tJ0vdOqprTwuGt2KKW2HzEVrKXZ-GF_ZaBLs
Le jury est composé de :
- Mme Olga KLOPP, Rapporteure
- M. Clément MARTEAU, Rapporteur
- M. Jean-Pierre FLORENS, Examinateur
- M. Eric GAUTIER, Directeur de thèse
Résumé :
Cette thèse est composée de quatre articles étudiant différents problèmes d’endogénéité en économétrie. L’endogénéité correspond aux situations où la dépendance des variables ne résulte pas d’une relation causale. Ces cas se présentent quand un jeu variables inobservées appelé hétérogénéité inobservée est dépend des variables explicatives tout en affectant la variable expliquée. Les travaux proposent des solutions faisant appel à des outils issus de la littérature de statistique de grande dimension. Ce domaine de recherche analyse l’estimation en présence d’un paramètre de grande dimension possédant une structure sous-jacente de petite dimension. L’approche utilisée permet de relâcher des hypothèses sur l’hétérogénéité inobservée dans les modèles étudiés. Le premier article étudie l’inférence dans un modèle de régression avec valeurs aberrantes où le nombre d’observations aberrantes croît avec la taille de l’échantillon mais leur proportion tend vers 0. L’hétérogénéité inobservée est représentée par un variable qui vaut 0 si l’observation est aberrante. Nous proposons un estimateur de type square-root lasso qui utilise une pénalisation par la norme `1, calculons des vitesses de convergence et établissons la normalité asymptotique de l’estimateur. L’estimateur a la même variance asymptotique que celui des moindres carrés ordinaires dans le modèle linéaire standard. Ceci permet de construire des tests et des intervalles de confiance de façon usuelle. Le deuxième article considère un estimateur pénalisé par la norme nucléaire pour les modèles de panel à effets interactifs, ces derniers constituant l’hétérogénéité inobservée du modèle. Le nombre de facteurs est inconnu et est autorisé à croître avec la taille de l’échantillon. Nous obtenons des vitesses de convergence et étudions les propriétés de l’estimateur quand le nombre de dates d’observation croît avec le nombre d’individus. Nous proposons et analysons un estimateur en deux étapes et démontrons sa normalité asymptotique. Aucune des procédures ne requiert la connaissance de la variance des erreurs. Le troisième article étudie un modèle de panel où la dépendance des régresseurs et des inobservables est modélisée une structure à facteurs. Cette structure est l’hétérogénéité inobservée du modèle. Le régime asymptotique est tel que le nombre de périodes et la taille d’échantillon tendent vers l’infini. Les facteurs non forts sont autorisés et le nombre de facteurs peut croître avec la taille de l’échantillon. Une classe d’estimateurs 2 en deux étapes des coefficients de régression est étudiée. Nous proposons des conditions suffisantes sur l’estimateur de première étape et le processus de génération des données telles que l’estimateur en deux étapes soit asymptotiquement normal. Des hypothèses sous lesquelles une approche utilisant l’analyse en composantes principales en première étape rend l’estimateur en deux étapes asymptotiquement normal sont données. Le dernier article analyse l’effet sur une durée d’un traitement discret non assigné aléatoirement. L’endogénéité est traitée grâce à une variable instrumentale discrète qui explique le traitement et est indépendante du terme d’erreur (l’hétérogénéité inobservée) du modèle. Notre approche est non paramétrique et la censure à droite est autorisée. Cette spécification génère un problème inverse non linéaire et l’effet de traitement moyen est calculé à partir de sa solution. Nous donnons des propriétés d’identification locales et globales qui reposent sur un système d’équations non linéaires. Une procédure d’estimation est proposée. Nous obtenons des vitesses de convergence et prouvons la normalité asymptotique de cette procédure. Quand la censure empêche l’identification exacte, nous développons des résultats d’identification partielle. Des simulations suggèrent que notre procédure a de bonnes propriétés en échantillon fini. Notre méthodologie est appliquée aux données de l’expérience dite du Illinois Reemployment Bonus.