Économétrie, Master MBFA Monnaie Banque Finance Assurance, modèle linéaire, modèle probit, modèle logit
Le document est un devoir corrigé d'économétrie sur le thème des modèles linéaires. Il contient spécifiquement l'analyse détaillée des modèles généralisés PROBIT/LOGIT.
[...] Pour réaliser cela, on construit une matrice de correspondance de dimension 2x2, mettant en correspondance les valeurs binaires prédites vs réalisées. Les éléments diagonaux correspondent à ceux correctement prédits, et le reste les individus dont les caractéristiques confondent le modèle. Pour ce faire, il est nécessaire de déterminer un seuil de probabilité à partir duquel il est possible de déterminer que le modèle prédit une venue de l'étudiant.e, donc assigné.e une valeur et 0 pour une valeur inférieure. D'après les statistiques descriptives du modèle, la distribution des probabilités de venue au master est représentée comme suit : - L'échantillon comporte 1445 individus - en déterminant le seuil de succès à (la proportion globale observée) on observe que le modèle prédit 430 inscriptions, et 1015 abandons. [...]
[...] Le modèle estimé s'écrit donc comme suit : et IV. Statistiques descriptives On importe le jeu de données dans le logiciel R Studio afin de présenter les statistiques descriptives de l'échantillon étudié. On observe les caractéristiques de certaines variables à travers leurs distributions respectives, représentées via un histogramme. On observe par exemple qu'une grande majorité des candidat.es ont une note s'établissant entre 10 et 15, mais aussi que beaucoup d'entre eux et elles ont obtenu leur baccalauréat entre 2018 et 2020 - ce qui est cohérent avec la composition démographique, avec des années de naissance concentrées entre 2000 et 2002. [...]
[...] Ainsi, une augmentation d'une unité dans une variable explicative entraîne une variation spécifique dans les chances ou la probabilité de l'événement, tout en tenant compte des autres variables du modèle. L'utilité des modèles PROBIT/LOGIT réside dans le traitement des variables binaires. En effet, on cherche à estimer la spécification suivante : Où P(Yi=1) est la probabilité d'un évènement 'succès' (dans ce cas, que l'étudiant.e s'inscrive au master). Or cette probabilité n'est pas observée - seul le résultat l'est. Cela veut dire donc qu'il est nécessaire de convertir l'estimation d'un score en probabilité, soit : Où est une fonction croissante, bornée entre 0 et soit : et II. [...]
[...] La formule généralement adoptée est la suivante : où L est la vraisemblance du modèle, et k le nombre de variables explicatives. Le critère AIC permet donc de trouver un équilibre entre d'un côté le nombre de variables explicatives, et la valeur de la log-vraisemblance. III. Estimation du modèle Les Moindres Carrés Ordinaires (MCO) ne peuvent pas être utilisés pour prédire une variable binaire, car la conversion d'un score en probabilité est linéaire - indiquant que le modèle MCO peut prédire des probabilités négatives, ou supérieures à 1. [...]
[...] Enfin, le classement correspond d'une manière plutôt cohérente au choix d'inscription, puisque les étudiant.es les mieux classé.es sont plus susceptibles de s'inscrire. VI. Diagnostic et pertinence S'il est intéressant d'identifier les variables les plus pertinentes via le score AIC, il est nécessaire de déterminer si le modèle retenu est capable de prédire correctement les décisions des étudiant.e.s à s'inscrire ou non au master MBFA. En d'autres termes, il est nécessaire de générer des prédictions à partir des scores et probabilité, et comparer la conversion en série binaire aux observations collectées. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture