PDF, FR, 219 p., 3,1 Mo - Femise

PDF, FR, 219 p., 3,1 Mo - Femise PDF, FR, 219 p., 3,1 Mo - Femise

12.10.2013 Views

accès à la formation, autrement dit que l’effet de la formation est à nouveau supposé homogène entre les individus. Donc, une autre version plus générale de ce modèle a été proposée pour lever en partie cette dernière condition. Les moindres carrés ordinaires sont appliquées au modèle suivant, sous H1, y = + + ˆ + ˆ μˆ i 1wi 2 p( xi ) 3wi ( pi p ) + ;oùμˆ p est la moyenne simple de pˆ i . On détermine alors quel est l’effet de la formation sur les salaires pour les individus dont la probabilité d’avoir accès à la formation est supérieur à la probabilité moyenne de la population. Ces modèles de régression basés sur le propensity score reposent toujours sur l’hypothèse d’une relation linéaire entre le salaire, la formation et cette probabilité, ce qui est probablement trop restrictif dans beaucoup d’applications. Les méthodes de matching peuvent alors à nouveau être appliquées pour lever cette hypothèse. En effet, le matching basé sur les variables x, mentionnée précédemment est difficile à appliquer à cause du nombre élevé de variable x qui peuvent exister et donc du nombre trop important de sous échantillons créer. La dimension du problème peut être réduite en stratifiant les individus, en créant des sous échantillons en fonction de la probabilité d’avoir accès à la formation, selon des intervalles de valeur. Et donc pour chaque sous échantillon, on calcule un effet moyen de la formation par la méthode non ajustée ou ajustée et on fait une moyenne de tous ces effets pour avoir l’effet moyen de la formation sur toute la population. 3. Les méthodes liées aux variables instrumentales Ces méthodes sont appliquées lorsque l’on suspecte que l’hypothèse de «l’ignorabilité» du traitement ne tient pas. Autrement dit, la sélection des individus se fait sur la base de variables observables x, comme le sexe, la CSP, mais aussi sur des variables inobservables, des variables auxquelles l’évaluateur n’a pas accès, comme la motivation par exemple, et qui influencent l’accès à la formation et le salaire de l’individu. Donc l’application des méthodes précédentes ne permet pas d’éliminer tout le biais de sélection. Il est donc nécessaire d’utiliser d’autres méthodes liées à la disponibilité d’un bon instrument du traitement. La variable instrumentale z, permet de prédire le traitement, le fait que l’on va accéder à la formation, mais ne doit pas être reliée à l’hétérogénéité non observée, c’est-à-dire qu’elle n’a pas d’influence propre sur le salaire. 211

Reprenons notre équation de départ (2): y = μ + μ μ ) w + v + w( ) 0 ( 1 0 0 1 O 1) L’effet de la formation est homogène Si nous supposons dans un premier temps, que les parties stochastiques, v0 et v1 sont les mêmes v0=v1, cad que l’effet de la formation est homogène, alors les termes d’interaction disparaissent, soit ATE=ATE1. Sans les termes d’interactions, nous pouvons utiliser les IV sous de faibles hypothèses. L(v0/x,z)=L(v0/x) : l’instrument ne doit pas être lié aux effets individuels. L(w/x,z) L(w/x) et l’instrument a un pouvoir de prédiction du traitement. Le modèle est le suivant : y = 0 + w + 0 x + u0 Par définition, u0 a une moyenne nulle et est non corrélé à x et z, maisu0 , le terme d’erreur, est généralement corrélé au traitement w, même après le contrôle des variables x, ce qui rend l’estimation des moindres carrés ordinaire biaisée. Sous ces hypothèses, , qui réprésente l’ATE peut être estimé par les méthodes des variables instrumentales en utilisant z comme instrument de w. Dans le cas de la formation, on peut proposer par exemple comme instrument le fait d’être éligible à la formation. L’hypothèse importante de cette méthode est de supposer que les instruments z sont indépendants de (y0,x). Par définition, l’instrument z, n’est pas corrélé au salaire, mais il peut par contre l’être avec les autres caractéristiques de l’individu, les variables x, et donc être corrélé à l’hétérogénéité non observée. En effet, le fait d’être éligible à la formation peut être lié aux caractéristiques des individus, tels que son âge, son emploi, etc. Pour permettre alors aux instruments z d’être corrélés avec les éléments de x, on choisit comme instrument la probabilité d’avoir accès à la formation en fonction de z et de x, le propensity score, qui permet de part sa forme non linéaire des interactions entre l’instrument et les variables x. Des hypothèses plus fortes sont alors posées. E(v0/x,z)=L(v0/x) : les effets individuels sont indépendants de z et sont linéaires en x P(w=1/x,z) P(w=1/x) et P(w=1/x,z)=G(x,z, ) est une forme paramétrique connue : la probabilité d’avoir accès à la formation est connue et l’instrument z est un déterminant du traitement. Var(v0/x,z)= : la variance de l’hétérogénéité non observée est constante. 2 0 Pour estimer l’ATE, on utilise la méthode des IV en deux étapes. 212

Reprenons notre équation de départ (2): y = μ + μ μ ) w + v + w(<br />

<br />

)<br />

0 ( 1 0 0 1 O<br />

1) L’effet de la formation est homogène<br />

Si nous supposons dans un premier temps, que les parties stochastiques, v0 et v1 sont les mêmes<br />

v0=v1, cad que l’effet de la formation est homogène, alors les termes d’interaction disparaissent,<br />

soit ATE=ATE1. Sans les termes d’interactions, nous pouvons utiliser les IV sous de faibles<br />

hypothèses.<br />

L(v0/x,z)=L(v0/x) : l’instrument ne doit pas être lié aux effets individuels.<br />

L(w/x,z) L(w/x) et l’instrument a un pouvoir de prédiction du traitement.<br />

Le modèle est le suivant : y = 0 + w<br />

+ 0 x + u0<br />

Par définition, u0 a une moyenne nulle et est non corrélé à x et z, maisu0 , le terme d’erreur, est<br />

généralement corrélé au traitement w, même après le contrôle des variables x, ce qui rend<br />

l’estimation des moindres carrés ordinaire biaisée.<br />

Sous ces hypothèses, , qui réprésente l’ATE peut être estimé par les méthodes des variables<br />

instrumentales en utilisant z comme instrument de w. Dans le cas de la formation, on peut<br />

proposer par exemple comme instrument le fait d’être éligible à la formation.<br />

L’hypothèse importante de cette méthode est de supposer que les instruments z sont<br />

indépendants de (y0,x). Par définition, l’instrument z, n’est pas corrélé au salaire, mais il peut par contre l’être avec les<br />

autres caractéristiques de l’individu, les variables x, et donc être corrélé à l’hétérogénéité non<br />

observée. En effet, le fait d’être éligible à la formation peut être lié aux caractéristiques des<br />

individus, tels que son âge, son emploi, etc. Pour permettre alors aux instruments z d’être corrélés<br />

avec les éléments de x, on choisit comme instrument la probabilité d’avoir accès à la formation en<br />

fonction de z et de x, le propensity score, qui permet de part sa forme non linéaire des<br />

interactions entre l’instrument et les variables x.<br />

Des hypothèses plus fortes sont alors posées.<br />

E(v0/x,z)=L(v0/x) : les effets individuels sont indépendants de z et sont linéaires en x<br />

P(w=1/x,z) P(w=1/x) et P(w=1/x,z)=G(x,z, ) est une forme paramétrique connue : la<br />

probabilité d’avoir accès à la formation est connue et l’instrument z est un déterminant du<br />

traitement.<br />

Var(v0/x,z)= : la variance de l’hétérogénéité non observée est constante.<br />

2<br />

0<br />

Pour estimer l’ATE, on utilise la méthode des IV en deux étapes.<br />

212

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!