PDF, FR, 219 p., 3,1 Mo - Femise

PDF, FR, 219 p., 3,1 Mo - Femise PDF, FR, 219 p., 3,1 Mo - Femise

12.10.2013 Views

E ( y / x, w) = E( y0 / x) + w[ E( y1 / x) = E( y0 / x)] Et si l’on fait la différence entre ces deux termes, selon la valeur prise par w, ontrouvel’ATEen fonction de x : E y / x, w = 1) = E( y / x, w = 0) = E( y / x) = E( y / x) = ATE( x) . ( 1 0 Ce premier terme, noté r ( ) correspond au salaire moyen des formés selon x, et le second terme, 1 x 0 ( ) x r correspond au salaire moyen des non formés selon x. Dans un second temps, on estime l’ATE, en faisant la moyenne de ces différences de salaires entre les deux groupes sur toute la population ou bien sur celle des formés pour l’ATE1. N ˆ 1 ATE N [ rˆ ( x ) rˆ ( x )] = i= 1 1 i 0 i N et ˆ 1 ATE ( ) ( [ ˆ ( ) ˆ 1 = wi wi r1 xi r0 ( xi )]) i= 1 Il est cependant important de noter qu’il est nécessaire que, pour chaque valeur de x, ilexistedes individus formés et des individus non formés. Si par l’exemple, pour une valeur de x, représentant la CSP, on n’a pour le groupe des ouvriers que des individus formés, alors on ne pourra pas calculer le salaire moyen des ouvriers non formés, donc il faut exclure de l’échantillon les ouvriers. Les différentes possibilités pour obtenir les effets moyens du traitement résident dans la manière d’obtenir les r(x), c’est-à-dire le salaire moyen des formés et le salaire moyen des non formés. Tout d’abord, on peut utiliser des estimateurs non paramétriques, pour être le plus flexible possible, mais il est parfois difficile d’obtenir de bons écarts types. Ensuite, on peut lister toutes les valeurs possibles de x et estimer en fonction de chaque valeur de x le salaire moyen des formés et le salaire moyen des non formés. Cependant, plus le nombre de valeurs prises par x est important, et plus il risque d’y avoir des cellules avec un nombre réduit d’observations. Ces méthodes sont relatives en fait aux méthodes de matching basées sur les variables x. Plus concrètement, le principe consiste à partir de quelques variables x, de créer plusieurs sous échantillons, en fonction par exemple du sexe, de la CSP, etc. Ensuite, pour chaque sous échantillon, on calcule un effet moyen de la formation. Pour cela, soit on soustraie le salaire moyen des formés au salaire moyen des non formés, (c’est la méthode non ajusté), soit on régresse une équation de salaire pour chaque sous échantillon (et c’est la méthode ajustée du matching). Ces méthodes de matching, et la constitution de plusieurs sous échantillons ont pour fondement de remettre en cause l’hypothèse de linéarité de la relation étudiée et de la constance des paramètres supposée dans les modèles paramétriques. Un modèle à coefficients constants suppose par exemple que l’effet de la formation sera le même pour tous, aussi bien pour les personnes sans diplômes que pour les personnes avec un diplôme universitaire, de même un N i= 1 207

modèle linéaire suppose que l’effet de la formation aura le même effet pour les individus à bas ou à hauts salaires. Néanmoins, une troisième méthode consiste justement à appliquer les méthodes de régression paramétriques, et donc de fait de supposer la linéarité de l’équation de salaire. Ces méthodes permettent sous certaines hypothèses d’estimer directement l’ATE. 1) Les modèles de régression Reprenons l’équation (2) : y = μ + w μ μ ) + v + w( ) Forme linéaire, effet homogène : 0 ( 1 0 0 1 O Une première hypothèse consiste à supposer que E v / x) = E( v / x) , c’est-à-dire qu’après avoir ( 1 0 contrôlé tous les facteurs déterminant la formation, on suppose qu’il n’existe pas de gains individuels spécifiques de la formation. L’effet de la formation est supposé homogène entre les individus et le terme d’interaction entre w et ) disparaît. ( 1 O Ainsi sous H2, l’hypothèse de «l’ignorabilité» de traitement en moyenne, ATE= ATE1 et le salaire moyen conditionnellement à la formation et aux variables x s’exprime de la manière suivante : E y / w, x) = μ + w + g ( x) avec = ATE et g ( ) = E(vo/x). ( 0 0 Une seconde hypothèse est que la relation entre l’accès à la formation et ses déterminants x est linéaire. E( vo / x) = 0 + h0 ( x) 0 , pour une fonction vecteur h0(x). Ce qui nous donne l’expression de salaire suivante : E ( y / w, x) = 0 + w + h0 ( x) 0 avec 0 = μ0 + 0 . Donc on régresse y = + w + h( x ) + par moindres carré ordinaires, pour estimer , i i 0 i l’ATE , avec h0(x) 0 , étant une fonction de contrôle du biais de sélection. Forme linéaire, effet hétérogène Cependant l’hypothèse d’un effet homogène de la formation n’est pas toujours réaliste. On peut par exemple supposer que l’impact de la formation sur les salaires peut être plus important pour les femmes que pour les hommes. On considère en effet le cas où l’effet de la formation varie selon les individus, donc le terme d’interaction entre w et les effets individuels est pris en compte. Cette hypothèse implique que l’ATE et ATE1 ne sont plus égaux. On obtient sous H2 E y / w, x) = μ + w + g ( x) + w[ g ( x) g ( x)] avec = ATE et g ( ) =E(v0/x) et g ( ) =E(v1/x) 0 x 1 x 0 x ( 0 0 1 0 208

E ( y / x,<br />

w)<br />

= E(<br />

y0<br />

/ x)<br />

+ w[<br />

E(<br />

y1<br />

/ x)<br />

= E(<br />

y0<br />

/ x)]<br />

Et si l’on fait la différence entre ces deux termes, selon la valeur prise par w, ontrouvel’ATEen<br />

fonction de x : E y / x,<br />

w = 1)<br />

= E(<br />

y / x,<br />

w = 0)<br />

= E(<br />

y / x)<br />

= E(<br />

y / x)<br />

= ATE(<br />

x)<br />

.<br />

( 1<br />

0<br />

Ce premier terme, noté r ( ) correspond au salaire moyen des formés selon x, et le second terme,<br />

1 x<br />

0 ( ) x r correspond au salaire moyen des non formés selon x.<br />

Dans un second temps, on estime l’ATE, en faisant la moyenne de ces différences de salaires<br />

entre les deux groupes sur toute la population ou bien sur celle des formés pour l’ATE1. N<br />

ˆ 1<br />

ATE N [ rˆ<br />

( x ) rˆ<br />

( x )]<br />

= <br />

i=<br />

1<br />

1<br />

i<br />

0<br />

i<br />

N<br />

et ˆ<br />

1<br />

ATE ( ) ( [ ˆ ( ) ˆ<br />

1 = wi<br />

wi<br />

r1<br />

xi<br />

r0<br />

( xi<br />

)])<br />

i=<br />

1<br />

Il est cependant important de noter qu’il est nécessaire que, pour chaque valeur de x, ilexistedes<br />

individus formés et des individus non formés. Si par l’exemple, pour une valeur de x,<br />

représentant la CSP, on n’a pour le groupe des ouvriers que des individus formés, alors on ne<br />

pourra pas calculer le salaire moyen des ouvriers non formés, donc il faut exclure de l’échantillon<br />

les ouvriers.<br />

Les différentes possibilités pour obtenir les effets moyens du traitement résident dans la manière<br />

d’obtenir les r(x), c’est-à-dire le salaire moyen des formés et le salaire moyen des non formés.<br />

Tout d’abord, on peut utiliser des estimateurs non paramétriques, pour être le plus flexible<br />

possible, mais il est parfois difficile d’obtenir de bons écarts types. Ensuite, on peut lister toutes<br />

les valeurs possibles de x et estimer en fonction de chaque valeur de x le salaire moyen des<br />

formés et le salaire moyen des non formés. Cependant, plus le nombre de valeurs prises par x est<br />

important, et plus il risque d’y avoir des cellules avec un nombre réduit d’observations. Ces<br />

méthodes sont relatives en fait aux méthodes de matching basées sur les variables x. Plus<br />

concrètement, le principe consiste à partir de quelques variables x, de créer plusieurs sous<br />

échantillons, en fonction par exemple du sexe, de la CSP, etc. Ensuite, pour chaque sous<br />

échantillon, on calcule un effet moyen de la formation. Pour cela, soit on soustraie le salaire<br />

moyen des formés au salaire moyen des non formés, (c’est la méthode non ajusté), soit on<br />

régresse une équation de salaire pour chaque sous échantillon (et c’est la méthode ajustée du<br />

matching).<br />

Ces méthodes de matching, et la constitution de plusieurs sous échantillons ont pour fondement<br />

de remettre en cause l’hypothèse de linéarité de la relation étudiée et de la constance des<br />

paramètres supposée dans les modèles paramétriques. Un modèle à coefficients constants<br />

suppose par exemple que l’effet de la formation sera le même pour tous, aussi bien pour les<br />

personnes sans diplômes que pour les personnes avec un diplôme universitaire, de même un<br />

N<br />

i=<br />

1<br />

207

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!