12.07.2015 Views

Analyses en Composantes Principales (ACP) - Julien Tap - Free

Analyses en Composantes Principales (ACP) - Julien Tap - Free

Analyses en Composantes Principales (ACP) - Julien Tap - Free

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>TP statistiques : <strong>Analyses</strong> <strong>en</strong> <strong>Composantes</strong><strong>Principales</strong> (<strong>ACP</strong>)IntroductionNous allons, à partir données du ministère de l’intérieur et l’INSEE, étudier les divers facteursliés aux accid<strong>en</strong>ts de la route.Nous allons traiter un tableau de 95 individus représ<strong>en</strong>tant les départem<strong>en</strong>ts de la Francemétropolitaine (remarque : nous avons regroupé la Corse sous un seul départem<strong>en</strong>t « 20 ») etde 5 variables que nous allons décrire ci après :1) Accid<strong>en</strong>ts : Nombre d’accid<strong>en</strong>ts rec<strong>en</strong>sés <strong>en</strong> 20002) Infractions : Nombre d’automobilistes <strong>en</strong> infractions contrôlés <strong>en</strong> état d’ivresse ou <strong>en</strong>excès de vitesses <strong>en</strong> 20003) D<strong>en</strong>sité : Nombre d’habitant au km2 <strong>en</strong> 20004) Jeunes : Taux de jeunes ayant <strong>en</strong>tre 20 à 29 ans <strong>en</strong> 20005) Chômage : Taux de chômage <strong>en</strong> 2000Etape 1 : Analyse des données généralesNous allons regarder le plan principal 1 et 2 formé par les axes principaux 1 et 2 afin de voircomm<strong>en</strong>t se répartiss<strong>en</strong>t les individus dans le nuage de point dans le but d’éliminer certainsindividus qui fausserait l’analyse ou d’id<strong>en</strong>tifier des groupes d’individus formant des nuagesbi<strong>en</strong> distinct.Graphique 1: Les individus sur le plan principal 1&2L’individu 75 correspondant au départem<strong>en</strong>t de Paris est isolé du nuage de point. Ce dernierfausse l’analyse <strong>en</strong> composante principale par conséqu<strong>en</strong>ts il sera écarté de l’analyse et feral’objet d’une analyse supplém<strong>en</strong>taire.Lic<strong>en</strong>ce IUP SIAL 1


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>Voici le nouveau nuage de points constitués de 94 individus :Graphique 2: Les sur plan principal 1&2 après suppression du point 75Les individus se répartiss<strong>en</strong>t de manière homogène malgré l’apparition de deux groupesdistincts de part et d’autre de l’axe des ordonnées. Nous verrons plus tard que ce constat estcaractéristique de la répartition sociodémographique des départem<strong>en</strong>ts.Etape 2 : Etude des valeurs propresVoici le diagramme <strong>en</strong> bâton représ<strong>en</strong>tant l’inertie totale.Nous choisissons d’étudier les axes 1, 2 et3. Cep<strong>en</strong>dant il est intéressant de constaterque les plans formés par les axes 1et 2 etformés par les axes 1 et 3 ont une inertieéquival<strong>en</strong>te de 65% <strong>en</strong>viron.Remarque : L’axe 4 a une inertierelativem<strong>en</strong>t faible par rapport au troisprécéd<strong>en</strong>tes mais s’avère intéressante car ilest lié à une variables particulièrem<strong>en</strong>timportante pour l’étude : le taux de jeune.Graphique 3 : diagramme d'inertie totaleLic<strong>en</strong>ce IUP SIAL 2


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>Etape 3 : Etudes des variablesNous allons interpréter la synthèse numérique des variables à l’aide de représ<strong>en</strong>tationgraphiques des variables sur les axes principaux.Pour cela nous allons étudier tout particulièrem<strong>en</strong>t les qtl (cosinus carrée) qui nous informesur la qualité de représ<strong>en</strong>tation d’une variable sur un axe.Etude axe 1 et 2L’axe 1 semble représ<strong>en</strong>ter les variables «accid<strong>en</strong>ts » avec des qlt voisines de 70% et l’axe 2semble représ<strong>en</strong>ter la variable « chômage » avec une qlt supérieur à 50%.Tableau 1: sélection des variables sur le plan 1&2Représ<strong>en</strong>tons maint<strong>en</strong>ant ces variables portés par le plan 1 : 2 sur un cercle de corrélations :Il est intéressant de constater les variablesportés par l’axe 1 et les variables portés parl’axe 2 forme un angle droit signifiantl’abs<strong>en</strong>ce de corrélation linéaire. Lesquatre variables étudiés sont proches ducercle de corrélation ainsi parl’intermédiaire de ce plan nous pourronsétudier l’influ<strong>en</strong>ce du chômage sur l<strong>en</strong>ombre d’accid<strong>en</strong>t. De plus nous pouvonsconstater que les variables« infractions », « accid<strong>en</strong>ts » et « jeunes »sont fortem<strong>en</strong>t liées <strong>en</strong>tre elles.Graphique 4: variables sur le cercle descorrélations du plan 1&2Lic<strong>en</strong>ce IUP SIAL 3


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>Etude des axes 1 et 3Sur le plan 1 et 3 une qlt de 70% permet de représ<strong>en</strong>ter les variables «accid<strong>en</strong>ts »« infractions » et « d<strong>en</strong>sité ». L’axe 1 est fortem<strong>en</strong>t induit par « accid<strong>en</strong>ts » tandis que l’axe 3est induit par la variable « d<strong>en</strong>sité ».Tableau 2: séléction des variables sur le plan 1&3Avec une inertie de 63,9% ce plan sera tout aussi intéressant à étudier que le plan 1 : 2.Représ<strong>en</strong>tons ces variables du plan 1 : 3 sur un cercle de corrélation :Avec une qualité de représ<strong>en</strong>tation de 80%la variable « accid<strong>en</strong>ts » disparaît sur ceplan l’axe est induit par la variable« infractions » tandis que l’axe 3 est induitpar la variable « d<strong>en</strong>sité ». Sur ce plannous pouvons constater que la variable« accid<strong>en</strong>ts » est liée avec la variable« infractions ».Graphique 5: variables sur le cercle descorrélations du plan 1&3Lic<strong>en</strong>ce IUP SIAL 4


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>Etude des axes 2 et 3Le plan 2 : 3 d’inertie 38,8% nous permettra avec une bonne qualité de représ<strong>en</strong>tation de 50%d’étudier la variable chômage <strong>en</strong> fonction de la variable d<strong>en</strong>sité.Tableau 3: sélection des variables sur le plan 2&3Représ<strong>en</strong>tons ces deux variables sur un cercle de corrélation :Avec un qtl de 70% ce plan d’étude nouspermettra d’expliquer la différ<strong>en</strong>ce <strong>en</strong>treles deux groupes de départem<strong>en</strong>t observésur le graphique 2. Formant un angle droitces deux variable sont indép<strong>en</strong>dantes l’unede l’autre sur ce plan.Graphique 6: variables sur le cercle descorrélations du plan 2&3Lic<strong>en</strong>ce IUP SIAL 5


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>Etude des axes 1 et 4Nous allons pousser notre étude jusqu’à ce plan car il parait fort intéressant. En effet comm<strong>en</strong>ous pouvons le voir sur le tableau ci-dessous, l’axe 4 malgré une faible qtl est induit par lavariable « jeune ».Tableau 4: sélection des variables sur le plan 1&4Ainsi ce plan 1 : 4 d’inertie 60,4% nous permettra d’étudier les départem<strong>en</strong>ts « jeune » parrapport au problème des accid<strong>en</strong>ts et aux infractions sur la route.Etapes 4 : étude des individusMaint<strong>en</strong>ant que nous avons définis nos plans d’étude nous allons procéder à l’étude desindividus autrem<strong>en</strong>t dits des départem<strong>en</strong>ts <strong>en</strong> fonction de leur contribution relative « cr » surles différ<strong>en</strong>ts axes.A l’aide du tableau de sélection de individus <strong>en</strong> fonction de leur contribution relative nousallons pouvoir mettre <strong>en</strong> valeur certain départem<strong>en</strong>t et former des groupem<strong>en</strong>tscaractéristiques sur les plans étudiés.Plan 1 : 2Ce plan va nous permettre de mesurer l’influ<strong>en</strong>ce du chômage sur les accid<strong>en</strong>ts et lesinfractions de la route.Avec un cr de 0,025 nous avons pu sélectionner les départem<strong>en</strong>ts contribuant le plus à laformation de l’axe 1 induite par les variable « accid<strong>en</strong>ts ». Les Bouche du Rhône (13), LeRhône (69), Le Nord (59), Le Pas de Calais (62) ainsi que la petite couronne parisi<strong>en</strong>ne (92,93, 94) sont les départem<strong>en</strong>ts qui influ<strong>en</strong>c<strong>en</strong>t l’axe 1.Avec un cr de 0,025 les départem<strong>en</strong>t contribuant à la formation de l’axe 2 induit par lavariable « chômage » sont les Ard<strong>en</strong>nes (8), l’Aude (11), le Gard (30), l’Hérault (34), l’Ile etVilaine (35), les Pyrénées Atlantiques (64).Nous avons représ<strong>en</strong>té ces deux regroupem<strong>en</strong>ts sur le graphique suivant :Lic<strong>en</strong>ce IUP SIAL 6


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>231Graphique 7: le plan 1&2 avec sélection des individus bi<strong>en</strong> représ<strong>en</strong>tésSur le graphique nous pouvons constater trois groupes de départem<strong>en</strong>ts :1) Départem<strong>en</strong>ts où le chômage est faible mais peu touché par les accid<strong>en</strong>ts.2) Départem<strong>en</strong>ts où le chômage est important avec peu d’accid<strong>en</strong>t de la route.3) Départem<strong>en</strong>ts où le chômage est important avec beaucoup d’accid<strong>en</strong>t de la routePlan 1 :3Ce plan va nous permettre de mesurer l’influ<strong>en</strong>ce de la d<strong>en</strong>sité de la population sur lesaccid<strong>en</strong>ts et les infractions de la route.Avec un cr de 0,025 l’axe est toujours représ<strong>en</strong>té par les départem<strong>en</strong>ts cités précédemm<strong>en</strong>t(13, 69, 59, 62, 92, 93, 94).Avec un cr de 0,020 l’axe 3 induit par la variable « d<strong>en</strong>sité » est fortem<strong>en</strong>t contribué par lesdépartem<strong>en</strong>ts suivants :Le Pas de Calais (62), La Seine et Marne (77) et la Gironde (33) ainsi que la petite couronneparisi<strong>en</strong>ne (92, 93, 94).Lic<strong>en</strong>ce IUP SIAL 7


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>312Graphique 8: le plan 1&3 avec sélection des indivus bi<strong>en</strong> représ<strong>en</strong>tésSur le graphique nous pouvons constater trois groupes de départem<strong>en</strong>ts :1) Départem<strong>en</strong>ts où la d<strong>en</strong>sité est moy<strong>en</strong>ne mais peu touché par les accid<strong>en</strong>ts.2) Départem<strong>en</strong>ts où la d<strong>en</strong>sité est moy<strong>en</strong>ne avec beaucoup d’accid<strong>en</strong>t de la route.3) Départem<strong>en</strong>ts où la d<strong>en</strong>sité est importante avec beaucoup d’accid<strong>en</strong>t de la routePlan 2 : 3Ce plan va nous permettre d’étudier les caractéristiques sociodémographiques desdépartem<strong>en</strong>t français <strong>en</strong> comme paramètre le chômage et la d<strong>en</strong>sité de population. Ceciexpliquera notamm<strong>en</strong>t la formation du nuage de point de la figure 2.132Graphique 9: le plan 2&3 avec sélection des individus bi<strong>en</strong> représ<strong>en</strong>tésAvec une contribution relative de 0,20 l’axe 2 et l’axe 3 sont représ<strong>en</strong>tés par les mêmedépartem<strong>en</strong>ts cités précédemm<strong>en</strong>t. Cep<strong>en</strong>dant grâce à la sélection des individus de l’<strong>ACP</strong> onpeut distinguer trois groupes de départem<strong>en</strong>t :Lic<strong>en</strong>ce IUP SIAL 8


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>1) la petite couronne parisi<strong>en</strong>ne avec une forte d<strong>en</strong>sité de population mais peu dechômage2) les départem<strong>en</strong>ts ayant une faible d<strong>en</strong>sité avec un important chômage (Var, Aude,Pyrénées Atlantiques)3) Les départem<strong>en</strong>ts de faible d<strong>en</strong>sité avec peu de chômage (May<strong>en</strong>ne)Replaçons Paris dans ce plan afin de mesurer l’écart sociodémographique avec tous les autresdépartem<strong>en</strong>ts de la métropole :Graphique 10: le plan 2&3 avec un individu supplém<strong>en</strong>taire 75 ParisIl est important de constater l’écart de l’individu 75 qui aurait r<strong>en</strong>du difficile une bonneinterprétation sur l’<strong>en</strong>semble des autres départem<strong>en</strong>ts. Ceci est du au fait que la France est trèsc<strong>en</strong>tralisé sur sa capitale.Plan 1 : 4Ce plan va permettre de situer la variable « jeune » dans le contexte des accid<strong>en</strong>ts de la route.123Graphique 11: le plan 1&4 avec sélection des individus bi<strong>en</strong> représ<strong>en</strong>tésLic<strong>en</strong>ce IUP SIAL 9


Goudot Sébasti<strong>en</strong> – Lakhdari Omar – <strong>Tap</strong> Juli<strong>en</strong>L’axe 1 induit par la variable « accid<strong>en</strong>ts » est représ<strong>en</strong>té par les départem<strong>en</strong>ts citésprécédemm<strong>en</strong>t. En revanche ces mêmes départem<strong>en</strong>ts (13, 92, 93, 94,59) particip<strong>en</strong>t à laformation de la variable jeunes induisant l’axe 4 avec d’autre départem<strong>en</strong>t comme la HauteSavoie (74) la haute Garonne (31) mais aussi le Gers (32) et l’Aveyron (12). Nous avons alorstrois groupe de départem<strong>en</strong>ts :1) Les départem<strong>en</strong>ts jeunes mais où le nombre d’accid<strong>en</strong>t de la route est peu important.2) Les départem<strong>en</strong>ts où la part des jeunes est faible et où il y a peu d’accid<strong>en</strong>ts.3) Les départem<strong>en</strong>ts où la part de jeunes est très forte avec beaucoup d’accid<strong>en</strong>t de laroute.ConclusionGrâce à l’<strong>ACP</strong> nous avons pu m<strong>en</strong>é une étude objective et assez approfondis sur laproblématique des accid<strong>en</strong>ts de la route <strong>en</strong> France. Nous avons vu d’une part que lesdépartem<strong>en</strong>ts les plus touché par les accid<strong>en</strong>ts de la route faisait objet de control fréqu<strong>en</strong>t<strong>en</strong>traînant l’augm<strong>en</strong>tation d’infraction rec<strong>en</strong>sé. En suite il fallait confronter les problème desaccid<strong>en</strong>t de route selon trois facteurs sociodémographiques : l’age, le chômage et la d<strong>en</strong>sité depopulation. A l’image d’une France coupé <strong>en</strong> deux, on reti<strong>en</strong>t ess<strong>en</strong>tiellem<strong>en</strong>t que lesdépartem<strong>en</strong>t les plus touché par les accid<strong>en</strong>ts de la route ont une part de jeune importante avecune forte d<strong>en</strong>sité de population (92, 93, 94, 69,13). A l’inverse les départem<strong>en</strong>ts de faibled<strong>en</strong>sité où la part des jeunes est faible sont peu touchés par les problèmes de sécurité routière(53, 32).Si on nuance ce jugem<strong>en</strong>t, certains départem<strong>en</strong>ts se situ<strong>en</strong>t <strong>en</strong>tre les deux situations avecnotamm<strong>en</strong>t le problème du chômage qui r<strong>en</strong>tre <strong>en</strong> compte par exemple (2, 30, 34, 83). LaFrance s’organise alors comme une structure pyramidale avec un sommet, où converg<strong>en</strong>t lesvariables, se nommant Paris (75).Source1) INSEE. La France <strong>en</strong> fait et <strong>en</strong> chiffres. [En ligne] disponible sur :2) Ministère de l’intérieur. Les accid<strong>en</strong>ts de la route. [En ligne] disponible sur :Ce rapport est disponible sur Internet avec <strong>en</strong> annexes toutes les données utilisées sur : (data.xls)Lic<strong>en</strong>ce IUP SIAL 10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!