03.08.2013 Views

Statistiques I

Statistiques I

Statistiques I

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Exercices Variables qualitatives Graphiques Résumé<br />

<strong>Statistiques</strong> I<br />

Alexandre Caboussat<br />

alexandre.caboussat@hesge.ch<br />

Classe : Mercredi 8h15-10h00<br />

Salle : C114<br />

http://campus.hesge.ch/caboussata<br />

A. Caboussat, HEG STAT I, 2010 1 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice 1.1<br />

Le département marketing de Pepsi fait faire des tests à l’aveugle à<br />

350 clients d’un supermarché afin de connaître leur préférence<br />

entre Pepsi et Coca.<br />

Décrire la population<br />

Décrire la variable d’intérêt<br />

Donner le type de la variable d’intérêt<br />

Décrire l’échantillon<br />

Décrire l’inférence<br />

A. Caboussat, HEG STAT I, 2010 2 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice 1.2<br />

Un supermarché qui vend des yoghourts, qui, correctement remplis<br />

ont un poids de 500 gr. Or, d’après les plaintes le consommateurs,<br />

le supermarché décide alors de retourner les yoghourts<br />

insuffisamment remplis à ses fournisseurs. Une récente livraison<br />

contient 1200 yoghourts. Le supermarché choisit aléatoirement 50<br />

yoghourts et les pèse au gramme près.<br />

Décrire la population<br />

Décrire la variable d’intérêt<br />

Donner le type de la variable d’intérêt<br />

Décrire l’échantillon<br />

Décrire l’inférence<br />

A. Caboussat, HEG STAT I, 2010 3 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice 1.3<br />

1 Dans quelles conditions l’ensemble des employés de votre<br />

entreprise serait-il considéré comme une population?<br />

2 Dans quelles conditions l’ensemble des employés de votre<br />

entreprise serait-il considéré comme un échantillon?<br />

A. Caboussat, HEG STAT I, 2010 4 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice 1.3<br />

3 Si l’ensemble des employés de votre entreprise était considéré<br />

comme un échantillon, celui-ci serait-il aléatoire ou non?<br />

4 Pourquoi le choix aléatoire de noms à partir de l’annuaire<br />

téléphonique d’une ville ne produit-il pas un échantillon<br />

représentatif des résidents de cette ville?<br />

A. Caboussat, HEG STAT I, 2010 5 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice 1.3<br />

5 Donner un exemple d’étude dans laquelle on s’intéresse au<br />

score moyen (tendance centrale) d’une population.<br />

A. Caboussat, HEG STAT I, 2010 6 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Variables qualitatives<br />

Distribution de fréquences et<br />

représentations graphiques<br />

A. Caboussat, HEG STAT I, 2010 7 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Objectifs<br />

Savoir résumer une variable qualitative par:<br />

une distribution de fréquences<br />

un diagramme en barres<br />

un diagramme circulaire<br />

une ogive (variables ordinales)<br />

A. Caboussat, HEG STAT I, 2010 8 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple introductif<br />

Ingénieur (I), Médecin (M), Etudiant (E), Avocat (A)<br />

I, I, M, E, E, A, I, M, E, E, I, A, I, A, E<br />

A. Caboussat, HEG STAT I, 2010 9 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Méthode générale<br />

Énumérer les différentes valeurs avec leur fréquence.<br />

Définition<br />

Une classe est une des catégories dans laquelle une variable<br />

qualitative peut être classifiée.<br />

Définition<br />

La fréquence d’une classe est le nombre d’observations dans cette<br />

classe.<br />

Définition<br />

La fréquence relative d’une classe est la fréquence de la classe<br />

divisée par le nombre total d’observations dans le jeu de données.<br />

A. Caboussat, HEG STAT I, 2010 10 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Distribution de fréquences<br />

Résumé des données sous forme de tableau décrivant la fréquence<br />

des observations dans les différentes classes juxtaposées<br />

classe fréquence fréq. relative<br />

xi ni fi<br />

x1 n1 n1/n<br />

x2 n2 n2/n<br />

.<br />

.<br />

xi ni ni/n<br />

.<br />

.<br />

xc nc nc/n<br />

Total n 1<br />

c : nombre de classes<br />

x i : i-ème valeur<br />

n i : nombre d’occurence de la classe x i<br />

n : nombre d’observations (n = P c i=1 n i )<br />

f i : fréquence relative = n i /n<br />

A. Caboussat, HEG STAT I, 2010 11 / 31<br />

.<br />

.


Exercices Variables qualitatives Graphiques Résumé<br />

Notations<br />

x1, . . . , xc.<br />

n1, . . . , nc.<br />

n = c<br />

i=1 ni<br />

A. Caboussat, HEG STAT I, 2010 12 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple 2<br />

Bon (B), Suffisant (S), Insuffisant (I)<br />

Comptons-les dans l’ordre!<br />

classe<br />

B,B,B,B,S,S,S,S,S,I,I,I<br />

A. Caboussat, HEG STAT I, 2010 13 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Définitions (suite)<br />

Définition<br />

La distribution de fréquence cumulée représente le nombre<br />

d’observations dont la valeur est inférieure ou égale à (la limite<br />

supérieure de) chaque classe.<br />

Définition<br />

La distribution de fréquence relative cumulée d’une classe est la<br />

fréquence cumulée de la classe divisée par le nombre total<br />

d’observations dans le jeu de données<br />

A. Caboussat, HEG STAT I, 2010 14 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

classe fréquence fréq. fréq. fréq.<br />

cumulée relative relative cumulée<br />

xi ni n1 + . . . + ni fi f1 + . . . + fi<br />

x1 n1 n1 n1/n n1/n<br />

x2<br />

.<br />

xi<br />

.<br />

xc<br />

n2<br />

.<br />

ni<br />

.<br />

nc<br />

Total n<br />

Notation: n1 + . . . + nc =<br />

c<br />

ni = n<br />

i=1<br />

A. Caboussat, HEG STAT I, 2010 15 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple<br />

Le groupe sanguin de 25 donneurs de sang est:<br />

AB, B, A, O, B, O, B, O, A, O, B, O<br />

B, B, B, A, O, AB, AB, O, A, B, AB, O, A<br />

Fréquence Pourcentage Pourcentage cumulatif<br />

Fréquence relative Fréquence cumulative<br />

A 5 20.0% 20.0%<br />

AB 4 16.0% 36.0%<br />

B 8 32.0% 68.0%<br />

O 8 32.0% 100.0%<br />

Total 25 100.0%<br />

A. Caboussat, HEG STAT I, 2010 16 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Remarque<br />

La somme des fréquences relatives vaut toujours 1.<br />

Commandes Informatiques<br />

table (R)<br />

frequence (Excel FR)<br />

frequency (Excel AN)<br />

[Exemple groupe sanguin (Excel). ]<br />

A. Caboussat, HEG STAT I, 2010 17 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Diagramme en barres<br />

Diagramme en barre décrit des données qualitatives résumées<br />

par une distribution de fréquence absolue, relative ou en<br />

pourcentage.<br />

Synonyme: diagramme en bâtons, graphique en tuyau<br />

d’orgue<br />

Axe vertical (ordonnée): fréquence<br />

Axe horizontal (abscisse): classes<br />

Les barres sont de largeurs égales, mais de hauteurs<br />

proportionnelles à la fréquence.<br />

Commandes Informatiques<br />

barplot (R)<br />

Insertion→Graphiques→Colonnes (Excel FR)<br />

Insert→Chart→Column (Excel AN)<br />

A. Caboussat, HEG STAT I, 2010 18 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple<br />

Liste des pays dans lesquels les société concurrentes de Sun4all ont<br />

leur siège:<br />

Allemagne, USA, USA, Taïwan, Japon, USA, Corée du Sud,<br />

Allemagne, Allemagne, USA, Japon, Japon, Japon, Taïwan, Corée<br />

du Sud, Allemagne, USA, Corée du Sud<br />

A. Caboussat, HEG STAT I, 2010 19 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple<br />

Liste des pays dans lesquels les société concurrentes de Sun4all ont<br />

leur siège:<br />

A. Caboussat, HEG STAT I, 2010 20 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice<br />

Nombres de commandes passées à une entreprise<br />

1, 3, 2, 4, 3, 3, 2, 3, 3, 2, 1, 1, 3, 2, 2, 1, 3<br />

Construisez un tableau de fréquences pour ces données, puis<br />

représentez-les sur un graphique en bâtons. Commentez les<br />

résultats.<br />

A. Caboussat, HEG STAT I, 2010 21 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Diagramme circulaire<br />

Disque (voire un demi-disque) découpé en secteurs, chacun<br />

ayant une surface proportionnelle à la fréquence de la<br />

modalité représentée.<br />

Synonyme: graphique en camembert, graphique en secteurs<br />

Construction:<br />

Angle du secteur [degré] = Fréquence relative ×360<br />

Si demi-disque:<br />

Angle du secteur [degré] = Fréquence relative ×180<br />

A. Caboussat, HEG STAT I, 2010 22 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple<br />

Sièges de sociétés concurrentes<br />

A. Caboussat, HEG STAT I, 2010 23 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice<br />

Situation en 1997: nombre total de médecins et nombre de<br />

médecins généralistes exerçant dans un canton entièrement<br />

romand.<br />

Canton Nombre total Nombre de médecins<br />

de médecins généralistes<br />

Genève 1’196 228<br />

Jura 92 42<br />

Neuchâtel 311 118<br />

Vaud 1’413 468<br />

Source: Annuaire statistique de la Suisse, édition 2000.<br />

Construisez et comparez deux diagrammes circulaires, l’un pour la<br />

distribution du nombre total de médecins par canton et l’autre pour<br />

la distribution du nombre de médecins généralistes par canton.<br />

A. Caboussat, HEG STAT I, 2010 24 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice (suite)<br />

Canton Nombre total Nombre de médecins<br />

de médecins généralistes<br />

Genève 1’196 228<br />

Jura 92 42<br />

Neuchâtel 311 118<br />

Vaud 1’413 468<br />

Source: Annuaire statistique de la Suisse, édition 2000.<br />

A. Caboussat, HEG STAT I, 2010 25 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Ogive<br />

Définition<br />

La distribution de fréquence cumulée représente le nombre<br />

d’observations dont la valeur est inférieure ou égale à (la limite<br />

supérieure de) chaque classe.<br />

Définition<br />

Une ogive est une représentation de la fréquence cumulée par une<br />

courbe.<br />

→ Variables qualitatives ordinales seulement (pas les nominales)<br />

A. Caboussat, HEG STAT I, 2010 26 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple<br />

Une entreprise a classé ses clients en 5 catégories d’importance<br />

croissante: très petite (TP), petite (P), moyenne (M), grande (G)<br />

et très grande (TG)<br />

TP, TP, TP, TP, P, P, P, P, M, M, M,<br />

M, M, M, M, M, G, G, G, TG, TG, TG<br />

A. Caboussat, HEG STAT I, 2010 27 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exemple<br />

Une entreprise a classé ses clients en 5 catégories d’importance<br />

croissante: très petite (TP), petite (P), moyenne (M), grande (G)<br />

et très grande (TG)<br />

TP, TP, TP, TP, P, P, P, P, M, M, M,<br />

M, M, M, M, M, G, G, G, TG, TG, TG<br />

A. Caboussat, HEG STAT I, 2010 27 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Attention aux graphiques pouvant induire en erreur!<br />

A. Caboussat, HEG STAT I, 2010 28 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Résumé<br />

Distribution de fréquence: résumé des données sous forme de<br />

tableau décrivant la fréquence des observations.<br />

Diagramme en barres: chaque catégorie correspond à une<br />

barre<br />

Diagramme en secteurs: chaque catégorie correspond à un<br />

secteur<br />

Ogive: cumul des fréquences par une courbe croissante.<br />

A. Caboussat, HEG STAT I, 2010 29 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

Exercice<br />

Satisfaction des consommateurs<br />

ES, ES, ES, TS, TS, TS, S, S, S, S, S, S, PS, PS, PS, PS, PTS,<br />

PTS<br />

Ecrire le tableau de distribuation de fréquences.<br />

Illustrer un diagramme en barres et un diagramme en secteurs.<br />

Dessiner l’ogive.<br />

A. Caboussat, HEG STAT I, 2010 30 / 31


Exercices Variables qualitatives Graphiques Résumé<br />

A. Caboussat, HEG STAT I, 2010 31 / 31

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!