11.07.2015 Views

A1. La curva normale (o di Gauss) - Università degli Studi della ...

A1. La curva normale (o di Gauss) - Università degli Studi della ...

A1. La curva normale (o di Gauss) - Università degli Studi della ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Università</strong> <strong>degli</strong> Stu<strong>di</strong> <strong>di</strong> Basilicata – Facoltà <strong>di</strong> EconomiaCorso <strong>di</strong> <strong>La</strong>urea in Economia Aziendale - a.a. 2012/2013lezione n. 8 dell’11 aprile 2013- <strong>di</strong> Massimo Cristallo -<strong>A1.</strong> <strong>La</strong> <strong>curva</strong> <strong>normale</strong> (o <strong>di</strong> <strong>Gauss</strong>)<strong>La</strong> <strong>curva</strong> <strong>normale</strong> (o <strong>di</strong> <strong>Gauss</strong>) è la <strong>di</strong>stribuzione continua maggiormente utilizzata in Statistica.Solitamente viene in<strong>di</strong>cata con il simbolo:X ~ N( µ , σ ) .In pratica, misurando più volte una stessa grandezza è ovvio che ci saranno <strong>degli</strong> errori <strong>di</strong> osservazione,la cui <strong>di</strong>stribuzione è ottenuta dall’espressione algebrica (<strong>di</strong>mostrata da <strong>Gauss</strong>) <strong>di</strong> seguito riportata:( x−µ) 2N −2 2y = e σσ 2πI parametri <strong>della</strong> <strong>curva</strong> <strong>normale</strong> sono la numerosità del collettivo, la me<strong>di</strong>a aritmetica e lo scaroquadratico me<strong>di</strong>o: N, µ e σ .<strong>La</strong> <strong>curva</strong> <strong>di</strong> <strong>Gauss</strong> presenta, inoltre, le seguenti caratteristiche:- ha una forma campanulare;- è asintotica (presenta due rami asintotici all’asse delle ascisse);- è simmetrica intorno alla me<strong>di</strong>a aritmetica;- in corrispondenza dell’ascissa x = µ l’or<strong>di</strong>nata assume il suo massimo valore;- in corrispondenza dei punti <strong>di</strong> ascissa µ − σ e µ + σ ha i punti <strong>di</strong> flesso;- N in<strong>di</strong>ca l’area compresa tra la <strong>curva</strong> <strong>normale</strong> e l’asse delle ascisse;- al variare <strong>di</strong> µ la <strong>curva</strong> subisce traslazioni verso sinistra o destra, a seconda cheµ <strong>di</strong>minuisce o aumenta;- al variare <strong>di</strong> σ la <strong>curva</strong> <strong>di</strong>venta più schiacciata o aguzza, a seconda che σ aumenta o<strong>di</strong>minuisce.In definitiva, le curve normali, pur assumendo <strong>di</strong>versi aspetti al variare dei 3 parametri, mantengonosempre la forma a campana.E’ possibile ricondurre le infinite curve normali ad un’unica <strong>curva</strong> <strong>normale</strong> (detta standar<strong>di</strong>zzata),ponendo:x − µz =σcioè, cambiando le unità <strong>di</strong> misura <strong>della</strong> variabile in unità <strong>di</strong> deviazioni standard dalla me<strong>di</strong>a.Considerando, poi, le frequenze relative (cioè <strong>di</strong>videndo per il totale dei casi esaminati N) e tenendoconto <strong>della</strong> precedente assunzione, si ricava la seguente espressione algebrica <strong>della</strong> <strong>curva</strong> <strong>normale</strong>standar<strong>di</strong>zzata:z2− 21y = e2πove ciascuno dei tre parametri assume sempre lo stesso valore:N = 1 (area totale); µ = 0; σ = 1.<strong>La</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata è ovviamente simmetrica intorno allo zero.1


Essendo i parametri costanti e z l’unica variabile (in<strong>di</strong>pendente), è possibile far ricorso alle tabulazionipresenti in letteratura, che forniscono <strong>di</strong>rettamente l’area “interessata” al <strong>di</strong> sotto <strong>della</strong> <strong>curva</strong> <strong>normale</strong>,senza ricorrere al calcolo <strong>degli</strong> integrali definiti.Si può verificare che per ogni <strong>di</strong>stribuzione <strong>normale</strong> con me<strong>di</strong>a µ e deviazione standard σ , risulta:a. l’intervallo [ µ σ , µ σ ]b. l’intervallo [ µ 2 σ , µ 2σ]c. l’intervallo [ µ 3 σ , µ 3σ]− + comprende sempre il 68,3% delle osservazioni;− + comprende sempre il 95,4% delle osservazioni;− + comprende sempre il 99,7% delle osservazioni.Si noti che gli intervalli precedenti sono tutti simmetrici intorno alla me<strong>di</strong>a aritmetica.EsempioSe l’altezza <strong>di</strong> un gruppo <strong>di</strong> 100.000 persone si <strong>di</strong>stribuisce secondo una <strong>curva</strong> <strong>normale</strong> X ~ N(180,5) ,si può affermare che:175,185a. il 68,3% <strong>degli</strong> in<strong>di</strong>vidui in esame ha un’altezza contenuta nell’intervallo [ ]b. il 95,4% <strong>degli</strong> in<strong>di</strong>vidui in esame ha un’altezza contenuta nell’intervallo [ 170,190 ]c. il 99,7% <strong>degli</strong> in<strong>di</strong>vidui in esame ha un’altezza contenuta nell’intervallo [ 165,195 ] .In altri casi, occorre prima calcolare i valori <strong>di</strong> z corrispondenti all’ascissa x, sottraendo la me<strong>di</strong>aaritmetica e <strong>di</strong>videndo il risultato ottenuto per la deviazione standard, e poi utilizzare la tavola <strong>della</strong><strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata.Se risulta, ad esempio, X ~ N(10,4) , considerando l’ascissa x=8 si ha:8 −10z∗= = − 0,54Si deve, quin<strong>di</strong>, “rintracciare” sull’apposita tavola il valore 0,5, trattandosi come è noto <strong>di</strong> una <strong>curva</strong>simmetrica intorno allo zero, e poi procedere a seconda del tipo <strong>di</strong> problema da risolvere.Se invece x è pari a 15, poiché risulta:15 −10z∗= = 1, 254il valore da cercare all’interno <strong>della</strong> tavola è proprio 1,25, in corrispondenza del quale compare il valore0,10565, il quale sta a significare che la percentuale dei casi in cui x è maggiore <strong>di</strong> 15 risulta pari a circa il10,56%.E’ possibile risolvere, sempre con l’uso <strong>della</strong> apposita tavola, tipologie <strong>di</strong>verse <strong>di</strong> applicazioni.Allegato: “tavola” area <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata, consegnata durante la lezione.A2. In<strong>di</strong>ci <strong>di</strong> asimmetria e <strong>di</strong> curtosi<strong>La</strong> simmetria statistica in<strong>di</strong>ca l’assenza <strong>di</strong> specularità <strong>di</strong> una <strong>di</strong>stribuzione rispetto al suo asse <strong>di</strong>simmetria. Disponendo <strong>di</strong> N osservazioni <strong>di</strong> un certo carattere quantitativo, si <strong>di</strong>ce che queste sonosimmetriche rispetto ad un centro (valore me<strong>di</strong>o) se le intensità or<strong>di</strong>nate x e x sono equi<strong>di</strong>stanti( i ) ( N − i + 1)dal centro µ.<strong>La</strong> relazione <strong>di</strong> simmetria comporta che il primo e l’ultimo termine or<strong>di</strong>nato hanno uguale <strong>di</strong>stanza dalcentro <strong>di</strong> simmetria. Nell’ipotesi <strong>di</strong> simmetria, il “centro” coincide con la Me<strong>di</strong>ana, con la Me<strong>di</strong>aaritmetica e la Moda <strong>della</strong> <strong>di</strong>stribuzione.2


Si pone allora il problema <strong>di</strong> misurare l’asimmetria. A tal fine, la costruzione dei corrispondenti in<strong>di</strong>cideve essere tale da poter misurare <strong>di</strong> quanto la situazione rilevata si <strong>di</strong>scosti da quella <strong>di</strong> simmetria, percui tali in<strong>di</strong>ci devono presentare le seguenti caratteristiche:1. devono assumere valore zero se e solo se esiste simmetria;2. devono avere valore assoluto tanto più grande quanto più la situazione rilevata si <strong>di</strong>scosta dallasituazione <strong>di</strong> simmetria;3. devono assumere valore positivo o negativo, a seconda che la Me<strong>di</strong>ana (Me) sia minore omaggiore <strong>della</strong> Me<strong>di</strong>a aritmetica µ.Si riportano <strong>di</strong> seguito una serie <strong>di</strong> in<strong>di</strong>ci <strong>di</strong> asimmetria, sia assoluti che relativi.INDICI ASSOLUTI DI ASIMMETRIAα = µ − Me1α = µ − Mo2Il primo in<strong>di</strong>ce misura la <strong>di</strong>stanza <strong>della</strong> me<strong>di</strong>a aritmetica rispetto alla Me<strong>di</strong>ana, mentre il secondo misurala <strong>di</strong>stanza <strong>della</strong> me<strong>di</strong>a aritmetica rispetto alla Moda.Entrambi gli in<strong>di</strong>ci assumono valori nulli, positivi o negativi, a seconda che la <strong>di</strong>stribuzione presenti,rispettivamente, simmetria, asimmetria positiva o negativa.Altra misura assoluta <strong>di</strong> asimmetria è:α = Q −Q − Q − Q( ) ( )3 3 2 2 1ove Q1e Q3in<strong>di</strong>cano il primo ed il terzo quartile, mentre Q2coincide con la me<strong>di</strong>ana.INDICI RELATIVI DI ASIMMETRIAIn considerazione dei <strong>di</strong>fetti che presentano in generale le misure assolute, si ricorre al seguente in<strong>di</strong>ce<strong>di</strong> asimmetria <strong>di</strong> Pearson:µ − Moαp=σ(è un numero puro)che presenta, però, i seguenti <strong>di</strong>fetti:1. non è adatto per <strong>di</strong>stribuzioni plurimodali (cioè con più valori modali);2. non varia tra limiti definiti;3. contiene la moda, che non è facilmente calcolabile quando i casi osservati sono limitati.Per <strong>di</strong>stribuzioni moderatamente asimmetriche si utilizza pertanto il seguente in<strong>di</strong>ce:( µ − )3 Meα4= (numero puro, var ia tra − 3 e 3)σUn secondo in<strong>di</strong>ce <strong>di</strong> asimmetria proposto da Fisher, molto più usato del precedente, è il coefficiente<strong>di</strong> asimmetria:λ31 N⎛ xi− µ ⎞1= ∑ ⎜ ⎟i = 1N⎝σ⎠numero puroOSSERVAZIONESe esiste PERFETTA SIMMETRIA, allora gli in<strong>di</strong>ci precedenti sono nulli. Non vale, però, il contrario.3


Un altro aspetto che interessa considerare è quello <strong>della</strong> curtosi. Essa si riferisce alla maggiore o minoresporgenza <strong>di</strong> una <strong>curva</strong> in prossimità del suo massimo e alla maggiore o minore lunghezza delle code.<strong>La</strong> valutazione <strong>di</strong> questo aspetto <strong>di</strong> “forma” <strong>della</strong> <strong>curva</strong> si effettua attraverso il confronto con la <strong>curva</strong><strong>normale</strong>.INDICI DI CURTOSIPearson ha proposto il seguente in<strong>di</strong>ce:β41 N⎛ xi− µ ⎞2= ∑ ⎜ ⎟i = 1N⎝σ⎠numero puroche assume valore 3 per una <strong>curva</strong> <strong>normale</strong>, valore maggiore <strong>di</strong> 3 per una <strong>di</strong>stribuzione leptocurtica (oiper<strong>normale</strong>, cioè più appuntita <strong>della</strong> <strong>curva</strong> <strong>normale</strong>), minore <strong>di</strong> 3 per una <strong>di</strong>stribuzione platicurtica (oipo<strong>normale</strong>, cioè più piatta <strong>della</strong> <strong>curva</strong> <strong>normale</strong>).Fisher ha proposto invece l’ in<strong>di</strong>ce:λ2 = β2 − 3 numero puroche assume valore 0 per una <strong>curva</strong> <strong>normale</strong>, valore maggiore <strong>di</strong> 0 per una <strong>di</strong>stribuzione leptocurtica,minore <strong>di</strong> 0 per una <strong>di</strong>stribuzione platicurtica.Il coefficiente <strong>di</strong> asimmetria <strong>di</strong> Fisher e gli in<strong>di</strong>ci <strong>di</strong> curtosi riportati nel presente paragrafo sono riferitial caso <strong>di</strong> serie <strong>di</strong> dati. Per <strong>di</strong>stribuzioni <strong>di</strong> <strong>di</strong>stribuzioni <strong>di</strong> frequenze, è necessario procedere con lerelative ponderazioni.---------------------------------------------------------------------------------------------------------B) Curva <strong>normale</strong>, asimmetria e curtosi - Applicazioni1) Supponendo che il <strong>di</strong>ametro <strong>di</strong> una serie <strong>di</strong> un lotto <strong>di</strong> sferette <strong>di</strong> acciaio sia <strong>normale</strong>, con me<strong>di</strong>a8.000 micron e scarto quadratico me<strong>di</strong>o 50 micron, si determini la frequenza <strong>di</strong> sferetteprodotte che hanno un <strong>di</strong>ametro compreso tra 7.930 e 8.080 micron.Fonte: G. Girone e T. Salvemini, Lezioni <strong>di</strong> statistica, Cacucci E<strong>di</strong>tore, Bari, 2007SoluzioneSi proceda all’operazione <strong>di</strong> standar<strong>di</strong>zzazione <strong>degli</strong> estremi dell’intervallo richiesto, cioè deivalori 7.930 e 8.080, e poi si faccia ricorso alla tavola dell’area <strong>della</strong> <strong>curva</strong> <strong>normale</strong>standar<strong>di</strong>zzata. Per ciascuno dei valori standar<strong>di</strong>zzati trovati si trovi l’area corrispondentenell’apposita tavola (attenzione: essendo la <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata simmetrica intornoallo zero, il valore <strong>di</strong> z negativo deve “essere letto” come se fosse positivo). Si sommino, infine,le due aree rintracciate.2) Si vuole calcolare la frazione dei ventenni italiani, sottoposti alla visita <strong>di</strong> leva, <strong>di</strong> statura inferiorea 160 cm nell’ipotesi che la statura si <strong>di</strong>stribuisca normalmente con me<strong>di</strong>a 172 cm e scartoquadratico me<strong>di</strong>o 6 cm.Fonte: G. Girone e T. Salvemini, Lezioni <strong>di</strong> statistica, Cacucci E<strong>di</strong>tore, Bari, 2007SoluzioneSi proceda all’operazione <strong>di</strong> standar<strong>di</strong>zzazione del valore 160 e poi si faccia ricorso alla tavoladell’area <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata, in<strong>di</strong>viduando la relativa area in corrispondenza delvalore <strong>di</strong> z (cambiato <strong>di</strong> segno), essendo z negativo nel caso in questione. Si calcoli l’area <strong>della</strong>coda sinistra <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata, che coincide con quella <strong>della</strong> coda destra,4


sottraendo al valore 0,5 il valore dell’area rintracciata nella “tavola”, poiché quest’ultima fornisceil valore dell’area nell’intervallo [0,z].3) Ritenendo che la <strong>di</strong>stribuzione <strong>degli</strong> investimenti <strong>di</strong> un gruppo <strong>di</strong> aziende omogenee sia <strong>normale</strong>con me<strong>di</strong>a pari a 200 milioni e scarto quadratico me<strong>di</strong>o (s.q.m.) pari a 50 milioni, si determini inquale intervallo simmetrico intorno alla me<strong>di</strong>a aritmetica è compreso l’80% delle aziende.Fonte: G. Girone e T. Salvemini, Lezioni <strong>di</strong> statistica, Cacucci E<strong>di</strong>tore, Bari, 2007SoluzioneSi rintracci all’interno <strong>della</strong> tavola dell’area <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata il valore <strong>di</strong> z “piùvicino” a 0,40 (cioè a 0,80/2, essendo la <strong>curva</strong> <strong>normale</strong> perfettamente simmetrica). Infine, alvalore me<strong>di</strong>o si sottragga (per ottenere l’estremo inferiore) e si aggiunga (per ottenere l’estremosuperiore) il risultato del prodotto <strong>di</strong> z con s.q.m.4) Il peso netto delle scatole <strong>di</strong> un certo prodotto è rappresentabile me<strong>di</strong>ante una <strong>di</strong>stribuzione<strong>normale</strong> con me<strong>di</strong>a uguale a 495 grammi. Sapendo che il 3% delle scatole viene scartato perchéha un peso inferiore a 480 grammi, si determini lo scarto quadratico me<strong>di</strong>o <strong>della</strong> <strong>di</strong>stribuzione.Fonte: A. Cerioli e M. A. Milioli, Esercizi <strong>di</strong> Statistica, parte II, UNI.NOVA, Parma, 2006SoluzioneSi rintracci all’interno <strong>della</strong> tavola dell’area <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata il valore <strong>di</strong> z “piùvicino” a 0,47 (cioè a [0,50-0,03], essendo la <strong>curva</strong> <strong>normale</strong> perfettamente simmetrica). Poichésiamo collocati nella “coda sinistra” <strong>della</strong> <strong>curva</strong> <strong>normale</strong>, si consideri con il segno negativo ilvalore <strong>di</strong> z così trovato e si risolva l’equazione:x − µz =σla cui unica incognita è rappresentata dallo scarto quadratico me<strong>di</strong>o.5) Il <strong>di</strong>ametro delle arance <strong>di</strong> una certa varietà è <strong>di</strong>stribuito secondo una <strong>curva</strong> <strong>normale</strong> con me<strong>di</strong>apari a 7,5 cm e varianza 1,44.I. Si determini la percentuale <strong>di</strong> arance scartate in quanto il loro <strong>di</strong>ametro è inferiore a 6 cm;II. Sapendo che il 20% delle arance più grosse viene venduto con la denominazione “extra”, sidetermini il <strong>di</strong>ametro minimo che consente <strong>di</strong> attribuire tale qualifica.Fonte: A. Cerioli e M. A. Milioli, Esercizi <strong>di</strong> Statistica, parte II, UNI.NOVA, Parma, 2006SoluzionePer il punto I, si proceda all’operazione <strong>di</strong> standar<strong>di</strong>zzazione del valore 6 e poi si faccia ricorsoalla tavola dell’area <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata, in<strong>di</strong>viduando la relativa area incorrispondenza del valore <strong>di</strong> z (cambiato <strong>di</strong> segno), essendo z negativo nel caso in questione; sicalcoli l’area <strong>della</strong> coda sinistra <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata, che coincide con quella <strong>della</strong>coda destra, sottraendo al valore 0,5 il valore dell’area rintracciata nella “tavola”, poichéquest’ultima fornisce il valore dell’area nell’intervallo [0,z].Per il punto II, si rintracci all’interno <strong>della</strong> tavola dell’area <strong>della</strong> <strong>curva</strong> <strong>normale</strong> standar<strong>di</strong>zzata ilvalore <strong>di</strong> z “più vicino” a 0,30 (cioè a [0,50-0,20]), poiché siamo collocati nella “codadestra”(arance più grosse) <strong>della</strong> <strong>curva</strong> <strong>normale</strong>. Si risolva l’equazione:x − µz =σove il segno <strong>di</strong> z è positivo e la cui unica incognita è rappresentata dal valore x (si facciaattenzione che lo s.q.m. non è noto ma si ottiene estraendo la ra<strong>di</strong>ce quadrata <strong>della</strong> varianza).5


6) Si valuti l’asimmetria e la curtosi del “numero <strong>di</strong> riviste mensili” (X) venduti in una certacircoscrizione territoriale, avendo rilevato i seguenti dati:Mesi n° rivisteGennaio 4Febbraio 7Marzo 9Aprile 10Maggio 10Giugno 15Luglio 27Agosto 32Settembre 12Ottobre 11Novembre 11Dicembre 8SoluzioneSi utilizzino gli in<strong>di</strong>ci proposti da Fisher (nel caso <strong>di</strong> serie <strong>di</strong> dati) e si fornisca un interpretazione deirisultati ottenuti.Suggerimento. Dopo aver calcolato la me<strong>di</strong>a aritmetica semplice e lo scarto quadratico me<strong>di</strong>o, sicreino ulteriori colonne, costituiti dagli scarti <strong>di</strong> ciascuna osservazione dalla me<strong>di</strong>a aritmetica, elevatialla potenza 3 (per l’asimmetria) e alla potenza 4 (per la curtosi), e si rapportino i totali <strong>di</strong> colonna alprodotto <strong>di</strong> N per lo scarto quadratico me<strong>di</strong>o “al cubo” (per l’asimmetria) e “alla quarta” (per lacurtosi).6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!