01.06.2013 Views

stat01.pdf - Liceo Norberto Rosa

stat01.pdf - Liceo Norberto Rosa

stat01.pdf - Liceo Norberto Rosa

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Elementi di statistica descrittiva<br />

Conoscenze<br />

- Essere in grado di analizzare una tabella di dati<br />

rilevati<br />

- Conoscere le principali rappresentazioni grafiche<br />

e saper scegliere le più funzionali<br />

- Conoscere i più semplici valori di sintesi e di<br />

variabilità di una distribuzione<br />

Competenze:<br />

MAPPA DEI CONCETTI<br />

- Saper tracciare e saper leggere rappresentazioni<br />

grafiche di dati statistici<br />

- Saper operare su una tabella per costruire frequenze<br />

relative e percentuali<br />

- Saper calcolare medie statistiche e indici di<br />

variabilità<br />

INDICAZIONI PER RICERCA GUIDATA IN RETE …<br />

http://it.wikipedia.org/wiki/Statistica<br />

CONCETTI GENERALI<br />

http://www.dif.unige.it/epi/hp/pal/0-EMS-Stat.pdf<br />

http://www.science.unitn.it/~matsoc/stat/sezione2/sezione2.html<br />

DISPENSA INTRODUTTIVA<br />

http://sirio.stat.unipd.it/files/stat.uno02-03/descrittiva2.pdf<br />

DISPENSA CON ESEMPI DI TIPO BIOLOGICO<br />

http://www2.dm.unito.it/paginepersonali/zucca/Statisticadescrittiva.pdf<br />

DISPENSA CON APPLICAZIONI IN EXCEL<br />

http://ishtar.df.unibo.it/stat/base/temp.html<br />

DISPENSA LEGATA ALL’ANALISI DEGLI ERRORI


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Generalità sulla statistica<br />

La statistica è entrata in questo secolo a far parte della vita quotidiana di ognuno di noi perché è presente in<br />

tutti i mezzi di comunicazione di massa. Sui giornali quotidiani troviamo tabelle, grafici, rapporti percentuali<br />

sia su argomenti di importanza vitale per la società, sia su argomenti di natura meno impegnativa.<br />

Le espressioni quali “ricerca di mercato”, “sondaggi di opinione”, “indice di ascolto”, “prodotto interno<br />

lordo”, “tasso di disoccupazione”, ecc., fanno parte del linguaggio comune.<br />

Varie sono le definizioni di statistica; riteniamo interessante quella proposta da B. Giardina:<br />

“La statistica, in senso moderno, è propriamente l’applicazione dei metodi scientifici alla programmazione<br />

della raccolta dei dati, alla loro classificazione, elaborazione, analisi e presentazione e alla inferenza di<br />

conclusioni attendibili da essi.”<br />

(da Manuale di statistica, F. Angeli, Milano, 1962)<br />

Si suddivide in:<br />

- statistica descrittiva, che consiste nella rilevazione e in una prima elaborazione di dati riguardanti<br />

fenomeni collettivi;<br />

- inferenza statistica, che permette di stimare le caratteristiche di un fenomeno collettivo partendo<br />

dall’analisi di un campione.<br />

1. Nota storica<br />

La statistica come raccolta di dati su popolazioni, beni posseduti dagli individui, quantità di prodotti agricoli,<br />

ecc., era già presente in Cina sotto l’imperatore Yu (circa 2000 anni a. C.).<br />

In Egitto per censire terre e case si inventò il catasto<br />

Nell’antica Roma Servio Tullio istituì il “Census” che consisteva in una rilevazione ogni 5 anni per conoscere<br />

il numero dei cittadini, l’ammontare dei loro beni, l’andamento delle nascite e delle morti.<br />

Nell’antichità si raccolsero dati, non solo per la rilevazione del numero di individui e dei loro beni per motivi<br />

di imposizione di tasse, ma anche gli astronomi babilonesi (circa 2500 a.C.) e quelli greci (circa 200 a. C.)<br />

per lo studio dei moti del sole e dei pianeti utilizzarono molte osservazioni e misurazioni ricavando dati<br />

interessanti.<br />

Il termine statistica, come “descrizione della situazione geografica e sociale degli stati”, si fa risalire allo<br />

studioso tedesco H. Conring (1606-1681).<br />

Una visione più moderna della statistica come “metodo di studio” è dovuta al belga<br />

A. Quêtelet (1796-1874), che sosteneva la necessità di una statistica scientifica legata al calcolo delle<br />

probabilità.<br />

Con gli studi di K. Pearson (1857-1936) e di R. A. Fisher (1890-1962) si ebbe un notevole progresso sia<br />

nella ricerca di relazioni fra due o più caratteri, sia con la teoria del campionamento e con le stime statistiche.<br />

Il campo di applicazione della statistica si è notevolmente ampliato, anzi si può dire che ogni ambito<br />

dell’attività umana, in modo più o meno approfondito, si avvale dei metodi statistici.<br />

Bruna Consolini Pagina 2 di 12


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

2. Introduzione al metodo statistico<br />

Il metodo statistico si occupa non di fenomeni singoli, ma di fenomeni collettivi allo scopo di ricavare le<br />

leggi che li governano, o almeno di evidenziare possibili regolarità per poterne prevedere il comportamento<br />

futuro.<br />

I fenomeni collettivi possono presentare grande variabilità; con i metodi statistici si cerca di sintetizzare i<br />

dati utilizzando medie, rapporti, scarti, ecc.<br />

Esempio<br />

- Se consideriamo il reddito dei cittadini italiani, i valori assunti possono essere molto variabili, mediante un<br />

valore medio si sintetizza tutta una serie di dati.<br />

- Se rileviamo il numero annuo di nascite nelle varie regioni italiane otteniamo dati molto variabili, mediante il<br />

rapporto fra il numero dei nati e la popolazione (detto tasso di natalità) si può analizzare meglio il fenomeno.<br />

Si definisce unità statistica il più piccolo elemento sul quale si effettua un’osservazione<br />

Si definisce popolazione statistica (o universo se molto grande) un insieme di unità statistiche fra loro omogenee<br />

Esempio<br />

- L’insieme degli allievi di una Scuola rappresenta una popolazione statistica, di cui gli allievi sono le unità<br />

statistiche.<br />

- L’insieme delle autovetture immatricolate in Italia nel 2008 è una popolazione statistica di cui ogni autovettura<br />

è una unità statistica.<br />

- L’insieme dei libri venduti in una libreria in un dato mese è una popolazione statistica. di cui i libri sono le<br />

unità statistiche.<br />

- L’insieme dei voti espressi dagli elettori in una consultazione elettorale è una popolazione statistica di cui i<br />

voti sono le unità statistiche.<br />

Le fasi fondamentali di un’indagine statistica sono essenzialmente tre:<br />

- rilevazione dei dati;<br />

- rappresentazione dei dati;<br />

- elaborazione dei dati.<br />

2.1 La rilevazione dei dati<br />

La rilevazione dei dati statistici consiste nel raccogliere le informazioni da una popolazione statistica<br />

secondo certi caratteri, ossia certi aspetti del fenomeno, e quindi nel raggrupparli.<br />

Esempio<br />

- Nella popolazione costituita dalle famiglie di una città si possono rilevare i seguenti caratteri: numero dei componenti,<br />

reddito del capo famiglia, possesso dell’abitazione, utilizzo dei mezzi di trasporto, titolo di studio, ecc.<br />

- Nella popolazione costituita dalle autovetture di nuova immatricolazione nell’anno 2008 da residenti in Italia, si<br />

possono rilevare i seguenti caratteri: cilindrata, potenza del motore, Casa costruttrice, tipo di alimentazione, velocità<br />

massima, numero di airbag installati, numero posti, ecc.<br />

I caratteri statistici si distinguono in: quantitativi e qualitativi.<br />

I caratteri quantitativi sono espressi da numeri ottenuti da enumerazioni o da misurazioni e si distinguono<br />

in discreti e continui:<br />

- continui, se si esprimono con numeri reali, che possono assumere i valori di un intervallo, come le<br />

altezze degli studenti di una classe, i pesi delle casse di un magazzino, l’estensione di superfici coltivabili,<br />

ecc.<br />

- discreti, se si esprimono generalmente mediante numeri naturali, come il numero dei componenti di<br />

una famiglia, il numero dei vani di un appartamento, il numero degli addetti in un settore industriale,<br />

ecc.<br />

I caratteri qualitativi sono espressi mediante aggettivi, o nomi come lo stato civile di un insieme di<br />

persone, la nazionalità di un insieme di persone, il sesso delle persone di un insieme, ecc.


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

2.2 La rappresentazione dei dati<br />

Effettuata la rilevazione statistica i dati rilevati vengono presentati in forma tabellare e/o grafica.<br />

Le tabelle/matrici possono essere a semplice entrata, a doppia entrata e tabelle composte, secondo che,<br />

rispettivamente, nella stessa popolazione statistica vengano rilevati un solo carattere, due caratteri collegati<br />

fra loro, più caratteri.<br />

Se il carattere è qualitativo la successione dei dati rilevati è detta serie statistica, se il carattere è quantitativo<br />

la successione è detta seriazione statistica.<br />

Per alcune tabelle statistiche si parla di distribuzione statistica proprio per indicare che la popolazione<br />

statistica è stata suddivisa fra le varie modalità sia qualitative, sia quantitative.<br />

Fra le distribuzioni statistiche hanno particolare rilevanza le distribuzioni di frequenza.<br />

In statistica con il termine frequenza assoluta si intende il numero delle unità statistiche aventi una data<br />

modalità.<br />

Nelle distribuzioni di frequenze, oltre alle frequenze assolute, per avere una migliore valutazione del<br />

fenomeno si possono utilizzare le frequenze relative che si ottengono dividendo ogni frequenza assoluta per<br />

la somma di tutte le frequenze. Sovente le frequenze relative si esprimono in percentuale moltiplicando ogni<br />

quoziente per 100..<br />

Esempio<br />

Distribuzione della popolazione in Italia per fasce di età. Anno 2007 (fonte: http://demo.istat.it)<br />

FASCE POPOLAZIONE FREQUENZA REL. FREQUENZA %<br />

0-9 5522939 0,0934 9,34%<br />

10-19 5740194 0,0971 9,71%<br />

20-29 6786046 0,1148 11,48%<br />

30-39 9333821 0,1578 15,78%<br />

40-49 9037561 0,1528 15,28%<br />

50-59 7625725 0,1290 12,90%<br />

60-69 6623137 0,1120 11,20%<br />

70-79 5322190 0,0900 9,00%<br />

80-89 2638440 0,0446 4,46%<br />

90'99 489737 0,0083 0,83%<br />

100 otre 11497 0,0002 0,02%<br />

TOTALE 59131287 1,0000 100,00%<br />

Un primo modo per analizzare le tabelle statistiche è la rappresentazione grafica che permette un esame<br />

globale del fenomeno oggetto di studio e consente il confronto con rilevazioni in altri luoghi o in altri tempi.<br />

Le rappresentazioni grafiche hanno anche uno scopo divulgativo e per tale motivo sono presenti non solo in<br />

pubblicazioni specializzate, ma in giornali quotidiani, riviste di varia natura, ecc.<br />

Bruna Consolini Pagina 4 di 12


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Si possono rappresentare graficamente sia tabelle di dati grezzi, sia tabelle di frequenze assolute o relative.Nella<br />

rappresentazione grafica è molto importante la scelta delle unità di misura che deve tener conto dei<br />

valori minimi e massimi dei dati da rappresentare, anche perché una scelta non opportuna può dare<br />

un’immagine distorta del fenomeno.<br />

In Statistica si utilizzano diversi tipi di rappresentazioni grafiche secondo il carattere qualitativo o quantitativo<br />

e si possono utilizzare vari programmi già predisposti per il computer.<br />

Esaminiamo le rappresentazioni grafiche più importanti usando come fonte “Italia in cifre 2008”:<br />

- Diagrammi cartesiani<br />

- Istogrammi<br />

- Diagrammi a settori circolari<br />

- Cartogrammi<br />

- Ideogrammi<br />

Nei diagrammi cartesiani si riportano<br />

sull’asse delle x e delle y<br />

i dati scegliendo unità di misura<br />

che facilitino la “lettura del fenomeno”<br />

senza appiattire o enfatizzare<br />

i comportamenti.<br />

Negli istogrammi si riportano<br />

sull’asse orizzontale<br />

tanti intervalli consecutivi<br />

che individuano le classi e<br />

su ognuno di essi si costruisce<br />

un rettangolo in modo<br />

che l’area sia proporzionale<br />

alla relativa frequenza.<br />

Negli aerogrammi si<br />

suddivide un cerchio in<br />

settori circolari di ampiezza<br />

proporzionale<br />

alle frequenze espresse<br />

solitamente in forma<br />

percentuale.


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

2.3 L’elaborazione dei dati<br />

I cartogrammi servono per rappresentare l’intensità di un<br />

fenomeno in diverse zone geografiche.<br />

Su una carta geografica si contrassegnano le varie parti in<br />

cui è suddiviso il fenomeno mediante simboli convenzionali<br />

e colorazione di diversa gradazione.<br />

Gli ideogrammi sono rappresentazioni mediante figure di<br />

grandezza dipendente dall’intensità del fenomeno, oppure<br />

figure uguali accostate secondo la frequenza assoluta del<br />

fenomeno.<br />

Si utilizzano soprattutto a scopo divulgativo.<br />

Diamo l’ideogramma dell’immigrazione in Italia negli anni<br />

dal 2001 al 2005 (da il Sole-24 Ore del 11 marzo 2007)<br />

I dati dopo essere stati raccolti possono essere analizzati mediante elaborazioni differenti per poter confrontare<br />

fra loro dati riguardanti fenomeni analoghi in tempi diversi o in luoghi differenti.<br />

Occorre procedere alla produzione di indici significativi e al calcolo di valori di sintesi.<br />

In particolare, si segnalano:<br />

⎧<br />

⎧ ⎧media aritmetica<br />

⎪<br />

⎪<br />

⎪<br />

medie di calcolo<br />

media geometrica<br />

⎪<br />

⎪<br />

⎨media<br />

quadratica<br />

⎪indici<br />

di sintesi ⎨<br />

⎪<br />

⎩media<br />

armonica<br />

⎪<br />

⎪<br />

medie di posizione<br />

mediana<br />

⎨<br />

⎪<br />

{ moda<br />

⎪<br />

⎩<br />

⎪<br />

⎧varianza<br />

⎪<br />

⎪<br />

indici di variabilità<br />

scarto quadratico medio<br />

⎨<br />

⎪ coefficiente<br />

di variabilità<br />

⎪<br />

⎪⎩ ⎩scostamento<br />

semplice dalla media<br />

Bruna Consolini Pagina 6 di 12


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Media aritmetica<br />

Data una serie di valori x1, x2... x n , si definisce media aritmetica di n valori x1, x2,..., xnil numero che si<br />

ottiene dividendo per n la somma dei valori<br />

x1+ x2 + ... + xn<br />

M =<br />

n<br />

Quando una variabile statistica viene fornita attraverso una serie di frequenze, ovvero dati n valori:<br />

x1, x2,..., x n , con le relative frequenze (pesi): y1, y2,..., y n , si definisce media aritmetica ponderata il<br />

rapporto fra la somma dei prodotti di ogni valore per il rispettivo peso e la somma dei pesi:<br />

x1y1+ x2y2+ ... + x y<br />

M =<br />

y + y + ... + y<br />

1 2<br />

n<br />

n n<br />

Nel caso in cui i dati siano espressi nel continuo mediante classi si assume come valore xi il valore centrale<br />

ottenuto come semisomma tra gli estremi di ogni classe, supponendo che i valori in ogni classe si dispongano<br />

in modo uniforme.<br />

Esempio<br />

Calcolo della media aritmetica di 20 valori nelle tre modalità di calcolo:<br />

- calcolo della media partendo dai singoli valori;<br />

- calcolo della media considerando i valori e le frequenze;<br />

- calcolo della media considerando gli intervalli di posizionamento dei valori e il valore centrale dell’intervallo.<br />

VALORI PUNTUALI FREQUENZA DISCRETA FREQUENZA CONTINUA<br />

xi scarti xi yi xi yi INF SUP CENT yi CENT yi<br />

1 5,1 0,0 4,6 1 4,6 4,5 5,0 4,75 5 23,75<br />

2 5,0 -0,1 4,8 1 4,8 5,0 5,5 5,25 13 68,25<br />

3 4,8 -0,3 4,9 3 14,7 5,5 6,0 5,75 2 11,5<br />

4 5,2 0,1 5,0 2 10,0<br />

5 5,3 0,2 5,1 3 15,3 SOMMA 20 103,5<br />

6 4,9 -0,2 5,2 6 31,2 MEDIA 5,2<br />

7 4,6 -0,5 5,3 2 10,6<br />

8 5,6 0,5 5,5 1 5,5<br />

9 5,2 0,1 5,6 1 5,6<br />

10 5,1 0,0<br />

11 5,2 0,1 SOMMA 20 102,3<br />

12 4,9 -0,2 MEDIA 5,1<br />

13 5,5 0,4<br />

14 5,2 0,1<br />

15 5,0 -0,1<br />

16 5,3 0,2<br />

17 5,2 0,1<br />

18 4,9 -0,2<br />

19 5,1 0,0<br />

20 5,2 0,1<br />

SOMMA 102,3 0<br />

MEDIA 5,1


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Mediana<br />

È una media di posizione e corrisponde al valore centrale della distribuzione quando i dati sono ordinati (in<br />

ordine crescente o decrescente).<br />

Siano x1, x2,..., x n i valori ordinati in senso non decrescente, si dice mediana (Me) il valore che bipartisce la<br />

successione, ossia il valore non inferiore a metà dei dati e non superiore all’altra metà.<br />

In caso di serie si ordinano i valori e se il numero dei termini è dispari la mediana è proprio il valore<br />

centrale, se il numero dei termini è pari si assume come mediana la semisomma dei due valori centrali.<br />

Esempio Calcolare la mediana di una serie di valori<br />

MEDIANA<br />

VALORI PUNTUALI FREQUENZA DISCRETA<br />

xi xi xi yi cumyi<br />

1 28 15 0 5 5<br />

2 19 19 1 12 17<br />

3 30 21 2 32 49<br />

4 23 23 3 21 70<br />

5 24 24 4 12 82<br />

6 27 25 5 8 90<br />

7 26 26 6 6 96<br />

8 25 27 7 3 99<br />

9 27 27 8 1 100<br />

10 15 28 SOMMA 100<br />

11 29 29<br />

12 30 30<br />

13 31 30<br />

14 21 31<br />

15 32 32<br />

MEDIA 26<br />

In presenza di valori puntuali è sufficiente ordinare la serie di valori e prendere il valore che corrisponde alla posizione<br />

centrale (nel caso 27 che occupa l’ottavo posto). Facciamo notare che il valore ottenuto per la mediana non è identico al<br />

valore che si ottiene calcolando la media aritmetica.<br />

Per le seriazioni con i valori nel discreto i dati in generale sono già ordinati. Occorre calcolare le frequenze assolute<br />

cumulate che si ottengono sommando ogni frequenza con quella precedente.<br />

Calcolata la somma N delle frequenze la mediana è il valore che corrisponde alla metà di N + 1 se N è dispari, alla<br />

semisomma fra la metà di N e il numero successivo se N è pari .<br />

Per le seriazioni con i dati raggruppati in classi si determina la classe mediana con le frequenze cumulate come detto<br />

sopra. Nel caso esemplificativo, essendo 100 la somma delle frequenze, il termine centrale è 100 : 2 = 50 pertanto si<br />

deve cercare il 50-esimo termine che bipartisce la successione e lo si trova per x = 3.<br />

Moda (o valore modale)<br />

La moda è un valore di sintesi che riguarda le distribuzioni di frequenza.<br />

Si definisce moda (o valore modale) di una distribuzione di frequenze la modalità, o il valore della<br />

variabile, se esiste, che ha la frequenza maggiore nella distribuzione.<br />

Esempio Calcolare la moda delle serie di valori precedenti<br />

Nel primo esempio la moda corrisponde a x=5.2 con frequenza 6.<br />

Nel secondo esempio la moda potrebbe essere indifferentemente 27 oppure 30 (frequenza 2).<br />

Nel terzo esempio la moda è 2 con frequenza 32.<br />

Bruna Consolini Pagina 8 di 12


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Media geometrica<br />

Si definisce media geometrica semplice di n numeri positivi 1 2<br />

esima del loro prodotto:<br />

G = n x ⋅x ⋅ ⋅ x<br />

1 2 ...<br />

n<br />

x , x , ,..., x n il valore ottenuto come radice n-<br />

Se i dati hanno frequenze diverse si determina la media geometrica ponderata con una formula simile alla<br />

precedente.<br />

La media geometrica si utilizza quando ha significato moltiplicare fra loro i dati statistici.<br />

Ad esempio la media geometrica trova applicazione per il calcolo del tasso medio di incremento o di<br />

decremento di prezzi e, in matematica finanziaria, per il calcolo del tasso medio di rendimento di un capitale<br />

impiegato a vari tassi.<br />

Media quadratica<br />

Si definisce media quadratica semplice dei numeri x1, x2, ,..., x n la radice quadrata della media aritmetica<br />

dei quadrati dei dati:<br />

2 2 2<br />

x1 + x2 + ... + xn<br />

Q =<br />

n<br />

Se i dati x1, x2, ,..., x n hanno pesi y1, y2,..., y n , la media quadratica ponderata è la radice quadrata della<br />

media ponderata dei quadrati dei dati, ossia:<br />

2 2 2<br />

x1 y1 + x2y2 + ... + xnyn Q =<br />

y + y + ... + y<br />

1 2<br />

n<br />

La media quadratica (semplice o ponderata) si utilizza con serie o seriazioni aventi dati positivi e negativi e<br />

serve per evidenziare l’esistenza di dati il cui valore assoluto si discosta molto dagli altri. Inoltre è applicata<br />

per la determinazione di un importante indice di variabilità: lo scarto quadratico medio.<br />

Media armonica<br />

Questo valore medio viene utilizzato quando ha significato calcolare il reciproco dei dati.<br />

Si definisce media armonica semplice di n valori positivi 1 2<br />

dei reciproci dei dati:<br />

n<br />

A =<br />

1 1 1<br />

+ + ... +<br />

x x x<br />

1 2<br />

n<br />

x , x , ,..., x n il reciproco della media aritmetica<br />

Analogamente per la media armonica ponderata se i dati hanno pesi diversi.<br />

Si utilizza la media armonica in fisica per il calcolo della velocità media, essendo noti gli spazi e i tempi di<br />

percorrenza, in economia per calcolare il potere di acquisto della moneta, noti i prezzi di una merce, ecc.


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Vale la seguente proprietà:<br />

media armonica ≤ media geometrica ≤ media aritmetica ≤ media quadratica<br />

Esempio: Calcolare le medie differenti per la stessa serie di valori<br />

CALCOLO DELLE MEDIE<br />

VALORI<br />

1 A 245<br />

2 B 311<br />

3 C 193<br />

4 D 292<br />

5 E 283<br />

6 F 392<br />

7 G 111<br />

8 H 298<br />

9 K 370<br />

10 J 135<br />

media aritmetica 237,5455<br />

media geometrica 207,5595<br />

media quadratica 260,6009<br />

media armonica 175,2267<br />

Quale media scegliere?<br />

Non esiste una regola generale per la scelta del tipo di media, che è legata alle caratteristiche della distribuzione.<br />

La media aritmetica è la più comune ed esprime un concetto di equidistribuzione; ad esempio per calcolare il<br />

reddito medio di una popolazione, l’altezza media di un insieme di persone della stessa età, la temperature<br />

media nell’arco di una giornata, ecc.<br />

Si utilizza anche la media aritmetica per determinare la misura media di una serie di misure per ottenere un<br />

valore più preciso che elimini gli errori accidentali.<br />

La mediana è il valore centrale di una distribuzione e risulta indipendente dai valori molto grandi o molto<br />

piccoli.<br />

Il valore modale di una distribuzione di frequenze è il valore che si presenta con maggiore frequenza.<br />

Ad esempio abbiamo calcolato che il numero medio dei componenti di una famiglia italiana è 2,6 con la<br />

media aritmetica, mentre il valore modale che si rileva guardando la tabella è 2 (secondo i dati del Censimento<br />

del 2001).<br />

Ad un produttore di indumenti interessa conoscere la taglia che è richiesta con frequenza maggiore, piuttosto<br />

che quella ricavata con la media aritmetica.<br />

Le medie (geometrica, quadratica, armonica) si applicano a problemi particolari.<br />

Bruna Consolini Pagina 10 di 12


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Indici di variabilità<br />

Un carattere importante dei dati statistici è la variabilità.<br />

Nello studio di una distribuzione statistica, dopo aver calcolato uno o più valori medi, si cerca di associare<br />

qualche valore che esprima la dispersione dei dati.<br />

Escursione (campo di variazione)<br />

Si definisce campo di variazione la differenza fra il maggiore e il minore dei dati rilevati.<br />

Il campo di variazione è sempre un numero positivo.<br />

Il campo di variazione è un indice semplice da calcolare, ma poco importante perché tiene conto solo dei<br />

valori estremi della distribuzione.<br />

Scarto semplice dalla media<br />

Assegnati n valori x1, x2, ..., x n si calcola la media aritmetica M.<br />

La differenza fra i singoli valori x1, x2, ..., x n e il loro valore medio, cioè: x1 − M , x2 −M ,..... , xn−<br />

M. , è<br />

detto scarto dalla media<br />

Gli scarti possono essere positivi, negativi o anche nulli; la somma degli scarti semplici dalla media vale 0.<br />

Scostamento semplice medio dalla media è la media dei valori assoluti degli scarti fra i valori e la mediana:<br />

SMe<br />

=<br />

x1 − M + x2 − M<br />

n<br />

+ ... + xn−M<br />

Scarto quadratico medio, Varianza<br />

Uno degli indici di variabilità più utilizzato è lo scarto quadratico medio.<br />

Si definisce varianza di una distribuzione la media aritmetica semplice o ponderata del quadrato degli<br />

scarti:<br />

2 2 2<br />

2 ( x1 − M) + ( x2 − M ) + ... + ( xn−M)<br />

σ =<br />

n<br />

Analogamente se i dati sono ponderati.<br />

La varianza è un indice al quadrato, pertanto si assume come indice la radice quadrata della varianza<br />

Si ha la seguente definizione:<br />

Assegnati n valori x1, x2, ..., x n , aventi media aritmetica M, si definisce scarto quadratico medio la radice<br />

quadrata della varianza::<br />

2 2 2<br />

( x1− M) + ( x2 − M ) + ... + ( xn−M)<br />

(1) σ=<br />

n<br />

Si può definire lo scarto quadratico medio utilizzando la media quadratica<br />

2 2 2<br />

x1 + x2 + ... + xn<br />

σ= − M<br />

n<br />

Coefficiente di variabilità<br />

σ<br />

E’ un indice percentuale dato dalla formula CV =<br />

100<br />

N<br />

2


Corso IFTS “Tecnico Superiore in sicurezza e qualità nelle scienze della vita” Statistica<br />

Esempio Considerare tre serie con dati diversi e stessa media confrontando lo scarto quadratico medio.<br />

CALCOLO DEGLI INDICI DI VARIABILITA'<br />

A1 A2 A3<br />

N1 46 46 48 50<br />

N2 20 35 46 50<br />

N3 24 58 44 50<br />

N4 91 29 48 50<br />

N5 55 55 55 50<br />

N6 82 76 62 50<br />

N7 76 62 54 50<br />

N8 64 81 53 50<br />

N9 10 30 46 50<br />

N10 66 37 56 50<br />

N11 35 25 45 50<br />

N12 31 66 43 50<br />

SOMMA 600 600 600<br />

MEDIA 50 50 50<br />

VARIANZA 694,18 363,82 34,55<br />

SCARTO QM 26,35 19,07 5,88<br />

CV 52,7% 38,1% 11,8%<br />

Se i dati sono ponderati lo scarto quadratico medio è dato da::<br />

σ=<br />

( M) ( M ) ... ( M)<br />

2 2 2<br />

1 − ⋅ 1+ 2 − ⋅ 2 + + n − ⋅ n<br />

x y x y x y<br />

y + y + ... + y<br />

1 2<br />

Esempio Calcolare lo scarto quadratico medio per una serie fornita con le frequenze.<br />

n<br />

xi yi xi yi xi - M (xi - M)^2 (xi - M)^2 yi<br />

F1 60 22 1320 -15,36 235,93 5190,45<br />

F2 70 44 3080 -5,36 28,73 1264,10<br />

F3 80 35 2800 4,64 21,53 753,54<br />

F4 90 18 1620 14,64 214,33 3857,93<br />

F5 100 6 600 24,64 607,13 3642,78<br />

TOTALE 125 9420 14708,80<br />

MEDIA 75,36 117,67 VARIANZA<br />

10,85 SCARTO QM<br />

Bruna Consolini Pagina 12 di 12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!