171D’altra parte, è ben nota la sensibilità della me<strong>di</strong>a aritmetica ai valori più gran<strong>di</strong> ed è perciò inappropriata nei casi incui tali manifestazioni rivestano un ruolo marginale: se si guarda agli atenei per numero <strong>di</strong> iscritti, l’inclusione <strong>di</strong> Roma“La Sapienza” porterà molto in alto il numero me<strong>di</strong>o <strong>di</strong> iscritti. Se il caso fosse unico allora si potrà escluderlo , se invecenon è caso isolato oppure si vuole tenerne esplicitamente conto, la me<strong>di</strong>a aritmetica ri<strong>di</strong>venta ammissibile.Un <strong>di</strong>scorso a parte meritano le me<strong>di</strong>e lasche: moda e me<strong>di</strong>ana in particolare. La prima è l’unica a poter essereutilizzata anche per variabili nominali e la seconda a partire dalle variabili su scala or<strong>di</strong>nale ed hanno, quin<strong>di</strong>, un raggiod’azione più ampio delle me<strong>di</strong>e <strong>di</strong> potenze. Non solo, le me<strong>di</strong>e lasche sono determinabili anche in <strong>di</strong>stribuzioni concode spesse, causa più verosimile dei valori remoti. La moda, nei casi in cui esiste una frequenza relativa che svettadecisamente sulle altre, è l’in<strong>di</strong>ce più in<strong>di</strong>cato: nessuna altra me<strong>di</strong>a potrebbe aggiungere informazioni significative.Peraltro, le me<strong>di</strong>ana è l’unica a poter essre calcolata con una certa accuratezza allorché gli estremi della primoe/o dell’ultima classe sono indeterminati.Esempio:Un campione <strong>di</strong> titoli è raggruppato in base ai giorni mancanti per la maturazione della cedola.Giorni Investimenti20 29 230 39 440 49 350 59 860 69 3170 79 980 89 690 99 265La classe “60-69” comprende da sola quasi il 50% delle rilevazioni. Ogni modalità ad essa interna è una can<strong>di</strong>data legittima comein<strong>di</strong>ce <strong>di</strong> centralità e qualunque sia la me<strong>di</strong>a (ragionevole) scelta ben <strong>di</strong>fficilmente si andrà al <strong>di</strong> fuori <strong>di</strong> tale intervallo.La moda ha però <strong>di</strong>fetti che ne complicano l’uso: non è sempre calcolabile oppure -se calcolabile- non è sempresignificativa: nelle <strong>di</strong>stribuzioni plurimodali ad esempio insorgono incertezze su quale modalità debba considerarsi“moda”. Inoltre, risente molto della strutturazione in classi e non sfrutta una parte delle informazioni. Questo <strong>di</strong>fettoè con<strong>di</strong>viso dalla me<strong>di</strong>ana che non coinvolge puntualmente le modalità, ma solo il loro or<strong>di</strong>namento. Le me<strong>di</strong>e lasche,in effetti, possono tornare utili allorché il poligono <strong>di</strong> frequenza presenti asimmetrie fortissime e inaspettate, verosimilmenteda attribuire a <strong>di</strong>storsioni nei dati.Esempi:a) Una strada ad alta intensità <strong>di</strong> traffico è stata sud<strong>di</strong>visa in tratti regolari e in ognuno è stato rilevato il numero <strong>di</strong> incidenti.Incident Tratti fi F i0 229 0.3969 0.39691 211 0.3657 0.76262 93 0.1612 0.92373 35 0.0607 0.98444 7 0.0121 0.99655 2 0.0035 1.0000577La moda non può essere utilizzata in quanto in<strong>di</strong>cherebbe lo “0” ignorando il verificarsi <strong>di</strong> incidenti che è l’oggetto della rilevazione. La me<strong>di</strong>aaritmetica µ=0.94, ci informa che, in me<strong>di</strong>a, in ogni tratto è avvenuto circa un incidenti, ma può trattarsi <strong>di</strong> una informazione inutile. La me<strong>di</strong>anaM e =1 è un in<strong>di</strong>ce più chiaro: sulla metà dei tratti è avvenuto almeno un incidente.b) In un negozio si è rilevato il numero <strong>di</strong> clienti serviti per ogni giorno <strong>di</strong> apertura.Clienti Giorni ci f0 10 9 5.00 0.029611 20 21 15.50 0.069121 25 39 23.00 0.128326 30 88 28.00 0.289531 35 66 33.00 0.217136 40 42 38.00 0.138241 50 27 45.50 0.088851 60 12 55.50 0.0395304 1.00000.300.250.200.150.100.050.000 5 10 15 20 25 30 35 40 45 50 55 60La moda (28.76), la me<strong>di</strong>ana (29.77) e la me<strong>di</strong>a aritmetica (30.92) <strong>di</strong>fferiscono poco e questo accade se il poligono <strong>di</strong> frequenza èsimmetrico intorno alla me<strong>di</strong>ana.Esercizio_SD44: per <strong>di</strong>stribuzioni unimodali e simmetriche o anche moderatamente asimmetriche dovrebbevalere la relazione: (me<strong>di</strong>ana-moda)=3(me<strong>di</strong>a-me<strong>di</strong>ana) cioè, la me<strong>di</strong>ana è posta, rispetto a “µ”, ad un terzodella <strong>di</strong>stanza cui è posta la moda.a) Verificare l’uguaglianza (anche approssimativa) per i dati dell’esempio precedente;b) Perché non è valida nelle <strong>di</strong>stribuzioni a “L”, a “J” e ad “U”?
1723.2 La variabilitàLe me<strong>di</strong>e forniscono informazioni sul centro della <strong>di</strong>stribuzione ovvero in<strong>di</strong>viduano la modalità dominante onormale cioè quella che dovrebbe essere scelta se si volesse rappresentare con un solo valore tutte quelle rilevate.Tuttavia, è tipico dei fenomeni che interessano la <strong>Statistica</strong> <strong>di</strong> presentare valori o attributi <strong>di</strong>versi (in verità, tuttele scienze si interessano dei cambiamenti) e dunque le me<strong>di</strong>e potranno assolvere il loro compito <strong>di</strong> sintesi in modopiù o meno efficace secondo la variabilità presente nel fenomeno. In questo paragrafo stu<strong>di</strong>eremo il concetto ela misura della variabilità per variabili metriche sia in termini assoluti che relativi. Discuteremo anche la misuradella variabilità per le variabili nominali ed or<strong>di</strong>nali (mutabilità).Concetto <strong>di</strong> variabilitàLa variabilità è la tendenza a <strong>di</strong>fferenziarsi della variabile. E’ cioè frutto dell’assenza o dell’annullamento <strong>di</strong> forzeche spingono ad un valore o una categoria costante in tutte le rilevazioni (ad esempio la velocità della luce rispettoalla sua fonte). Un fenomeno ha più variabilità quanto maggiore è la gamma <strong>di</strong> modalità che presenta confrequenza non nulla e quanto minore è la <strong>di</strong>versificazione tra le frequenze con cui le modalità del suo dominiosi verificano.Esempio:Distribuzione "1" Distribuzione "2" Distribuzione "3"Xi niX niXi ni1 1 1 1 1 53 23 2 2 2 55 1 3 19 3 525 4 2 4 55 1 5 525 25Distribuzione "4"Xin i3 2525La “1” ha meno variabilità della “2” e “3” perché, a parità <strong>di</strong> unità, è minore il numero <strong>di</strong> modalità che presenta (tre rispetto a cinque).La “3” ha maggiore variabilità della “2” perché, a parità del numero <strong>di</strong> modalità e del numero <strong>di</strong> unità, sono minori le <strong>di</strong>fferenze trale frequenze. La “4” è un caso estremo- detto <strong>di</strong>stribuzione degenere- in cui si presenta una sola modalità e la variabilità è assente.Da notare che le quattro <strong>di</strong>stribuzioni hanno in comune moda, me<strong>di</strong>ana e me<strong>di</strong>a aritmetica e quin<strong>di</strong>, dal punto <strong>di</strong> vista della centralitàsono in<strong>di</strong>stinguibili; lo <strong>di</strong>ventano solo se si allarga il confronto estendendolo ad altri aspetti oltre che la tendenza centrale.La variabilità è una caratteristica tanto evidente e generale che A. Costanzo (1969, p. 9) considera confermatal'opinione <strong>di</strong> molti statistici del passato che l'indagine statistica altro non sia che un insieme <strong>di</strong> tecniche rivolteallo stu<strong>di</strong>o della variabilità. Graficamente la variabilità corrisponde alla forma più o meno assottigliata delpoligono o della densità <strong>di</strong> frequenza ed alla estensione più o meno vasta dell’arco dei valori. Consideriamo le<strong>di</strong>stribuzioni del ren<strong>di</strong>mento <strong>di</strong> due fon<strong>di</strong> <strong>di</strong> investimento.BALa curva B è maggiormente addensata intorno al suo centro; le code della A sono più spesse. La <strong>di</strong>stribuzioneB è meno variabile della A Gli investitori in B rischiano meno, ma pure guadagnano meno; in A c’è più rischioe le per<strong>di</strong>te possono essere gravi, ma sono anche possibili alti guadagni.Requisiti degli in<strong>di</strong>ci <strong>di</strong> variabilitàGli in<strong>di</strong>ci <strong>di</strong> variabilità V(x 1,x 2,…,x n) esprimono l’attitu<strong>di</strong>ne a variare delle modalità (cfr. Castellano, !962).Qualunque sia lo schema <strong>di</strong> costruzione e la scala <strong>di</strong> misurazione del dominio, un in<strong>di</strong>ce <strong>di</strong> variabilità dovrà:1) Essere nullo se e solo se le modalità sono tutte uguali;2) Aumentare se e solo se aumenta la <strong>di</strong>versificazione tra le modalità.