13.07.2015 Views

202 - Dipartimento di Economia e Statistica

202 - Dipartimento di Economia e Statistica

202 - Dipartimento di Economia e Statistica

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

167Caratteristiche della anomaliaIglewicz e Hoaglin (1996, pp. 6-7) affermano che, a livello teorico e pratico, è riconosciuta la necessità <strong>di</strong>effettuare sui dati controlli <strong>di</strong> routine per la ricerca <strong>di</strong> valori eccezionali. Anche se questi dovessero risultareosservazioni isolate e inatten<strong>di</strong>bili, spesso hanno origine in una causa identificabile e la sua conoscenza contribuiràad una migliore comprensione del fenomeno che produce i dati. Spesso, i valori anomali sono trattati consospetto e fasti<strong>di</strong>o dato che compromettono l’opportunità <strong>di</strong> rappresentare la rilevazione empirica con un modelloteorico semplice e ben conosciuto e c’è il rischio concreto che una minuscola frazione dei dati finisca con ildeterminare le conclusioni <strong>di</strong> un’indagine.L’anomalia <strong>di</strong> per sé non è una caratterizzazione negativa. Infatti, ricordano Barnett e Lewis (1978, p. 32)un fisico delle particelle può considerare un colpo <strong>di</strong> fortuna e non un errore la presenza <strong>di</strong> una osservazionetalmente <strong>di</strong>scosta dalle altre da far pensare piuttosto ad un nuovo tipo <strong>di</strong> particella. Come si è già detto altrove,molte scoperte scientifiche e molti successi commerciali sono dovuti alla constatazione <strong>di</strong> valori troppo estremio fuori posto rispetto al contesto ed al tentativo riuscito <strong>di</strong> spiegarne la ragione. I valori anomali sono lampi <strong>di</strong>luce scorti da lontano. A produrre il brillìo può essere un coccio <strong>di</strong> bottiglia lasciato dai gitanti oppure unosmeraldo grezzo; per capire <strong>di</strong> che si tratta occorre andare a vedere.Esempi:a) La procura della repubblica avviò un’indagine intesa ad accertare i motivi per i quali a Catanzaro si verificava una consistenteaffluenza <strong>di</strong> can<strong>di</strong>dati provenienti da altre regioni per gli esami <strong>di</strong> Stato per l’abilitazione alla professione <strong>di</strong> avvocato. Uno dei dati <strong>di</strong>partenza fu una percentuale <strong>di</strong> promossi molto più elevata <strong>di</strong> quanto non si registrasse in altri <strong>di</strong>stretti <strong>di</strong> corte d’appello.b) Barnett e Lewis (1978, p. 6) riportano la seguente serie: {43, 43, 41, 41, 41, 41, 43, 58, 58, 41, 41} relativa alla temperatura in gra<strong>di</strong>Farhenheit tra la sera del 31.12.1960 e il mattino del 1.1.1961 nel Nord della Scozia. Il valore “58” è manifestamente incoerente conil livello generale degli altri. Tanto più inverosimile se si pensa che corrisponde a circa 14° il che non è male per la notte <strong>di</strong> Capodannoa due passi dal Polo Nord. Un esame più approfon<strong>di</strong>to accertò che, dopo la mezzanotte, venne adottato un sistema <strong>di</strong> registrazionedelle temperature in gra<strong>di</strong> Celsius per cui “58” andava letto come “5.8” corrispondente a 42 gra<strong>di</strong> Farenheit; inoltre, “41” era ”4.1” ilche equivale a 39F° e quin<strong>di</strong> in linea con quelli registrati prima.Esercizio_SD37: copie <strong>di</strong>ffuse per giornalisti assunti per i quoti<strong>di</strong>ani italiani (ads 12/99; 11/2000).0.37 0.45 0.46 0.56 0.61 0.61 0.63 0.63 0.63 0.69 0.71 0.75 0.80 0.80 0.81 0.850.85 0.86 0.89 0.89 0.89 0.89 0.93 0.95 0.99 1.02 1.03 1.10 1.13 1.19 1.23 1.241.24 1.25 1.35 1.37 1.37 1.38 1.51 1.62 1.62 1.73 2.08 2.13 2.16 2.64 3.00 3.15Rappresentare graficamente la <strong>di</strong>stribuzione e <strong>di</strong>scutere la presenza <strong>di</strong> valori remoti.Esercizio_SD38: una ricerca <strong>di</strong> mercato tentò <strong>di</strong> in<strong>di</strong>viduare quanto fossero efficaci i canali televisivi. La ricercasi concentrò su 24 zone <strong>di</strong>vise in tre gruppi: A, B, C in cui il prodotto era pubblicizzato con gli stessi spot su TVnazionali, su TV locali inserite in network nazionali e TV locali. Gli incrementi <strong>di</strong> ven<strong>di</strong>ta furono i seguenti:TV Naz. 6.7 8.1 7.2 8.3 6.8 7.1 1.5 8.2TV L/N 3.2 0.1 3.9 4.1 4.4 4.5 3.3 2.9TV Loc. 1.5 1.2 1.1 1.4 1.3 1.6 1.4 1.3I valori inclusi nei cerchi furono riconosciuti anomali: un insuccesso così patente delle campagna pubblicitariain quelle zone era sorprendente. Un semplice incrocio <strong>di</strong> dati bastò per accertare che le due zone erano se<strong>di</strong> <strong>di</strong>stabilimenti per la produzione del bene che davano molta occupazione tra <strong>di</strong>retta ed indotta. Ogni incremento<strong>di</strong> pubblicità qui era da considerarsi superfluo. Che insegnamento si può trarre?Le me<strong>di</strong>e troncateUn espe<strong>di</strong>ente ingegnoso per instaurare un legame forte tra modalità e in<strong>di</strong>ce <strong>di</strong> centralità e -nello stesso tempocontenerel’effetto dei valori abnormi è il taglio delle ali ovvero l’eliminazione <strong>di</strong> una certa percentuale in unao in entrambe le code come ancora si fa nella valutazione delle performances in <strong>di</strong>versi sport. Limiteremo peròla <strong>di</strong>scussione alla sola me<strong>di</strong>a aritmetica. In<strong>di</strong>chiamo con M γ1,γ2la me<strong>di</strong>a calcolata sulle modalità superiori alquantile <strong>di</strong> or<strong>di</strong>ne γ 1ed inferiori al quantile γ 2:Mγ1, γ =2n−[ nγ2 ]∑ Xi ()i=[ nγ1 ]n nγnγ− [ 2]− [ 1]Questa formula è nota come me<strong>di</strong>a aritmetica troncata o potata (in inglese: trimmed) e la rilevazione che risultadalla potatura dei valori più estremi è detta rilevazione troncata.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!