13.07.2015 Views

202 - Dipartimento di Economia e Statistica

202 - Dipartimento di Economia e Statistica

202 - Dipartimento di Economia e Statistica

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

EEEEEEE166Esempio:Foto all’incanto. Prezzi <strong>di</strong> aggiu<strong>di</strong>cazione esitati a New York il 15.4.1992.Autore Anno Valore P. Outerbridge 1936 3'000'800B. Abbot 1935 4'364'800 I. Penn 1971 27'280'000M. Bourke-White 1932 4'364'800 J. Sudek 1955 3'546'400A. Kertész 1929 19'096'000 E. Weston 1936 25'916'000In questo ambito l’anomalia è più <strong>di</strong>fficile da in<strong>di</strong>viduare dato che nella formazione del prezzo concorrono fattori emotivi e ragioni <strong>di</strong>prestigio. Secondo Christies non esiste un valore eccessivo, qualunque sia l’oggetto battuto.E’ chiaro che, in un insieme <strong>di</strong> modalità <strong>di</strong>sposte in or<strong>di</strong>ne, una <strong>di</strong> esse sarà maggiore delle altre ed un’altra saràminore; solo se questi estremi sono molto remoti rispetto alle modalità loro contigue ovvero remoti rispetto aquanto ragionevolmente ci si può attendere, nascerà il sospetto <strong>di</strong> <strong>di</strong>sfunzioni: se una ASL ha storicamenterichiesto il rimborso <strong>di</strong> un numero mensile <strong>di</strong> “parti cesarei con complicazioni” che oscilla tra i 20 ed i 30 e, undato mese, richiede rimborsi per 120 <strong>di</strong> tali operazioni non necessariamente è un fatto anomalo, ma potrebbeessere la spia <strong>di</strong> un cambiamento nel meccanismo dei rimborsi o nel management della ASL.Esempio:I massimi mensili (classi <strong>di</strong> ampiezza <strong>di</strong> 1 dml) delle precipitazioni giornaliere in una stazione delle isole Fiji sono riassunte (Revfeim,1986) nella tabella che segue. Si riporta inoltre il poligono delle frequenze per valori non superiori ai 19 dml.Xini0 1 391 2 472 3 433 4 434 5 405 6 416 7 287 8 208 9 169 10 1110 11 711 12 712 13 713 14 414 15 515 16 216 17 417 18 218 19 0>19 5504540353025201510500 2 4 6 8 10 12 14 16 18 20Le 5 unità nella classe “>19” sono in parte manifestazioni estreme <strong>di</strong> un fenomeno normale, ma anche veri e proprie catastrofiatmosferiche (lo è ad esempio il valore massimo: 272 dml, non riportato).E’ facile confondere valori <strong>di</strong>scordanti, ma ragionevoli con valori remoti del tutto incompatibili con gli altridati o con la teoria in cui si inquadra la rilevazione. Se un fenomeno può produrre modalità estremamente piccolee/o gran<strong>di</strong> è inevitabile che nel corso della rilevazione qualcuno <strong>di</strong> questi si mostri prima o poi apparendo però<strong>di</strong>screpante dalla maggioranza e non rappresentativo.Esempi:a) Se un provve<strong>di</strong>torato sbaglia una volta su cento a comunicare il numero <strong>di</strong> docenti in servizio sarà <strong>di</strong>fficile accorgersi della presenza<strong>di</strong> un valore anomalo confrontando poche rilevazioni: {1781, 1975, 1789, 1763}. Le possibilità aumentano se il numero <strong>di</strong> rilevazioniè più esteso. Se si analizza la serie per un numero maggiore <strong>di</strong> anni si potrà spiegare lo scostamento <strong>di</strong> un dato da tutti gli altri: {1736,1778, 1801, 1795, 1733, 1756, 1719, 1728, 1768, 1781, 1975, 1789, 1763}. In questo caso, il dato “1975” è da attribuire o ad unainversione <strong>di</strong> cifre (1795) ovvero alla confusione del numero <strong>di</strong> docenti con l’anno <strong>di</strong> rilevazione. Il giu<strong>di</strong>zio sull’anomalia non puòprescindere dal numero <strong>di</strong> osservazioni considerate.b) Hamilton (1990, p150-152) propone come caso <strong>di</strong> valore remoto il numero <strong>di</strong> matrimoni ogni 100 residenti per gli Stati dellafederazione USA. Ecco il <strong>di</strong>agramma a punti per il logaritmo del rapporto:EEEEEEE E EE EEEEEEEEE EEE1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.9 4.1 4.3 4.5 4.7 4.9 5.1Nonostante l’effetto telescopico della scala logaritmica il dato relativo al Nevada (142.83) contro una me<strong>di</strong>ana <strong>di</strong> circa 10.57 ed unvalore penultimo <strong>di</strong> 17.27 emerge senza ombra dubbio come valore anomalo. In questo caso la sua cancellazione dal data set èmotivata dalle <strong>di</strong>sinvolte leggi <strong>di</strong> quello Stato che agevola particolarmente le nozze dei non residenti e che lo rendono un caso<strong>di</strong>somogeneo rispetto al resto.Esercizio_SD36: il rischio <strong>di</strong> violazione della riservatezza dei dati rilasciati nelle indagini statistiche è influenzatodalla presenza <strong>di</strong> casi unici. Diversi stu<strong>di</strong>osi ipotizzano che la percentuale <strong>di</strong> casi eccezionali presenti inuna determinata area <strong>di</strong>penda soprattutto dal numero <strong>di</strong> unità presenti in essa.a) Che relazione ritenete possa esistere tra la percentuale <strong>di</strong> incremento <strong>di</strong> casi unici e la percentuale <strong>di</strong>incremento <strong>di</strong> popolazione dell’area; b) Il caso unico può sempre essere considerato un caso anomalo?c) Discutete il trade-off tra aumento dei dettagli rilevati sull’unità ed il rischio <strong>di</strong> violazione della privacydell’unità stessa.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!