13.07.2015 Views

materiale didattico

materiale didattico

materiale didattico

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniDott. Silvia SaliniDipartimento di Economia Politica e AziendaleUniversità degli Studi di Milano(e-mail: silvias@statistica.unimib.it )tel. 0272342491tel. 02503215381Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 1 - Variabile Casuale Media CampionariaSia data una popolazione costituita da N=2 unità cuicorrispondono i valori Y 1 =1 e Y 2 =5 rispettivamente conpesi 1/4 e 3/4. Si estraggono con ripetizione tutti i possibilicampioni ordinati di quattro unità e si calcoli la media diogni campione.2


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 1Lo spazio campionario è costituito da |Ω|=2 4 =16 punti campione cuicorrisponde il seguente piano di campionamento:3Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 1Lo media della popolazione è YLa varianza della popolazione è= ( 1⋅1/4 + 5⋅3/4) = 4σ2= (1⋅1/4 + 25⋅3/4) − 42= 3Distribuzione della variabile casuale media campionariayipiy ⋅ pii2i⋅ p i1 1/256 1/256 1/2562 12/256 24/256 48/2563 54/256 162/256 486/2564 108/256 432/256 1728/2565 81/256 405/256 2025/2561 1024/256 4288/256yM ( Y ) = 44288 2 4 2 =2= −2σy0. 75σ 3σy= = = 0. 75256n 44


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 1Definire:•sottospazio che fornisce una stima esatta di108C12 , C13,C14,C15p(Y = 4) = = 0.422256Y•sottospazio che fornisce una stima campionaria di Y che non siallontana per più di una unità135{(Y = 3) ∪ ( Y = 5) } = 0. 527C6 , C7,C8,C9,C10,C11,C16p=256In questo caso utilizzando lo stimatore media campionariasi ottiene la media esatta nel 42,2% dei casi e non sisbaglia per più di una unità nel 94,7% dei casi5Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 2 - Estrazione di numeri casualiEstrarre casualmente n=10 edifici dislocati in 15 strade delcomune di Piacenza in base alla seguente tabella.Strade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Tot edifici 17 25 70 32 19 13 29 31 37 41 47 19 26 25 22Tot cumulato 17 42 112 144 163 176 205 236 273 314 361 380 406 431 4536


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 3A) Si calcolano le ampiezze normalizzate, Pi (= Xi/X dove Xi è dato dalnumero dei furti per la i-esimo negozio ed X il totale dei furti subiti dalgruppo AUCHAN) e si estrae la prima unità con la tecnica di Lahiri o deitotali cumulati;Si ricalcolano le probabilità P i =X j /(X-X i ) per i cinque supermercatirimasti e si estrae una seconda unità con la stessa tecnica usata per lascelta della prima unità;Pi Pj/1-Pi1 12 0,181818 0,235294 0,218182 0,20339 0,214286 0,2181822 15 0,227273 0,277778 0,272727 0,254237 0,267857 0,2727273 11 0,166667 0,203704 0,215686 0,186441 0,196429 0,24 7 0,106061 0,12963 0,137255 0,127273 0,125 0,1272735 10 0,151515 0,185185 0,196078 0,181818 0,169492 0,1818186 11 0,166667 0,203704 0,215686 0,2 0,186441 0,19642966 1 1 1 1 1 1 111Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 3B) Le probabilità di inclusione nel caso di n=2 sono:ππNNii = Pi+ ∑ Pj= P ⎜i 1 +j i − P∑≠ 1jj ≠iij⎝PjPi= Pi+ Pj1 − P 1 − PiPjP ⎞j⎟1 − Pj ⎠supponendo di aver estratto la terza e la quarta sezione si calcolano leprobabilità di inclusione π 3e π 34Pi/(1-Pi) 0,2222 0,2941 0.2000 0,1186 0,1786 0,2000⎛π 3 = 0,1667(1+0,2222+0,2941+0,1186+ 0,1786 +0,2000)=0,335π 34 = 0,1667(0,1061/(1-0,1667)) + 0,1061(0,1667/(1-0,1061))= 0,04112


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 3C) Se il campione risulta formato dal terzo e dal quarto supermercato,la sequenza ordinata di dati campionari d=((3, Y 3 ),(4, Y 4 )) presenta ivalori Y 3 =65 e Y 4 =30, rispettivamente con probabilità di inclusione delprimo ordineπ 3 = 0,1667(1+0,2222+0,2941+0,1186+ 0,1786 +0,2000)=0,33566π 4 = 0,1061(1+0,2222+0,2941+0,2000+ 0,1786 +0,2000)=0,22227La stima del totale è quindi:ˆ yi65 30YHT = ∑ = + = 328,6195i∈cπ 0.33566 0.22227i13Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 4 - Piano di Campionamento(DISCUSSIONE IN GRUPPI DI LAVORO)L’Associazione Commercianti vuole conoscerel’atteggiamento dei consumatori del comune diSalsomaggiore Terme nei confronti della piccola, media egrande distribuzione.•Definire la popolazione di riferimento•Predisporre un appropriato piano di campionamento•Predisporre lo schema di campionamento14


SCRMaster in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia Salini•probabilità costanti→STIMA DEL TOTALEY ˆ =NySTIMATORE PER ESPANSIONEy x•probabilità variabili → Yˆ1iiHH= ∑ pi=n i∈cpixSSRN•probabilità costanti→ Yˆ= ∑ yi= Nyn i∈c•probabilità variabili → ˆ yiYHT= ∑i∈cπiSTRATIFICATON•probabilità costanti→hYˆh= ∑ yn= Nhyi hn cYˆSThH= ∑ Nn=1hhyhSTIMATORE DI HANSEN-HURWITZSTIMATORE PER ESPANSIONESTIMATORE DI HORVITZ-THOMPSONSTIMATORE DELTOTALE NELLO STRATO h15Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniGRAPPOLI•probabilità costanti → Yˆ•probabilità variabili → YˆSTIMA DEL TOTALEYˆDUE STADI•probabilità costanti →YˆN= ∑n i∈cGRy iHHGRHTGR•probabilità variabili → YˆDSM=n02yi= ∑i=1 πN∑ yii∈ci∑ˆyij= ∑ ∑i∈cj∈cπ ⋅π(SSR)Mipi=Mπi= Brwel (n = 2)ˆYˆ0yˆi= ∑i∈cπ(SCR)DS= yi⋅yiSTIMATORE ⋅ PER ESPANSIONE NEL GRAPPOLOn i∈cyijyˆ= ∑j∈πDSii i j|iic ij|i(2° STADIO)SISTEMATICO→YˆSM=Nn∑ yi= Nyri∈c16


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 5 – Campionamento GrappoliSi vuole condurre un’indagine campionaria sulle ore di assenza dal lavoro da parte degliaddetti nelle 870 imprese manifatturiere di un dato settore della regione Lombardia.I)Proporre e discutere un appropriato piano di campionamento.II)Supponiamo che venga estratto in blocco un campione di 10 imprese e si consideranotutti gli addetti di ciascuna impresa giungendo ai dati esposti nella seguente tabella,relativi ad una settimana lavorativa.Imprese 1 2 3 4 5 6 7 8 9 10N. addetti 7 29 64 52 85 12 47 34 72 21Tot ore assenza 8 24 49 32 48 16 51 24 56 16A) Che tipo di campionamento è stato utilizzato?B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e ilcorrispondente scarto quadratico medioC) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stimadella media delle ore di assenza.D) Se non fossero stati considerati tutti gli addetti di ciascuna impresa ma solo 6 perognuna estratti casualmente, che tipo di campionamento sarebbe stato utilizzato?17Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 5 (II parte)A) Si è utilizzato un campionamento a grappoli, in quanto si ha una popolazione“addetti nelle imprese manifatturiere di un dato settore della RegioneLombardia” suddivisa in 870 grappoli “le aziende”. Si sono estratti in blocco 10grappoli e si sono esaminati completamente.Dunque:•è noto N=870 numero totale di grappoli•è noto n=10 numero grappoli costituenti il campione•sono note le M i=numero di unità elementari che formano il grappolo i•sono note le y i=ore di assenza per ciascun grappolo i•non è noto M 0=numero di unità elementari che formano la popolazione (totaleaddetti nelle imprese manifatturiere di un dato settore nella Regione Lombardia)18


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 5 (II parte)B) ˆ N 870YGR = ∑ y i ⋅= 324 = 28188n i∈c10( Yˆ2 1−f) = N sn22 0,9885= 870 ⋅ ⋅299,6= 4734,54810con f = 10 / 870 = 0,00115; y = 324 /10 = 32,4; s222(8 − 32,4) + ..... + (16 − 32,4)=9= 299,6v GR0ˆC) Nel campionamento a grappoli lo stimatore della media è il seguente: YPer il calcolo è necessario conoscere M 0 , il numero degli addetti di tutte le 870aziende. Tale dato non è a disposizione. In questo caso non è dunque possibilestimare la media, ma solo il totaleGR=YˆMGRD) campionamento a due stadi19Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 6 – Campionamento Stratificato (ALLOCAZIONE)Si vuole stimare il numero medio di libri venduti in un giorno in una grande città.I) Proporre un piano di campionamento idoneo per raggiungere il suddettoobiettivo.II) Sono riportati, rispettivamente, per ciascuna delle tre zone in cui la città èsuddivisa, il numero N hdi librerie presenti nella zona h-esima e il numero medio,con il relativo scarto quadratico medio di libri venduti in un giorno dalle libreriedella zona h-esimaN h Y h S hZona 1 40 120 4Zona 2 36 63 8Zona 3 24 60 3A) In base ai dati riportati in tabella, si dica, motivando la risposta, se sia piùopportuno effettuare un campionamento stratificato o a grappoli.B) Volendo effettuare un campionamento stratificato di numerosità n=30, si stabiliscacome ripartire tale numerosità nei tre diversi strati secondo la ripartizione proporzionalee quella ottimale. Si stabilisca il guadagno in efficienza sulla stima della media, se si optaper la ripartizione ottimale.20


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 6 (II PARTE)A)Y = 120 ⋅SSS2W2B21=100= V40100( 16 ⋅ 40 + 64 ⋅ 36 + 9 ⋅ 24 )2[ µ ] = M [ µ ] − M [ µ ]= 845,8336i+ 63 ⋅i36100SS2B2+ 60 ⋅241002{ }i= 0,962640= 85,08= 31,6= 814 ,2336E’ molto alta la variabilità tra gli strati→ CAMPIONAMENTO STRATIFICATO21Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 6B) n=30nNhnh= = nwh;n1= 12;Nn2ˆ 1 −⎜⎛⎟⎞ f ShV Y = ⋅ ∑ wh⎝ ⎠ n nf3160= 0.02 ⋅100= 0.6322= 11;= 0.4n = 73ALL. PROPORZIONALENh⋅ Shnh= ⋅ n n1= 9; n2= 17;∑ Nh⋅ Sh22ˆ ( ⋅ ) ⋅⎜⎛⎟⎞ =∑ whsh ∑ whs hV Y-⎝ ⎠ nN= 0,901 3 − 0,316 = 0,585 3n = 143ALL. OTTIMAINCREMENTO PERCENTUALE 7%22


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 7 – Campionamento Stratificato (STIMATORI)Una azienda produce bulloni utilizzando quattro diverse macchine. Dallaseguente produzione settimanale viene estratto un campione dei bulloniprodotti per valutarne la conformità ai modelli standard:Macchine 1 2 3 4N° di bulloni prodotti settimanalmente 1800 2500 5000 8000Determinare un opportuno piano di campionamento per estrarre uncampione con frazione di sondaggio del 5%. Motivare la scelta. Scrivere leformule dello stimatore del peso medio dei bulloni e della sua varianzasecondo il piano di campionamento prescelto.23Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 7Si sceglie un campionamento stratificato con allocazioneproporzionale.N=17300, n=865nNNhnh= =nwhn 1=90, n 2=125, n 3=250, n 4=400.ˆY ST=v ˆ Y ST4∑i =1W hy h( )= 1 42∑ NN 2 hi =11− f hn hs h224


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 8 – Campionamento Stratificato (STIMATORI)Allo scopo di stimare l'ammontare mensile delle multe per infrazione al codice dellastrada, l'amministrazione di una certa provincia italiana ha deciso di effettuare unaindagine campionaria scegliendo casualmente 40 dei suoi comuni.Nell'ipotesi che i comuni siano stati ripartiti in tre strati in funzione della lorodimensione demografica e disponendo delle seguenti informazioni:POPOLAZIONEstrati NumeroComunitotale pop.residente(migl.)XCAMPIONEammontare pop.neidelle multe comuni(mil. lit.) estratti(migl.)s x2s y2s xy7000 20 200 43 90 105 296 140,351. si effettui l'allocazione che si ritiene più opportuna;2. si stimi l'ammontare mensile delle multe per l'intera provincia mettendo a confronto le duestrategie suggerite dalle informazioni date;3. si dimostri e si commenti la maggiore efficienza del campionamento ST rispetto alcampionamento SSR e la maggiore efficienza del campionamento ST con allocazione25ottima rispetto al campionamento ST con allocazione proporzionale.Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 8a) Non disponendo delle varianze di strato di popolazione, si procede adun’allocazione proporzionale, ottenendo n 1=25, n 2=10, n 3=5;b) In caso di campionamento ST - stimatore per espansione, si ottieneY ˆ ST= 316,6(formula (4.11))c) In generale (dimostrazione pag. 110-113)Vv(ˆ ) = 35724.96ˆ)Y ST( Yˆ) ≥ V ( Yˆ)( Y ≥ VpropST minST(formula (4.18));•se le varianze di strato sono uguali il campionamento stratificato con allocazione ottima è deltutto simile al campionamento stratificato con allocazione proporzionale•se le medie di strato sono tutte uguali il campionamento stratificato con allocazioneproporzionale è del tutto simile al campionamento semplice26


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 8B) stimatore per quoziente combinato (perché pur disponendo degli X h, lenumerosità di strato non sono sufficienti a garantire la correttezza asintotica),si ottieneY ˆ qC= 316,6812,4630 = 245,517v( ˆ ) = 21672.68Y qC(formula (6.39))(formula (6.41))doveˆ = 0.38971R CLimitando il confronto alle varianze, lo stimatore per quoziente combinatorisulta più efficiente.27Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 8In alternativa allo stimatore per quoziente, si può utilizzare lo stimatore perregressione combinato, ottenendo i seguenti risultati:ˆ = 157.2933Y rC(formula (7.24))v( Yˆ rC) = 15456.51(formula (7.25)),doveβ C= 0.873392In questo caso, risulta evidente il guadagno in termini di efficienza.28


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 9 – Coefficiente di omogeneità nei grappoliSia data una popolazione di N=3 aziende formate ciascuna da 3 reparti; perciascuno di essi si rileva il consumo in Kilowatt:azienda 2 azienda 1 azienda 3 azienda 41,4 1,5 1,25 1,91,2 1,6 1,85 2,11,3 1,8 1,65 1,8a. Si calcoli il coefficiente di omogeneità nei grappoli, dopo avereverificato l’identità sulle devianze.b. Verificare l’espressione di S21in funzione del coefficiente diomogeneità r.c. Si estragga un campione GR di 2 grappoli e si verifichi l’efficienza delcampionamento a grappoli nei confronti del campionamento SSR.29Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 9a)S 2 = 0,082329545Y = 4,8375 Y = 1, 6125 S 2 1= 0,605625azienda 1 azienda 2 azienda 3 azienda 4Y i 4,9 3,9 4,75 5,8Y i 1, 6 3 1,3 1, 58 3 1, 9 32S i0, 02 3 0,01 0, 09 3 0, 02 3222(NM-1 )S = (NM-N)S W + (N-1)S B0,037490 ,905625 = 0,29 + 0,6056249 cvd;ρ = 1 −= 0,544513457.0,082329545⎡b) S 2 1= MS 21 + ρ N( M −1)⎤⎢⎥ = 0,605625⎣ N −1 ⎦c) Sul campione SSR formato dai valori afferenti ai grappoli 1 e 4 con N=12, n=6 es2 = 0,0456 , v( Y ˆ )= 0,548 ; sul campione GR, N=4, n=2 e s 12=0,405,v( Y ˆ GR )= 1,62 ; Deff=2,956.30


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 10 - Campionamento Due StadiPer introdurre una indennità informatica oraria nelle sedi regionali di unaamministrazione dello Stato si è interessati a valutare il totale delle ore trascorsegiornalmente dagli impiegati davanti ai videoterminali. Si suppone che il piano dicampionamento preveda una prima m i estrazione con probabilità costanti di 4 delle 20sedi regionali ed una successiva estrazione, sempre con probabilità costanti, pari al25% degli impiegati in ciascuna sede. Dopo aver riscontrato i seguenti risultaticampionari: sedi2y smi1 25 4 0,252 43 3 23 19 6 4,24 48 2 5,1ia) si definiscano per il piano di campionamento in esame le probabilità diinclusione di primo e del secondo ordine;b) si stimi il numero totale delle ore trascorse davanti ai videoterminali dagliimpiegati delle 20 sedi e si calcoli la varianza dello stimatore utilizzato;c) si valutino le condizioni per cui è sufficiente stimare la varianza in formaapprossimata.31iSoluzioni Esercizio 10a)b)c)f1=nNMaster in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia Salini=420= 0,2 ; f2imi=Mn miπ ( ij ) = = f1f2iN Mi⎧ n mimi−1⎪N MiMi−1π ( ij )( i ' k ) = ⎨⎪ n n −1mimi'⎪⎩N N −1MiMi 'i= 0,25 (costanti)per i'= iper i'≠ iI ordineII ordineˆ N 20Y = ∑ ˆ = ⋅400+ 516 + 456 + 384 87804=DSy i ⋅n( )i∈c2ˆ = 2 1−f11 ⎛ ˆ 1 ˆ ⎞ N 2 1−2 2⎜ − ⎟ + ∑fiv YDSN ∑ Yi∑YiMis2in n −1i∈c⎝ n i∈c⎠ n i∈cmi2 0,8 20= 20 ⋅ ⋅10764+⋅( 75 + 1032+957,2 + 2937,6) = 287.040 + 25010 = 312.05112 4Come si può notare il contributo del secondo termine è alquanto modesto; in genere,quando il coefficiente di espansione N/n1 una stima approssimata per difetto dellavarianza dello stimatore viene fornita dalla varianza di primo stadio, ciè considerando 32solo il primo addendo.


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 11 - Campionamento SistematicoPer stimare il numero di errori di digitazione compiuti da un operatore incaricato diinserire le risposte fornite in 80 questionari, viene estratto un campione sistematicodi 8 questionari.I. Definire il passo di campionamento ed i possibili campioni estraibili.II. Supposto che i questionari estratti confrontati con la matrice datiabbiano fornito il numero di errori di digitazione pari a 1, 3, 2, 4, 0, 0, 12, si stimi il totale degli errori di digitazione e la varianza dellostimatore.III. Si spieghino le modifiche da apportare allo stimatore ed alla relativavarianza nel caso si scelgano m campioni di ampiezza n/m invece di unsingolo campione di numerosità n.33Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 11a)k = N n = 10r 1 2 3 4 5 6 7 81 1 11 21 31 41 51 61 712 2 12 22 32 42 52 62 723 3 13 23 33 43 53 63 734 4 14 24 34 44 54 64 745 5 15 25 35 45 55 65 756 6 16 26 36 46 56 66 767 7 17 27 37 47 57 67 778 8 18 28 38 48 58 68 789 9 19 29 39 49 59 69 7910 10 20 30 40 50 60 70 8034


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 11b) YˆN=∑SMy in i∈c= 130( ˆ 2 1−f) N s2 = 1427, 04v YSM=rdove s 12=1,982n(SSR)c) Libro pagine 132-133.Vengono estratti m numeri casuali r 1 ,….r m nell’intervallo [1,mk], ciascuno dei qualifornisce un campione formato dalle unità [r i +(j-1)mk]. In questo modo la popolazionerisulta divisa in mk grappoli di uguale dimensione e si sceglie un campione di m grappoli;pertanto sia le probabilità di inclusione che la varianza dello stimatore si ricavano dalleformule del campionamento a grappoli35Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 12 – Stima proporzione campionamento semplicePer valutare il gradimento di una nuova marca di guanti da lavoro,un’azienda estrae un campione SSR tra i suoi 1500 operai. Definirel’intervallo di confidenza per P al livello di confidenza del 95%, nell’ipotesiche venga considerata una frazione di sondaggio del 5% e che tra glioperai intervistati 25 abbiano gradito la nuova marca di guanti.Soluzioni Esercizio 12N=75, p=0,33 (formula (5.6)),( ) = 0,053v pq=0,67, 1 2n= 0,007.0,222 ≤ P ≤ 0, 445(formula (5.10)),(formula (5.12)).36


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 13 – Stima proporzione campionamento stratificatoUn comprensorio è formato da 5 comuni con la seguente popolazione:comuni 1 2 3 4 5popolazione 3570 2840 2155 1144 983Si estragga un campione casuale stratificato con una frazione di sondaggiodel 10% per valutare il consumo di una certa marca di acqua minerale.I risultati campionari sono:p 1=0,35, p 2=0,20, p 3=0,18, p 4=0,25, p 5=0,22.Si stimi il consumo di acqua minerale dell’intero comprensorio e l’errorestandard dello stimatore37Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 13n 1=357, n 2=284, n 3=216, n 4=114, n 5=98,N=10692, n=1069.p ST= 0,25324formula (5.14)v( p ST) = 0,00015559 = 0,0125formula (5.16)38


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 14 – Stima proporzione campionamento stratificatoPer conoscere le opinioni degli studenti sulle proposte del Ministero della PubblicaIstruzione relative ai cambiamenti da apportare all'esame di maturità, un preside diun liceo scientifico effettua un sondaggio tra i suoi studenti tenendo conto dellediverse classi di frequenza. La popolazione studentesca risulta cosi suddivisa:classi 1 a 2 a 3 a 4 a 5 an. studenti 150 140 139 123 100Si estragga un campione ST con una frazione di sondaggio del 10%. Si effettuil'allocazione proporzionale e si stimi la proporzione dei favorevoli alla propostaministeriale avendo riscontrato le seguenti proporzioni campionarie di strato:p 1=0,15 p 2=0,08 p 3=0,05 p 4=0,02 p 5=0,03.Si stimi inoltre la varianza dello stimatore e si definiscano le condizioni in base allequali l'allocazione ottima è più efficiente della proporzionale.39Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 14In base all'allocazione proporzionale le numerosità dei campioni di stratosono n 1=15, n 2=14; n 3=14; n 4=12; n 5=l0.La stima della proporzione è ,(formula (5.14)); la stima dellavarianza è , v(p ST) = 0,0009 (formula 5.16)). L’allocazione ottima èpreferibile all’allocazione proporzionale quando le proporzioni di strato sonoesterne all’intervallo [0,1;0,9].p ST= 0,0740


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 15 – Stima della proporzione campionamento a grappoliUna impresa con 10 unità locali (U.L.) distribuite nella regione vuole introdurrel'orario flessibile. Allo scopo effettua un sondaggio scegliendo casualmente n=3 U.L.tenendo conto del numero di addetti per U.L..U.L. 1 2 3 4 5 6 7 8 9 10addetti 8 12 23 15 50 75 115 43 19 25Supponendo che, per le tre U.L. scelte, la proporzione di favorevoli all'orarioflessibile sia rispettivamente pari a p 1=0,42, p 2=0,61, p 3=0,251. si estragga il campione di n=3 U.L., impiegando il "cumulative total method"ed indicando come sono state scelte le U.L. dalle tavole dei numeri casuali;2. si stimi la proporzione di addetti che sono favorevoli all'orario flessibile3. si stimi la varianza dello stimatore e si definiscano le proprietà dello stimatoreimpiegato.41Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 151. Per utilizzare il "cumulative total method" si considerano i seguenti valoricumulati: 8-20-43-58-108-183-298-341-360-385. Dalle tavole dei numericasuali si considerano solo i valori compresi nell'intervallo [1;385].Prendendo le prime tre colonne della tavola si estraggono i numeri 126-367-213 cui corrispondono rispettivamente le U.L. 6-10-7.2. Poiché i grappoli hanno dimensioni differenti si considera lo stimatorepGR∑i∈c=∑i∈caM(formula (5.22)), essendo a 1=32, a 2=15, a 3=28.= 0 .303. v() = 0.005 ,(formula (5.24)). Lo stimatore impiegato èp GRasintoticamente corretto.ii42


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 16 – Stima della proporzione campionamento a grappoliSi consideri una ipotetica città ripartita in 10 quartieri ciascuno contenente un certonumero di fabbricati:quartieri 1 2 3 4 5 6 7 8 9 10fabbricati 50 12 20 31 10 100 15 13 240 17Si estragga un campione di 2 quartieri con la tecnica dei totali cumulati; i quartieriestratti risultino il 6 ed il 5.Si supponga di aver intervistato le famiglie residenti nei due quartieri estratti, con loscopo di effettuare un sondaggio sulla propensione all'acquisto dei quotidiani.Nell'ipotesi che mediamente in ogni fabbricato vi siano 4 famiglie e che il numero difamiglie che risponde positivamente è 1/5 per il primo quartiere e 1/3 per ilsecondo:1. si stimi la propensione all'acquisto di quotidiani per l'intera città motivandola scelta dello stimatore;2. si stimi la varianza dello stimatore impiegato.43Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 16Se sono stati estratti i quartieri 6 e 5 (quartieri/grappoli con numerositàmolto diversa), lo stimatore da considerare èp GR= 0,21(formula (5.22)), ottenuto stimando M 1=400 e M 2=40v() =p GR0.0004(formula (5 24)).44


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 17 – Stimatore per quoziente e regressione SSRUn proprietario agricolo vuole prevedere, con la maggiore accuratezzapossibile, la produzione dell'anno corrente di un terreno di 1000 ettari.Per i primi 10 appezzamenti sperimentali di un ettaro ciascuno ha giàottenuto la produzione nell'anno in corso, misurata in numero di piantee ha conservato, inoltre, i dati relativi alla produzione di taliappezzamenti nell'anno passato. I dati sulla produzione dei 10appezzamenti sono riportati nella seguente tabellaappez. 1 2 3 4 5 6 7 8 9 10anno in 25 15 22 24 13 18 35 30 10 29corsoannopreced.23 14 20 25 12 18 30 27 8 3145Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 17Sapendo che la produzione totale dell'anno passato è stata di 21000piante e sapendo che nella teoria del campionamento da popolazionifinite sono disponibili due stimatori alternativi che sfruttano leinformazioni su una variabile ausiliaria,1. si stimi il valore della produzione totale dell'anno in corsoutilizzando i due stimatori;2. si stimi la varianza dei due stimatori;3. sulla base dei risultati ottenuti si dica quale dei due stimatori èpreferibile e si discutano le condizioni in base alle quali talestimatore è preferibile all'altro.46


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 17X ˆ = 20800 Yˆ = 22100R ˆ = 1,0625Y ˆ q= 22312,5v( Y ˆ q )= 418343,750 (formula (6.28))Y ˆ r= 22300,587v( Y ˆ r )= 397048,387N=1000, n=10, , ,(formula (4.7)); X=210001. , S 2 X =60,622, S2 Y =64,989, S XY=60,8, (formula (6.1)),2. (formula (7.14)), (formula (7.15))con β=1,003.3. Lo stimatore per quoziente va utilizzato quando esiste una dipendenza lineareuscente dall’origine; se la dipendenza è lineare ma non uscente dall’origine siusa lo stimatore per regressione. Bisogna quindi disegnare la nuvola di punti evalutare la dipendenza.47Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 18 – Stimatore per quoziente nel campionamento SSRUna azienda commerciale possiede 15 punti vendita (P.V.) la cuisuperficie di vendita in mq. è M(X)=65, con variabilità pari aVar(X)=680. Per stimare il fatturato totale vengono estratticasualmente senza rimessa 4 P.V. con le caratteristiche riportate intabella.I) Stimare con due differenti strategie il fatturato totale dell'azienda.II) Confrontare le strategie impiegate e commentare il risultato.P.V. Sup. (mq) Fatturato (mld. Lit.)A 80 1,2B 70 0,92C 50 0,5D 110 1,848


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 18I) 1 a strategia (campione semplice-stimatore per espansione):Y ˆ = Ny = 16,575v( Yˆ)= 12.26913ˆ ∑ yi iR = = 0,0143; Yˆ= RˆX =q13.90161∑ xi iv( ˆ ) = 1.493104(formula(6.28))Y q(formula 4.7));(formula(4.9));2 a strategia (campione semplice-stimatore per quoziente):formula (4.21));49Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzione Esercizio 18II) Per confrontare le strategie occorre confrontare l'MSE dei due stimatori. Ilprimo stimatore è corretto pertanto MSE=VAR; il secondo stimatore èasintoticamente corretto e, poiché il campione è di piccole dimensioni, si haMSE=VAR+B 2 . In base alla formula (6.15) si definisce la distorsione con laquantità ,2 2680B ≤ C XˆV Yˆ≈ 1.493 = 0, (formula (6.23)).( ) ( ) 24q652( Yˆ ) = 12.26913Si osserva quindi: MSE e MSE( Y ˆ ) = 1.493+0,24 =q1,733.Si può pertanto ritenere che lo stimatore per quoziente sia più efficiente dellostimatore per espansione anche se nel caso in esame di n=4, è uno stimatoredistorto.50


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 19 – Stimatore per quoziente nel camp. a grappoliAd una USL afferiscono 15 poliambulatori con un totale di 227 dipendenti trapersonale medico e paramedico. Per conoscere il numero totale di prestazionimutualistiche effettuate in una settimana tipo si estrae un campione SSR di 3poliambulatori rilevando i seguenti dati:poliamb. n. dipendenti n. prestaz. mut.1 17 452 15 303 22 731. Stimare il numero totale di prestazioni mutualistiche nella settimana diriferimento per tutti i poliambulatori con la strategia che si ritiene piùefficiente, stimare inoltre l'errore standard;2. motivare la scelta dello stimatore impiegato in a) ed elencare le possibilistrategie alternative.51Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 19N=15, n=3, M 0=227, s 2 y =476,3331) Y ˆGR= 740v(formula (4.29)),( Y ˆ GR )= 28580(formula (4.31))Y ˆ qGR= 622,148 (formula (6.49)), v( Y ˆ qGR )= 8621,317 (formula (6.51))Lo stimatore per quoziente risulta più efficiente confrontando le varianze,ma è fortemente distorto a causa delle ridotte dimensioni del campione.( qGR ) = 95,851 Y ˆHTGR2) v Y ˆ In alternativa, si potrebbe utilizzare lo stimatoreIn questo caso è però necessario conoscere la tecnica di estrazione delcampione per definire le π i.52


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 20 – Stimatore per quoziente nel campionamento a due stadiSi vuole stimare il numero di pazienti ricoverati per incidenti automobilistici, nel corsodi un anno, negli ospedali non specializzati di un’area composta da 10 comuni. I datirelativi alla popolazione sono riportati nella seguente tabella:comuni 1 2 3 4 5 6 7 8 9 10n.°osp. 2 3 1 1 4 2 4 2 3 1n.°posti 677 198 300 32 410 275 570 311 408 65lettoSi decide di effettuare un campionamento a due stadi, con i comuni come unitàprimarie e gli ospedali come unità secondarie. Al primo stadio vengono scelti, conprobabilità costante, tre comuni, al secondo viene scelto, sempre con probabilitàcostante, un ospedale per comune. I risultati ottenuti dall’indagine campionariasono i seguenti:Comuni Casi di ricoveroPer incidentin.° postiletto1 14 3107 10 2238 6 15053Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 20– Stimatore per quoziente nel campionamento a due stadi1. Proporre uno stimatore, che non tenga conto di variabili ausiliarie,e stimare il numero di ricoveri per incidenti automobilistici, nelcorso di un anno.2. Proporre uno stimatore, che tenga conto di variabili ausiliarie, estimare il numero di ricoveri per incidenti automobilistici3. Commentare la differenza dei risultati ottenuti nei punti a) e b).4. Elencare tutti i possibili contesti in cui vengono impiegate levariabili ausiliarie, evidenziandone i vantaggi.54


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 20ˆ = 266.6667Y DS1. (formula (4.56))ˆ =143.3113Y qDS2. Stimatore per quoziente (formula (6.55))3. Nel secondo caso si sfrutta l’informazione aggiuntiva portata dalla variabileausiliaria che, se correlata positivamente con la variabile oggetto di studio,tende ad avvicinare lo stimatore per espansione al valore vero Y.4. Definizione delle probabilità di estrazione, nel caso si estragga a probabilitàvariabili. definizione degli strati; definizione dello stimatore per quoziente eper regressione.55Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 21 Numerosità campionariaL’ufficio marketing di una casa produttrice di cosmetici vuole valutare laspesa media annua per prodotti di bellezza delle donne giovani (15-25anni) residenti in una certa città. Determinare la numerosità campionariasapendo che l’errore di campionamento non deve essere superiore alle5000 lire, al livello di probabilità del 95%.Si tenga conto, inoltre, che le residenti in quella fascia di età sono 1855e che la variabilità prestimata risulta pari a S=29000.Soluzioni Esercizio 21⎡ Vn0= ⎢⎣ N S02 211 −⎤+N ⎥⎦formula (8.4)(Se si considera la varianza dello stimatoredella media N 2 non va considerato)D=5000, V 0=6507705.123, N=1855n=12156


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio 22 Numerosità campionariaPer conoscere la percentuale delle matricole favorevoli alle proposte delMinistro della Pubblica Istruzione relative alla Riforma Universitaria ilRettore di una Università effettua un sondaggio tra le 1680 matricole. Atale scopo viene estratto un campione SSR.1. si determini la dimensione campionaria la livello di significatività 1-α=0,95 con un errore non superiore allo 5% nell’ipotesi che non siabbia alcuna informazione sulla varianza della popolazione.2. A parità di livello di significatività e di varianza si determini l’errorecampionario relativo al caso di un campione SCR di numerositàn=30057Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniSoluzioni Esercizio 2211 −1. ⎡ V0⎤nformula (8.6) con0= ⎢ + ⎥⎣ PQ N ⎦2 2r PV = k = zk0 2α 2r=0.05; P=0.5; Q=0.5; k=1.96; N=1680 V 0=0.000163; n 0=80222. PQ k PQ formula (8.7)n ' 0= =2V D0r =kP22PQ⋅n'0=21,96 ⋅0,5⋅0,5= 0.11320,5 ⋅300n=300; V 0=0.000833; r=0.11 (11%)58


Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio finaleIl comune di Bologna vuole indagare circa gli accessi ai siti web dipubblica utilità (enti pubblici, ministero, università, …) effettuati dagliinternet point dislocati nella città.Internet point Zona N° computer1 NE 342 NE 223 NO 124 SO 345 SO 126 SE 307 NE 208 NE 349 NO 2010 NO 1211 NE 1212 SO 3013 SE 1514 SE 1815 SO 2816 SE 2417 NE 2618 NO 3819 NE 401. Si illustrino i possibili piani dicampionamento e per ognuno diquesti lo stimatore idoneo2. Si commentino le strategieproposte e si esprima un giudiziomotivato su quale possa essereconsiderata la ‘migliore’59Master in Statistica per le Ricerche di Mercato e Sondaggi di OpinioniESERCITAZIONI TEORIA DEI CAMPIONIDott.ssa Silvia SaliniEsercizio finaleDomanda teorica1. ….le variabili ausiliarie nel campionamento da popolazioni finite2. ……numerosità campionaria3. … errori di campionari e non campionari4. ….campionamento stratificato / campionamento per quote5. ….stimatore combinato e separato6. ….campionamenti probabilistici e non probabilistici7. …campionamento a grappoli e campionamento stratificato8. ….stimatori per quoziente e regressione…perché e come vengonocostruiti…………………………………….60

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!