13.07.2015 Views

Modelo de diseño unifactorial completamente aleatorizado

Modelo de diseño unifactorial completamente aleatorizado

Modelo de diseño unifactorial completamente aleatorizado

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Nivel Observaciones Totales Promedios1 y 11 y 12 ··· y 1n y 1· ȳ 1·2 y 21 y 22 ··· y 2n y 2· ȳ 2·. ········· ··· ···a y a1 y a2 ··· y an y a· ȳ a·y··ȳ··La i<strong>de</strong>a es <strong>de</strong>scubrir cómo se reparte la variabilidad total <strong>de</strong> la muestra. Una posiblemedida <strong>de</strong> variabilidad total es la suma <strong>de</strong> cuadrados, <strong>de</strong>nominada total, o suma total <strong>de</strong>cuadrados corregida:don<strong>de</strong>SCT =aXi=1ȳ·· = 1n · anX(y ij − ȳ··) 2Se pue<strong>de</strong> <strong>de</strong>somponer en dos partes esta suma total <strong>de</strong> cuadrados:= nSCT =aXi=1nX(y ij − ȳ··) 2 =j=1aX(ȳ i· − ȳ··) 2 +i=1= SCTra + SCE.aXi=1j=1aXi=1aXi=1nXj=1y ijnX((ȳ i· − ȳ··)+(y ij − ȳ i·)) 2 =j=1nX(y ij − ȳ i·) 2 =j=1ya queaX nX2 (ȳ i· − ȳ··)(y ij − ȳ i·) == 2i=1j=1aX(ȳ i· − ȳ··)i=1j=1nX(y ij − ȳ i·)peronX(y ij − ȳ i·) =nȳ i· − nȳ i· =0j=1y así los dobles productos se hacen 0.Las diferencias entre los promedios observados <strong>de</strong> los tratamientos y el promedio general,da una medida <strong>de</strong> las diferencias entre los tratamientos.5


Las diferencias <strong>de</strong> las observaciones <strong>de</strong>ntro <strong>de</strong> los tratamientos con respecto al promedio<strong>de</strong>l tratamiento, se consi<strong>de</strong>ra error aleatorio.Grados <strong>de</strong> libertad.Se tiene un total <strong>de</strong> a · n observaciones y <strong>de</strong> a tratamientos.SCT tiene (an − 1) grados <strong>de</strong> libertad.SCTra tiene (a − 1) grados <strong>de</strong> libertad.SCE tiene a(n−1) grados <strong>de</strong> libertad, porque hay n réplicas <strong>de</strong>ntro <strong>de</strong> cada tratamiento,es<strong>de</strong>cir,setienen(n− 1) grados <strong>de</strong> libertad para estimar el error experimental. Altener a tratamientos, se tiene un total <strong>de</strong> a(n − 1) grados <strong>de</strong> libertad.Observaciones.Se tiene que"aX nXaX nX#SCE = (y ij − ȳ i·) 2 = (y ij − ȳ i·) 2 .i=1 j=1i=1 j=1Si el término entre paréntesis se divi<strong>de</strong> entre n − 1, se obtiene la cuasivarianza <strong>de</strong>ltratamiento i :s 2 i = 1n − 1nX(y ij − ȳ i·) 2 .j=1Se pue<strong>de</strong> estimar la varianza poblacional combinando dichas varianzas por grupos:"aX nX#(y ij − ȳ i·) 2(n − 1)s 2 1 +(n − 1)s 2 2 + ···+(n − 1)s 2 a i=1 j=1==(n − 1) + (n − 1) + ···+(n − 1)aX(n − 1)don<strong>de</strong> N = a · n.= SCEN − aSi no hay diferencias entre los a tratamientos, se pue<strong>de</strong> estimar la varianza poblacionali=1σ 2 comoSCTraa − 1= naX(ȳ i· − ȳ··) 2i=16a − 1


cuando las medias <strong>de</strong> los tratamientos son iguales, ya que el términoaX(ȳ i· − ȳ··) 2i=1a − 1sería un estimador <strong>de</strong> la varianza <strong>de</strong> la media muestral: σ 2 /n.Se dispone, así <strong>de</strong> dos posibles estimadores <strong>de</strong> σ 2 :MCTra = SCTraa − 1MCE = SCEN − aCuando no existen diferencias entre las medias <strong>de</strong> los tratamientos, las estimaciones<strong>de</strong>ben ser similares.Si consi<strong>de</strong>ramos las medias <strong>de</strong> cuadrados anteriores, entonces, se pue<strong>de</strong> <strong>de</strong>mostrar,sustituyendo, queE(MCE) = σ 2E(MCTra) = σ 2 + n P ai=1 τ 2 i.a − 1De este modo, si para algún τ i 6=0, entonces E(MCTra) >σ 2 .La i<strong>de</strong>a básica es diseñar un contraste que tenga en cuenta estas diferencias entre losdos estimadores <strong>de</strong> σ 2 .Como los errores ε ij se distribuyen in<strong>de</strong>pendientemente entre sí, según una N(0,σ),entonces, por el lema <strong>de</strong> Fishersiempre que τ i =0, ∀i.SCEσ 2 ∼ χ 2 N−aSCTraσ 2 ∼ χ 2 a−1NOTA: Teorema <strong>de</strong> Cochran:7


Sea z i ∼ N(0, 1) in<strong>de</strong>pendientes entre sí, para i =1, 2,...v y seavXzi 2 = Q 1 + Q 2 + ···+ Q si=1don<strong>de</strong> s ≤ v ycadaQ i tiene v i grados <strong>de</strong> libertad (i =1, 2,...s), entoncesQ 1 ,Q 2 ,...,Q s son v.a. in<strong>de</strong>pendientes distribuidas como una chi cuadrado conv 1 ,v 2 ,...,v s grados <strong>de</strong> libertad respectivamente, si y sólo siv = v 1 + v 2 + ...+ v sSi se aplica el teorema <strong>de</strong> Cochran, se tiene que SSEσ 2lo que si τ i =0, ∀i, entoncesy SSTraσ 2son in<strong>de</strong>pendientes, porF 0 =SCTraa−1SCEN−a= MCTraMCEse distribuye como una F <strong>de</strong> Sne<strong>de</strong>cor, F a−1,N−a .Si algún τ i6=0, entonces E(MSTra) >σ 2 entonces el valor <strong>de</strong>l estadístico F 0 esmayor, obteniéndose una región crítica superior, <strong>de</strong> modo que se rechaza, a nivel α, lahipótesis nula <strong>de</strong> igualdad <strong>de</strong> tratamientos, siF 0 >F α,a−1,N−aResumen: Tabla ANOVA.H 0 ≡ τ 1 = τ 2 = ···τ aH 1 ≡ τ i 6=0, ∃iF. Variación S. Cuadrados gl M. Cuadrados F 0PFactor SCTra = n a (ȳ i· − ȳ··) 2 a − 1 MCTra = SCTra Fa−1 o = MCTraMCEi=1PError SCE = a nP(y ij − ȳ i·) 2 N − a MCE = SCETotalSCT = a Pi=1 j=1i=1 j=1nP(y ij − ȳ··) 2 N − 1n−aSe rechaza H 0 anivelα cuando F 0 >F α,a−1,N−a .8


Estimación <strong>de</strong> los parámetros.Dado el mo<strong>de</strong>loy ij = µ + τ i + ε ijdon<strong>de</strong> i =1,...,a; j =1,...,n, se pue<strong>de</strong>n estimar los parámetros µ y τ i por el método<strong>de</strong> los mínimos cuadrados, <strong>de</strong> modo que no se necesita suponer normalidad <strong>de</strong> los erroresε ij .la suma <strong>de</strong> los cuadrados <strong>de</strong> los errores esL =aX nXε 2 ij =i=1 j=1aX nX(y ij − µ − τ i ) 2 ,i=1 j=1<strong>de</strong> modo que los estimadores <strong>de</strong> µ y τ i son los valores ˆµ y ˆτ i que minimizan el funcionalL.Derivando respecto cada uno <strong>de</strong> los parámetros, se obtiene un total <strong>de</strong> (a +1)ecuaciones:se obtiene∂LaX∂µ = 0 =⇒−2∂L∂τ i= 0 =⇒−2i=1nX(y ij − ˆµ − ˆτ i )=0j=1nX(y ij − ˆµ − ˆτ i )=0, i =1, 2,...,aj=1N ˆµ + nˆτ 1 + nˆτ 2 + ···+ nˆτ a = ⎧y··nˆµ +nˆτ 1 = y 1·⎪⎨ nˆµ +nˆτ 2 = y 2·⎪⎩. ··· ··· ··· ··· .nˆµ +nˆτ a = y a·Estasse<strong>de</strong>nominanecuaciones normales <strong>de</strong> mínimos cuadrados. Si se suman las últimasa ecuaciones, se obtiene la primera ecuación, <strong>de</strong> modo que no forman un sistemain<strong>de</strong>pendiente <strong>de</strong> ecuaciones y no existe solución única. Para evitar esto, se consi<strong>de</strong>ra larestricciónaXˆτ i =0,i=19


obteniéndose, entonces, los estimadoresˆµ = ȳ··ˆτ i = ȳ i· − ȳ··para i =1, 2,...,a.Si se asume que los errores están distribuidos según una normal, entonces cada ȳ i· ∼N (µ i ,σ 2 /n) . De este modo, cuando σ 2 es <strong>de</strong>sconocida un intervalo <strong>de</strong> confianza al 100(1−α)% es "De la misma manera, "Diseño <strong>de</strong>sequilibrado.ȳ i· ± t α 2 ,N−a rMCEn(ȳ i· − ȳ··) ± t α 2 ,N−a r2MCEnSi el número <strong>de</strong> observaciones es diferente según cada tratamiento i: n i don<strong>de</strong> i =1, 2,...,a, las expresiones previas son iguales salvo que se sustituye n por n i :SCT =SCTra =aX Xn i(y ij − ȳ··) 2 =i=1j=1aX Xn i(ȳ i· − ȳ··) 2 =i=1j=1SCE = SCT − SCTra#.i=1#.aX Xn iyij 2 − y2··NaXi=1j=1yi·2 − y2··n i NPararesolverlasecuacionesnormalesseconsi<strong>de</strong>ralarestricciónaXn iˆτ i =0i=1y se resuleve <strong>de</strong>l mismo modo.Si el diseño es no balanceado o <strong>de</strong>sequilibrado, aumenta la sensibilidad <strong>de</strong>l análisis<strong>unifactorial</strong> a la falta <strong>de</strong> igualdad entre las varianzas <strong>de</strong> cada grupo (heterocedasticidad).10


Ejemplo 1Un ingeniero <strong>de</strong> <strong>de</strong>sarrollo <strong>de</strong> productos está interesado en maximizar laresistencia a la tensión <strong>de</strong> una nueva fibrasintéticaqueseemplearáenlamanufactura<strong>de</strong> tela para camisas <strong>de</strong> hombre. El ingeniero sabe por experiencia que la resistenciaestá influida por el porcentaje <strong>de</strong> algodón presente en la fibra. A<strong>de</strong>más, sospecha que elcontenido <strong>de</strong> algodón <strong>de</strong>be estar aproximadamente entre un 10 y 40 % para que la telaresultante tenga otras características <strong>de</strong> calidad que se <strong>de</strong>sean (como la capacidad <strong>de</strong>recibir un tratamiento <strong>de</strong> planchado permanente). El ingeniero <strong>de</strong>ci<strong>de</strong> probar muestras acinco niveles <strong>de</strong> porcentaje <strong>de</strong> algodón: 15, 20, 25, 30 y 35 %. Asimismo, <strong>de</strong>ci<strong>de</strong> ensayarcinco muestras a cada nivel <strong>de</strong> contenido <strong>de</strong> algodón. Las 25 observaciones <strong>de</strong>ben asignarseal azar. Para ilustrar la forma en que pue<strong>de</strong> aleatorizarse el or<strong>de</strong>n <strong>de</strong> ejecución, supóngaseque las observaciones se numeran como sigue:%algodón15 1 2 3 4 520 6 7 8 9 1025 11 12 13 14 1530 16 17 18 19 2035 21 22 23 24 25Ahora se elige al azar un número entre 1 y 25. Supongamos que es el 8, entonces laobservación 8 a se ejecuta primero (es <strong>de</strong>cir, a un 20 % <strong>de</strong> algodón). A continuación seelige un número al azar entre 1 y 25, quitando el 8. Supongamos que es el 4, entonces laobservación 4 a se ejecuta en segundo lugar (a un 15 % <strong>de</strong> algodón). Se repite el procesohasta completar las 25 observaciones.Esta secuencia <strong>de</strong> prueba aleatorizada es necesaria para evitar que los resultados secontaminen por los efectos <strong>de</strong> variables <strong>de</strong>sconocidas que pue<strong>de</strong>n salir <strong>de</strong> control duranteel experimento. Para ilustrar esto, supóngase que se ejecutan las 25 muestras <strong>de</strong> pruebaen el or<strong>de</strong>n no <strong>aleatorizado</strong> original (esto es, las 5 muestras con un 15 % <strong>de</strong> algodón seprueban primero, luego las 5 muestras con un 20 % <strong>de</strong> algodón, y así sucesivamente). Si lamáquina que prueba la resistencia a la tensión presenta un efecto <strong>de</strong> calentamiento tal que11


a mayor tiempo <strong>de</strong> funcionamiento menores lecturas <strong>de</strong> resistencia a la tensión, entoncesdicho efecto contaminará los datos <strong>de</strong> resistencia e invalidará el experimento.Supóngase ahora que el ingeniero ejecuta la prueba en el or<strong>de</strong>n aleatorio que hemos<strong>de</strong>terminado. Las observaciones obtenidas acerca <strong>de</strong> la resistencia a la tensión son:%<strong>de</strong>algodón Observaciones Suma Media15 7 7 15 11 9 49 9.820 12 17 12 18 18 77 15.425 14 18 18 19 19 88 17.630 19 25 22 19 23 108 21.635 7 10 11 15 11 54 10.8376 15.04Representamos el diagrama <strong>de</strong> dispersión para la resistencia frente al porcentaje <strong>de</strong>algodón, y.el diagrama <strong>de</strong> cajas para la resistencia a la tensión a cada nivel <strong>de</strong> porcentaje<strong>de</strong> algodón.diagrama <strong>de</strong> dispersión252219161310252219161310observacionesmedias715 20 25 30 35porcentaje <strong>de</strong> algodón712


Diagrama <strong>de</strong> cajas25observaciones2219161310715 20 25 30 35porcentaje <strong>de</strong> algodónAmbas gráficas indican que la resistencia a la tensión aumenta con el contenido <strong>de</strong>algodón hasta el 30 %. Mas allá <strong>de</strong>l 30 % ocurre un notable <strong>de</strong>crecimiento en la resistencia.No hay una fuerte evi<strong>de</strong>ncia que sugiera que la variabilidad en la resistencia alre<strong>de</strong>dor<strong>de</strong> la media <strong>de</strong>penda <strong>de</strong>l porcentaje <strong>de</strong> algodón. Se sospecha, no obstante, que el porcentaje<strong>de</strong> algodón influye en la resistencia a la tensión.Se disponen los datos en una tabla como esta:Observaciones Sumas Mediasy 11 , ··· ,y 1n1 y 1· ȳ 1·.. .y I1 , ··· ,y InI y I· ȳ I·y··ȳ··A) Hipótesis <strong>de</strong>l mo<strong>de</strong>loLas principales hipótesis <strong>de</strong>l mo<strong>de</strong>lo son:—Normalidad:ε ij sigue una distribución normal.— Linealidad: E(ε ij )=0— Homocedasticidad: Var(ε ij )=σ 2 13


— In<strong>de</strong>pen<strong>de</strong>ncia: ε ij son in<strong>de</strong>pendientes entre sí.Estas hipótesis son equivalentes a las siguientes:—Normalidad:y ij sigue una distribución normal.— E(y ij )=µ i— Homocedasticidad: Var(y ij )=σ 2— In<strong>de</strong>pen<strong>de</strong>ncia: y ij son in<strong>de</strong>pendientes entre sí.B) MetodologíaEn nuestro análisis vamos a seguir los siguientes pasos:— Estimar los parámetros <strong>de</strong>l mo<strong>de</strong>lo.—Contrastarsielfactorinfluye en la respuesta, es <strong>de</strong>cir, si los valores medios <strong>de</strong> Yson diferentes al cambiar el nivel <strong>de</strong>l factor.— Sielfactorinfluye en la variable respuesta, es <strong>de</strong>cir, las medias no son iguales, buscarlas diferencias entre poblaciones (o niveles <strong>de</strong>l factor).— Diagnosis <strong>de</strong>l mo<strong>de</strong>lo: comprobar si las hipótesis <strong>de</strong>l mo<strong>de</strong>lo son ciertas mediante elanálisis <strong>de</strong> los residuos.C) Estimación <strong>de</strong> los parámetrosEn este ejemplo, a =5,n i =5y N =25. Las estimaciones puntuales <strong>de</strong> los parámetrosson las siguientes:14


ˆµ 1 = ȳ 1· =9,8ˆµ 2 = ȳ 2· =15,4ˆµ 3 = ȳ 3· =17,6ˆµ 4 = ȳ 4· =21,6ˆµ 5 = ȳ 5· =10,8Porejemplo,elintervalo<strong>de</strong>confianza para µ 1 , al nivel (1 − α) =0,95, es:" r #MCEȳ i· ± t α 2 ,N−a =n"r #8,06= 9,8 ± t 0,025,20 =5[7,1515, 12,4485]D) Análisis <strong>de</strong> la varianzaEl contraste <strong>de</strong> hipótesis que vamos a abordar es el siguiente:⎧⎨ H 0 : µ 1 = ···= µ a (el factor no influye)H 1 : algún factor es diferente (el factor influye)⎩nivel <strong>de</strong> significación αFV SC GL FTratamiento SCTra = P ai=1 n i(ȳ i· − ȳ··) 2 a − 1 F 0 = SCTra/(a−1)SCE/(N−a)Error SCE = P a P nii=1 j=1 (y ij − ȳ i·) 2 N − aTotal SCT = P a P nii=1 j=1 (y ij − ȳ··) 2 N − 1siendo FV = Fuente <strong>de</strong> variación, SC = Suma <strong>de</strong> Cuadrados, GL = Grados <strong>de</strong> libertad.Las sumas <strong>de</strong> cuadrados también se pue<strong>de</strong>n calcular <strong>de</strong> la siguiente forma:SCT = XX y 2 ij − nȳ 2··SCTra = X n i ȳ 2 i· − nȳ 2··SCE = SCT − SCTra15


Cuando sólo hay dos poblaciones (un factor con dos niveles), este contraste es idénticoal contraste <strong>de</strong> la t para comparar las medias <strong>de</strong> dos poblaciones normales e i<strong>de</strong>pendientescon la misma varianza.Analizamos a continuación la tabla <strong>de</strong> análisis <strong>de</strong> la varianza <strong>de</strong>l ejemplo 1SCT = XX y 2 ij − nȳ 2·· == 7 2 +7 2 +15 2 + ... +15 2 +11 2 − 25 × 15,04 2 == 636,96SCTra = X n i ȳ 2 i· − nȳ 2·· == 5(9,8 2 + ... +10,8 2 ) − 25 × 15,04 2 == 475,76La tabla ANOVA es:SCE = SCT − SCTra =636,96 − 475,76 = 161,2F.V. S.C. G.L. M.C. FTratamiento 475.76 4 118.94 14.76Error 161.2 20 8.06Total 636.96 24F 4,20;0,1 = 2,2489F 4,20;0,05 = 2,8661F 4,20;0,01 = 4,4307Por lo tanto, rechazamos H 0 a los niveles anteriores y concluimos que hay diferenciasentre los tratamientos.Ejemplo 2. Analizaremos los siguientes conjuntos <strong>de</strong> datos:16


Primer casoSumas Medias20 19 20 21 80 2022 22 22 22 88 2224 24 23 25 96 24264 22Segundo casoSumas Medias45 0 10 25 80 208 30 38 12 88 2215 44 2 35 96 24264 22Las medias son iguales en los dos casos, con lo cual la diferencia <strong>de</strong> medias <strong>de</strong>bería serigual en ambos casos. Los diagramas <strong>de</strong> puntos, consi<strong>de</strong>rando en abscisas los grupos y enor<strong>de</strong>nadas las observaciones, son:25Primer caso2423222120192421 2 3Segundo caso504030201001 2 317


Debido a las diferentes dispersiones (varianzas) que existen en los dos casos, la impresiónvisual es muy distinta. En el segundo caso no se aprecia diferencia entre los tresgrupos (el factor no parece influir), mientras que en el primer caso, la cosa no está tanclara. Entonces, no es suficiente sólo con comparar las medias <strong>de</strong> cada grupo, la variabilidadtambié influye. Lo que vamos a hacer es comparar la variabilidad entre las mediascon la variabilidad <strong>de</strong>ntro <strong>de</strong> cada grupo, mediante el análisis <strong>de</strong> la varianza.Vamos a construir la tabla ANOVA:Caso 1 :SCT =SCTra =aX Xn i(y ij − ȳ··) 2 =36.i=1j=1aX(ȳ i· − ȳ··) 2 =32i=1SCE = SCT − SCTra =36− 32 = 4La tabla ANOVA es:F.V. S.C. G.L. M.C. FTratamiento 32 2 16 36Error 4 9 0.444Total 36 11Como F 2,9;0,05 =4,2565, rechazamos la hipótesis nula y concluimos que el factor influyeen la respuesta.Caso 2 :SCT = XX yij 2 − nȳ 2·· =8692− 12 × 22 2 =2884.SCTra = X n i ȳi· 2 − nȳ 2·· = 5840 − 12 × 22 2 =32SCE = SCT − SCTra =2884− 32 = 2852.La tabla ANOVA es:18


F.V. S.C. G.L. M.C. FTratamiento 32 2 16 0.05Error 2852 9 316.889Total 2884 11Como F 2,9;0,05 =4,2565, no rechazamos la hipótesis nula y concluimos que el factor noinfluye en la respuesta al nivel α =0,05..19


Comparaciones entre mediasUna vez obtenidas diferencias significativas entre los tratamientos, conviene estudiarpor qué se rechaza la igualdad entre medias, comparando todos los pares <strong>de</strong> medias,porque pue<strong>de</strong> ser que se rechace la igualdad <strong>de</strong> medias porque haya un par <strong>de</strong> mediasdiferentes entre sí. Se consi<strong>de</strong>ra, entonces, los siguientes contrastes:H 0 ≡ µ i = µ j , i 6=jH 0 ≡ µ i 6=µ j , i 6=jLosmétodosgeneralessonlascomparacionesmúltiplesylostests<strong>de</strong>recorridostu<strong>de</strong>ntizado.Comparaciones múltiples.LSD <strong>de</strong> Fisher (Least significant difference)Se contrasta µ i = µ j , para todo i 6=j, (i, j =1,...,a).Se tiene que se distribuye como una t <strong>de</strong> Stu<strong>de</strong>nt:(ȳ i· − ȳ j·) − ¡ ¢µ i − µq j∼ t N−aˆσ 1n i+ 1 n jAsí, un Intervalo <strong>de</strong> Confianza para ¡ ¢µ i − µ j anivelα es[(ȳ i· − ȳ j·) ± LSD α ]yse<strong>de</strong>nominasLSD α = t N−a,α ˆσ 1+ 12n i n j1. Si |ȳ i· − ȳ j·| >LSD α =⇒ Se rechaza que µ i = µ j anivelα.2. Si |ȳ i· − ȳ j·|


SiZ 1 ,...,Z a ∼ N(0, 1)U ∼ χ 2 min<strong>de</strong>pendientemente, entonces,Q =máxi6=j|Z i − Z j |qUm= Z (a) − Z (1)qUm∼ q a,mse distribuye con una distribución <strong>de</strong> recorrido estu<strong>de</strong>ntizado <strong>de</strong> parámetros a y m.Método <strong>de</strong> TukeySe requiere que n i = n, i =1,...,a. Si esto no se cumple, entonces se toma n =mín i {n i } .q11. Si |ȳ i· − ȳ j·| >q a,N−a;αˆσ =⇒ Se rechaza que µ n i = µ j anivelα.q12. Si |ȳ i· − ȳ j·| t N−a,α ˆσ 1+ 12pn i n jdon<strong>de</strong> p es el número <strong>de</strong> comparaciones que se pue<strong>de</strong>n obtener: 1 ≤ p ≤ ¡ a2¢.Se pue<strong>de</strong> aproximar t N−a,α2psiendo z α ∼ N(0, 1).por una normal:t v,α = z α + 1 ¡ ¢z34v α − z α ,21


Ejemplos.En el problema <strong>de</strong> comparación <strong>de</strong>l porcentaje <strong>de</strong> algodón en las prendas, las mediasmuestrales eran:Se tiene quea =5n =5N =25ˆσ 2 =8,06N − a =20.ȳ i· ȳ 1· ȳ 2· ȳ 3· ȳ 4· ȳ 5·9,8 15,4 17,6 21,6 10,8— LSD <strong>de</strong> FishersLSD α = t N−a,α ˆσ 1+ 1 r= t2 20,0n i n 0 025 8,06 · 2j 5 =3,745— Método <strong>de</strong> Tuckey— Método <strong>de</strong> BonferroniHSD α = ˆσ √ nq a,N−a,α =r8,065 q 5,20,0 0 05 =1,269 · 4,24 = 5,38Comoµ 5p = =102luego hay 10 posibles comparaciones:sB α = t N−a,α ˆσ 1+ 1 r= t2pn i n 20,0 0 05 8,06 · 2j20 5Comot 20,0 0 0520= t 20,0 0 0025 ≈ z 0,0025 + 1 ¡ ¢z34 · 20 0,0025 − z 0,0025 == 2,81 + 1 ¡2,81 3 − 2,81 ¢ =3,05280luegoB α = t 20,0 0 0520Así la tabla <strong>de</strong> diferencias es:r8,06 · 25 =3,052 · r8,06 · 25 =5,48.22


(i, j) (ȳ i· − ȳ j·) LSD α =3,745 HSD α =5,38 B α =5,48(1,2) 5,6 6= 6= 6=(1,3) 7,8 6= 6= 6=(1,4) 11,8 6= 6= 6=(1,5) 1,0 = = =(2,3) 2,2 = = =(2,4) 6,2 6= 6= 6=(2,5) 4,6 6= = =(3,4) 4 6= = =(3,5) 6,8 6= 6= 6=(4,5) 10,8 6= 6= 6=Tests <strong>de</strong> recorrido stu<strong>de</strong>ntizadoEn estos tests, se requiere que n i = n, i =1,...,a. Si esto no se cumple, entonces setoma la media armónica:µ 1n = a + ···+ 1 −1n 1 n aLos tests principales son:— El test <strong>de</strong> Duncan— El test <strong>de</strong> Newman-KeulsEn ambos tests se siguen los siguientes pasos:(i) Se or<strong>de</strong>nan <strong>de</strong> manera creciente las medias muestrales a comparar:ȳ (1)· < ȳ (2)· < ···< ȳ (a)·(ii) Se comparan las diferencias entre dos medias separadas por p posiciones con p =a, a − 1,...,2 usando los siguientes puntos críticos:Duncan.d p =ˆσ √ nr p,N−a,αdon<strong>de</strong> r p,N−a,α se obtiene a partir <strong>de</strong> la tabla <strong>de</strong> intervalos significativos <strong>de</strong>Duncan.23


Newman-Keuls.NK p =ˆσ √ nq p,N−a,αdon<strong>de</strong> q p,N−a,α se obtiene a partir <strong>de</strong> la tabla <strong>de</strong> la distribución <strong>de</strong> recorridostu<strong>de</strong>ntizado.Por ejemplo, para p = a se contrasta sir1|ȳ (a)· − ȳ (1)·| > r a,N−a;αˆσnr1|ȳ (a)· − ȳ (1)·| > q a,N−a;αˆσnPara p = a − 1 se contrasta sir1|ȳ (a)· − ȳ (2)·| > r a−1,N−a;αˆσnr1|ȳ (a−1)· − ȳ (1)·| > r a−1,N−a;αˆσnr1|ȳ (a)· − ȳ (2)·| > q a−1,N−a;αˆσnr1|ȳ (a−1)· − ȳ (1)·| > q a−1,N−a;αˆσn(iii) Se van <strong>de</strong>clarando diferentes o no a las parejas <strong>de</strong> medias. Si no se <strong>de</strong>claran diferentes,se conectan con una línea base. Al final sólo se <strong>de</strong>claran diferentes las medias queno están conectadas por ninguna línea.(iv) Si un grupo <strong>de</strong> medias no es significativamente diferente, ningún subgrupo <strong>de</strong> ellaslo es.Se tiene que la relación entre ambas tablas es la siguiente:r p,N−a;α = q p,N−a;1−(1−α) p−1Si comparamos los respectivos puntos críticos con N − a =20, por ejemplo:24


p 2 3 4 5 6 7 8r p,20,0 0 01 4.02 4.22 4.33 4.4 4.47 4.53 4.58q p,20,0 0 01 4.02 4.64 5.02 5.29 5.51 5.69 5.84Se observa que r p,20,0 0 01 ≤ q p,20,0 0 01, con lo cual se tiene qued α,p = ˆσ √ nr p,N−a,α


p |ȳ i· − ȳ j·| Newman-Keuls Duncan5 |ȳ 1· − ȳ 4·| =11,8 > 5,38 > 4,124 |ȳ 1· − ȳ 3·| =7,8 > 5,03 > 4,03|ȳ 5· − ȳ 4·| =10,8 > 5,03 > 4,033 |ȳ 1· − ȳ 2·| =5,6 > 4,54 > 3,93|ȳ 5· − ȳ 3·| =6,8 > 4,54 > 3,93|ȳ 2· − ȳ 4·| =6,2 > 4,54 > 3,932 |ȳ 1· − ȳ 5·| =1 < 3,74 < 3,74|ȳ 5· − ȳ 2·| =4,6 > 3,74 > 3,74|ȳ 3· − ȳ 2·| =2,2 < 3,74 < 3,74|ȳ 3· − ȳ 4·| =4 > 3,74 > 3,74Como conclusión, se obtiene que µ 4 >µ i para i =1, 2, 3, 5 <strong>de</strong> manera significativa segúnambos criterios.Y el resultado es:µ 1 µ 5x______yµ 2 µ 3x______yµ 4Contrastes Ortogonales (método <strong>de</strong> Scheffé)En general, un contraste entre k medias poblacionales se pue<strong>de</strong> <strong>de</strong>finir como unacombinación linealΨ = c 1 µ 1 + c 2 µ 2 + ···+ c a µ atales que c 1 ,...,c a son constantes <strong>de</strong> suma nula: P aj=1 c j =0.Un estimador <strong>de</strong> Ψ esˆΨ = c 1¯x 1· + c 2¯x 2· + ···+ c a¯x a·y la estimación <strong>de</strong> la varianza <strong>de</strong> Ψ esˆσ 2 Ψ = MCEµ c21+ ···+ c2 a.n 1 n aEn particular, por ejemplo, la diferencia entre dos medias cualesquiera equivale a uncontrasteˆΨ = c i µ i + c j µ j26


con c i =1y c j = −1 y cero para el resto <strong>de</strong> términos.El procedimiento se Scheffé seaplica<strong>de</strong>lasiguienteforma:(i) Especificar Ψ así como los coeficientes que <strong>de</strong>terminan el contraste. Calcular ˆΨ reemplazandolas medias muestrales por las poblacionales.(ii) Estimar ˆσ 2 Ψ y calcular la razónˆΨˆσ Ψ.(iii) Si la razón ¯¯¯ ˆΨ¯¯ q> (a − 1)F a−1,N−a,α ,ˆσ Ψse rechaza la hipótesis H 0 ≡ Ψ =0al nivel α.Ejemplo.Supongamos que se trata <strong>de</strong> contrastarΨ 1 = µ 1 + µ 3 − µ 4 − µ 5Ψ 2 = µ 1 − µ 4Las estimas sonˆΨ 1 = ¯x 1· +¯x 3· − ¯x 4· − ¯x 5· =9,8+17,6 − 21,6 − 10,8 =5,0ˆΨ 2 = ¯x 1· − ¯x 4· =9,8 − 21,6 =−11,8ˆσ Ψ1 =ˆσ Ψ2 =vut MCEr5Xi=18,06 2 5 =1,8c 2 in i=r8,06 4 5 =2,54ycomoF a−1,N−a,α = F 4,20,0 0 01 =4,43, <strong>de</strong> modo que p (a − 1)F a−1,N−a,α = √ 4 · 4,43 = 4,21¯ ˆΨ 1¯¯¯= 5,0 =1,97 < 4,21ˆσ Ψ1 2,54se acepta la H 0 .27


¯ ˆΨ 2¯¯¯= 11,8 =6,56 > 4,21ˆσ Ψ2 1,8se rechaza la H 0 .Aunque el método <strong>de</strong> Scheffé permite plantear muchas posibles comparaciones entremedias, cuando se estudian sólo diferencias entre medias resulta menos eficaz que los testsespecíficos para diferencias <strong>de</strong> pares <strong>de</strong> medias.28


Estudio <strong>de</strong> la a<strong>de</strong>cuación <strong>de</strong>l mo<strong>de</strong>loLa mayor parte <strong>de</strong> las <strong>de</strong>sviaciones <strong>de</strong> las hipótesis básicas <strong>de</strong>l mo<strong>de</strong>lo, se pue<strong>de</strong>nestudiar a través <strong>de</strong> los residuos:e ij = y ij − ŷ ijal igual que se hace, habitualmente en Regresión.Así, el dibujo <strong>de</strong> los errores <strong>de</strong> modo secuencial a como aparecen las observacionespermite <strong>de</strong>tectar correlaciones entre los mismos y, <strong>de</strong> este modo, se observa si se cumplela hipótesis <strong>de</strong> in<strong>de</strong>pen<strong>de</strong>ncia. Si no es así, es un problema difícil <strong>de</strong> corregir en la práctica,como no sea repitiendo el experimento y aleatorizando <strong>de</strong> modo conveniente.También se pue<strong>de</strong> consi<strong>de</strong>rar la gráfica <strong>de</strong> los errores frente a los valores predichosŷ ij =ȳ i·, que no <strong>de</strong>bería presentar ten<strong>de</strong>ncias en cuanto a su aspecto. Si lo hace, es unsigno <strong>de</strong> la existencia <strong>de</strong> varianza no constante o heterocedasticidad.Cuando n i= n, parai =1,...a la existencia <strong>de</strong> varianzas heterogéneas entre losgrupos, apenas afecta al contraste <strong>de</strong> la F . Sin embargo, si los tamaños muestrales son<strong>de</strong>siguales, la probabilidad <strong>de</strong> cometer error <strong>de</strong> tipo I pue<strong>de</strong> ser diferente al valor α prefijado.Para comprobar este supuesto, se pue<strong>de</strong> consi<strong>de</strong>rar el test <strong>de</strong> Levene o el test <strong>de</strong>Barlett. Sin embargo, la prueba <strong>de</strong> Levene tiene la ventaja <strong>de</strong> que no se ve afectada porla falta <strong>de</strong> normalidad <strong>de</strong>l mo<strong>de</strong>lo, y se pue<strong>de</strong> aplicar a tamaños muestrales <strong>de</strong>siguales.El estadístico <strong>de</strong> contraste <strong>de</strong> la prueba <strong>de</strong> Levene esF 0 =P a P ni¡i=1 j=1 dij − i·¢ ¯d /(N − a)P ai=1 n ¡i ¯di· − ¯d··¢/(a − 1)don<strong>de</strong>d ij = |y ij − ȳ i·| ,P nij=1 ¯d i· =d ij,nP ia P nii=1 j=1 ¯d·· =d ij.N29


Si las varianzas son homogéneas, entonces este estadístico F 0 se distribuye como unaF<strong>de</strong>Sne<strong>de</strong>cor,F a−1,N−a,α , siendo α el nivel <strong>de</strong> significación elegido.Transformaciones para conseguir homocedasticidadCuando se presenta homocedasticidad se <strong>de</strong>be a menudo a que la varianza cambiacuando lo hace la media. Si µ i es la media <strong>de</strong>l grupo i-ésimo y σ i su <strong>de</strong>sviación típica,entonces σ i = f(µ i ) para alguna función f.ParaestabilizarlavarianzasebuscaunafunciónT tal que T (x) tengavarianzaconstante.En la práctica se usaT (x ij )=½ xλij λ 6= 0log(x ij ) λ =0En particular se suele consi<strong>de</strong>rar una función f <strong>de</strong> la formaf(µ i )=kµ α i<strong>de</strong> modo queσ i = kµ α iSe pue<strong>de</strong> <strong>de</strong>mostrar que para conseguir la homocedasticidad, se <strong>de</strong>be usar la transformacióncon parámetro λ =1− α.Para estimar λ se usan los diagramas rango-media. Se asume el ajuste a una ecuación<strong>de</strong>l tipo σ = kµ α yasílog(σ) =log(k)+α log(µ)α será la pendiente <strong>de</strong> la recta que pasa por los puntos <strong>de</strong>l gráfico, esto es, <strong>de</strong> la correspondienterecta <strong>de</strong> regresión. Una vez estimado α se calcula λ =1− α.Observaciones(i) Las transformaciones estabilizadoras <strong>de</strong> la vrainza se <strong>de</strong>finen sólo para conjuntos <strong>de</strong>datos positivos. En caso contrario, hay que sumar una constante a los datos.30


(ii) En general se consi<strong>de</strong>ra una rejilla <strong>de</strong> valores <strong>de</strong> λ y se va probando con múltiplos<strong>de</strong> 1 2 .(iii) Frecuentemente la transformación no sólo estabiliza la varianza sino que normalizalos datos, cuando estos no se distribuyen como una normal.31


<strong>Mo<strong>de</strong>lo</strong> <strong>de</strong> efectos aleatoriosSi el número <strong>de</strong> niveles <strong>de</strong>l factor no está fijado <strong>de</strong> antemano, sino que es una muestraaleatoria <strong>de</strong> una población <strong>de</strong> niveles, entonces se tiene un mo<strong>de</strong>lo <strong>de</strong> efectos aleatorios.El mo<strong>de</strong>lo se expresa igual que antesy ij = µ + τ i + ε ijdon<strong>de</strong> i =1, 2,...,a y j =1, 2,...,n, siendo, en este caso, τ i y ε ij variables aleatorias.Si se asume que τ i y ε ij son in<strong>de</strong>pendientes, y que τ i tiene como varianza σ 2 τ, entoncesla varianza <strong>de</strong> una observación dada esVar(y ij )=σ 2 τ + σ 2 .Se <strong>de</strong>nomina a σ 2 τ yaσ 2 como los componentes <strong>de</strong> la varianza ysesuponequeε ij ∼ N(0,σ 2 )τ i ∼ N(0,σ 2 τ)in<strong>de</strong>pendientemente entre sí.Ahora carece <strong>de</strong> sentido contrastar hipótesis basadas en tratamientos individuales, porlo que se contrasta:H 0 ≡ σ 2 τ =0H 1 ≡ σ 2 τ > 0Todos los tratamientos serán iguales si σ 2 τ =0. Sin embargo, si σ 2 τ > 0 existe variabilida<strong>de</strong>ntre los tratamientos.En este caso, si H 0 es cierta, σ 2 τ =0, entoncesF 0 =SCTraa−1SCEN−a= MCTraMCE∼ F a−1,N−a32


Si se consi<strong>de</strong>ran los valores esperados <strong>de</strong> las medias <strong>de</strong> cuadrados, entonces=Del mismo modo, se obtiene queE [MCTra]= 1a − 1 E [SCTra] =" aX#1a − 1 E yi·2n − y2·· = σ 2 + nσ 2Nτ.i=1E [MCE]=σ 2 .Si la hipótesis alternativa es cierta, entonces el valor esperado <strong>de</strong>l numerador en F 0 esmayor que el esperado <strong>de</strong>l <strong>de</strong>nominador. Así, se rechaza H 0 para valores altos <strong>de</strong> F 0 , conlo cual, la región crítica es unilateral superior, rechazándose siF 0 >F a−1,N−a,αEl procedimiento <strong>de</strong> cálculo es igual que en el mo<strong>de</strong>lo <strong>de</strong> efectos fijos, aunque lasconclusiones se aplican a toda la población <strong>de</strong> tratamientos.Estima <strong>de</strong> los componentes <strong>de</strong> la varianzaSi se igualan los valores esperados <strong>de</strong> las medias <strong>de</strong> cuadrados con los valores observados,se obtiene<strong>de</strong> don<strong>de</strong>MCTra = σ 2 + nσ 2 τMCE = σ 2NOTA:ˆσ 2 = MCEˆσ 2 τ =MCTra− MCEnSi n i , para i =1,...,a son distintos entre sí, se sustituye en la expresión anterior npor" aXn 0 = 1P #ai=1n i −n2 iPa − 1ai=1i=1 n .i33


Ejemplo.Una fábrica <strong>de</strong> maquinillas <strong>de</strong> afeitar utiliza una gran cantidad <strong>de</strong> máquinas en laproducción. Se <strong>de</strong>sea que las máquinas sean homogéneas para producir objetos <strong>de</strong> lamisma calidad. Para investigar si existen variaciones significativasentrelasmáquinas,se seleccionan 4 al azar y se mi<strong>de</strong> el porcentaje <strong>de</strong> un cierto componente <strong>de</strong> la hoja. Elexperimento se realiza con or<strong>de</strong>n aleatorio.y i·Máquina 1 98 97 99 96 390Máquina 2 91 90 93 92 366Máquina 3 96 95 97 95 383Máquina 4 95 96 99 98 388y·· =1527Se obtiene la siguiente tabla ANOVA:F.V. S.C. G.L. M.C. F 0Explicada 89.19 3 29.73 15.68Residual 22.75 12 1.90Total 11.94 15ComoF 3,12,0 0 05 =3,49 < 15,68Se rechaza H 0 ≡ σ τ =0.Estimación <strong>de</strong> los componentes <strong>de</strong> la varianza:ˆσ 2 = MCE =1,90ˆσ 2 τ =MCTra− MCEn=29,73 − 1,904=6,96.La estimación <strong>de</strong> la varianza <strong>de</strong> cualquier observación <strong>de</strong> la muestra esˆσ 2 +ˆσ 2 τ =1,90 + 6,96 = 8,86y la mayor parte <strong>de</strong> la variabilidad se <strong>de</strong>be a diferencias entre las máquinas.34


Intervalos <strong>de</strong> confianza para los componentes <strong>de</strong> la varianzaEl intervalo <strong>de</strong> confianza para σ 2 al 100(1 − α)% es(N − a)MCEχ 2 N−a, α 2≤ σ 2 ≤(N − a)MCEχ 2 N−a,1− α 2El intervalo <strong>de</strong> confianza para σ 2 τ no se pue<strong>de</strong> calcular <strong>de</strong> modo exacto, dado que <strong>de</strong>pen<strong>de</strong><strong>de</strong> una combinación lineal <strong>de</strong> χ 2 ’s. Por tanto se calcula el intervalo para el cocienteσ 2 τ.σ 2 + σ 2 τSe <strong>de</strong>nominaÃl 1 = 1 nÃl 2 = 1 nMCTraMCEMCTraMCE1F a−1,N−a , α 21F a−1,N−a,1−α2− 1!− 1!entonces el intervalo <strong>de</strong> confianza al 100(1 − α)% esl 11+l 1≤ σ2 τσ 2 + σ 2 τ≤ l 21+l 2.Ejemplo.En el caso <strong>de</strong> la fábrica <strong>de</strong> maquinillas <strong>de</strong> afeitar,F a−1,N−a , α 2F a−1,N−a,1−α2= F 3,12,0,025 =4,47= F 3,12,0,975 =1F 12,3,0,025=0,070.De este modoÃl 1 = 1 nÃl 2 = 1 nMCTraMCEMCTraMCE1F a−1,N−a , α21F a−1,N−a,1−α2− 1!− 1=0,625!=54,88335


<strong>de</strong> modo quel 1σ 2 τ≤1+l 1 σ 2 + σ 2 τ0,6251, 625 ≤ σ 2 τσ 2 + σ 2 τ≤ l 21+l 2≤ 54,88355,8830,39 ≤σ 2 τσ 2 + σ 2 τ≤ 0,98Esto es, la variabilidad <strong>de</strong> las máquinas justifica entre el 40 % y el 98 % <strong>de</strong> la variabilidadtotal.36


Test <strong>de</strong> Kruskal-WallisCuando no está justificado asumir normalidad, se pue<strong>de</strong> utilizar la metodología noparamétrica. El test <strong>de</strong> Kruskal-Wallis propone como hipótesis nula que los a tratamientosson iguales, frente a la hipótesis alternativa <strong>de</strong> que algunas observaciones son mayores queotras entre los tratamientos. Se pue<strong>de</strong> consi<strong>de</strong>rar que este test es a<strong>de</strong>cuado para contrastarla igualdad entre las medias.Procedimiento.Se calculan rangos <strong>de</strong> cada una <strong>de</strong> las observaciones y ij <strong>de</strong> manera creciente y se reemplazapor su rango R ij , don<strong>de</strong> la menor observación tendría el valor 1. En caso <strong>de</strong> empates,se asigna a todas las observaciones empatadas el valor medio <strong>de</strong> sus correspondientes rangos.Se <strong>de</strong>nota como R i· la suma <strong>de</strong> los rangos <strong>de</strong>l i-ésimo tratamiento <strong>de</strong> modo que elestadístico esH = 1 S 2 " aXi=1R 2 i·n i−#N(N +1)24don<strong>de</strong> n i es el número <strong>de</strong> observaciones que hay en el tratamiento i, N es el número total<strong>de</strong> observaciones y" aXS 2 = 1N − 1i=1Xn ij=1R 2 ij −#N(N +1)2.4Se pue<strong>de</strong> observar que S 2 es simplemente la varianza <strong>de</strong> los rangos. Si no hay empates,entonces S 2 = N(N+1)12y el test se simplifica, quedando el estadísticoH =12N(N +1)aXi=1R 2 i·n i− 3(N +1).Para valores n i > 5, H se distribuye aproximadamente como una χ 2 a−1 si la hipótesisnula es cierta. Por tanto, si H>χ 2 a−1,α serechazalahipótesisnulaaunnivelα.Ejemplo.En el ejemplo <strong>de</strong> las camisas fabricadas según su porcentaje <strong>de</strong> algodón, se tenían lossiguientes datos:37


%<strong>de</strong>algodón Observaciones15 7 7 15 11 920 12 17 12 18 1825 14 18 18 19 1930 19 25 22 19 2335 7 10 11 15 11Si se calculan los correspondientes rangos, se obtiene:RangosSumaR 1j 2 2 12.5 7 4 27.5R 2j 9.5 14 9.5 16.5 16.5 66R 3j 11 16.5 16.5 20.5 20.5 85R 4j 20.5 25.5 23 20.5 24 113R 5j 2 5 7 12.5 7 33.5Así, calculando" aX#S 2 = 1 Xn iR 2 N(N +1)2ij − =N − 14i=1 j=1¸125 · 262∙5497,79 − =53,03244" aX#H = 1 Ri·2 N(N +1)2− =S 2 ni=1 i 4¸125 · 262=∙52,45 − =19,25.53,034Como H>χ 2 4,0,01 =13,28, entonces se rechaza la hipótesis nula obteniéndose la mismaconclusión que en el caso <strong>de</strong> usar el test clásico paramétrico.38


Test <strong>de</strong> aleatorización y test BootstrapSe pue<strong>de</strong>n realizar tests <strong>de</strong> aleatorización sobre los errores para contrastar medias. Elalgoritmo es1. Calcular el estadístico F 0 <strong>de</strong>l modo habitual sobre los datos originales.2. Calcular el residuo para cada observación, como la diferencia entre cada observacióny la media <strong>de</strong> todas las observaciones <strong>de</strong>ntro <strong>de</strong> su grupo correspondiente.3. Asignar aleatoriamente los residuos en los grupos <strong>de</strong>l mismo tamaño sumándolos alasmedias<strong>de</strong>cadagrupo,ycalcularF 1 , el estadístico <strong>de</strong> la F <strong>de</strong> Sne<strong>de</strong>cor obtenidosobre los nuevos datos generados.4. Repetir el paso (3) un número N <strong>de</strong> veces para generar los valores F 1 ,F 2 ,...,F N5. Declarar que F 0 es significativo a un nivel α si es mayor que el valor correspondienteal percentil (1 − α) <strong>de</strong> los valores F 1 ,F 2 ,...,F N .Se pue<strong>de</strong> modificar este algoritmo, cambiando el paso (3) remuestreando los residuoscon reemplazamiento para producir nuevos conjuntos <strong>de</strong> datos. Este método da un testBootstrap <strong>de</strong> significación que tiene propieda<strong>de</strong>s similares al anterior. Sin embargo, hayuna diferencia entre ambos métodos:El test basado en aleatorización, se basa en la i<strong>de</strong>a <strong>de</strong> que los residuos aparecen or<strong>de</strong>naleatorio, mientras que el método Bootstrap se basa en una aproximación a la distribuciónF <strong>de</strong> Sne<strong>de</strong>cor que se obtendría remuestreando <strong>de</strong> las poblaciones <strong>de</strong> don<strong>de</strong> vienen los datosoriginales.39


La cantidad Φ 2 está relacionada con el parámetro <strong>de</strong> centralidad, y se presentan habitualmentecurvas para α =0,05 y α =0,01.El parámetro anterior, <strong>de</strong>pen<strong>de</strong> <strong>de</strong>1. Los valores τ 1 ,...,τ a obienµ 1 ,...,µ a para los que se consi<strong>de</strong>ran medias distintas,ya que obviamente dichos valores no son conocidos previamente.2. El valor <strong>de</strong> σ 2 , que al ser también <strong>de</strong>sconocido, se suele usar el valor que se obtienemediante una muestra piloto.3. El número <strong>de</strong> réplicas por tratamiento.Así, fijadoslosvalores<strong>de</strong>τ i y el valor <strong>de</strong> σ 2 se <strong>de</strong>be <strong>de</strong>terminar n para que la potenciasea (1 − β). Una manera <strong>de</strong> hacerlo es buscando en las tablas <strong>de</strong> curvas características <strong>de</strong>operación.Ejemplo.Supongamos que en el ejemplo <strong>de</strong> las prendas el experimentador está interesado enrechazar la igualdad entre los tratamientos con una probabilidad mínima <strong>de</strong> 0,9 (error <strong>de</strong>tipo II: β =0,1).Se asumen unas medias poblacionales por grupo igual aµ 1 =11, µ 2 =12, µ 3 =15, µ 4 =18, µ 5 =19<strong>de</strong> modo que la media total es µ = 11+12+15+18+19 =15.5Supongamos una estimación previa (mediante e.g. una muestra piloto) <strong>de</strong> ˆσ 2 =9yque el nivel α elegido es 0,01. Se tiene que τ i = µ i − µ, <strong>de</strong> manera queτ 1 = 11− 15 = −4τ 2 = 12− 15 = −3τ 3 = 15− 15 = 0τ 4 = 18− 15 = 3τ 5 = 19− 15 = 441


EntoncesΦ 2 =n5Xi=15ˆσ 2τ 2 i= n(16+16+9+9)5 · 9Se construye una tabla, dando distintos valores a n :=1,11 · nn Φ 2 Φ g.l. (a − 1,a(n − 1)) β (1-β) Potencia4 4,44 2,11 (4, 15) 0,3 0,75 5,55 2,36 (4, 20) 0,15 0,856 6,66 2,58 (4, 25) 0,04 0,96Por tanto es necesario realizar, al menos, 6 réplicas.Lectura <strong>de</strong> las Curvas <strong>de</strong> Operación(i) Se elige la curva <strong>de</strong> operación. Para ello se calculan los grados <strong>de</strong> libertad: a − 1=5 − 1=4, y se elige la curva con v 1 =4.(ii) Se fijaelhaz<strong>de</strong>curvascorrespondientealvalor<strong>de</strong>α elegido: en el ejemplo, seríaα =0,01.(iii) Se elige la curva correspondiente a v 2 = a(n − 1). Por ejemplo, si n =4, se tomaríav 2 =15.(iv) En el eje X se busca el valor <strong>de</strong>l parámetro Φ ysefija la or<strong>de</strong>nada para ese valor<strong>de</strong> Φ que muestra la curva <strong>de</strong> operación elegida en (iii). Por ejemplo, para n =4,v 2 =15, el valor está cerca <strong>de</strong> 0,30.(v) El valor <strong>de</strong> la probabilidad <strong>de</strong> error <strong>de</strong> tipo II está en la or<strong>de</strong>nada. En el ejemplo es0.30, <strong>de</strong> manera que la potencia es (1 − β) =0,70.A menudo resulta difícil seleccionar las medias para cada tratamiento que se quierenusar, para <strong>de</strong>terminar el tamaño <strong>de</strong> la muestra. Una alternativa consiste en consi<strong>de</strong>rar elvalor <strong>de</strong> la máxima diferencia posible entre las medias: D.42


Se pue<strong>de</strong> <strong>de</strong>mostrar que el valor mínimo <strong>de</strong> Φ 2 esΦ 2 = D2 n2aσ 2 .Como es el valor mínimo, entonces se obtiene el tamaño muestral a<strong>de</strong>cuado para obtenercomo mínimo la potencia especificada.<strong>Mo<strong>de</strong>lo</strong> <strong>de</strong> efectos aleatoriosEn este mo<strong>de</strong>lo, se contrastaH 0 ≡ σ τ =0H 1 ≡ σ τ > 0En este caso, si H 1 es cierta, entoncesF 0 = MCTraMCE∼ F a−1,N−a<strong>de</strong> manera que se pue<strong>de</strong>n usar las tablas habituales <strong>de</strong> la F <strong>de</strong> Sne<strong>de</strong>cor para <strong>de</strong>terminarel tamaño muestral.También se pue<strong>de</strong>n usar curvas <strong>de</strong> operación característica, don<strong>de</strong> aparecen las gráficas<strong>de</strong>l error <strong>de</strong> tipo II, frente al parámetrorλ = 1+ nσ2 τσ 2Los términos σ 2 τ y σ 2 al ser <strong>de</strong>sconocidos se fijan <strong>de</strong>pendiendo <strong>de</strong> la sensibilidad <strong>de</strong>seadapara el experimento.43


Aplicación con RSe pue<strong>de</strong> usar la librería Rcmdr <strong>de</strong> R, y ejecutar las siguientes sentencias en la ventana<strong>de</strong> arriba <strong>de</strong> Rcmdr:library(Rcmdr)Datos


lmedias


Para comparaciones múltiples se pue<strong>de</strong>n consi<strong>de</strong>rar el test <strong>de</strong> LSD, el <strong>de</strong> Bonferroni y eltest <strong>de</strong> Tukey. El test <strong>de</strong> LSD hay que programarlo:# test <strong>de</strong> LSDn1


Aplicación con SASoptions ls=75 nodate nonumber;title 'ANOVA UNIFACTORIAL DE EFECTOS FIJOS';data ano1;input grupo medida;cards;1 71 71 151 111 92 122 172 122 182 183 143 183 183 193 194 194 254 224 194 235 75 105 115 155 11;proc anova;class grupo;mo<strong>de</strong>l medida=grupo;means grupo /duncan snk lsd tukey;run;ANOVA UNIFACTORIAL DE EFECTOS FIJOSThe ANOVA ProcedureClass Level InformationClass Levels Valuesgrupo 5 1 2 3 4 5Number of observations 2547


Depen<strong>de</strong>nt Variable: medidaSum ofSource DF Squares Mean Square F Value Pr > FMo<strong>de</strong>l 4 475.7600000 118.9400000 14.76 Fgrupo 4 475.7600000 118.9400000 14.76


Duncan's Multiple Range Test for medidaNOTE: This test controls the Type I comparisonwise error rate, not theexperimentwise error rate.Alpha 0.05Error Degrees of Freedom 20Error Mean Square 8.06Number of Means 2 3 4 5Critical Range 3.745 3.931 4.050 4.132Means with the same letter are not significantly different.Duncan Grouping Mean N grupoA 21.600 5 4B 17.600 5 3BB 15.400 5 2C 10.800 5 5CC 9.800 5 149


Stu<strong>de</strong>nt-Newman-Keuls Test for medidaNOTE: This test controls the Type I experimentwise error rate un<strong>de</strong>r thecomplete null hypothesis but not un<strong>de</strong>r partial null hypotheses.Alpha 0.05Error Degrees of Freedom 20Error Mean Square 8.06Number of Means 2 3 4 5Critical Range 3.7454539 4.5427095 5.0256316 5.3729604Means with the same letter are not significantly different.SNK Grouping Mean N grupoA 21.600 5 4B 17.600 5 3BB 15.400 5 2C 10.800 5 5CC 9.800 5 1Tukey's Stu<strong>de</strong>ntized Range (HSD) Test for medidaNOTE: This test controls the Type I experimentwise error rate, but itgenerally has a higher Type II error rate than REGWQ.Alpha 0.05Error Degrees of Freedom 20Error Mean Square 8.06Critical Value of Stu<strong>de</strong>ntized Range 4.23186Minimum Significant Difference 5.373Means with the same letter are not significantly different.Tukey Grouping Mean N grupoA 21.600 5 4AB A 17.600 5 3BB C 15.400 5 2CD C 10.800 5 5DD 9.800 5 150


options ls=75 nodate nonumber;title 'ANOVA UNIFACTORIAL DE EFECTOS ALEATORIOS';data ano1;input caja peso;cards;1 481 492 462 492 493 513 503 503 523 494 514 514 524 535 525 505 536 506 506 516 49;proc glm;class caja;mo<strong>de</strong>l peso=caja;random caja/ test;proc varcomp method=type1;class caja;mo<strong>de</strong>l peso=caja;run;ANOVA UNIFACTORIAL DE EFECTOS ALEATORIOSThe GLM ProcedureClass Level InformationClass Levels Valuescaja 6 1 2 3 4 5 6Number of observations 2151


Depen<strong>de</strong>nt Variable: pesoSum ofSource DF Squares Mean Square F Value Pr > FMo<strong>de</strong>l 5 36.69285714 7.33857143 5.21 0.0057Error 15 21.11666667 1.40777778Corrected Total 20 57.80952381R-Square Coeff Var Root MSE peso Mean0.634720 2.361750 1.186498 50.23810Source DF Type I SS Mean Square F Value Pr > Fcaja 5 36.69285714 7.33857143 5.21 0.0057Source DF Type III SS Mean Square F Value Pr > Fcaja 5 36.69285714 7.33857143 5.21 0.0057SourcecajaType III Expected Mean SquareVar(Error) + 3.4476 Var(caja)Tests of Hypotheses for Random Mo<strong>de</strong>l Analysis of VarianceDepen<strong>de</strong>nt Variable: pesoSource DF Type III SS Mean Square F Value Pr > Fcaja 5 36.692857 7.338571 5.21 0.0057Error: MS(Error) 15 21.116667 1.407778Variance Components Estimation ProcedureClass Level InformationClass Levels Valuescaja 6 1 2 3 4 5 6Number of observations 21Depen<strong>de</strong>nt Variable: peso52


Type 1 Analysis of VarianceSum ofSource DF Squares Mean Squarecaja 5 36.692857 7.338571Error 15 21.116667 1.407778Corrected Total 20 57.809524 .Type 1 Analysis of VarianceSourceExpected Mean SquarecajaVar(Error) + 3.4476 Var(caja)ErrorVar(Error)Corrected Total .Type 1 EstimatesVariance Component EstimateVar(caja) 1.72026Var(Error) 1.4077853

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!