11.05.2013 Views

Tema 3. Experimentos unifactoriales CON restricciones en la ...

Tema 3. Experimentos unifactoriales CON restricciones en la ...

Tema 3. Experimentos unifactoriales CON restricciones en la ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

TEMA 3<br />

EXPERIMENTOS UNIFACTORIALES <strong>CON</strong> RESTRICCIONES<br />

EN LA ALEATORIZACIÓN<br />

(Hicks, cap. 4; Winer, pag. 240 y ss.)<br />

Introducción<br />

En ocasiones los diseños completam<strong>en</strong>te aleatorizados pres<strong>en</strong>tan muchas desv<strong>en</strong>tajas.<br />

Sería conv<strong>en</strong>i<strong>en</strong>te introducir alguna restricción <strong>en</strong> <strong>la</strong> aleatorización para int<strong>en</strong>tar comp<strong>en</strong>sar no<br />

sólo <strong>la</strong> media de <strong>la</strong>s desviaciones, sino eliminar <strong>en</strong> lo posible <strong>la</strong> varianza asociada. Veámoslo <strong>en</strong><br />

un ejemplo.<br />

Ejemplo 1:<br />

Supongamos que queremos determinar si difer<strong>en</strong>tes lotes de neumáticos pres<strong>en</strong>tan pérdidas de<br />

superficie de rodadura distinta después de 20.000 km.<br />

El ger<strong>en</strong>te de una compañía de coches desea considerar cuatro lotes disponibles y decidir cuál<br />

pres<strong>en</strong>ta <strong>la</strong> m<strong>en</strong>or pérdida de superficie de rodadura después de 20.000 km. Los lotes<br />

considerados son A, B, C y D. Aunque <strong>la</strong>s condiciones de conducción pued<strong>en</strong> simu<strong>la</strong>rse <strong>en</strong> el<br />

<strong>la</strong>boratorio, quiere probar los cuatro lotes bajo verdaderas condiciones de conducción.<br />

La variable a medir ( y ij ) es <strong>la</strong> máxima difer<strong>en</strong>cia <strong>en</strong> “profundidad del dibujo” sobre un<br />

neumático desde que se montó <strong>en</strong> el coche hasta después de haberlo utilizado durante 20.000 km.<br />

(medida <strong>en</strong> mils 0.001 inch.). El único factor de interés es el lote ( j ) con j 1,<br />

2,<br />

3,<br />

4 .<br />

Como los lotes se prueban sobre coches y necesitamos alguna medida del error, usaremos más de<br />

una rueda por lote. Será más práctico escoger 4 ruedas de cada lote (es decir, 16 neumáticos <strong>en</strong><br />

total), y podríamos <strong>en</strong>tonces tomar también cuatro coches. Podemos tomar, <strong>en</strong> este caso, el<br />

sigui<strong>en</strong>te diseño:<br />

Coche I II III IV<br />

Lote A B C D<br />

A B C D<br />

A B C D<br />

A B C D<br />

En este caso, <strong>la</strong>s medias por lotes serían también <strong>la</strong>s medias para los coches. Si éstos se<br />

conduc<strong>en</strong> por difer<strong>en</strong>tes terr<strong>en</strong>os por conductores distintos, es posible que lo que apar<strong>en</strong>tem<strong>en</strong>te<br />

son difer<strong>en</strong>cias <strong>en</strong>tre los lotes sean, <strong>en</strong> realidad, difer<strong>en</strong>cias <strong>en</strong>tre los coches. Este diseño se dice<br />

que es completam<strong>en</strong>te confundido (completely confounded) ya que <strong>en</strong> nuestro análisis no<br />

podemos distinguir <strong>en</strong>tre lotes y coches.<br />

Podemos int<strong>en</strong>tar un diseño completam<strong>en</strong>te aleatorizado (completely randomized) asignando los<br />

16 neumáticos a los cuatro coches de forma aleatoria. Por ejemplo:<br />

Coche I II III IV<br />

Lote (pérdida) C(12) A(14) C(10) A(13)<br />

A(17) A(13) D(11) D(9)<br />

D(13) B(14) B(14) B(8)<br />

D(11) C(12) B(13) C(9)<br />

El propósito del diseño completam<strong>en</strong>te aleatorizado es, <strong>en</strong> este caso, eliminar <strong>la</strong>s posibles<br />

difer<strong>en</strong>cias <strong>en</strong>tre los coches (que, de existir, estarán “distorsionando” los resultados). El modelo<br />

considerado es yij <br />

j eij<br />

j 1,<br />

2,<br />

3,<br />

4 i 1,<br />

2,<br />

3,<br />

4 . El ANOVA da<br />

Fu<strong>en</strong>te de variación g.d.l. SC CM F F0. 05 F0.<br />

01<br />

Lote ( j ) 3 30.69 10.23 2.43 <strong>3.</strong>49 2.61<br />

Error ( e ij ) 12 50.25 4.2<br />

Total 15 80.94<br />

<strong>Tema</strong> 3 1 de 9


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

Por tanto, no rechazo <strong>la</strong> hipótesis (es decir, <strong>la</strong>s pérdidas medias son estadísticam<strong>en</strong>te iguales).<br />

Diseño por bloques completos totalm<strong>en</strong>te aleatorizado<br />

Si nos fijamos <strong>en</strong> el diseño completam<strong>en</strong>te aleatorizado del ejemplo anterior,<br />

<strong>en</strong>contramos que aún pres<strong>en</strong>ta ciertos problemas. Por ejemplo, el lote A no se usa <strong>en</strong> el coche III,<br />

ni el lote B se usa <strong>en</strong> el coche II. Por lo tanto, cualquier variación d<strong>en</strong>tro del bloque A reflejará<br />

variaciones <strong>en</strong>tre los coches I, II, III y IV. Por consigui<strong>en</strong>te, el error aleatorio no será sólo un<br />

error experim<strong>en</strong>tal sino también incluirá variación <strong>en</strong>tre coches. Como el objetivo principal del<br />

diseño de experim<strong>en</strong>tos es reducir el error experim<strong>en</strong>tal, será mejor diseño aquel <strong>en</strong> el que<br />

eliminemos <strong>la</strong> variación <strong>en</strong>tre los coches de <strong>la</strong> variación del error (obsérvese que <strong>en</strong> el diseño<br />

completam<strong>en</strong>te aleatorizado hemos “comp<strong>en</strong>sado” los efectos de los coches, pero no hemos<br />

eliminado <strong>la</strong> variación <strong>en</strong>tre los coches).<br />

Un diseño que requiere que cada lote se use una so<strong>la</strong> vez sobre cada coche se dice que es<br />

un diseño por bloques completos aleatorizado (randomized complete block design).<br />

Por ejemplo, para el caso de los coches:<br />

Coche I II III IV<br />

Lote (pérdida) B(14) D(11) A(13) C(9)<br />

C(12) C(12) B(13) D(9)<br />

A(17) B(14) D(11) B(8)<br />

D(13) A(14) C(10) A(13)<br />

En este diseño, el ord<strong>en</strong> <strong>en</strong> el que se colocan los cuatro neumáticos <strong>en</strong> el coche es aleatorio, y<br />

cada coche ti<strong>en</strong>e un neumático de cada tipo. De esta forma podemos comparar mejor los lotes, ya<br />

que han sido utilizados todos sobre aproximadam<strong>en</strong>te los mismos terr<strong>en</strong>os ( mismas<br />

condiciones de conducción para los lotes; por tanto, <strong>la</strong>s “únicas” difer<strong>en</strong>cias exist<strong>en</strong>tes serían<br />

<strong>en</strong>tre los lotes). Esto nos proporciona un ambi<strong>en</strong>te más homogéneo para comparar los cuatro<br />

lotes.<br />

En g<strong>en</strong>eral, estas agrupaciones para obt<strong>en</strong>er homog<strong>en</strong>eidad se l<strong>la</strong>man bloques (blocks) y<br />

<strong>la</strong> aleatorización se restringe ahora d<strong>en</strong>tro de cada bloque. Este diseño permite, además, que <strong>la</strong><br />

variación de los bloques (coches) sea indep<strong>en</strong>di<strong>en</strong>te, por lo que podemos separar<strong>la</strong> del término<br />

del error. El modelo es<br />

y <br />

e<br />

ij<br />

donde i repres<strong>en</strong>ta el efecto del bloque.<br />

Podemos realizar <strong>en</strong> este caso un análisis de <strong>la</strong> varianza de dos factores (sin<br />

interacciones).<br />

Ejemplo 1 (cont.):<br />

Reord<strong>en</strong>ando los datos<br />

Lote<br />

Coche<br />

A B C D yi<br />

I 17 14 12 13 56<br />

II 14 14 12 11 51<br />

III 13 13 10 11 47<br />

IV 13 8 9 9 39<br />

y 57 49 43 44 y <br />

=193<br />

i<br />

j<br />

yij 2 823 625 469 492 <br />

i,<br />

j<br />

<strong>Tema</strong> 3 2 de 9<br />

i<br />

j<br />

ij<br />

y<br />

2<br />

ij =2409


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

SC<br />

SC<br />

total<br />

lotes<br />

<br />

y<br />

2<br />

2 <br />

yij<br />

<br />

i,<br />

j N<br />

2<br />

y<br />

j y<br />

<br />

n N<br />

j<br />

2<br />

<br />

193<br />

2409 <br />

16<br />

57<br />

<br />

4<br />

2<br />

49<br />

<br />

4<br />

2<br />

2<br />

<br />

43<br />

<br />

4<br />

80.<br />

94<br />

44<br />

<br />

4<br />

193<br />

<br />

16<br />

30.<br />

69<br />

SCcoches<br />

2 2<br />

yi<br />

y<br />

<br />

i n N<br />

2 2 2 2 2<br />

56 51 47 39 193<br />

38.<br />

69<br />

4 4 4 4 16<br />

SCerror<br />

SCtotal<br />

SClotes<br />

SCcoches<br />

80. 94 30.<br />

69 38.<br />

69 11.<br />

56<br />

Nos da <strong>la</strong> tab<strong>la</strong> ANOVA<br />

Fu<strong>en</strong>te<br />

variación<br />

de g.d.l. SC CM E(CM)<br />

Lotes 3 30.69 10.23<br />

2<br />

e 4<br />

Coches 3 38.69 12.9 2 2<br />

e 4 <br />

Error 9 11.56 1.3 2<br />

e<br />

Total 15 80.94<br />

<strong>Tema</strong> 3 3 de 9<br />

2<br />

Para contrastar H 0 : A <br />

B<br />

C D , t<strong>en</strong>emos<br />

10.<br />

23<br />

F 7.<br />

87 6.<br />

99 F3,<br />

9;<br />

0.<br />

01.<br />

1.<br />

3<br />

Por consigui<strong>en</strong>te, rechazo <strong>la</strong> hipótesis de que <strong>la</strong>s medias por lotes son iguales (recuérdese que <strong>en</strong><br />

el diseño completam<strong>en</strong>te aleatorizado no podíamos rechazar<strong>la</strong>; sin embargo, al eliminar <strong>la</strong><br />

influ<strong>en</strong>cia de los bloques – coches – hemos reducido <strong>la</strong> varianza estimada de 4.2 a 1.3).<br />

También podemos contrastar H 0 : I II III IV , es decir, que el desgaste medio es igual<br />

<strong>en</strong> todos los coches:<br />

12.<br />

9<br />

F 9.<br />

92 6.<br />

99 ,<br />

1.<br />

3<br />

que también es rechazada al nivel del 1%. Por consigui<strong>en</strong>te, se detectan difer<strong>en</strong>cias de coche a<br />

coche.<br />

Consideremos un diseño con tres tratami<strong>en</strong>tos realizados así:<br />

Bloque 1 Bloque 2<br />

Trat. 3 Trat. 2<br />

Trat. 1 Trat. 3<br />

Trat. 2 Trat. 1<br />

Cada bloque se divide <strong>en</strong> k subbloques de igual tamaño. D<strong>en</strong>tro de cada bloque los k<br />

tratami<strong>en</strong>tos se asignan aleatoriam<strong>en</strong>te a los subbloques. Cada bloque es completo <strong>en</strong> el s<strong>en</strong>tido<br />

de que conti<strong>en</strong>e todos los tratami<strong>en</strong>tos.<br />

En g<strong>en</strong>eral, un bloque corresponde con una repetición del experim<strong>en</strong>to bajo condiciones<br />

equiparables. Cada bloque se divide <strong>en</strong> k subbloques y el número n de bloques es el número de<br />

repeticiones requeridas <strong>en</strong> el diseño. El propósito principal al agrupar <strong>en</strong> bloques es eliminar <strong>la</strong><br />

variación debida a difer<strong>en</strong>cias <strong>en</strong>tre los bloques del error experim<strong>en</strong>tal (es decir, t<strong>en</strong>er un cierto<br />

grado de control sobre <strong>la</strong> heterog<strong>en</strong>eidad de <strong>la</strong>s unidades experim<strong>en</strong>tales).<br />

Aunque los bloques pued<strong>en</strong> considerarse como un factor aleatorio, lo trataremos como<br />

fijo ya que no altera el análisis mi<strong>en</strong>tras que nuestro interés recaiga <strong>en</strong> <strong>la</strong> eliminación de los<br />

efectos de los bloques del error experim<strong>en</strong>tal y mi<strong>en</strong>tras que los tests estadísticos se reduzcan a<br />

los efectos de los tratami<strong>en</strong>tos.<br />

2<br />

2


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

Observaciones:<br />

Aunque <strong>en</strong> este ejemplo se ha separado un efecto debido a los coches (bloques), el objetivo<br />

principal sigue si<strong>en</strong>do contrastar difer<strong>en</strong>cias <strong>en</strong>tre lotes. Sigue si<strong>en</strong>do un experim<strong>en</strong>to<br />

unifactorial; los bloques sólo repres<strong>en</strong>tan una restricción sobre <strong>la</strong> aleatorización completa<br />

debida al ambi<strong>en</strong>te <strong>en</strong> el que se desarrol<strong>la</strong> el experim<strong>en</strong>to.<br />

Cuando los datos se pres<strong>en</strong>tan <strong>en</strong> forma tabu<strong>la</strong>r, se sugiere que se dibuj<strong>en</strong> líneas verticales u<br />

horizontales (simples, dobles, etc.) para indicar <strong>la</strong>s <strong>restricciones</strong> <strong>en</strong> <strong>la</strong> aleatorización.<br />

Como realizar bloques es un procedimi<strong>en</strong>to muy útil para reducir el error experim<strong>en</strong>tal,<br />

haremos un nuevo ejemplo para ilustrar <strong>la</strong> situación <strong>en</strong> <strong>la</strong> que se observan <strong>la</strong>s mismas unidades<br />

experim<strong>en</strong>tales (animales, personas, etc.) antes del experim<strong>en</strong>to y al concluir el mismo. Son los<br />

diseños antes-después (pre-post contraste), que pued<strong>en</strong> tratarse como diseño de bloques<br />

aleatorizado donde <strong>la</strong>s unidades experim<strong>en</strong>tales son bloques. El interés primordial está <strong>en</strong> el<br />

efecto del tratami<strong>en</strong>to y se pued<strong>en</strong> “eliminar” los efectos de los bloques para reducir el error<br />

experim<strong>en</strong>tal. En algunos textos también se l<strong>la</strong>man diseños de medidas repetidas (Winer;<br />

repeated-measures designs).<br />

Ejemplo 2:<br />

Un estudio sobre <strong>la</strong> medida de fuerza física sobre 7 individuos antes y después de un periodo de<br />

<strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to da los valores<br />

Individuos Pretest Posttest<br />

1 100 115<br />

2 110 125<br />

3 90 105<br />

4 110 130<br />

5 125 140<br />

6 130 140<br />

7 105 125<br />

Podemos considerarlo como un contraste de datos apareados ( H 0 : d<br />

d medida posttest-medida pretest.<br />

T<strong>en</strong>emos<br />

d 15.<br />

71<br />

0 ) donde<br />

Sd<br />

<strong>3.</strong><br />

45<br />

y<br />

d <br />

t 12.<br />

05<br />

S n<br />

que es muy significativa (p-valor 0.00002) para 6 g.d.l.<br />

Si lo consideramos como un experim<strong>en</strong>to unifactorial con dos niveles (pre y post) con<br />

siete bloques, nos lleva a un diseño por bloques aleatorizado y el ANOVA es<br />

Fu<strong>en</strong>te de variación g.d.l. SC CM F p-valor<br />

Tratami<strong>en</strong>tos (test) 1 864.29 864.29 145.25 0.00002<br />

Bloques (individuos) 6 2085.71 347.62 58.42


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

ANOVA<br />

Para el diseño por bloques completos aleatorizado el modelo es yij i<br />

<br />

j eij<br />

o<br />

y <br />

y con <strong>la</strong> verdadera media del bloque i.<br />

bi<strong>en</strong> <br />

ij<br />

i<br />

j<br />

ij i j<br />

Los mejores estimadores de <strong>la</strong>s medias pob<strong>la</strong>cionales son <strong>la</strong>s correspondi<strong>en</strong>tes medias<br />

muestrales (tanto por el método de mínimos cuadrados, que es el que se usa para obt<strong>en</strong>er los<br />

estimadores de los parámetros del ANOVA, como si utilizamos el método de máxima<br />

verosimilitud), luego<br />

y y y y y y y <br />

yij y <br />

i<br />

<br />

j <br />

ij i<br />

j<br />

y<br />

de donde, elevando al cuadrado y sumando <strong>en</strong> todos los valores posibles, se obti<strong>en</strong>e<br />

k<br />

n<br />

<br />

j1<br />

i1<br />

n<br />

k<br />

n k<br />

2<br />

2<br />

2<br />

yy = kyy<br />

+ nyy<br />

+ yyyy ij<br />

<br />

<br />

i 1<br />

i<br />

<br />

<strong>Tema</strong> 3 5 de 9<br />

<br />

j<br />

1<br />

j<br />

<br />

i<br />

<br />

i1<br />

j1<br />

pues los tres productos cruzados se anu<strong>la</strong>n, por lo que <strong>la</strong> ecuación fundam<strong>en</strong>tal del análisis de <strong>la</strong><br />

varianza bifactorial es<br />

SCT SCB SCTr <br />

SCE (1)<br />

total bloques tratami<strong>en</strong>tos<br />

error<br />

donde <strong>la</strong>s sumas de cuadrados ti<strong>en</strong><strong>en</strong> asociados, respectivam<strong>en</strong>te, unos grados de libertad<br />

( nk 1)<br />

( n 1)<br />

( k 1)<br />

( n 1)(<br />

k 1)<br />

<br />

<br />

<br />

<br />

total<br />

bloques<br />

j1<br />

i1<br />

tratami<strong>en</strong>tos<br />

Además, desarrol<strong>la</strong>ndo <strong>la</strong>s sumas de cuadrados anteriores, se pued<strong>en</strong> obt<strong>en</strong>er <strong>la</strong>s<br />

expresiones<br />

k n<br />

k n<br />

2<br />

2<br />

2 y<br />

SCT = yij<br />

y <br />

= y<br />

ij <br />

N<br />

n<br />

SCB = kyy<br />

<br />

i<br />

1<br />

i<br />

<br />

k<br />

SCTr = nyy<br />

<br />

j<br />

1<br />

j<br />

n k<br />

SCE = yyyy <br />

i1<br />

j1<br />

ij<br />

i<br />

j<br />

<br />

2<br />

=<br />

<br />

i<br />

1<br />

<br />

2<br />

k<br />

2<br />

=<br />

=<br />

j1<br />

i1<br />

n<br />

<br />

i1<br />

n<br />

<br />

j1<br />

i1<br />

k<br />

<br />

j1<br />

y<br />

yi<br />

k<br />

error<br />

2<br />

<br />

<br />

2<br />

y j<br />

n<br />

<br />

2<br />

y<br />

N<br />

2<br />

y<br />

N<br />

ij<br />

<br />

i<br />

j<br />

n 2 k 2 2<br />

y y<br />

i<br />

j y<br />

<br />

k n N<br />

2<br />

ij<br />

<br />

i1<br />

j1<br />

SCB SCTr SCE<br />

Los cuadrados medios , , son cuadrados medios indep<strong>en</strong>di<strong>en</strong>tes<br />

n 1<br />

k 1<br />

n1k1 2<br />

2<br />

con distribución (y estimadores insesgados, bajo H 0 , de ). Se obti<strong>en</strong>e <strong>la</strong> tab<strong>la</strong><br />

Fu<strong>en</strong>te g.d.l. SC CM<br />

Bloques n-1 <br />

<br />

n<br />

2<br />

k y i y<br />

SCB<br />

n 1<br />

k<br />

Tratami<strong>en</strong>tos k-1 nyy<br />

<br />

j<br />

1<br />

j<br />

n k<br />

Error (n-1)(k-1) yyyy <br />

i1<br />

j1<br />

k n<br />

Total nk-1=N-1 yy ij<br />

<br />

j1<br />

i1<br />

i<br />

ij<br />

<br />

j<br />

<br />

2<br />

2<br />

<br />

2<br />

<br />

2<br />

SCTr<br />

k 1<br />

SCE<br />

1 k <br />

n 1


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

Omisión de observaciones<br />

En ocasiones se pierd<strong>en</strong> algunas observaciones de un diseño por bloques: se muere un<br />

animal, explota una rueda, etc.; por consigui<strong>en</strong>te, al m<strong>en</strong>os t<strong>en</strong>emos una observación perdida.<br />

Para el diseño completam<strong>en</strong>te aleatorizado unifactorial esto no repres<strong>en</strong>ta ningún<br />

problema, ya que el análisis de <strong>la</strong> varianza puede realizarse con n j distintas.<br />

Para un análisis bifactorial (two-way) significa una pérdida de ortogonalidad, ya que para<br />

al m<strong>en</strong>os un bloque no se verifica 0 y para al m<strong>en</strong>os un tratami<strong>en</strong>to 0 tampoco<br />

j<br />

j<br />

se verifica.<br />

Si esto ocurre, el procedimi<strong>en</strong>to habitual es reemp<strong>la</strong>zar el valor por uno que haga mínima<br />

<strong>la</strong> suma de cuadrados de los errores.<br />

Ejemplo 1 (cont.):<br />

Consideremos nuevam<strong>en</strong>te el ejemplo de los coches. Si se estropea el lote C del coche III (y<br />

restamos 13 a los datos)<br />

Lote<br />

Coche<br />

A B C D Ti<br />

I 4 1 -1 0 4<br />

II<br />

III<br />

1<br />

0<br />

1<br />

0<br />

-1<br />

y<br />

-2<br />

-2<br />

-1<br />

y -2<br />

IV 0 -5 -4 -4 -13<br />

T j<br />

Entonces t<strong>en</strong>emos<br />

5 -3 y -6 -8 T <br />

= y -12<br />

k n<br />

n 2 k 2 2 y<br />

2 yi<br />

j y<br />

SCE = SCT SCTr SCB = yij<br />

=<br />

j1<br />

i1<br />

i1<br />

k j1<br />

n nk<br />

2 2<br />

2 2 2 2<br />

2<br />

2<br />

2<br />

2 2 2<br />

2 5 <br />

<br />

3<br />

y 6<br />

8<br />

4 1 y 2<br />

13 y 12<br />

4 1<br />

1<br />

<br />

4 <br />

<br />

<br />

4<br />

4<br />

16<br />

2<br />

2<br />

2<br />

2 98 y 36 12y<br />

186 y 4 4y<br />

y 144<br />

24y<br />

9 2 5<br />

= y 86 <br />

<br />

<br />

= y y 14<br />

4<br />

4<br />

16 16 2<br />

que, al minimizar respecto a y ,<br />

d<br />

SCE dy<br />

9 5<br />

y <br />

8 2<br />

<strong>Tema</strong> 3 6 de 9<br />

<br />

9 5<br />

20<br />

y 0 y <br />

8 2<br />

9<br />

nos da que el valor numérico perdido debería ser sustituido por<br />

20<br />

y <br />

9<br />

20<br />

Reemp<strong>la</strong>zando <strong>la</strong> y de <strong>la</strong> tab<strong>la</strong> por , t<strong>en</strong>dremos un ANOVA aproximado (ahora <strong>la</strong>s sumas<br />

9<br />

de cuadrados no serán insesgadas).<br />

Fu<strong>en</strong>te de g.d.l. SC CM F p-valor<br />

variación<br />

Lotes 3 38.32 12.77 3 <br />

Coches 3 28.76 9.58 6<br />

9.1075


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

El resultado no es muy difer<strong>en</strong>te al original, aunque hemos perdido un grado de libertad para los<br />

errores.<br />

Podemos repetir el proceso cuando hay más de una observación perdida, obt<strong>en</strong>i<strong>en</strong>do <strong>en</strong><br />

ese caso un sistema de m ecuaciones con m incógnitas (si<strong>en</strong>do m el número de omisiones). Esto<br />

será válido mi<strong>en</strong>tras m no sea un valor muy grande.<br />

En g<strong>en</strong>eral, si se ha perdido <strong>la</strong> observación (i,j), podemos poner<br />

' ' '<br />

ny ' i<br />

ky<br />

j y<br />

yij<br />

<br />

n1k1 donde los apóstrofes indican que <strong>la</strong> operación realizada se ha hecho con los valores numéricos<br />

'<br />

observados ( y j y<br />

j y , donde y es <strong>la</strong> observación perdida anterior).<br />

Diseño para comparar pares aleatorizados.<br />

Muy frecu<strong>en</strong>tem<strong>en</strong>te podemos aum<strong>en</strong>tar considerablem<strong>en</strong>te <strong>la</strong> precisión si hacemos <strong>la</strong>s<br />

comparaciones d<strong>en</strong>tro de pares asociados (matched pairs) de material experim<strong>en</strong>tal. La<br />

aleatorización nuevam<strong>en</strong>te garantiza <strong>la</strong> validez de dichos experim<strong>en</strong>tos.<br />

Ejemplo 3:<br />

Consideremos <strong>la</strong>s medidas del deterioro de <strong>la</strong>s sue<strong>la</strong>s de los zapatos usados por 10 niños.<br />

Las sue<strong>la</strong>s estaban hechas de dos materiales sintéticos difer<strong>en</strong>tes, A y B. Puede hacerse un<br />

diagrama con los datos de <strong>la</strong> tab<strong>la</strong> adjunta de manera que se observe que los resultados se<br />

superpon<strong>en</strong> y parec<strong>en</strong> sugerir, a primera vista, que no hay un material mejor que el otro.<br />

Un hecho importante de este experim<strong>en</strong>to, que lo difer<strong>en</strong>cia de los hechos hasta ahora, es que se<br />

realizó por pares.<br />

Cada niño llevaba un par especial de zapatos, con una sue<strong>la</strong> hecha con el material A y <strong>la</strong> otra con<br />

el B. La decisión sobre qué sue<strong>la</strong> (derecha o izquierda) llevaba el material A o el B fue aleatoria<br />

(con una moneda, por ejemplo). Las difer<strong>en</strong>cias B-A para cada niño indican con c<strong>la</strong>ridad que el<br />

material A muestra habitualm<strong>en</strong>te m<strong>en</strong>os desgaste que el B.<br />

Los resultados obt<strong>en</strong>idos se pres<strong>en</strong>tan <strong>en</strong> <strong>la</strong> tab<strong>la</strong> adjunta, donde junto con el desgaste del<br />

material A aparece, <strong>en</strong>tre paréntesis, el pie <strong>en</strong> el que se hizo el experim<strong>en</strong>to con dicho material.<br />

Niño Material A Material B B-A yi. <br />

j<br />

1 1<strong>3.</strong>2 (I) 14 0.8 27.2 370.24<br />

2 8.2 (I) 8.8 0.6 17 144.68<br />

3 9 (D) 11.2 0.3 22.1 244.25<br />

4 14.3 (I) 14.2 -0.1 28.5 406.13<br />

5 10.7 (D) 11.8 1.1 22.5 25<strong>3.</strong>73<br />

6 6.6 (I) 6.4 -0.2 13 84.52<br />

7 9.5 (I) 9.8 0.3 19.3 186.29<br />

8 10.8 (I) 11.3 0.5 22.1 244.33<br />

9 8.8 (D) 9.3 0.5 18.1 16<strong>3.</strong>93<br />

10 1<strong>3.</strong>3 (I) 1<strong>3.</strong>6 0.3 26.9 361.85<br />

y . j<br />

106.3 110.4 4.1 216.7<br />

i<br />

yij 2 1184.05 1275.9 2459.95<br />

<strong>Tema</strong> 3 7 de 9<br />

yij 2


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

2<br />

2<br />

2 y..<br />

216.<br />

7<br />

SCT yij<br />

2459.<br />

95 112.<br />

0055 19 g.d.l.<br />

N<br />

20<br />

2<br />

2<br />

2<br />

106.<br />

3 110.<br />

4 216.<br />

7<br />

SCTr <br />

0.<br />

8405<br />

10 20<br />

1 g.d.l. CMTr 0.<br />

8405<br />

2 2<br />

2<br />

2<br />

27.<br />

2 17<br />

<br />

26.<br />

9 216.<br />

7<br />

SCB <br />

110.<br />

4905<br />

2<br />

20<br />

SCE SCT SCTr SCB 0.<br />

6745<br />

<br />

9 g.d.l. CMB 12.<br />

27672<br />

<br />

9 g.d.l. CME 0.<br />

07494<br />

DISEÑOS UNIFACTORIALES <strong>CON</strong> MEDIDAS REPETIDAS<br />

(Single-factor experim<strong>en</strong>ts with repeated measures)<br />

En <strong>la</strong>s ci<strong>en</strong>cias sociales los elem<strong>en</strong>tos que constituy<strong>en</strong> habitualm<strong>en</strong>te una pob<strong>la</strong>ción<br />

estadística son personas. Debido a sus difer<strong>en</strong>tes experi<strong>en</strong>cias y anteced<strong>en</strong>tes, <strong>la</strong>s respuestas de <strong>la</strong><br />

g<strong>en</strong>te a un mismo tratami<strong>en</strong>to experim<strong>en</strong>tal pres<strong>en</strong>tan una gran variabilidad. En muchos casos, <strong>la</strong><br />

mayor parte de <strong>la</strong> variabilidad se debe a difer<strong>en</strong>cias exist<strong>en</strong>tes <strong>en</strong>tre <strong>la</strong>s personas antes de realizar<br />

el experim<strong>en</strong>to. Si se puede separar esta variabilidad a priori de los efectos de los tratami<strong>en</strong>tos y<br />

del error experim<strong>en</strong>tal, se podrá aum<strong>en</strong>tar <strong>la</strong> s<strong>en</strong>sibilidad del experim<strong>en</strong>to. Si no pudiera<br />

estimarse, seguiría formado parte de <strong>la</strong>s fu<strong>en</strong>tes de variabilidad incontro<strong>la</strong>das y, por<br />

consigui<strong>en</strong>te, formaría parte automáticam<strong>en</strong>te del error experim<strong>en</strong>tal.<br />

Uno de los objetivos primordiales de los experim<strong>en</strong>tos <strong>en</strong> los que se observa a un mismo<br />

sujeto bajo difer<strong>en</strong>tes tratami<strong>en</strong>tos (todos los posibles) es proporcionar un control de <strong>la</strong>s<br />

difer<strong>en</strong>cias <strong>en</strong>tre los sujetos. En este tipo de experim<strong>en</strong>tos, los efectos del tratami<strong>en</strong>to para el<br />

sujeto i se mid<strong>en</strong> <strong>en</strong> re<strong>la</strong>ción a <strong>la</strong> respuesta media de dicho sujeto para todos los tratami<strong>en</strong>tos. En<br />

este s<strong>en</strong>tido, cada sujeto sirve como su propio control. Por lo tanto, <strong>la</strong> variabilidad debida a<br />

difer<strong>en</strong>cias <strong>en</strong> <strong>la</strong> “respuesta media” (average responsiv<strong>en</strong>ess) de los individuos es eliminada del<br />

error experim<strong>en</strong>tal (si el modelo es aditivo).<br />

Los experim<strong>en</strong>tos <strong>en</strong> los que se usan los mismos elem<strong>en</strong>tos bajo los k tratami<strong>en</strong>tos<br />

precisan k observaciones de cada elem<strong>en</strong>to (de ahí el término de medidas repetidas que aparece<br />

<strong>en</strong> algunos libros para este <strong>en</strong>foque, como por ejemplo <strong>en</strong> Winer pág. 261, aunque, como<br />

veremos a continuación, puede verse como una aplicación del diseño de bloques completos que<br />

acabamos de introducir <strong>en</strong> este tema).<br />

Ya que <strong>la</strong>s características únicas de los elem<strong>en</strong>tos individuales permanec<strong>en</strong> constantes<br />

bajo los difer<strong>en</strong>tes tratami<strong>en</strong>tos, los pares de observaciones sobre los mismos elem<strong>en</strong>tos están<br />

positivam<strong>en</strong>te corre<strong>la</strong>cionados (<strong>la</strong>s observaciones serán dep<strong>en</strong>di<strong>en</strong>tes; téngase <strong>en</strong> cu<strong>en</strong>ta que bajo<br />

<strong>la</strong> distribución normal multivariante los términos dep<strong>en</strong>di<strong>en</strong>tes y corre<strong>la</strong>dos son equival<strong>en</strong>tes).<br />

ANOVA<br />

Consideremos y ij <strong>la</strong> observación o medida del tratami<strong>en</strong>to j sobre el individuo i<br />

( j 1, ,<br />

k , i 1, ,<br />

n ). L<strong>la</strong>mamos, como hasta ahora,<br />

y<br />

k<br />

n<br />

n k<br />

i.<br />

yij<br />

y.<br />

j yij<br />

y..<br />

yi.<br />

y.<br />

j <br />

j1<br />

i1<br />

i<br />

j i1<br />

j1<br />

k<br />

n<br />

n k<br />

1<br />

1<br />

1<br />

y i.<br />

yij<br />

y . j yij<br />

y .. y<br />

ij<br />

k j1<br />

n i1<br />

kn i1<br />

j1<br />

En el análisis de este tipo de experim<strong>en</strong>tos, <strong>la</strong> variación total se divide <strong>en</strong> dos: una parte<br />

es función de <strong>la</strong>s difer<strong>en</strong>cias <strong>en</strong>tre <strong>la</strong>s medias de <strong>la</strong>s personas y <strong>la</strong> otra es función de <strong>la</strong> variación<br />

ponderada d<strong>en</strong>tro de los individuos.<br />

<strong>Tema</strong> 3 8 de 9<br />

y<br />

ij


Diseño de <strong>Experim<strong>en</strong>tos</strong><br />

<br />

La variación total es y y <br />

SCtotal ij .. suma de los cuadrados de <strong>la</strong>s desviaciones<br />

de cada observación respecto a <strong>la</strong> media g<strong>en</strong>eral (grand mean). Esta fu<strong>en</strong>te de variación ti<strong>en</strong>e<br />

nk 1<br />

grados de libertad.<br />

La parte de <strong>la</strong> variación debida a <strong>la</strong>s difer<strong>en</strong>cias <strong>en</strong>tre <strong>la</strong>s medias de <strong>la</strong> g<strong>en</strong>te es<br />

SC<br />

<strong>en</strong>tre<br />

k<br />

n<br />

<br />

i 1<br />

yy i.<br />

..<br />

2<br />

<strong>Tema</strong> 3 9 de 9<br />

2<br />

, es decir, <strong>la</strong> variación <strong>en</strong>tre <strong>la</strong> g<strong>en</strong>te es una función de <strong>la</strong>s variaciones al<br />

cuadrado de <strong>la</strong>s medias de los individuos respecto a <strong>la</strong> media g<strong>en</strong>eral (también puede verse como<br />

debida a <strong>la</strong>s difer<strong>en</strong>cias <strong>en</strong>tre todos los posibles pares de y i.<br />

). Ti<strong>en</strong>e n 1<br />

grados de libertad.<br />

k<br />

La variación d<strong>en</strong>tro de <strong>la</strong> persona i es SC yy d<strong>en</strong>tro<br />

i<br />

<br />

j 1<br />

ij<br />

i.<br />

2<br />

, suma de los cuadrados<br />

de <strong>la</strong>s desviaciones de <strong>la</strong>s observaciones de <strong>la</strong> persona i respecto a su media. Esta fu<strong>en</strong>te de<br />

variación ti<strong>en</strong>e k 1<br />

grados de libertad.<br />

La variación ponderada d<strong>en</strong>tro de <strong>la</strong>s personas vi<strong>en</strong>e dada por<br />

SC<br />

d<strong>en</strong>tro<br />

<br />

n<br />

<br />

i1<br />

SC<br />

d<strong>en</strong>tro<br />

i<br />

<br />

n<br />

k<br />

<br />

i1<br />

j1<br />

yy ij<br />

i.<br />

2<br />

. Como <strong>la</strong> variación d<strong>en</strong>tro de cada persona ti<strong>en</strong>e k 1<br />

grados de libertad, t<strong>en</strong>dremos n ( k 1)<br />

grados de libertad.<br />

Las variaciones <strong>en</strong>tre y d<strong>en</strong>tro de <strong>la</strong>s personas son estadísticam<strong>en</strong>te indep<strong>en</strong>di<strong>en</strong>tes y se<br />

ti<strong>en</strong>e<br />

SCtotal SCd<strong>en</strong>tro<br />

SC<strong>en</strong>tre<br />

(2)<br />

con sus correspondi<strong>en</strong>tes grados de libertad nk 1<br />

= n ( k 1)<br />

+ n 1<br />

La difer<strong>en</strong>cia <strong>en</strong>tre dos observaciones de una misma persona dep<strong>en</strong>d<strong>en</strong> <strong>en</strong> parte de <strong>la</strong>s<br />

difer<strong>en</strong>cias <strong>en</strong> los efectos de los tratami<strong>en</strong>tos y, <strong>en</strong> parte, <strong>en</strong> fu<strong>en</strong>tes de variación incontro<strong>la</strong>das o<br />

residuales. Por consigui<strong>en</strong>te, <strong>la</strong> variación d<strong>en</strong>tro de <strong>la</strong>s personas puede dividirse <strong>en</strong> dos: una parte<br />

que dep<strong>en</strong>de de <strong>la</strong>s difer<strong>en</strong>cias <strong>en</strong>tre <strong>la</strong>s medias de los tratami<strong>en</strong>tos y otro que consiste <strong>en</strong><br />

variación residual. La que dep<strong>en</strong>de de difer<strong>en</strong>cias <strong>en</strong> los tratami<strong>en</strong>tos se define como<br />

SC<br />

tratami<strong>en</strong>tos<br />

n<br />

k<br />

<br />

j 1<br />

yy 2<br />

. j .. . Esta fu<strong>en</strong>te ti<strong>en</strong>e 1<br />

k grados de libertad.<br />

n k<br />

La variación residual es SC yyyyyy residuos<br />

<br />

i1<br />

j1<br />

ij<br />

2<br />

.. i.<br />

.. . j .. y repres<strong>en</strong>ta<br />

aquel<strong>la</strong>s fu<strong>en</strong>tes de variación <strong>en</strong> el total que no pued<strong>en</strong> atribuirse a difer<strong>en</strong>cias <strong>en</strong>tre <strong>la</strong>s personas<br />

y a difer<strong>en</strong>cias <strong>en</strong>tre los tratami<strong>en</strong>tos; sus grados de libertad quedan<br />

gdl( res.)<br />

gdl(<br />

total)<br />

gdl(<br />

<strong>en</strong>tre)<br />

gdl(<br />

tratami<strong>en</strong>tos)<br />

Además, son estadísticam<strong>en</strong>te indep<strong>en</strong>di<strong>en</strong>tes y<br />

=( nk 1)-(<br />

n 1<br />

)-( k 1)<br />

= ( k 1)( n 1)<br />

SC SC SC (3)<br />

d<strong>en</strong>tro<br />

tratami<strong>en</strong>tos<br />

n ( k 1)<br />

=( k 1)+<br />

( k 1)( n 1)<br />

Puede observarse que esta descomposición de <strong>la</strong> suma de cuadrados total (componi<strong>en</strong>do<br />

(2) y (3)) coincide con <strong>la</strong> descomposición que aparecería de haber considerado a los individuos<br />

como bloques (ver (1)).<br />

residuos

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!