01.11.2014 Views

Prácticas de Estadística en R - Departamento de Estadística e ...

Prácticas de Estadística en R - Departamento de Estadística e ...

Prácticas de Estadística en R - Departamento de Estadística e ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

86 10. Tests <strong>de</strong> bondad <strong>de</strong> ajuste<br />

10.2.3. Diagnosis <strong>de</strong>l mo<strong>de</strong>lo<br />

Vamos a utilizar dos contrastes <strong>de</strong> hipótesis sobre la distribución <strong>de</strong> la variable tiempos.<br />

El primero es el contraste χ 2 <strong>de</strong> Pearson. En primer lugar, este contraste especifica<br />

la hipótesis nula H 0 <strong>de</strong> que la distribución g<strong>en</strong>eradora <strong>de</strong> los datos es F 0 y una hipótesis<br />

alternativa H 1 <strong>de</strong> que la distribución g<strong>en</strong>eradora <strong>de</strong> los datos no es F 0 . Este contraste<br />

está basado <strong>en</strong> la comparación <strong>de</strong> las frecu<strong>en</strong>cias absolutas observadas con la muestra<br />

comparadas con las frecu<strong>en</strong>cias absolutas esperadas con la muestra. El contraste se<br />

construye como sigue:<br />

1. Crear k clases como hemos hecho para el histograma y calcular O i , la frecu<strong>en</strong>cia<br />

absoluta <strong>de</strong> datos <strong>en</strong> la clase i.<br />

2. Calcular la probabilidad p i que la distribución F 0 asigna a cada clase. Entonces, el<br />

número <strong>de</strong> datos esperados <strong>en</strong> la clase i es E i = np i .<br />

3. Calcular la discrepancia <strong>en</strong>tre lo observado y lo esperado mediante:<br />

X 2 =<br />

k∑ (O i − E i ) 2<br />

E<br />

i=1 i<br />

que se distribuye como una χ 2 cuando la distribución especificada F 0 es correcta.<br />

Los grados <strong>de</strong> libertad <strong>de</strong> esta distribución son k − r − 1 don<strong>de</strong> r es el número <strong>de</strong><br />

parámetros estimados <strong>de</strong> la distribución F 0 .<br />

4. La hipótesis nula H 0 (la distribución g<strong>en</strong>eradora <strong>de</strong> los datos es F 0 ) se rechaza si<br />

la probabilidad <strong>de</strong> obt<strong>en</strong>er una discrepancia mayor o igual que la observada es lo<br />

sufici<strong>en</strong>tem<strong>en</strong>te baja. En otras palabras, cuando X 2 ≥ χ 2 k−r−1,α<br />

para un cierto α<br />

pequeño.<br />

Vamos a realizar este contraste para nuestros datos. Para ello, <strong>de</strong>finimos el número<br />

<strong>de</strong> clases n.cl y a las frecu<strong>en</strong>cias <strong>de</strong> cada clase O:<br />

> n.cl=8<br />

> puntos=min(tiempos)+(0:n.cl)*(max(tiempos)-min(tiempos))/n.cl<br />

> O=table(cut(tiempos,breaks=puntos))<br />

> O<br />

(1.16,1.22] (1.22,1.29] (1.29,1.35] (1.35,1.42] (1.42,1.48] (1.48,1.55]<br />

(1.55,1.61] (1.61,1.68]<br />

2 6 6 14 10 5 5 6<br />

A continuación <strong>de</strong>bemos calcular las frecu<strong>en</strong>cias absolutas esperadas para la primera<br />

distribución candidata que es la N(1,4254, 0,1231). Para ello, <strong>de</strong>finimos el vector E:<br />

> library(MASS)<br />

> ajuste.normal=fitdistr(tiempos,"normal")

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!