01.11.2014 Views

Prácticas de Estadística en R - Departamento de Estadística e ...

Prácticas de Estadística en R - Departamento de Estadística e ...

Prácticas de Estadística en R - Departamento de Estadística e ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

84 10. Tests <strong>de</strong> bondad <strong>de</strong> ajuste<br />

Vemos cuáles son las estimaciones máximo verosimiles <strong>de</strong> los parámetros, que coinci<strong>de</strong>n<br />

prácticam<strong>en</strong>te con el resultado que da la función mean y la función sd. Esta última<br />

función da la cuasi-<strong>de</strong>sviación típica, <strong>en</strong> lugar <strong>de</strong> la <strong>de</strong>sviación típica y por eso existe<br />

esta pequeña difer<strong>en</strong>cia. Guardamos los valores obt<strong>en</strong>idos <strong>en</strong> mu.tiempos y sd.tiempos:<br />

> mu.tiempos=as.numeric(ajuste.normal$estimate[1])<br />

> sd.tiempos=as.numeric(ajuste.normal$estimate[2])<br />

Una vez que hemos hecho el ajuste, vamos a hacer tres gráficos, que nos van a<br />

permitir comparar: (1) el histograma <strong>de</strong> los tiempos con respecto a la <strong>de</strong>nsidad <strong>de</strong> la<br />

normal; (2) la función <strong>de</strong> distribución empírica <strong>de</strong> los datos con respecto a la función <strong>de</strong><br />

distribución <strong>de</strong> una normal y (3) los cuantiles <strong>de</strong> los datos con respecto a los cuantiles<br />

<strong>de</strong> la distribución normal. Recordamos que la función <strong>de</strong> distribución empírica <strong>de</strong> una<br />

muestra está dada por:<br />

⎧<br />

⎨<br />

F n (x) =<br />

⎩<br />

0 si x < x (1) ,<br />

r<br />

n<br />

si x (r) ≤ x < x (r+1) ,<br />

1 si x (n) ≤ x.<br />

Para hacer los gráficos recordamos que el valor mínino y el máximo <strong>de</strong> los datos eran<br />

1.160 y 1.680, respectivam<strong>en</strong>te. Entonces:<br />

> par(mfrow=c(1,3))<br />

> x=seq(1.16,1.68,by=.01)<br />

> hist(tiempos,breaks=puntos,freq=FALSE)<br />

> lines(x,dnorm(x,mu.tiempos,sd.tiempos))<br />

> plot(ecdf(tiempos),do.points=F)<br />

> lines(x,pnorm(x,mu.tiempos,sd.tiempos))<br />

> tiempos.tip=(tiempos-mean(tiempos))/sd(tiempos)<br />

> qqnorm(tiempos.tip)<br />

> abline(0,1)<br />

Todo ello parece indicar que la distribución normal pue<strong>de</strong> ser una clara candidata<br />

para los datos. Pero no ti<strong>en</strong>e porque ser la única que po<strong>de</strong>mos usar para el ajuste.<br />

Como hemos dicho antes, también po<strong>de</strong>mos int<strong>en</strong>tar la Weibull o la log-normal. Empezamos<br />

con la Weibull. Recordamos que la distribución Weibull ti<strong>en</strong>e dos parámetros,<br />

que aquí aparec<strong>en</strong> con los nombres <strong>de</strong> shape y scale, respectivam<strong>en</strong>te.<br />

> ?rweibull<br />

> ajuste.weibull=fitdistr(tiempos,"weibull")<br />

> ajuste.weibull<br />

shape scale<br />

12.33899365 1.48241754<br />

( 1.24243723) ( 0.01716987)<br />

Guardamos esos valores <strong>en</strong> shape.tiempos y scale.tiempos:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!