Prácticas de Estadística en R - Departamento de Estadística e ...
Prácticas de Estadística en R - Departamento de Estadística e ...
Prácticas de Estadística en R - Departamento de Estadística e ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capítulo 12<br />
El mo<strong>de</strong>lo <strong>de</strong> regresión lineal<br />
simple<br />
12.1. Introducción<br />
En esta práctica apr<strong>en</strong><strong>de</strong>remos a utilizar R como herrami<strong>en</strong>ta para la estimación y<br />
diagnosis <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> regresión. La situación g<strong>en</strong>eral es la sigui<strong>en</strong>te. Disponemos <strong>de</strong><br />
una variable aleatoria respuesta Y , que supondremos relacionada con otra variable X,<br />
que llamaremos explicativa o in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>te. A partir <strong>de</strong> una muestra <strong>de</strong> n individuos<br />
para los que se dispone <strong>de</strong> los valores <strong>de</strong> ambas variables, {(X i , Y i ), i = 1, . . .,n}, po<strong>de</strong>mos<br />
visualizar gráficam<strong>en</strong>te la relación exist<strong>en</strong>te <strong>en</strong>tre ambas. Así, utilizando la función<br />
plot <strong>de</strong> R po<strong>de</strong>mos realizar un gráfico <strong>de</strong> dispersión, <strong>en</strong> el que los valores <strong>de</strong> la variable X<br />
se dispon<strong>en</strong> <strong>en</strong> el eje horizontal y los <strong>de</strong> Y <strong>en</strong> el vertical. En la Figura 12.1 se muestran<br />
ejemplos <strong>de</strong> gráficos <strong>de</strong> dispersión.<br />
¿Qué conclusiones podrías sacar a partir <strong>de</strong> las gráficas sobre la relación <strong>en</strong>tre las<br />
variables X e Y <strong>en</strong> cada ejemplo?<br />
Los puntos (X i , Y i ) <strong>de</strong> la gráfica (a) han sido g<strong>en</strong>erados a partir <strong>de</strong>l mo<strong>de</strong>lo lineal<br />
Y i = a + bX i + ε i , con ε i ∼ N(0, σ 2 ε). ¿Sabrías <strong>de</strong>cir a que se <strong>de</strong>be que casi no<br />
se aprecie la relación lineal? Aunque los datos han sido g<strong>en</strong>erado a partir <strong>de</strong> la<br />
ecuación <strong>de</strong> una recta, el error ε que hemos introducido ti<strong>en</strong>e una varianza muy<br />
gran<strong>de</strong>. Eso hace que los datos aparezcan tan dispersos.<br />
¿Existe relación lineal <strong>en</strong>tre las variables X e Y repres<strong>en</strong>tadas <strong>en</strong> la gráfica (b)?<br />
¿Qué tipo <strong>de</strong> relación crees que existe?<br />
En la gráfica (c), los puntos (X i , Y i ) han sido g<strong>en</strong>erados a partir <strong>de</strong>l mo<strong>de</strong>lo lineal<br />
Y i = a + bX i + ε i , pero con errores heterocedásticos, es <strong>de</strong>cir, la varianza <strong>de</strong>l error<br />
no es constante.<br />
En la gráficas (d) y (e), los puntos (X i , Y i ) han sido g<strong>en</strong>erados a partir <strong>de</strong>l mo<strong>de</strong>lo<br />
lineal Y i = a+bX i +ε i , con ε i ∼ N(0, σ 2 ε). ¿En que se difer<strong>en</strong>cian ambos ejemplos?