01.11.2014 Views

Prácticas de Estadística en R - Departamento de Estadística e ...

Prácticas de Estadística en R - Departamento de Estadística e ...

Prácticas de Estadística en R - Departamento de Estadística e ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capítulo 12<br />

El mo<strong>de</strong>lo <strong>de</strong> regresión lineal<br />

simple<br />

12.1. Introducción<br />

En esta práctica apr<strong>en</strong><strong>de</strong>remos a utilizar R como herrami<strong>en</strong>ta para la estimación y<br />

diagnosis <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> regresión. La situación g<strong>en</strong>eral es la sigui<strong>en</strong>te. Disponemos <strong>de</strong><br />

una variable aleatoria respuesta Y , que supondremos relacionada con otra variable X,<br />

que llamaremos explicativa o in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>te. A partir <strong>de</strong> una muestra <strong>de</strong> n individuos<br />

para los que se dispone <strong>de</strong> los valores <strong>de</strong> ambas variables, {(X i , Y i ), i = 1, . . .,n}, po<strong>de</strong>mos<br />

visualizar gráficam<strong>en</strong>te la relación exist<strong>en</strong>te <strong>en</strong>tre ambas. Así, utilizando la función<br />

plot <strong>de</strong> R po<strong>de</strong>mos realizar un gráfico <strong>de</strong> dispersión, <strong>en</strong> el que los valores <strong>de</strong> la variable X<br />

se dispon<strong>en</strong> <strong>en</strong> el eje horizontal y los <strong>de</strong> Y <strong>en</strong> el vertical. En la Figura 12.1 se muestran<br />

ejemplos <strong>de</strong> gráficos <strong>de</strong> dispersión.<br />

¿Qué conclusiones podrías sacar a partir <strong>de</strong> las gráficas sobre la relación <strong>en</strong>tre las<br />

variables X e Y <strong>en</strong> cada ejemplo?<br />

Los puntos (X i , Y i ) <strong>de</strong> la gráfica (a) han sido g<strong>en</strong>erados a partir <strong>de</strong>l mo<strong>de</strong>lo lineal<br />

Y i = a + bX i + ε i , con ε i ∼ N(0, σ 2 ε). ¿Sabrías <strong>de</strong>cir a que se <strong>de</strong>be que casi no<br />

se aprecie la relación lineal? Aunque los datos han sido g<strong>en</strong>erado a partir <strong>de</strong> la<br />

ecuación <strong>de</strong> una recta, el error ε que hemos introducido ti<strong>en</strong>e una varianza muy<br />

gran<strong>de</strong>. Eso hace que los datos aparezcan tan dispersos.<br />

¿Existe relación lineal <strong>en</strong>tre las variables X e Y repres<strong>en</strong>tadas <strong>en</strong> la gráfica (b)?<br />

¿Qué tipo <strong>de</strong> relación crees que existe?<br />

En la gráfica (c), los puntos (X i , Y i ) han sido g<strong>en</strong>erados a partir <strong>de</strong>l mo<strong>de</strong>lo lineal<br />

Y i = a + bX i + ε i , pero con errores heterocedásticos, es <strong>de</strong>cir, la varianza <strong>de</strong>l error<br />

no es constante.<br />

En la gráficas (d) y (e), los puntos (X i , Y i ) han sido g<strong>en</strong>erados a partir <strong>de</strong>l mo<strong>de</strong>lo<br />

lineal Y i = a+bX i +ε i , con ε i ∼ N(0, σ 2 ε). ¿En que se difer<strong>en</strong>cian ambos ejemplos?

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!