13.07.2015 Views

Bioestadística. Curso 2012-2013 Práctica: La recta de regresión

Bioestadística. Curso 2012-2013 Práctica: La recta de regresión

Bioestadística. Curso 2012-2013 Práctica: La recta de regresión

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Bioestadística</strong>. Grado en Medicina<strong>Práctica</strong>: <strong>La</strong> <strong>recta</strong> <strong>de</strong> <strong>regresión</strong>Coecientes <strong>de</strong> la <strong>recta</strong> <strong>de</strong> <strong>regresión</strong>. Obtenemos en la primera columna <strong>de</strong> esta tabla (Coefficient)las estimaciones <strong>de</strong> los coecientes <strong>de</strong>l mo<strong>de</strong>lo. En el ejemplo, ^0 = 5:31288 (constante) y ^1 = 0:05131(pendiente). Por lo tanto, la <strong>recta</strong> ajustada será: Y = 5:31288 + 0:05131X.Contrastes sobre los parámetros <strong>de</strong>l mo<strong>de</strong>lo. <strong>La</strong>s dos últimas columnas <strong>de</strong> la tabla <strong>de</strong> coecientes (T, P) nosproporcionan información para realizar los contrastes que nos permiten comprobar si los coecientes <strong>de</strong>l mo<strong>de</strong>loson signicativos (si son distintos <strong>de</strong> cero). Si escribimos el mo<strong>de</strong>lo como Y = 0 + 1X + ", los contrastes seplantean <strong>de</strong> la siguiente forma:Para la constante: {H0 : 0 = 0H1 : 0 6= 0Para la pendiente: {H0 : 1 = 0H1 : 1 6= 0Estos contrastes son importantes, porque en caso <strong>de</strong> no rechazar alguna <strong>de</strong> las hipótesis nulas ( 0 = 0 o1 = 0), podríamos prescindir <strong>de</strong> alguno <strong>de</strong> los coecientes <strong>de</strong>l mo<strong>de</strong>lo y así simplicarlo. En el ejemplo el valor<strong>de</strong>l estadístico para el contraste sobre la constante <strong>de</strong>l mo<strong>de</strong>lo es T = 13; 46, con un p-valor igual a 0, loque nos lleva a rechazar la hipótesis nula H0. Es <strong>de</strong>cir, la constante <strong>de</strong> la <strong>recta</strong> es signicativamente distinta <strong>de</strong>cero. Por otra parte, el valor <strong>de</strong>l estadístico para el contraste sobre la pendiente es T = 20; 37, con un p-valorigual a 0. Por lo tanto, también rechazamos la hipótesis nula H0 y concluimos que la pendiente <strong>de</strong> la <strong>recta</strong> essignicativamente distinta <strong>de</strong> cero. Ambos coecientes son signicativos.Coeciente <strong>de</strong> <strong>de</strong>terminación. Una vez resuelto el problema <strong>de</strong> estimar los parámetros surge la pregunta <strong>de</strong> sila <strong>recta</strong> estimada es o no representativa para los datos. Esto se resuelve mediante el coeciente <strong>de</strong> <strong>de</strong>terminaciónR 2 . En el ejemplo, el coeciente <strong>de</strong> <strong>de</strong>terminación (R-Squared) es R 2 = 0; 9765.Descomposición <strong>de</strong> la variabilidad. Los métodos <strong>de</strong> <strong>regresión</strong> preten<strong>de</strong>n darnos una explicación <strong>de</strong> cómo lavariable respuesta, Y , se comporta <strong>de</strong> distinta manera en función <strong>de</strong>l valor que tome la variable explicativa, X.En consecuencia, parte <strong>de</strong> la variabilidad <strong>de</strong> Y quedaría justicada por la inuencia <strong>de</strong> la variable X, mientrasque otra parte sería fruto <strong>de</strong>l error <strong>de</strong>l mo<strong>de</strong>lo.<strong>La</strong> variabilidad <strong>de</strong> toda la muestra la <strong>de</strong>nominamos variabilidad total (VT) o suma total <strong>de</strong> cuadrados y se<strong>de</strong>scompone en dos sumandos:VT = VE + VNE:<strong>La</strong> variabilidad explicada (VE) sirve como medición <strong>de</strong> la variabilidad que po<strong>de</strong>mos explicar en base al mo<strong>de</strong>lo <strong>de</strong><strong>regresión</strong>. <strong>La</strong> variabilidad no explicada (VNE) se interpreta como variabilidad residual. En Statistix, la <strong>de</strong>composición<strong>de</strong> la variabilidad se muestra en la columna SS (sum of squares). Para los datos <strong>de</strong>l ejemplo tenemosVT=6.16917, VE=6.02393 y VNE=0.14523. Efectivamente, se cumple que VT = VE + VNE:Recuerda que a<strong>de</strong>más el coeciente <strong>de</strong> <strong>de</strong>terminación se <strong>de</strong>nía como la proporción <strong>de</strong> variabilidad <strong>de</strong> la variable<strong>de</strong>pendiente que es explicada por la <strong>regresión</strong>. EfectivamenteR 2 = VEVT = 6:023936:16917 = 0:9765:También pue<strong>de</strong>s comprobar que en el mo<strong>de</strong>lo <strong>de</strong> <strong>regresión</strong> lineal simple, el coeciente <strong>de</strong> <strong>de</strong>terminación coinci<strong>de</strong>con el cuadrado <strong>de</strong>l coeciente <strong>de</strong> correlación, es <strong>de</strong>cir R 2 = r 2 xy .Carmen M a Cadarso, M a <strong>de</strong>l Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Página 8 <strong>de</strong> 9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!