13.07.2015 Views

Regresión Lineal Múltiple - Universidad Nacional Agraria La Molina

Regresión Lineal Múltiple - Universidad Nacional Agraria La Molina

Regresión Lineal Múltiple - Universidad Nacional Agraria La Molina

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Transformaciones en RegresiónRegresión <strong>Lineal</strong> MúltipleMs Carlos López de Castilla Vásquez<strong>Universidad</strong> <strong>Nacional</strong> <strong>Agraria</strong> <strong>La</strong> <strong>Molina</strong>2011-2Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deConsideremos por ahora solo modelos con una variablepredictora.<strong>La</strong> idea es tratar de aumentar la medida de ajuste R 2 delmodelo, sin incluir variables predictoras adicionales.Lo primero que hay que hacer es un plot para obervar el tipode tendencia, como los que aparecen el la Figura 1.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deFigura 1: Modelos no linealesMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deEn la primera gráca de la Figura 1 se ha ajustado un modelocuadrático, que es de la forma general y = a + bx + cx 2 .Estopuede ser modelado como una regresión múltiple con dosvariables predictoras.<strong>La</strong> segunda gráca corresponde a un modelo exponencial de laforma y = αe βx con α y β positivos. Este modelo es muyadecuado para modelar crecimientos poblacionales.<strong>La</strong> tercera gráca corresponde a un modelo potencial odoblemente logarítmico de la forma y = αx β , con β positivo.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deFigura 2: Modelos no linealesMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable de<strong>La</strong> primera gráca de la Figura 2 corresponde a un modelohiperbólico o inverso de la forma y = α + β/x, con x > 0.<strong>La</strong> segunda gráca corresponde a un modelo logarítmico de laforma y = α + βlog(x) con x > 0.<strong>La</strong> tercera gráca corresponde a un modelo potencia pero conβ > 0.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable de<strong>La</strong> siguiente tabla muestra las transformaciones de la variablepredictora y/o respuesta que se requieren para linealizar variosmodelos.Nombre del modelo Ecuación del Modelo Transformación Modelo <strong>Lineal</strong>izadoExponencial Y = αe βX Z = LogY X = X Z = Logα + βXLogaritmico Y = α + βLogX Y = Y W = LogX Y = α + βWDoblemente Logarítmico Y = αX β Z = LogY W = LogX Z = Logα + βWHiperbólico Y = α + β/X Y = Y W = 1/X Y = α + βWDoblemente Inverso Y = 1/(α + βX ) Z = 1/Y X = X Z = α + βXMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deTransformaciones de las variables predictoras en regresiónmúltipleSe tiene una variable de respuesta Y y varias variablespredictoras, y desea hacer transformaciones en las variablesrespuesta para mejorar la medida de ajuste del modelo.Estas transformaciones se pueden ver afectadas por lacolinealidad (dependencia lineal) existente entre las variablespredictoras.Box y Tidwell, propusieron un método para transformar lasvariables predictoras pero solo usando potencia de ellas.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMas especicamente, ellos consideraron el modelo:y = β 0 + β 1 w 1 + ... + β k w k + e...(1.2.1)Donde:w = x αjjsi α j ≠ 0 y w j = ln(x j ) si α j = 0.El método está basado en el desarrollo en series de Taylor delmodelo anterior.Con respecto a a = (α 1 , ...α k ) y alrededor del punto aa 0 = (α 1,0 , ...α k,0 ) = (1, ..., 1).Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deEl procedimiento para la estimación de los α j se puede resumircomo sigue:a) Hacer la regresión lineal múltiple considerando las variablespredictoras originales x j y denotar los estimados de loscoecientes por b j .b) Hacer una regresión lineal múltiple de Y versus las variablespredictoras originales, más las variables z j = x j ln(x j ) y denotarlos estimados de los coecientes de z j por ˆγ jc) Estimar ˆα j por ˆγ jb j+ 1Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deEl procedimiento se puede repetir varias veces usando en cadaetapa las nuevas variables transformadas y la siguiente relaciónde recurrencia:ˆα (m+1)j= ( ˆγ(m) j+ 1)ˆα (m)b (m) j...(1.2.3)jTerminando el proceso cuando | ˆα (m+1)j− ˆα j |< TOL es unacantidad de tolerancia muy cercana a cero.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deEJEMPLO 1: Aplicar la técnica sugerida por Box and Tidwellal conjunto de datos millaje.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deTransformaciones para mejorar la normalidad de la variablede respuestaBox y Cox introdujeron una transformación de la variable derespuesta con el objetivo de satisfacer la suposición denormalidad del modelo de regresión.<strong>La</strong> transformación es de la forma y λ (transformaciónpotencia), donde λ es estimada con los datos tomados.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deMs Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deFigura 3:Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple


Transformaciones en RegresiónTransformaciones para linealizar modelosTransformaciones de las variables predictoras en regresión múTransformaciones para mejorar la normalidad de la variable deFigura 3. Plot de normalidad de los residuales de la regresiónpara el conjunto de datos millaje después de la transformaciónBox-Cox.Se observan claramente dos outliers inferiores y uno superior.Notar que el R 2 ha subido de 87.33 % a 92.52 %, mejorando elefecto de transformar las variables predictoras que se llevó acabo en el EJEMPLO 1.Ms Carlos López de Castilla VásquezRegresión <strong>Lineal</strong> Múltiple

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!