Modelos de Regresión Aditivos Estructurados (STAR) con respuesta ...

More documents

Recommendations

Info

3.2.3. Covariables ContinuasEn esta sección, consideramos que el modelo simple η i = f(x i ), i = 1, ..., n,donde la función f se supone que es una función suave de una variable continuao escala de tiempo x. Para aproximar estas funciones no lineales, hay diferentesenfoques en la literatura, ya sea en función de los enfoques de probabilidad local(véase, por ejemplo Fan y Gijbels (1984) y Loader (1999)) o en una expansión defunciones de la base. En este trabajo se considerará el último caso.B-SplinesLas funciones de base que se usan son funciones spline polinomiales que sedefinen a trozos sobre un conjunto de nodos. Los nodos se separan del rando de lavariable x comox min = k 0 < ... < k r = x maxCada función de base, respectivamente, cada spline, esUn polinomio de grado l en el intervalo [k i , k i+1 ], i = 0, ..., r − 1l − 1 veces continuamente diferenciables en los nodos k i (l veces en todos losotros puntos además de los nodos).La función f puede ser escrita como una combinación lineal de las funciones dela base B j , es decirf(x i ) = β 1 · B 1 (x i ) + ... + β p · B p (x i ), donde p = l + r (ver De Boor (1978) o Dierckx (1995)). Los términos B j (x i )denotan el valor de la j − th función de base evaluada en el punto de observación x iy sirven como nuevas covariables. La propia función f también puede ser llamadaspline, ya que tiene las mismas propiedades que se ha descrito anteriormente. Enla notación matricial, cada fila i de la matriz de diseño X = (B j (x i )) contiene lasevaluaciones de las funciones de todas las funciones de base para el respectivo puntode observación x i . El vector de la función de evaluación f está dado por f = Xβ.P-SplinesUna cuestión crucial con B-splines es la elección de los nodos, afectando tantoen el número de nodos como su ubicación. La pregunta es cuántos nodos deberían serelegidos de modo que la función resultante no sea demasiado duro ni para suavizar.
Este problema a menudo se llama equilibrio del sesgo y la varianza (ver Hastie yTibshirani (1990)): muchos nodos resultado de una función en bruto que está cercade los datos y por lo tanto tiene un pequeño sesgo. Sin embargo, la varianza de estafunción es grande. Pocos nodos resultan en una función suave que tiene sólo unapequeña varianza pero un alto sesgo en su lugar. Un problema adicional cuando seeligen sólo unos pocos nodos es dónde colocar los nudos.Para superar estos problemas, hay dos enfoques diferentes en la literatura: el primerose basa en la selección adaptativa del nodo donde los nodos son elegidos cuidadosamente,pero en las posiciones que dan lugar a una función suficientemente flexible.Enfoques bayesianos para la selección adaptativa del nodo se describen en Biller(2000). El segundo método utiliza una sanción dura. La idea es utilizar un númerorelativamente grande de funciones de la base para obtener la suficiente flexibilidad.La suavidad se consigue por un término de penalización que impone restriccionessobre el vector de parámetros β, como por ejemplo la reducción de los parámetros acero o penalizar saltos abruptos entre los parámetros adyacentes. Para ese propósito,el logaritmo de verosimilitud se sustituye por un logaritmo de verosimilitud penalizadodefinido por:l pen (y|β 1 , ..., β p ) = φ · l(y|β 1 , ..., β p ) − 1 · penalty(λ), (3.12)2donde el equilibrio entre el sesgo y la varianza, es decir, entre la flexibilidad y lasuavidad, es controlado por el parámetro de suavización λ.Utilizamos la llamada P(enalised)-splines la cual fue introducida por Eilers yMarx (1996) y Marx y Eilers (1998) y que se basan en la base B-splines. Aquí 20-40 nodos son elegidos, por lo general equidistantes en el rango de x. Con el fin deasegurar la suavidad se utiliza un término de penalización diferente que consta delas diferencias cuadráticas de coeficientes adyacentes, es decir,penalty(λ) = λ ·p∑(∆ k β j ) 2 = λ · β ′ Pβ, (3.13)j=k+1donde ∆ k denota diferencias de orden k. Por lo general, las diferencias de ordenk = 1 o k = 2 son usadas. Para nodos equidistantes, estos toman la forma:∆ 1 β j = β j − β j−1 y ∆ 2 β j = β j − 2β j−1 + β j−2 (3.14)Generalmente, las diferencias de orden k se pueden definir de forma recursivacomo ∆ k β j = ∆ 1 (∆k − 1β j ) con ∆ 0 β j = β j . Por lo tanto, las diferencias de segundoorden se pueden calcular como∆ 2 β j = ∆ 1 β j + ∆ 1 β j−1 = β j − β j−1 − (β j−1 − β j−2 )
Page 1 and 2: Máster en Técnicas EstadísticasT
Page 3: AgradecimientosDebo agradecer de un
Page 6 and 7: 3.3.2. Criterio de Información Bay
Page 9 and 10: Capítulo 1IntroducciónLos incendi
Page 11 and 12: et al. (2000) han utilizado la regr
Page 13 and 14: Capítulo 2Área de Estudio y Mater
Page 15 and 16: Variables Descripción de las varia
Page 17 and 18: Figura 2.3: Incendios forestales pr
Page 19 and 20: Figura 2.5: Estaciones climatológi
Page 21 and 22: inflamabilidad y combustibilidad de
Page 23: - Cantidad de combustible (materia
Page 26 and 27: a través de una función de respue
Page 28 and 29: con un parámetro de varianza τ 2
Page 32 and 33: Mediante la definición (p − k)
Page 34 and 35: Los pesos se pueden elegir inversam
Page 36 and 37: Por último, echamos un vistazo en
Page 38 and 39: B 12 = p(y|M 1)p(y|M 2 ) , (3.29)El
Page 41 and 42: Capítulo 4Explorando la incidencia
Page 43 and 44: 4.1.2. Modelización de los incendi
Page 45 and 46: tre 20 y 30 ◦ C aproximadamente s
Page 47 and 48: los concellos en gris (ver Figura 4
Page 49 and 50: El efecto observado de la altitud c
Page 51 and 52: donde las zonas núcleo parecen ser
Page 53 and 54: las variables explicativas y el log
Page 55 and 56: un efecto lineal creciente más ace
Page 57 and 58: Figura 4.13: Efectos espaciales no
Page 59 and 60: Figura 4.14: Estimación de los efe
Page 61 and 62: Figura 4.17: Efectos espaciales est
Page 63 and 64: 4.3.1. Modelización de los incendi
Page 69 and 70: Figura 4.24: Efectos espaciales no
Page 75: Figura 4.30: Efectos espaciales no
Page 78 and 79: 3. Trabajamos con máximo rigor, pe
Page 80 and 81:
Figura A.1: Distribución de todas
Page 82 and 83:
Figura A.4: Distribución de obtenc
Page 84 and 85:
en cada punto del territorio galleg
Page 86 and 87:
Figura A.10: Distribución del Mato
Page 88 and 89:
Figura A.12: Distribución de los R
Page 90 and 91:
B.1.B.1.1.Un ejemplo de código R p
Page 93 and 94:
BibliografíaAkaike, H.,(1973). Inf
Page 95 and 96:
Felicísimo, A.M., (1994). Modelos
Page 97 and 98:
Moritz, M.A.,(2003). Spatiotemporal
show all

Modelos de Regresión Aditivos Estructurados (STAR) con respuesta ...

Create successful ePaper yourself

Delete template?

Save as template?