13.07.2015 Views

Modelos de Regresión Aditivos Estructurados (STAR) con respuesta ...

Modelos de Regresión Aditivos Estructurados (STAR) con respuesta ...

Modelos de Regresión Aditivos Estructurados (STAR) con respuesta ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Máster en Técnicas EstadísticasTrabajo Fin <strong>de</strong> Máster<strong>Mo<strong>de</strong>los</strong> <strong>de</strong> <strong>Regresión</strong> <strong>Aditivos</strong><strong>Estructurados</strong> (<strong>STAR</strong>) <strong>con</strong><strong>respuesta</strong> binaria para lapredicción <strong>de</strong> incendios forestalesen Galicia. Agosto 2006Autora:Codirectores:Laura Ríos PenaCarmen Mª Cadarso SuárezManuel Fco. Marey PérezJulio <strong>de</strong> 2013


Este trabajo se presenta para su evaluación como Trabajo Fin <strong>de</strong> Máster, en lamodalidad <strong>de</strong> prácticas en empresas, <strong>de</strong> la alumna Laura Ríos Pena.Ha sido realizado bajo la dirección <strong>de</strong> Carmen María Cadarso Suárez y ManuelFrancisco Marey Pérez que autorizan la entrega <strong>de</strong>l mismo.A Coruña, a 1 <strong>de</strong> julio <strong>de</strong> 2013Carmen Mª Cadarso SuárezManuel Fco. Marey Pérez


Agra<strong>de</strong>cimientosDebo agra<strong>de</strong>cer <strong>de</strong> una manera especial y sincera a la Profesora Carmen CadarsoSuárez por aceptarme para realizar este trabajo fin <strong>de</strong> máster bajo su dirección.Su apoyo y <strong>con</strong>fianza en mi trabajo ha sido un aporte invaluable, no solamente en el<strong>de</strong>sarrollo <strong>de</strong>l trabajo, sino también en mi formación como investigadora. Las i<strong>de</strong>aspropias, siempre enmarcadas en su orientación y rigurosidad, han sido la clave <strong>de</strong>lbuen trabajo que hemos realizado juntas.Quiero expresar también mi más sincero agra<strong>de</strong>cimiento al profesor Manuel MareyPérez por su importante aporte y participación activa en el <strong>de</strong>sarrollo <strong>de</strong> estetrabajo. Debo <strong>de</strong>stacar, por encima <strong>de</strong> todo, su disponibilidad y paciencia que hizoque nuestras siempre acaloradas discusiones redundaran benéficamente tanto a nivelcientífico como personal. No cabe duda que su participación ha enriquecido eltrabajo realizado.A Luís Franco, por su ayuda computacional y todos los buenos <strong>con</strong>sejos a lolargo <strong>de</strong>l trabajo.Gracias a Biostatech, Advice, Training & Innovation in Biostatistics, S.L. poraceptarme para realizar las prácticas en empresa y, especialmente a Vicente LustresPérez que ha ejercido <strong>de</strong> tutor a lo largo <strong>de</strong> mi práctica formativa, darle las graciaspor su <strong>con</strong>stante motivación y <strong>con</strong>fianza brindada en el <strong>de</strong>sarrollo <strong>de</strong>l trabajo cadadía.Por último quiero dar las gracias al profesorado <strong>de</strong>l Programa Interuniversitario<strong>de</strong>l Tercer Ciclo <strong>de</strong> Estadística e Investigación Operativa <strong>de</strong> las Universida<strong>de</strong>s <strong>de</strong> ACoruña, Santiago <strong>de</strong> Compostela y Vigo por la formación recibida.


Índice general1. Introducción 52. Área <strong>de</strong> Estudio y Material <strong>de</strong> Partida 92.1. Área <strong>de</strong> Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.2. Origen y <strong>de</strong>scripción <strong>de</strong> los datos utilizados . . . . . . . . . . . . . . . 102.2.1. Mapa <strong>de</strong> <strong>con</strong>cellos <strong>de</strong> Galicia . . . . . . . . . . . . . . . . . . . 132.2.2. Base <strong>de</strong> Datos Climatológicos . . . . . . . . . . . . . . . . . . 142.2.3. Mo<strong>de</strong>lo Digital <strong>de</strong>l Terreno (MDT) . . . . . . . . . . . . . . . 152.2.4. Cuarto Inventario Forestal Nacional (IFN-4) . . . . . . . . . . 163. Metodología estadística 213.1. Mo<strong>de</strong>lo <strong>de</strong> <strong>Regresión</strong> Aditivo Estructurado (<strong>STAR</strong>) . . . . . . . . . . 213.2. Las componentes <strong>de</strong>l mo<strong>de</strong>lo . . . . . . . . . . . . . . . . . . . . . . . 233.2.1. Efectos Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.2. Variables Categóricas . . . . . . . . . . . . . . . . . . . . . . . 253.2.3. Covariables Continuas . . . . . . . . . . . . . . . . . . . . . . 263.2.4. Escala <strong>de</strong> Tiempo . . . . . . . . . . . . . . . . . . . . . . . . . 283.2.5. Covariables Espaciales . . . . . . . . . . . . . . . . . . . . . . 293.2.6. Heterogeneidad no observada . . . . . . . . . . . . . . . . . . 303.2.7. Coeficientes <strong>de</strong> Variación . . . . . . . . . . . . . . . . . . . . . 313.3. Criterios <strong>de</strong> Selección <strong>de</strong>l mo<strong>de</strong>lo . . . . . . . . . . . . . . . . . . . . 323.3.1. Criterio <strong>de</strong> Información <strong>de</strong> Akaike (AIC) . . . . . . . . . . . . 325


3.3.2. Criterio <strong>de</strong> Información Bayesiano (BIC) . . . . . . . . . . . . 333.3.3. Validación Cruzada Genaralizada (GCV) . . . . . . . . . . . . 344. Explorando la inci<strong>de</strong>ncia <strong>de</strong> incendios forestales totales y provocados374.1. Mo<strong>de</strong>lización a partir <strong>de</strong> variables meteorológicas . . . . . . . . . . . 384.1.1. Corrección <strong>de</strong> los datos meteorológicos . . . . . . . . . . . . . 384.1.2. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales totales . . . . . . . . . 394.1.3. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales provocados . . . . . . 434.1.4. Ajuste <strong>de</strong> mo<strong>de</strong>los . . . . . . . . . . . . . . . . . . . . . . . . 474.2. Mo<strong>de</strong>lización a partir <strong>de</strong> grupos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible . . . . . . 484.2.1. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales totales . . . . . . . . . 484.2.2. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales provocados . . . . . . 534.2.3. Ajuste <strong>de</strong> mo<strong>de</strong>los . . . . . . . . . . . . . . . . . . . . . . . . 584.3. Mo<strong>de</strong>lización a partir <strong>de</strong> variables climatológicas y grupos <strong>de</strong> mo<strong>de</strong>los<strong>de</strong> combustible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.3.1. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales totales . . . . . . . . . 594.3.2. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales provocados . . . . . . 654.3.3. Comparativa <strong>de</strong> mo<strong>de</strong>los . . . . . . . . . . . . . . . . . . . . . 715. Conclusiones y Futuras Líneas <strong>de</strong> Investigación 73A. Base <strong>de</strong> datos 75A.1. Variables Meteorológicas . . . . . . . . . . . . . . . . . . . . . . . . . 75A.1.1. Temperatura Media Diaria . . . . . . . . . . . . . . . . . . . . 76A.1.2. Humedad Relativa Media . . . . . . . . . . . . . . . . . . . . 77A.1.3. Precipitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 78A.2. Variables <strong>de</strong> grupos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible <strong>de</strong> Rothermel . . . . . 79A.2.1. Sin Asignar Mo<strong>de</strong>lo . . . . . . . . . . . . . . . . . . . . . . . . 80A.2.2. Grupo <strong>de</strong> Pastos . . . . . . . . . . . . . . . . . . . . . . . . . 81


A.2.3. Grupo <strong>de</strong> Matorral . . . . . . . . . . . . . . . . . . . . . . . . 81A.2.4. Grupo <strong>de</strong> Hojarasca bajo arbolado . . . . . . . . . . . . . . . 82A.2.5. Grupo <strong>de</strong> Restos y/o Operaciones Selvícolas . . . . . . . . . . 83B. Software 85B.1. Un ejemplo <strong>de</strong> código R para mo<strong>de</strong>los <strong>STAR</strong> . . . . . . . . . . . . . . 86B.1.1. Script <strong>de</strong> la mo<strong>de</strong>lización <strong>de</strong> la ocurrencia <strong>de</strong> incendios totales<strong>con</strong> variables climatológicas . . . . . . . . . . . . . . . . . . . 86B.1.2. Script para la representación <strong>de</strong> los efectos <strong>de</strong> las covariables<strong>con</strong>tinuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86B.1.3. Script para dibujar los efectos espaciales estructurados y noestructurados . . . . . . . . . . . . . . . . . . . . . . . . . . . 87Bibliografía 87


Capítulo 1IntroducciónLos incendios ocurren en multitud <strong>de</strong> ecosistemas forestales (Moritz, 2003), <strong>con</strong>una gran influencia en las <strong>con</strong>secuencias ecológicas (Minnich & Bahre, 1995) y lasfunciones e<strong>con</strong>ómicas <strong>de</strong>l bosque (Hardy, 2005). Estos fenómenos, al igual que otroscomo avalanchas, terremotos, tormentas <strong>de</strong> arena, etc., tienen la propiedad <strong>de</strong> quecuando ocurren por encima <strong>de</strong> un <strong>de</strong>terminado umbral producen una cascada <strong>de</strong>actividad ambiental, social y e<strong>con</strong>ómica (Malamud et al., 1998). A su vez experimentancomportamientos muy distintos según los diferentes ámbitos en los que sepuedan localizar (Reed & Mckelvey, 2002), variando en función <strong>de</strong> variables naturalesy socioe<strong>con</strong>ómicas ligadas a los paisajes forestales y presentando comportamientosdifícilmente parametrizables.Se sabe que los incendios naturales han sido esenciales para mantener la biodiversidady también han sido una herramienta ampliamente utilizada para la gestión<strong>de</strong>l territorio (Moreno 1989). Sin embargo, en las últimas décadas, los incendios causados<strong>de</strong> forma natural han experimentado alteraciones significativas (frecuencia <strong>de</strong>incendios, intensidad y gravedad) que han agravado la ecológica, <strong>con</strong>secuencias socialesy e<strong>con</strong>ómicas (Westerling et al. 2006, FAO 2007). Los cambios en los patronestradicionales <strong>de</strong>l uso <strong>de</strong> la tierra <strong>de</strong>rivados <strong>de</strong> la transformación socio-e<strong>con</strong>ómica enlas zonas rurales (abandono rural) han modificado recientemente la inci<strong>de</strong>ncia <strong>de</strong>incendios <strong>de</strong>bido a una acumulación inusual <strong>de</strong> los combustibles forestales, que enparticular aumenta el riesgo <strong>de</strong> incendio y <strong>de</strong> la severidad <strong>de</strong>l fuego. A<strong>de</strong>más, el usocada vez mayor <strong>de</strong> los bosques como recurso recreativo implica una mayor inci<strong>de</strong>ncia<strong>de</strong> los incendios <strong>de</strong> origen humano, ya sea por negligencia o incendio (Chuvieco etal. 1999). La importancia <strong>de</strong> <strong>con</strong>tar <strong>con</strong> información precisa y fiable sobre la inci<strong>de</strong>ncia<strong>de</strong> los incendios forestales, así como sobre las causas <strong>de</strong>l fuego es evi<strong>de</strong>nte.El <strong>con</strong>ocimiento <strong>de</strong> los mecanismos que hay <strong>de</strong>trás <strong>de</strong> la ocurrencia <strong>de</strong> incendiosespera mejorar las activida<strong>de</strong>s <strong>de</strong> prevención <strong>de</strong> incendios (estimación <strong>de</strong>l riesgo <strong>de</strong>incendio) y reducir su impacto ecológico negativo, impactos e<strong>con</strong>ómicos, sociológicosy ambientales.9


En Galicia, la problemática <strong>de</strong> los incendios forestales se observa a partir <strong>de</strong>1961, año en el que comienzan las estadísticas sobre incendios forestales, hasta octubre<strong>de</strong> 2011. En este periodo se han producido en Galicia 245.593 incendios forestales.Estos incendios arrasaron una superficie <strong>de</strong> 1.794.578 ha, lo que equivale a (62 %)<strong>de</strong>l área geográfica <strong>de</strong> la Comunidad Autónoma y casi todos (87 %) <strong>de</strong> la superficieforestal total. Por ello los incendios forestales son percibidos como el principal problemamedioambiental <strong>de</strong> la región (Alonso-Betanzos et al, 2003; Chas, 2007). Enla Figura 1.1 se observa esta evolución.Figura 1.1: Evolución <strong>de</strong> los incendios forestales <strong>de</strong>s<strong>de</strong> 1961-2011. Fuente: Consellería<strong>de</strong> Medio Rural e do Mar - Xunta <strong>de</strong> GaliciaDiferentes técnicas han sido <strong>de</strong>sarrolladas para pre<strong>de</strong>cir el comportamiento <strong>de</strong>lfuego. Técnicas <strong>de</strong> regresión logística han sido comúnmente utilizadas para referirseal riesgo y a la ocurrencia <strong>de</strong> incendios, y para <strong>de</strong>terminar los días en los que seproduzcan gran<strong>de</strong>s incendios o varios incendios, mediante el uso <strong>de</strong>, por ejemplo,mo<strong>de</strong>los logísticos clásicos (Brillinger <strong>de</strong> 2003, González, et al., 2006, González yPukkala, 2007), mo<strong>de</strong>los logísticos <strong>con</strong> funciones spline (Preisler y Westerling, 2007)y mo<strong>de</strong>los <strong>de</strong> regresión logística <strong>con</strong> componentes espaciales y temporales (Preisleret al, 2004). Cunningham y Martell (1973), Martell et al. (1987, 1989) y An<strong>de</strong>rson


et al. (2000) han utilizado la regresión logística para estudiar la relación entre losíndices <strong>de</strong> riesgo y la probabilidad <strong>de</strong> incendio por día. Chou et al. (1990, 1993)aplicó la regresión logística incluyendo el clima como variable explicativa para evaluarla autocorrelación espacial entre los incendios ubicados cerca. Preisler et al.(2004) también utiliza la regresión logística para estimar la probabilidad <strong>de</strong> la ocurrencia<strong>de</strong> incendios. A<strong>de</strong>más <strong>de</strong> los mo<strong>de</strong>los logísticos, otros mo<strong>de</strong>los <strong>de</strong> regresión sehan utilizado también, como los mo<strong>de</strong>los lineales generalizados (Preisler y Westerling,2007) y los mo<strong>de</strong>los aditivos generalizados <strong>con</strong> efectos fijos, efectos aleatorios y<strong>de</strong> efectos mixtos (Breslow y Clayton, 1993; Brillinger, y col ., 2003, Brillinger et al.2004, Brillinger et al. 2006) para evaluar las probabilida<strong>de</strong>s asociadas <strong>con</strong> la ocurrencia<strong>de</strong> incendios forestales como por ejemplo, la probabilidad <strong>de</strong> que pueda ocurrirun incendio en una región <strong>de</strong>terminada durante un día <strong>de</strong>terminado, semana o mes<strong>de</strong>l año. Diversas técnicas <strong>de</strong> aprendizaje se han <strong>de</strong>sarrollado, incluyendo re<strong>de</strong>s neuronales,que se utilizan para <strong>de</strong>terminar la propagación <strong>de</strong>l fuego (Alonso-Betanzoset al 2003;. Loehle, 2004) y para <strong>de</strong>terminar la mejor posición para los equipos <strong>de</strong>extinción aéreos (Varela, 2002), así como los métodos <strong>de</strong> simulación (Reinhardt, etal. 2001).Hay una serie <strong>de</strong> estudios que analizan la ocurrencia <strong>de</strong> incendios forestales, quese <strong>de</strong>fine como el número <strong>de</strong> incendios por unidad espacial, como se trata en este trabajo,<strong>de</strong> manera que la variable <strong>respuesta</strong> en esos mo<strong>de</strong>los se refiere a la ocurrencia,comúnmente obtenida a partir <strong>de</strong> información disponible en bases <strong>de</strong> datos <strong>de</strong> incendiosforestales, sin embargo, la precisión <strong>de</strong> la ubicación espacial <strong>de</strong> los incendiosvaría significativamente <strong>de</strong>pendiendo <strong>de</strong> la fuente <strong>de</strong> datos. Como resultado, unaamplia gama <strong>de</strong> posibilida<strong>de</strong>s se pue<strong>de</strong>n en<strong>con</strong>trar en la literatura. Algunos autoreshan utilizado como variable <strong>de</strong> <strong>respuesta</strong> en sus mo<strong>de</strong>los estadísticos ubicacionesexactas a partir <strong>de</strong> las coor<strong>de</strong>nadas geográficas (coor<strong>de</strong>nadas x, y) <strong>de</strong> los puntos <strong>de</strong>ignición (Cardille et al 2001; Pew y Larsen 2001; Vas<strong>con</strong>celos et al. 2001; Koutsias etal. 2004; Robin et al. 2006; Kalabokidis et al. 2007; Yang et al. 2007). Otros autoreshan utilizado como variable <strong>respuesta</strong> en sus mo<strong>de</strong>los menos exactos informaciónsobre los incendios, espacialmente colocados en una rejilla y/o diferentes unida<strong>de</strong>sadministrativas (municipio, provincia, etc.).El presente trabajo persigue la obtención <strong>de</strong> mo<strong>de</strong>los predictivos <strong>de</strong> ocurrencia<strong>de</strong> incendios forestales a partir <strong>de</strong> variables climatológicas y <strong>de</strong> tipo <strong>de</strong> combustible.Se propone el empleo <strong>de</strong> técnicas <strong>de</strong> <strong>Regresión</strong> Aditivas Estructuradas (<strong>STAR</strong>) paragenerar mo<strong>de</strong>los predictivos especializados a una resolución <strong>de</strong> 1 Km × 1 Kmasociando las cuadrículas <strong>de</strong> la rejilla al <strong>con</strong>cello al que pertenecen y tomando comovariables <strong>respuesta</strong> información para los incendios provocados y otras causas. Paraalcanzar este objetivo general se abordarán los siguientes objetivos específicos:I<strong>de</strong>ntificar aquellas variables in<strong>de</strong>pendientes que representen los diversos factores<strong>de</strong> riesgo <strong>de</strong> incendio forestal (en este estudio se han <strong>con</strong>si<strong>de</strong>rado las


variables climatológicas y <strong>de</strong> tipo <strong>de</strong> combustible existente en el suelo).Generar la variable <strong>de</strong>pendiente en el mo<strong>de</strong>lo: En este trabajo se generan dostipos <strong>de</strong> variable <strong>respuesta</strong> para un mismo mo<strong>de</strong>lo <strong>de</strong> variables explicativas; laocurrencia <strong>de</strong> incendios forestales provocados y totales por <strong>con</strong>cello.Generar mo<strong>de</strong>los <strong>de</strong> regresión aditivos estructurados (<strong>STAR</strong>) <strong>de</strong> <strong>respuesta</strong> binariapara ambas variables <strong>respuesta</strong>.Validar los resultados obtenidos en cada mo<strong>de</strong>lo <strong>de</strong> regresión aditivo estructurado(<strong>STAR</strong>) <strong>con</strong> <strong>respuesta</strong> binaria.El propósito final <strong>de</strong> la línea <strong>de</strong> trabajo es <strong>de</strong>sarrollar mo<strong>de</strong>los <strong>con</strong>sistentesespacio-temporalmente que puedan integrarse <strong>con</strong> facilidad en un sistema <strong>de</strong> predicción<strong>de</strong> riesgo más complejo que incluya otros factores (sociales, e<strong>con</strong>ómicos, etc.)relacionados <strong>con</strong> la ocurrencia <strong>de</strong> incendios forestales.El documento se estructura en un primer apartado que <strong>de</strong>scribe el área <strong>de</strong>estudio, junto <strong>con</strong> material <strong>de</strong> partida (bases <strong>de</strong> datos) y una breve <strong>de</strong>scripción<strong>de</strong> las variables. Posteriormente en el capítulo 3 se presenta la metodología en elestudio. Los resultados se discuten en el capítulo 4, y finalmente las <strong>con</strong>clusiones yfuturas líneas <strong>de</strong> investigación se <strong>de</strong>scriben en el capítulo 5.


Capítulo 2Área <strong>de</strong> Estudio y Material <strong>de</strong>Partida2.1. Área <strong>de</strong> EstudioLos mo<strong>de</strong>los <strong>de</strong> ocurrencia <strong>de</strong> incendio <strong>de</strong>bidos a <strong>con</strong>diciones climáticas y <strong>de</strong>tipo <strong>de</strong> combustible para cualquier causa <strong>de</strong> incendio forestal han sido elaboradospara la Comunidad Autónoma <strong>de</strong> Galicia (ver Figura 2.1). El período <strong>de</strong> estudiocompren<strong>de</strong> la primera quincena <strong>de</strong>l mes <strong>de</strong> Agosto <strong>de</strong> 2006. Se ha elegido este períodopara asegurar la <strong>con</strong>sistencia <strong>de</strong> los datos <strong>de</strong> incendios utilizados y para garantizarla robustez <strong>de</strong> los análisis estadísticos efectuados.Figura 2.1: Mapa <strong>de</strong> España - Área <strong>de</strong> estudio por <strong>con</strong>cellos13


2.2. Origen y <strong>de</strong>scripción <strong>de</strong> los datos utilizadosLos datos <strong>de</strong> incendios utilizados son una selección <strong>de</strong> la base <strong>de</strong> datos <strong>de</strong> incendios<strong>de</strong> la Consellería <strong>de</strong> Medio Rural y Mar <strong>de</strong> la Xunta <strong>de</strong> Galicia, correspondientesa la primera quincena <strong>de</strong> agosto <strong>de</strong> 2006, en la que se dieron unas circunstancias <strong>de</strong>gran número <strong>de</strong> incendios simultáneos.Esta nueva base <strong>de</strong> datos está formada en un total <strong>de</strong> 362625 registros. La componenteespacial, está formada por 30685 celdas que proce<strong>de</strong>n <strong>de</strong> dividir el territoriogallego <strong>con</strong> una rejilla <strong>de</strong> 1Km × 1Km asociando a cada una <strong>de</strong> las cuadrículas untotal <strong>de</strong> 9 variables. El apéndice A es una <strong>de</strong>scripción estadística y espacial <strong>de</strong>tallada<strong>de</strong> las variables. Posteriormente, para los análisis y la presentación <strong>de</strong> los resultados,se ha utilizado un mapa “boundary” <strong>de</strong> los <strong>con</strong>cellos <strong>de</strong> Galicia, la selección <strong>de</strong> estaescala <strong>de</strong> trabajo permite facilitar la interpretación <strong>de</strong> los resultados y un menorcoste computacional. La componente temporal se correspon<strong>de</strong> a los 15 primeros días<strong>de</strong>l mes <strong>de</strong> agosto <strong>de</strong> 2006 en los que se produjeron un total <strong>de</strong> 2060 incendios, <strong>de</strong>los cuales 1553 han sido incendios intencionados, 222 por causas <strong>de</strong>s<strong>con</strong>ocidas, 198por reproducción, 58 <strong>de</strong>bido a otras causas, 9 por línas eléctricas, 5 <strong>de</strong> fumadores,5 por hogueras, 3 <strong>de</strong> escapes <strong>de</strong> verte<strong>de</strong>ros, 3 por quemas agrícolas, 3 <strong>de</strong> motores ymáquinas y 1 <strong>de</strong>bido a quema <strong>de</strong> matorral.La variable <strong>respuesta</strong> es binaria: (1) ocurrencia <strong>de</strong> incendio forestal (0) no ocurrencia<strong>de</strong> incendio forestal. Las variables <strong>de</strong> estudio asociadas a cada cuadrículason:Variables meteorológicas: temperatura media, humedad relativa y precipitacionesdiarias, <strong>de</strong> las que se ha registrado dato en la estación meteorológicamás cercana al incendio. Se ha establecido una restricción <strong>de</strong> distancia máxima<strong>de</strong> 30 Km.Variables <strong>de</strong> tipos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible (Rothermel (1983)),que se correspon<strong>de</strong>n <strong>con</strong> la superficie en m 2 <strong>de</strong> cada uno <strong>de</strong> los 5 grupos<strong>de</strong> mo<strong>de</strong>los (sin asignar mo<strong>de</strong>lo, pastos, matorral, hojarasca bajo arbolado yrestos <strong>de</strong> cortas/operaciones selvícolas).El cuadro 2.2 aporta una <strong>de</strong>scripción <strong>de</strong> las variables <strong>respuesta</strong> (las dos primeras),explicativas y <strong>de</strong> agregación espacial (última) que usaremos en nuestro mo<strong>de</strong>lo.


Variables Descripción <strong>de</strong> las variables <strong>de</strong> estudionumero incendios Ocurrencia <strong>de</strong> incendio forestal <strong>con</strong> categorías “no ocurrencia”(=0)y “ocurrencia” (=1)numero incendios provocados Ocurrencia <strong>de</strong> incendio forestal provocado <strong>con</strong> categorías“no ocurrencia”(=0) y “ocurrencia” (=1)altitud Altitud media <strong>de</strong> cada cuadrícula en m.ta media Temperatura media diaria registrada para cada cuadrícula en ◦ Chr % <strong>de</strong> la humedad relativa media diaria para cada cuadrículapp Precipitación diaria registrada en cada cuadrícula en l/m 2mc Sin asignar mo<strong>de</strong>lo Formación heterogénea, no se asigna ningún mo<strong>de</strong>lomc pastos Formaciones <strong>de</strong> pastizales por cuadrícula en m 2mc matorral Formaciones <strong>de</strong> matorral por cuadrícula en m 2mc hojarasca Formaciones <strong>de</strong> hojarasca bajo bosque por cuadrícula en m 2mc restos Formaciones <strong>de</strong> bosque <strong>con</strong> gran cantidad <strong>de</strong> restos leñososmuertos por cuadrícula en m 2cd<strong>con</strong>c Concellos <strong>de</strong> GaliciaCuadro 2.1: Variables generadas a partir <strong>de</strong>l material <strong>de</strong> partida.La Figura 2.2 representa la distribución espacial <strong>de</strong> la variable <strong>respuesta</strong> numeroincendios = 1. Se observa una mayor <strong>con</strong>centración <strong>de</strong> incendios en las provincias<strong>de</strong> A Coruña y Pontevedra, en especial en la zona <strong>de</strong> las rías baixas y en la zona sur<strong>de</strong> la provincia <strong>de</strong> Ourense.


Figura 2.2: Incendios forestales registrados durante la primera quincena <strong>de</strong> agosto<strong>de</strong> 2006La Figura 2.3 representa la distribución espacial <strong>de</strong> la variable <strong>respuesta</strong> numeroincendios provocados ¯1 <strong>con</strong> un total <strong>de</strong> 1553. La distribución espacial sigue unpatrón espacial similar a la variable anterior.


Figura 2.3: Incendios forestales provocados que fueron registrados en la primeraquincena <strong>de</strong> agosto <strong>de</strong> 20062.2.1. Mapa <strong>de</strong> <strong>con</strong>cellos <strong>de</strong> GaliciaHa sido necesario incorporar un mapa <strong>de</strong> Galicia dividido en sus correspondientes<strong>con</strong>cellos (Instituto Geográfico Nacional). Consta <strong>de</strong> un total <strong>de</strong> 315 <strong>con</strong>cellos, <strong>de</strong>ellos, 94 pertenecen a la provincia <strong>de</strong> A Coruña, 67 a la <strong>de</strong> Lugo, 92 a la <strong>de</strong> Orense,y 62 municipios están en Pontevedra. La Figura 2.7 muestra el mapa <strong>de</strong> localización<strong>de</strong>l área <strong>de</strong> estudio dividido por <strong>con</strong>cellos.


Figura 2.4: Mapa <strong>de</strong> Galicia dividido por <strong>con</strong>cellosEste mapa permitirá interpretar el efecto <strong>de</strong> la correlación espacial <strong>de</strong> los <strong>con</strong>cellosen relación a la ocurrencia <strong>de</strong> incendios.2.2.2. Base <strong>de</strong> Datos ClimatológicosMeteogalicia cuenta <strong>con</strong> un total <strong>de</strong> 134 estaciones meteorológicas. Para el periodo<strong>de</strong> análisis <strong>de</strong> la primera quincena <strong>de</strong> agosto <strong>de</strong> 2006, solamente 71 <strong>de</strong> ellas seen<strong>con</strong>traban operativas. Las variables obtenidas fueron:Precipitaciones (l/m 2 )Humedad relativa media ( %)Temperatura media <strong>de</strong>l aire ( ◦ C)En la Figura 2.5 se muestran las estaciones meteorológicas utilizadas en el análisis.


Figura 2.5: Estaciones climatológicas <strong>de</strong> Galicia2.2.3. Mo<strong>de</strong>lo Digital <strong>de</strong>l Terreno (MDT)El MDT es una estructura numérica <strong>de</strong> datos que representa la distribuciónespacial <strong>de</strong> una variable cuantitativa y <strong>con</strong>tinua (Felicísimo, 1994), en nuestro casose trata <strong>de</strong> una elevación <strong>de</strong>l terreno.MDT200El MDT200 se ha obtenido por interpolación <strong>de</strong> mo<strong>de</strong>los digitales <strong>de</strong>l terreno<strong>de</strong> 5 m <strong>de</strong> paso <strong>de</strong> malla proce<strong>de</strong>ntes <strong>de</strong>l Plan Nacional <strong>de</strong> Ortofotografía Aérea(PNOA). El mo<strong>de</strong>lo digital <strong>de</strong>l terreno <strong>con</strong> paso <strong>de</strong> malla <strong>de</strong> 200 m, se distribuye porprovincias (rectángulo envolvente <strong>de</strong> cada provincia). Sistema geodésico <strong>de</strong> referenciaETRS89. Proyección UTM en el huso correspondiente a cada provincia. En la Figura2.6 se muestra el resultado.


Figura 2.6: MDT200 <strong>de</strong> Galicia2.2.4. Cuarto Inventario Forestal Nacional (IFN-4)La serie <strong>de</strong> inventarios forestales nacionales (IFN) comienzan en el año 1966 y seencuentra en la actualidad realizándose el cuarto ciclo (MAGRAMA 2013). En el año1966 se pone en marcha <strong>con</strong> caracter previo al IFN la realización <strong>de</strong>l mapa forestal<strong>de</strong> España (MFE). Esta cartografía tenía como objetivo principal servir <strong>de</strong> basepara el cálculo <strong>de</strong> existencias <strong>de</strong> ma<strong>de</strong>ra <strong>de</strong> los bosques y <strong>con</strong>sistía en la teselación(tesela, superficie <strong>de</strong> terreno <strong>con</strong> el mismo uso) <strong>de</strong> todo el territorio nacional. Esteobjetivo inicial se ha ido <strong>de</strong>sarrollando y en el tercer inventario forestal (1997) seincorporaron nuevos campos a la base <strong>de</strong> datos asociada a la cartografía, entre ellos,el mapa <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustibles <strong>de</strong> Rothermel, 1983. En el año 2008 se inicia elcuarto ciclo, y al igual que los anteriores se comienza por la Comunidad Autónoma<strong>de</strong> Galicia, por lo que aunque los datos no están publicados, ya se dispone <strong>de</strong> ellospor parte <strong>de</strong> los grupos <strong>de</strong> investigación <strong>de</strong> la universidad.Los mo<strong>de</strong>los <strong>de</strong> combustible <strong>de</strong> Rothermel, son una clasificación <strong>de</strong> los diferentestipos <strong>de</strong> vegetación y su comportamiento en el fuego. La combustibilidad <strong>de</strong> unsistema forestal se <strong>de</strong>fine como la capacidad <strong>de</strong>l mismo para ar<strong>de</strong>r, <strong>de</strong>sprendiendo laenergía suficiente para <strong>con</strong>sumirse y provocar la inflamación <strong>de</strong> la vegetación vecina,propagando <strong>de</strong> esta forma el fuego. A cada tipo <strong>de</strong> vegetación, le correspon<strong>de</strong> una


inflamabilidad y combustibilidad <strong>de</strong>terminadas, que varían en función <strong>de</strong>l tipo ycantidad <strong>de</strong> biomasa, y su distribución espacial o estratificación (Galiana et al.2009). La clasificación <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible <strong>con</strong>si<strong>de</strong>ra 13 tipos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong>combustible, divididos en 4 gran<strong>de</strong>s grupos en función <strong>de</strong> cuál sea el principal medio<strong>de</strong> propagación <strong>de</strong>l fuego: pasto, matorral, hojarasca bajo arbolado y restos <strong>de</strong> cortao <strong>de</strong> tratamientos selvícolas. En este trabajo se ha incluido un quinto grupo que esun grupo <strong>de</strong>nominado sin asignar mo<strong>de</strong>lo. Se ha hecho uso <strong>de</strong>l IFN-4 para <strong>con</strong>ocerel tipo <strong>de</strong> combustible existente en cada punto <strong>de</strong>l territorio gallego.Un mo<strong>de</strong>lo útil <strong>de</strong> riesgo para la planificación forestal <strong>de</strong>be tener en cuentala estructura y composición <strong>de</strong> las especies (Díaz Delgado et al., 2004) que sonobtenidas en los inventarios forestales (González, et al., 2007). Los mo<strong>de</strong>los, basadosen datos empíricos, <strong>de</strong>ben ser sensibles a los efectos <strong>de</strong> tratamientos selvícolas y tipos<strong>de</strong> gestión para establecer el riesgo <strong>de</strong> incendio en una <strong>de</strong>terminada situación. Losmo<strong>de</strong>los existentes no parecen cumplir todos estos requisitos. En algunos mo<strong>de</strong>los elriesgo <strong>de</strong> incendio <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la edad (Reed, 1994; Moritz, 2003), y otros al igual quela clasificación <strong>de</strong> riesgo <strong>de</strong> incendio siguiendo el mo<strong>de</strong>lo utilizado por Thompson etal. (2000), se basan en evaluaciones cualitativas <strong>de</strong> expertos (González, et al. 2007)o en encuestas a ciudadanos (Tábara et al., 2003; Riera & Mogas, 2004). Tambiénresulta interesante <strong>con</strong>ocer que vegetación resulta <strong>de</strong> una serie <strong>con</strong>tinuada <strong>de</strong> fuegosy si esta pue<strong>de</strong> estar formando parte <strong>de</strong>l ciclo natural <strong>de</strong>l mismo (Viedma, et al.2006).A <strong>con</strong>tinuación se muestra la clasificación y <strong>de</strong>scripción <strong>de</strong> los diferentes tipos<strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible.1. Sin Asignar Mo<strong>de</strong>lo2. PastosMo<strong>de</strong>lo <strong>de</strong> combustible 0: no se dispone <strong>de</strong> información, se recogerá lainformación en visita a campo.Mo<strong>de</strong>lo <strong>de</strong> Combustible 1:- Pasto fino, seco y bajo, que recubre completamente el suelo.- Pue<strong>de</strong>n aparecer algunas plantas leñosas dispersas ocupando menos <strong>de</strong>1/3 <strong>de</strong> la superficie.- Cantidad <strong>de</strong> combustible (materia seca): 1-2 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 2:- Pasto fino, seco y bajo, que recubre completamente el suelo.- Las plantas leñosas dispersas cubren <strong>de</strong> 1/3 a 2/3 <strong>de</strong> la superficie, perola propagación <strong>de</strong>l fuego se realiza por el pasto.


- Cantidad <strong>de</strong> combustible (materia seca): 5-10 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 3:- Pasto grueso, <strong>de</strong>nso, seco y alto (¿1m).- Pue<strong>de</strong> haber algunas plantas leñosas dispersas.- Cantidad <strong>de</strong> combustible (materia seca): 4-6 t/ha.3. MatorralMo<strong>de</strong>lo <strong>de</strong> Combustible 4:- Matorral o plantación joven muy <strong>de</strong>nsa, <strong>de</strong> más <strong>de</strong> 2 m <strong>de</strong> altura; <strong>con</strong>ramas muertas en su interior- Propagación <strong>de</strong>l fuego por la copas <strong>de</strong> las plantas.- Cantidad <strong>de</strong> combustible (materia seca): 25-35 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 5:- Matorral <strong>de</strong>nso y ver<strong>de</strong>, <strong>de</strong> menos <strong>de</strong> 1 m <strong>de</strong> altura.- Propagación <strong>de</strong>l fuego por hojarasca y el pasto.- Cantidad <strong>de</strong> combustible (materia seca): 5-8 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 6:- Parecido al mo<strong>de</strong>lo 5, pero <strong>con</strong> especies más inflamables o <strong>con</strong> restos <strong>de</strong>corta y plantas <strong>de</strong> mayor talla.- Propagación <strong>de</strong>l viento <strong>con</strong> vientos mo<strong>de</strong>rados a fuertes.- Cantidad <strong>de</strong> combustible (materia seca): 10-15 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 7:- Matorral <strong>de</strong> especies muy inflamables; <strong>de</strong> 0.5 a 2 m <strong>de</strong> altura, situadocomo sotobosque en masas <strong>de</strong> <strong>con</strong>íferas.- Cantidad <strong>de</strong> combustible (materia seca): 10-12 t/ha.4. Hojarasca bajo arboladoMo<strong>de</strong>lo <strong>de</strong> Combustible 8:- Bosque <strong>de</strong>nso, sin matorral- Propagación <strong>de</strong>l fuego por la hojarasca muy compacta.


- Cantidad <strong>de</strong> combustible (materia seca): 10-12 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 9:- Parecido al mo<strong>de</strong>lo 8, pero <strong>con</strong> hojarasca menos compacta, formada poracículas largas y rígidas o follaje <strong>de</strong> frondosas <strong>de</strong> hojas gran<strong>de</strong>s.- Cantidad <strong>de</strong> combustible (materia seca): 7-9 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 10:- Bosque <strong>con</strong> gran cantidad <strong>de</strong> leña y árboles caídos, como <strong>con</strong>secuancia<strong>de</strong> vendavales, plagas intensas, etc.- Cantidad <strong>de</strong> combustible (materia seca): 30-35 t/ha.5. Restos <strong>de</strong> cortas y operaciones selvícolasMo<strong>de</strong>lo <strong>de</strong> Combustible 12:- Predominio <strong>de</strong> los restos sobre arbolado- Restos <strong>de</strong> poda o aclareo cubriendo todo el suelo.- Cantidad <strong>de</strong> combustible (materia seca): 50-80 t/ha.Mo<strong>de</strong>lo <strong>de</strong> Combustible 13:- Gran<strong>de</strong>s acumulaciones <strong>de</strong> restos gruesos y pesados, cubriendo todo elsuelo.- Cantidad <strong>de</strong> combustible (materia seca): 100-150 t/ha.


Capítulo 3Metodología estadísticaEste capítulo <strong>de</strong>scribe los mo<strong>de</strong>los <strong>de</strong> regresión basados en un predictor aditivoestructurado (mo<strong>de</strong>los <strong>STAR</strong>). Estos mo<strong>de</strong>los <strong>de</strong> regresión son muy generalesy pue<strong>de</strong>n hacer frente a diferentes tipos <strong>de</strong> variables <strong>de</strong>pendientes y también <strong>con</strong>diferentes tipos <strong>de</strong> covariables. En la primera sección 3.1 <strong>de</strong> este capítulo, se da unabreve introducción en mo<strong>de</strong>los <strong>de</strong> regresión incluyendo la genaralización a mo<strong>de</strong>los<strong>STAR</strong>. La sección 3.2 trata los efectos <strong>de</strong> las distintas covariables y la sección 3.3aborda los distintos criterios <strong>de</strong> selección <strong>de</strong> los mo<strong>de</strong>los <strong>STAR</strong>.3.1. Mo<strong>de</strong>lo <strong>de</strong> <strong>Regresión</strong> Aditivo Estructurado(<strong>STAR</strong>)El objetivo <strong>de</strong>l análisis <strong>de</strong> regresión es medir la influencia <strong>de</strong> algunas variablesx j , j = 1, ..., q, llamadas covariables, en una variable y llamada <strong>respuesta</strong> o variablein<strong>de</strong>pendiente. El mo<strong>de</strong>lo más ampliamente usado es el mo<strong>de</strong>lo lineal clásico. Estemo<strong>de</strong>lo requiere una distribución gausiana en la variable <strong>respuesta</strong> (o bajo supuestosmenos estrictos que una <strong>con</strong>tinua). La relación entre la media <strong>con</strong>dicional <strong>de</strong> la<strong>respuesta</strong> y las covariables es que asume:E(y|x 1 , ..., x q ) = γ 0 + γ 1 x 1 + ... + γ q x q = γ ′ x =: η (3.1)A través <strong>de</strong> su valor y signo algebraico, los coeficientes <strong>de</strong> regresión γ 1 , ..., γ q <strong>de</strong>terminanla dirección y la fuerza <strong>de</strong> la influencia <strong>de</strong> sus covariables. El parámetro γ 0 esel término <strong>con</strong>stante o intercepto. El parámetro η es referido como predictor linealporque en la fórmula 3.1 es lineal en los coeficicentes <strong>de</strong> regresión y la relación entrecovariables y los valores esperados también son lineales.Si la variable <strong>respuesta</strong> ya no es una distribución gausiana pero pertenece a una familiaexponencial univariante, el mo<strong>de</strong>lo lineal generalizado pue<strong>de</strong> ser usado. Aquí,asumimos que el predictor lineal η y el valor esperado <strong>con</strong>dicional están vinculados25


a través <strong>de</strong> una función <strong>de</strong> <strong>respuesta</strong> h, es <strong>de</strong>cir:E(y|x 1 , ..., x q ) = h(γ 0 + γ 1 x 1 + ... + γ q x q ) = h(γ ′ x) = h(η) (3.2)Generalmente, la función h se elige <strong>de</strong> tal manera que los valores <strong>de</strong> η son transformadosal dominio <strong>de</strong>l valor esperado. Para las <strong>respuesta</strong>s <strong>de</strong> distribuciones gausianas,los valores esperados pue<strong>de</strong> adoptar todos los valores reales. Por lo tanto, una transformaciónno es necesaria y la función <strong>de</strong> i<strong>de</strong>ntidad pue<strong>de</strong> ser elegido por h, porejemplo h = id. En este trabajo se reemplaza el predictor linealη := γ 0 + γ 1 x 1 + ... + γ q x q = γ ′ x (3.3)por un predictor aditivo estructurado semiparamétrico (comparar <strong>con</strong> Fahrmeir,Kneib & Lang (2004)) <strong>de</strong> la formaη := γ 0 + f 1 (x 1 ) + ... + f q (x q ) + γ 1 u 1 + ... + γ p u p = f 1 (x 1 ) + ... + f q (x q ) + γ ′ u (3.4)La razón <strong>de</strong> usar un predictor semiparamétrico resi<strong>de</strong> en los fuertes supuestos realizadospor el predictor lineal. El predictor lineal supone:1. Una influencia lineal <strong>de</strong> las covariables en el predictor o incluso en la <strong>respuesta</strong>en el caso gausiano.2. La in<strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong> las observaciones.En muchas situaciones, sin embargo, las hipótesis no son a<strong>de</strong>cuadas y son<strong>con</strong>frontadas <strong>con</strong> uno o más <strong>de</strong> los siguientes problemas:El efecto <strong>de</strong> algunas covariables <strong>con</strong>tinuas pue<strong>de</strong> ser <strong>de</strong> una forma nolineal (<strong>de</strong>s<strong>con</strong>ocida).Las observaciones pue<strong>de</strong>n ser espacialmente correlacionadas.Las observaciones pue<strong>de</strong>n ser temporalmente correlacionadas.No pue<strong>de</strong> haber heterogeneidad no observada entre individuos o unida<strong>de</strong>sque no se explica por las covariables <strong>de</strong> las que se dispone.Pue<strong>de</strong> haber interacción compleja entre dos variables <strong>con</strong>tinuas enditemizeEl predictor aditivo estructurado (3.4) supera las dificulta<strong>de</strong>s sustituyendo losefectos lineales γ j x j por funciones f j (x j ). Las funciones f j pue<strong>de</strong>n ser <strong>de</strong> diferentetipo según los diferentes tipos <strong>de</strong> covariables x j . Por ejemplo, el factor <strong>de</strong> predicciónes capaz <strong>de</strong> mo<strong>de</strong>lizar los efecctos no lineales <strong>de</strong> variables <strong>con</strong>tinuas o escalas <strong>de</strong>tiempo y pue<strong>de</strong> manejar la información espacial o unidad específica. El predictorpue<strong>de</strong> ser semiparamétrico, es <strong>de</strong>cir, incluir una parte paramétrica γ ′ u como en laecuación 3.4, por lo que algunas covariables, en especial las variables categóricas,todavía pue<strong>de</strong> ser mo<strong>de</strong>ladas por efectos lineales. Hay que tener en cuenta que


las covariables se mo<strong>de</strong>lan linealmente por u j <strong>con</strong> el fin <strong>de</strong> distinguirlas <strong>de</strong> otrascovariables. La parte paramétrica γ ′ u <strong>con</strong>tiene también el término intercepto γ 0 .Los mo<strong>de</strong>los <strong>de</strong> regresión aditivo estructurado cubren una amplia gama <strong>de</strong> mo<strong>de</strong>losdiferentes. Algunos casos especiales que son muy <strong>con</strong>ocidos en la literatura sonlos aditivos y mo<strong>de</strong>los aditivos generalizados (Hastie y Tibshirani (1990), Rigby yStasinopoulos (2005) o Wood (2006a)),mo<strong>de</strong>los mixtos aditivos generalizados (Ruppert,Wand y Carroll (2003)), mo<strong>de</strong>los geoaditivos (Fahrmeir y Lang (2001a) oKammann y Wand (2003)), mo<strong>de</strong>los <strong>de</strong> coeficientes diferentes (Hastie y Tibshirani(1993)), regresión geográficamente pon<strong>de</strong>rada (Fotheringham, Brunsdon y Charlton(2002)) y mo<strong>de</strong>los <strong>de</strong> iteracción <strong>de</strong> tipo ANOVA (Chen (1993)).3.2. Las componentes <strong>de</strong>l mo<strong>de</strong>loComo ya mencionamos en la sección anterior, vamos a tratar <strong>con</strong> diferentes tipos<strong>de</strong> variables en el <strong>con</strong>texto <strong>de</strong> los mo<strong>de</strong>los <strong>STAR</strong>. Para cada tipo <strong>de</strong> covariable,existen una o más posibilida<strong>de</strong>s <strong>de</strong> <strong>con</strong>struir una función que represente a<strong>de</strong>cuadamentela disposición <strong>de</strong> la información. Estas posibilida<strong>de</strong>s <strong>con</strong> sus característicasespecíficas se <strong>de</strong>finen en esta sección. Todas las funciones no lineales <strong>de</strong>scritas en estasección pue<strong>de</strong>n ser escritas <strong>de</strong> forma general. Esto permite una igualdad <strong>de</strong> trato <strong>de</strong>todas las funciones no lineales para estimar los coeficientes <strong>de</strong> regresión y seleccionarlas covariables relevantes. Esto significa que, para la inferencia y algoritmos <strong>de</strong>selección solo es necesario distinguir entre dos casos: efectos lineales y funciones nolineales.Las características comunes <strong>de</strong> todas las funciones no lineales f(x) son:El vector <strong>de</strong> evaluaciones <strong>de</strong> la función f = (f 1 , ..., f n ) ′para n observacionespue<strong>de</strong> ser escrito como una combinación lineaL <strong>de</strong> una n × p matriz <strong>de</strong> diseñoX y un vector <strong>de</strong> coeficientes <strong>de</strong> regresión β = (β 1 , ..., β p ) ′ , es <strong>de</strong>cir,f = Xβ (3.5)Esto significa que todas las funciones f son lineales en sus coeficientes <strong>de</strong>regresión.En un marco bayesiano, cada función f está provista <strong>de</strong> una distribución apriori. La distribución previa <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l tipo <strong>de</strong> covariable x y en suposicionesacerca <strong>de</strong> la suavidad <strong>de</strong> la función f. Esto <strong>con</strong>duce a diferentes tipos<strong>de</strong> funciones que se <strong>de</strong>scribirán posteriormente en <strong>de</strong>talle. Generalmente, lossupuestos anteriores a cerca <strong>de</strong> f se pue<strong>de</strong>n expresar mediante la aplicación<strong>de</strong> una distribución a priori <strong>de</strong> los coeficientes <strong>de</strong> regresión. La distribución esuna distribución gausiana a<strong>de</strong>cuada o ina<strong>de</strong>cuada <strong>de</strong> la forma( ) −1p(β) ∝ exp Pβ(3.6)2τ 2 β′


<strong>con</strong> un parámetro <strong>de</strong> varianza τ 2 y una matriz <strong>de</strong> penalización P. Las distribucionesa priori <strong>de</strong> diferentes tipos <strong>de</strong> funciones se caracterizan por su matriz<strong>de</strong> penalización individual que <strong>con</strong>tiene información sobre el tipo <strong>de</strong> función ysuposiciones a cerca <strong>de</strong> la suavidad <strong>de</strong> la función. Si la matriz P es <strong>de</strong> rango<strong>de</strong>ficiente, la distribución a priori es ina<strong>de</strong>cuada, <strong>de</strong> lo <strong>con</strong>trario es apropiada.Existe una estrecha relación entre lo Bayesiano y el enfoque <strong>de</strong> verosimilitudpenalizada. Suponemos que el predictor solo <strong>con</strong>tiene la función f, es <strong>de</strong>cir,η = f = Xβ. En este caso la función <strong>de</strong> verosimilitud L(y|β) y la función <strong>de</strong>verosimilitud logarítmica l(y|β) solo <strong>con</strong>tienen el parámetro vector y ningúnotro parámetro. Entonces, la distribución a posteriori p(β|y) <strong>con</strong> el vector<strong>respuesta</strong> y = (y 1 , ..., y n ) viene dado porp(β|y) ∝ L(y|β) · p(β) (3.7)El modo <strong>de</strong> esta distribución pue<strong>de</strong> ser calculada a partir <strong>de</strong> la distribuciónlogarítmica a posteriorilog(p(β|y)) ∝ l(y|β) + log(p(β)) ∝ l(y|β) − 12τ 2 β′ Pβ (3.8)La Fórmula 3.8 es equivalente al logaritmo <strong>de</strong> verosimilitud penalizado don<strong>de</strong>la matriz <strong>de</strong> penalización P es la matriz utilizada, por lo tanto, la estimación<strong>de</strong> máxima verosimilitud y la forma <strong>de</strong> la distribución a posteriori son idénticas.En el <strong>con</strong>texto <strong>de</strong> verosimilitud penalizada, en lugar <strong>de</strong>l parámetro <strong>de</strong> varianzaτ 2 generalmente se utiliza un parámetro <strong>de</strong> suavizado para <strong>con</strong>trolar la suavidad<strong>de</strong> la función. Este parámetro <strong>de</strong> suavizado es <strong>de</strong>finido como λ := φ/τ 2(ver Green y Silverman (1994)), don<strong>de</strong> φ es el parámetro <strong>de</strong> escala <strong>de</strong> la distribución<strong>de</strong> la variable <strong>respuesta</strong>, es <strong>de</strong>cir,φ = τ 2 y λ := σ2 para el casoτ 2especial <strong>de</strong> <strong>respuesta</strong> <strong>con</strong> distribución gausiana. La fórmula <strong>de</strong>l logaritmo <strong>de</strong>verosimilitud penalizado, la cuál ha <strong>de</strong> ser maximizada para el cálculo <strong>de</strong> lasestimaciones <strong>de</strong> β, se <strong>de</strong>fine comol pen (y|β) = φ · l(y|β) − 1 2 λβ′ Pβ (3.9)Todas las distribuciones a priori (3.6) incluyen un parámetro <strong>de</strong> varianza τ 2que influye en la forma <strong>de</strong>l efecto estimado. En este apartado <strong>con</strong>si<strong>de</strong>ramos elparámetro τ 2 o equivalente al parámetro <strong>de</strong> suavización λ para cada función,tanto no lineal como fija.3.2.1. Efectos LinealesComo se mencionó en la sección anterior, un predictor aditivo estructurado <strong>con</strong>tienea menudo una parte paramétrica que incluye variables u j , j = 1, ..., q que han


<strong>de</strong> ser mo<strong>de</strong>ladas linealmente. A<strong>de</strong>mas, el predictor siempre <strong>con</strong>tiene un términointercepto γ 0 . Para el vector <strong>de</strong> parámetros <strong>de</strong> regresión γ = (γ 0 , ..., γ q ) ′para todoslos efectos lineales incluidos en el término intercepto γ 0 , no utilizamos ninguna penalización.En este caso, obtenemos las estimaciones <strong>de</strong> máxima verosimilitud <strong>de</strong> loscoeficientes.3.2.2. Variables CategóricasCon el fin <strong>de</strong> estimar el efecto <strong>de</strong> una variable categórica u <strong>con</strong> k ≥ 2 categorías,la variable está representada por k − 1 variables dummy. Una <strong>de</strong> las categoríastiene que ser especificada como categoría <strong>de</strong> referencia. Sin restricción, el número <strong>de</strong>categorías 1, ..., k utiliza la última categoría k como referencia.Codificación dummy. Las variables dummy u j , j = 1, ..., k − 1 se <strong>de</strong>finen comou j ={ 1, si u = j0, en otro caso(3.10)La categoría <strong>de</strong> referencia se indica mediante entradas <strong>de</strong> cero en todas lasvariables dummy. El efecto <strong>de</strong> la variable categórica es una combinación lineal<strong>de</strong> todas las variables dummy, es <strong>de</strong>cirγ 1 · u 1 + ... + γ k−1 · u k−1y se aña<strong>de</strong> a la parte paramétrica <strong>de</strong>l predictor.Codificación efecto, que trabaja <strong>de</strong> forma similar a la anterior pero las variablesu j son ahora <strong>de</strong>finidas por⎧⎨ 1, si u = ju j = −1, si u = k⎩0, en otro caso(3.11)para j = 1, ...k−1. Esto <strong>con</strong>duce a una interpretación diferente <strong>de</strong> los coeficientes<strong>de</strong> regresión. Un parámetro para la categoría <strong>de</strong> referencia pue<strong>de</strong> calcularsepor∑k−1γ k = −El intercepto representa el promedio <strong>de</strong> todas las categorías y parámetros γ jy la diferencia entre esta media y la categoría j.j=1γ j


3.2.3. Covariables ContinuasEn esta sección, <strong>con</strong>si<strong>de</strong>ramos que el mo<strong>de</strong>lo simple η i = f(x i ), i = 1, ..., n,don<strong>de</strong> la función f se supone que es una función suave <strong>de</strong> una variable <strong>con</strong>tinuao escala <strong>de</strong> tiempo x. Para aproximar estas funciones no lineales, hay diferentesenfoques en la literatura, ya sea en función <strong>de</strong> los enfoques <strong>de</strong> probabilidad local(véase, por ejemplo Fan y Gijbels (1984) y Loa<strong>de</strong>r (1999)) o en una expansión <strong>de</strong>funciones <strong>de</strong> la base. En este trabajo se <strong>con</strong>si<strong>de</strong>rará el último caso.B-SplinesLas funciones <strong>de</strong> base que se usan son funciones spline polinomiales que se<strong>de</strong>finen a trozos sobre un <strong>con</strong>junto <strong>de</strong> nodos. Los nodos se separan <strong>de</strong>l rando <strong>de</strong> lavariable x comox min = k 0 < ... < k r = x maxCada función <strong>de</strong> base, respectivamente, cada spline, esUn polinomio <strong>de</strong> grado l en el intervalo [k i , k i+1 ], i = 0, ..., r − 1l − 1 veces <strong>con</strong>tinuamente diferenciables en los nodos k i (l veces en todos losotros puntos a<strong>de</strong>más <strong>de</strong> los nodos).La función f pue<strong>de</strong> ser escrita como una combinación lineal <strong>de</strong> las funciones <strong>de</strong>la base B j , es <strong>de</strong>cirf(x i ) = β 1 · B 1 (x i ) + ... + β p · B p (x i ), don<strong>de</strong> p = l + r (ver De Boor (1978) o Dierckx (1995)). Los términos B j (x i )<strong>de</strong>notan el valor <strong>de</strong> la j − th función <strong>de</strong> base evaluada en el punto <strong>de</strong> observación x iy sirven como nuevas covariables. La propia función f también pue<strong>de</strong> ser llamadaspline, ya que tiene las mismas propieda<strong>de</strong>s que se ha <strong>de</strong>scrito anteriormente. Enla notación matricial, cada fila i <strong>de</strong> la matriz <strong>de</strong> diseño X = (B j (x i )) <strong>con</strong>tiene lasevaluaciones <strong>de</strong> las funciones <strong>de</strong> todas las funciones <strong>de</strong> base para el respectivo punto<strong>de</strong> observación x i . El vector <strong>de</strong> la función <strong>de</strong> evaluación f está dado por f = Xβ.P-SplinesUna cuestión crucial <strong>con</strong> B-splines es la elección <strong>de</strong> los nodos, afectando tantoen el número <strong>de</strong> nodos como su ubicación. La pregunta es cuántos nodos <strong>de</strong>berían serelegidos <strong>de</strong> modo que la función resultante no sea <strong>de</strong>masiado duro ni para suavizar.


Este problema a menudo se llama equilibrio <strong>de</strong>l sesgo y la varianza (ver Hastie yTibshirani (1990)): muchos nodos resultado <strong>de</strong> una función en bruto que está cerca<strong>de</strong> los datos y por lo tanto tiene un pequeño sesgo. Sin embargo, la varianza <strong>de</strong> estafunción es gran<strong>de</strong>. Pocos nodos resultan en una función suave que tiene sólo unapequeña varianza pero un alto sesgo en su lugar. Un problema adicional cuando seeligen sólo unos pocos nodos es dón<strong>de</strong> colocar los nudos.Para superar estos problemas, hay dos enfoques diferentes en la literatura: el primerose basa en la selección adaptativa <strong>de</strong>l nodo don<strong>de</strong> los nodos son elegidos cuidadosamente,pero en las posiciones que dan lugar a una función suficientemente flexible.Enfoques bayesianos para la selección adaptativa <strong>de</strong>l nodo se <strong>de</strong>scriben en Biller(2000). El segundo método utiliza una sanción dura. La i<strong>de</strong>a es utilizar un númerorelativamente gran<strong>de</strong> <strong>de</strong> funciones <strong>de</strong> la base para obtener la suficiente flexibilidad.La suavidad se <strong>con</strong>sigue por un término <strong>de</strong> penalización que impone restriccionessobre el vector <strong>de</strong> parámetros β, como por ejemplo la reducción <strong>de</strong> los parámetros acero o penalizar saltos abruptos entre los parámetros adyacentes. Para ese propósito,el logaritmo <strong>de</strong> verosimilitud se sustituye por un logaritmo <strong>de</strong> verosimilitud penalizado<strong>de</strong>finido por:l pen (y|β 1 , ..., β p ) = φ · l(y|β 1 , ..., β p ) − 1 · penalty(λ), (3.12)2don<strong>de</strong> el equilibrio entre el sesgo y la varianza, es <strong>de</strong>cir, entre la flexibilidad y lasuavidad, es <strong>con</strong>trolado por el parámetro <strong>de</strong> suavización λ.Utilizamos la llamada P(enalised)-splines la cual fue introducida por Eilers yMarx (1996) y Marx y Eilers (1998) y que se basan en la base B-splines. Aquí 20-40 nodos son elegidos, por lo general equidistantes en el rango <strong>de</strong> x. Con el fin <strong>de</strong>asegurar la suavidad se utiliza un término <strong>de</strong> penalización diferente que <strong>con</strong>sta <strong>de</strong>las diferencias cuadráticas <strong>de</strong> coeficientes adyacentes, es <strong>de</strong>cir,penalty(λ) = λ ·p∑(∆ k β j ) 2 = λ · β ′ Pβ, (3.13)j=k+1don<strong>de</strong> ∆ k <strong>de</strong>nota diferencias <strong>de</strong> or<strong>de</strong>n k. Por lo general, las diferencias <strong>de</strong> or<strong>de</strong>nk = 1 o k = 2 son usadas. Para nodos equidistantes, estos toman la forma:∆ 1 β j = β j − β j−1 y ∆ 2 β j = β j − 2β j−1 + β j−2 (3.14)Generalmente, las diferencias <strong>de</strong> or<strong>de</strong>n k se pue<strong>de</strong>n <strong>de</strong>finir <strong>de</strong> forma recursivacomo ∆ k β j = ∆ 1 (∆k − 1β j ) <strong>con</strong> ∆ 0 β j = β j . Por lo tanto, las diferencias <strong>de</strong> segundoor<strong>de</strong>n se pue<strong>de</strong>n calcular como∆ 2 β j = ∆ 1 β j + ∆ 1 β j−1 = β j − β j−1 − (β j−1 − β j−2 )


Mediante la <strong>de</strong>finición (p − k) × p <strong>de</strong> matrices <strong>de</strong> diferencia D k , es posible escribirlas diferencias para todos los parámetros en notación matricial usando el productoD k β. Para k = 1 y k = 2 las matrices D k toma la forma⎛D 1 = ⎜⎝−1 1−1 1. .. . ..−1 1⎞⎟⎠⎛y D 2 = ⎜⎝−1 −2 11 −2 1. .. . .. . ..1 −2 1⎞⎟⎠Para la matriz <strong>de</strong> penalización P k = D ′ kD k obtenemos⎛P 1 =⎜⎝−1 1−1 2 −1. .. . .. . ..−1 2 −1−1 1⎞⎟⎠⎛y P 2 =⎜⎝1 −2 1−2 5 −4 11 −4 6 −4 1. .. . .. . .. . .. . ..1 −4 6 −4 11 −4 5 −21 −2 1⎞⎟⎠Un parámetro <strong>de</strong> suavización pequeño λ da lugar a una función <strong>con</strong> sesgo pequeñopero varianza gran<strong>de</strong>. En el límite λ → 0 no se produce penalización enabsoluto. Por el <strong>con</strong>trario, un parámetro <strong>de</strong> suavizado gran<strong>de</strong> se traduce en unafunción <strong>con</strong> alto sesgo y la baja varianza. El límite λ → ∞ <strong>con</strong>duce a resultadosdiferentes en función <strong>de</strong>l or<strong>de</strong>n k elegido: la penalización <strong>de</strong> las diferencias <strong>de</strong> primeror<strong>de</strong>n <strong>con</strong>duce a una función <strong>con</strong>stante y penalización <strong>de</strong> diferencias <strong>de</strong> segundoor<strong>de</strong>n a un ajuste lineal. Una versión bayesiana <strong>de</strong> P-splines ha sido introducida porLang y Brezger (2004) y Brezger y Lang (2006).3.2.4. Escala <strong>de</strong> TiempoEl efecto <strong>de</strong>l tiempo a menudo se pue<strong>de</strong> dividir en una ten<strong>de</strong>ncia suave y unacomponente estacional, es <strong>de</strong>cirf tiempo (t) = f tend. suave (t) + f comp. estacional (t) (3.15)Con el fin <strong>de</strong> aproximar la función <strong>de</strong> ten<strong>de</strong>ncia suave po<strong>de</strong>mos usar el mismotipo <strong>de</strong> funciones no lineales como las covariables <strong>con</strong>tinuas, es <strong>de</strong>cir, P-splines opaseos aleatorios (ver Fahrmeir y Lang (2001a)).


3.2.5. Covariables EspacialesEn esta sección se aborda el mo<strong>de</strong>lado <strong>de</strong> correlación espacial cuando se observanlos puntos <strong>de</strong> datos en diferentes localizaciones. A menudo esta correlaciónespacial se pue<strong>de</strong> atribuir a diferentes covariables no observables. La <strong>con</strong>strucción<strong>de</strong> una función espacial don<strong>de</strong> las funciones <strong>de</strong> evaluación se correlacionan en todoslos lugares es el objetivo en este apartado. A veces hay factores adicionales noobservables, cuyo efecto es in<strong>de</strong>pendiente el uno <strong>de</strong>l otro en diferentes lugares.f espacial (s) = f estructurado (s) + f no estructurado (s) (3.16)Se <strong>con</strong>si<strong>de</strong>ra el caso <strong>de</strong> que la covariable s representa una ubicación en regionesgeográficas <strong>con</strong>ectadas. En este caso, una función espacial suavizada pue<strong>de</strong> sermo<strong>de</strong>lizada por el campo aleatorio <strong>de</strong> Markov (MRF). Una parte importante en la<strong>con</strong>strucción <strong>de</strong> los MRF es el <strong>con</strong>junto <strong>de</strong> vecinos que <strong>de</strong>ben <strong>de</strong> ser <strong>de</strong>finidos paracada región s. Generalmente, los vecinos <strong>de</strong> un área s <strong>con</strong>siste en todas las regionesque comparten una frontera común <strong>con</strong> s. Para <strong>de</strong>finiciones más complejas sobrevecindad, se pue<strong>de</strong> <strong>con</strong>sultar en Besag, York y Mollie (1991). La i<strong>de</strong>a es que lasregiones adyacentes son más similares que las ubicaciones arbitrarias.La función <strong>de</strong> evaluación anterior f espacial (s) = β s toma la forma⎛β s |β s′, s ′ ≠ s ∼ N ⎝ 1 ∑N ss ′ ∈δsβ s′, τ 2N s⎞⎠ (3.17)don<strong>de</strong> δ s <strong>de</strong>nota el <strong>con</strong>junto <strong>de</strong> vecinos <strong>de</strong> la región s y N s = |δ s | el número <strong>de</strong> estosvecinos. Una <strong>con</strong>tabilidad antes <strong>de</strong> la mejora <strong>de</strong> las irregularida<strong>de</strong>s en el mapa sepue<strong>de</strong> lograr por <strong>de</strong>finir una versión pon<strong>de</strong>rada similar a la <strong>de</strong> paseos aleatorios <strong>de</strong>una dimensión, es <strong>de</strong>cir,⎛β s |β s′, s ′ ≠ s ∼ N ⎝ ∑ s ′ ∈δs⎞w ′ ssw s + β ′, τ 2⎠s (3.18)w s+don<strong>de</strong> w s+ = ∑ s ′ ∈δs w ′ ss y los pesos w ′ ss <strong>de</strong>pen<strong>de</strong>n <strong>de</strong> una medida <strong>de</strong> la distanciaentre las regiones s y s ′ . Una medida <strong>de</strong> la distancia se pue<strong>de</strong> especificar <strong>de</strong> acuerdo<strong>con</strong> uno <strong>de</strong> los siguientes ejemplos:Si uno supone siempre la misma distancia entre las regiones adyacentes, lospesos se <strong>con</strong>vierten en w ′ ss = 1 y la reduce a la Fórmula 3.17 anterior.Los pesos pue<strong>de</strong>n ser elegidos proporcional a la longitud <strong>de</strong> la frontera común.


Los pesos se pue<strong>de</strong>n elegir inversamente proporcionales a la distancia euclídiad(s, s ′) entre los centroi<strong>de</strong>s <strong>de</strong> dos regiones, es <strong>de</strong>cir, w ss ′ ∝exp(−d(s,s ′ )).Para las p regiones, la matriz <strong>de</strong> diseño X es una matriz <strong>de</strong> or<strong>de</strong>n n×p indicandosi la observación i pertenece a la región s(X is = 1) o no s(X is = 0).Hay que tener en cuenta que, la evaluación <strong>de</strong> la función <strong>de</strong> una región pue<strong>de</strong>estimarse incluso si no hay observaciones disponibles para esta región. Esto es <strong>de</strong>bidoa los supuestos <strong>de</strong> suavidad incluidos en la distribución a priori. La MRF pue<strong>de</strong>aplicarse también cuando un número relativamente pequeño <strong>de</strong> ubicaciones exactass = (s x , s y ) están disponibles mediante la <strong>de</strong>finición <strong>de</strong> una estructura <strong>de</strong> entornosimétrico. Para un gran <strong>con</strong>junto <strong>de</strong> diferentes ubicaciones o si se requiere una estimación<strong>de</strong> la superficie, existen otros enfoques, más preferibles. Una posibilidad, noimplementada para nuestros algoritmos <strong>de</strong> selección, son GRF (Gaussian RandomField) que asumen una función <strong>de</strong> correlación bidimensional al mo<strong>de</strong>lo <strong>de</strong> correlaciónespacial (ver Kammann y Wand (2003) o Kneib (2006)). Otra posibilidad <strong>de</strong>basar la estimación en splines tensor <strong>de</strong> productos penalizados bidimensionales. La<strong>de</strong>sventaja <strong>de</strong> este enfoque (en <strong>con</strong>traste <strong>con</strong> un GRF) son las funciones <strong>de</strong> baseanisotrópicas (ver Kneib (2006)). En este caso, las líneas <strong>de</strong> las funciones <strong>de</strong> base<strong>de</strong> los gráficos <strong>de</strong> <strong>con</strong>torno no forman círculos, sobre todo para un pequeño grado l.Esto implica, que las diferentes direcciones se tratan <strong>de</strong>sigualmente.3.2.6. Heterogeneidad no observadaEn este apartado se tratan datos que <strong>con</strong>sisten en observaciones repetidas <strong>de</strong>individuos o <strong>de</strong>ntro <strong>de</strong> grupos, como grupos o regiones. No pue<strong>de</strong> haber diferenciasentre las unida<strong>de</strong>s individuales o grupos que se <strong>de</strong>ben a factores no observados.Para superar este problema, es posible estimar un efecto aleatorio que mo<strong>de</strong>la lasdiferencias entre cada unidad y la media global. Para ello usamos efectos aleatoriosgausianos i.i.d asumiendo los parámetros β i , i = 1, ..., p para los individuos p quese distribuyen normalmente <strong>de</strong> forma in<strong>de</strong>pendiente <strong>con</strong> un parámetro <strong>de</strong> varianzacomún, es <strong>de</strong>cir,β i ∼ N(0, τ 2 ) (3.19)Aquí la distribución <strong>con</strong>junta para β es una distribución normal a<strong>de</strong>cuada. Sinembargo, se pue<strong>de</strong> escribir en la misma forma general 3.6 como todas las otrasdistribuciones a priori mediante el uso <strong>de</strong> la matriz <strong>de</strong> i<strong>de</strong>ntidad, es <strong>de</strong>cir, P rand = I.Esta matriz es <strong>de</strong> rango completo, <strong>de</strong> modo que el espacio nulo es <strong>de</strong> dimensión ceroy sólo <strong>con</strong>tiene el vector nulo 0 = (0, ..., 0) ′ .La matriz <strong>de</strong> diseño X es <strong>de</strong> nuevo una matriz 0/1 <strong>de</strong> inci<strong>de</strong>ncia <strong>de</strong> or<strong>de</strong>n n × p.Si el efecto aleatorio se utiliza para estimar un efecto espacial no estructurado, la


matriz <strong>de</strong> diseño <strong>de</strong>l efecto aleatorio es exactamente idéntica a la que pertenece alefecto espacial estructurado. Un efecto aleatorio incluye un término <strong>con</strong>stante aligual que todas las <strong>de</strong>más funciones univariantes que se <strong>de</strong>scriben en este capítulo.Pero a diferencia <strong>de</strong> otras funciones univariantes, los efectos aleatorios penalizanel término <strong>con</strong>stante. Esto se pue<strong>de</strong> ver a partir <strong>de</strong> la matriz <strong>de</strong> penalización cuyoespacio nulo <strong>con</strong>tiene simplemente el vector nulo.3.2.7. Coeficientes <strong>de</strong> VariaciónEn los apartados anteriores se han introducido diversos métodos <strong>de</strong> mo<strong>de</strong>lización<strong>de</strong> diferentes tipos <strong>de</strong> efectos <strong>de</strong> una dimensión. Ahora vamos a <strong>de</strong>scribir extensionesque nos permiten mo<strong>de</strong>lar las interacciones <strong>de</strong> dos dimensiones. Distintos coeficientesfueron primero popularizado por Hastie y Tibshirani (1993) en el <strong>con</strong>texto <strong>de</strong> splinessuavizados. Aquí, la pendiente <strong>de</strong> una variable z varía suavemente sobre el alcance<strong>de</strong> otra variable v <strong>de</strong>finiendo el término,f(v, z) = g(v)z (3.20)A menudo, la variable <strong>de</strong> interacción z es categórica, pero pue<strong>de</strong> ser <strong>con</strong>tinuatambién. El efecto <strong>de</strong> modificar v pue<strong>de</strong> ser una variable <strong>con</strong>tinua, una localizaciónespacial o un grupo indicador. El vector <strong>de</strong> la función <strong>de</strong> evaluaciones f pue<strong>de</strong> serescrito como una combinación lineal.f = Xβ, (3.21)Usando una matriz <strong>de</strong> diseño X y un vector <strong>de</strong> coeficientes β = (β 1 , ..., β p ) ′ . Lamatriz <strong>de</strong> diseño para f(v, z) se basa tanto en las observaciones <strong>de</strong> z y <strong>de</strong> v y secalcula comoX = diag(z 1 , ..., z n )V, (3.22)don<strong>de</strong> V es la matriz <strong>de</strong> diseño correspondiente a g(v).Algunos casos especiales <strong>de</strong> diferentes coeficientes a veces aparecen bajo unnombre diferente: si el efecto <strong>de</strong> modificar v es un indicador <strong>de</strong> grupo, la funciónf(v, z) <strong>de</strong> dos dimensiones (v, z) se llama la pendiente aleatoria. Los mo<strong>de</strong>los queincluyen un coeficiente diferente <strong>con</strong> un efecto espacial como función modificada se<strong>con</strong>oce como regresión geográficamente pon<strong>de</strong>rada (ver Fotheringham, Brunsdon yCharlton (2002)). Los mo<strong>de</strong>los dinámicos se basan en coeficientes <strong>de</strong> variaciones <strong>de</strong>tiempo (véase Fahrmeir y Tutz (2001)).


Por último, echamos un vistazo en el límite <strong>de</strong> f(v, z) para λ → ∞ o equivalenteτ 2 → 0. Esto <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la distribución a priori impuesta a la función univarianteg(v). Las funciones <strong>de</strong> límite g (∞) (v)z se <strong>de</strong>scriben en las secciones respectivas <strong>de</strong>todas las funciones univariantes g. La función <strong>de</strong> límite <strong>de</strong>l coeficiente <strong>de</strong> variaciónesf (∞) (v, z) = g (∞) (v)z (3.23)Esto significa que, f (∞) (v, z) es igual a cero si g(v) es un efecto aleatorio <strong>de</strong> zpara un paseo aleatorio a priori <strong>de</strong> primer or<strong>de</strong>n (MRF o P-spline <strong>de</strong> primer or<strong>de</strong>n).Para un paseo aleatorio a priori <strong>de</strong> segundo or<strong>de</strong>n se obtiene una interacción <strong>de</strong> laforma f (∞) (v, z) = c 1 · z + c 2 · v · z.3.3. Criterios <strong>de</strong> Selección <strong>de</strong>l mo<strong>de</strong>loLa selección <strong>de</strong> variables y parámetros <strong>de</strong> suavizado se basa en los criterios <strong>de</strong>selección. Hay una amplia variedad <strong>de</strong> criterios <strong>de</strong> selección disponibles. En estetrabajo se restringe a algunos <strong>de</strong> los criterios más utilizados que pue<strong>de</strong>n ser usadosen combinación <strong>con</strong> nuestros algoritmos <strong>de</strong> selección. Una <strong>de</strong>scripción <strong>de</strong>tallada <strong>de</strong>este tema se pue<strong>de</strong> en<strong>con</strong>trar en Miller (2002), por ejemplo.3.3.1. Criterio <strong>de</strong> Información <strong>de</strong> Akaike (AIC)El Criterio <strong>de</strong> Información <strong>de</strong> Akaike o AIC fue introducido originalmente porAkaike (1973). Burnham y An<strong>de</strong>rson (1998) o Cavanaugh (1997) <strong>de</strong>rivaron el AIC<strong>de</strong>s<strong>de</strong> la distancia <strong>de</strong> Kullback-Leibler∫I(f, g) =( ) ∫f(y)f(y)ln dy =g(y|θ)∫f(y)ln(f(y))dy −f(y)ln(g(y|θ))dy, (3.24)A menudo, el mo<strong>de</strong>lo g presenta una familia <strong>de</strong> mo<strong>de</strong>los que <strong>de</strong>pen<strong>de</strong>n <strong>de</strong>lparámetro θ. Cuanto menor sea el valor <strong>de</strong> I(f, g) mejor es el mo<strong>de</strong>lo g asumido.El AIC es una estimación <strong>de</strong> la expectativa <strong>de</strong>l segundo término, multiplicado pordos. Por lo tanto, el AIC no tiene cero natural. Eso significa que, el AIC pue<strong>de</strong> serutilizado para comparar los mo<strong>de</strong>los, pero no da evi<strong>de</strong>ncia <strong>de</strong> la calidad real <strong>de</strong> unmo<strong>de</strong>lo. La fórmula para AIC esAIC = −2 · l(θ|y) + 2 · p, (3.25)


don<strong>de</strong> l(θ|y) = ln(g(y|θ)) es el logaritmo <strong>de</strong> verosimilitud <strong>de</strong>l mo<strong>de</strong>lo y p es elnúmero <strong>de</strong> parámetros estimados en θ. Para la selección en mo<strong>de</strong>los <strong>de</strong> regresiónlineal, el vector θ incluye todos los coeficientes <strong>de</strong> regresión y, posiblemente, unparámetro <strong>de</strong> escala (en función <strong>de</strong>l tipo <strong>de</strong> distribución <strong>de</strong> la variable <strong>respuesta</strong>).En fórmula 3.25 los mo<strong>de</strong>los g asumidos son funciones <strong>de</strong> verosimilitud. Enlos mo<strong>de</strong>los aditivos estructurados realizamos inferencia <strong>de</strong> máxima verosimilitudpenalizada, por lo que los mo<strong>de</strong>los g asumidos ahora son probabilida<strong>de</strong>s penalizadas.En la forma general el AIC tiene la fórmula (comparar Hastie y Tibshirani (1990))AIC = −2l(θ|y) + 2tr(H) = −2l(θ|y) + 2df total , (3.26)don<strong>de</strong> la matriz hat H es la matriz que proyecta la información y <strong>de</strong> los valoresajustados, es <strong>de</strong>cir, ŷ = Hy. En el caso <strong>de</strong> <strong>respuesta</strong> no gausiana, H es la matriz<strong>de</strong> evaluación <strong>de</strong> la última iteración <strong>de</strong>l algoritmo <strong>de</strong> puntuación, es <strong>de</strong>cir, ˆη = Hȳ.A<strong>de</strong>más, nos referimos a la cantidad df total := tr(H) como los grados <strong>de</strong> libertad <strong>de</strong>lmo<strong>de</strong>lo. En inferencia <strong>de</strong> máxima verosimilitud la cantidad tr(H) es igual al número<strong>de</strong> parámetros <strong>de</strong> regresión.3.3.2. Criterio <strong>de</strong> Información Bayesiano (BIC)El Criterio <strong>de</strong> Información Bayesiano (BIC) se <strong>de</strong>riva <strong>de</strong> Schwarz (1978). El BICse origina a partir <strong>de</strong> un <strong>con</strong>texto bayesiano. Supongamos que tenemos dos mo<strong>de</strong>lodiferentes M i ,i = 1, 2, los cuales asumen unas probabilida<strong>de</strong>s a priori p(M 1 ) y p(M 2 ).Los ceoficientes <strong>de</strong> regresión a priori son <strong>de</strong>finidos <strong>con</strong>dicionalmente en el mo<strong>de</strong>lopor p(θ i |M i ). Con el teorema <strong>de</strong> Bayes se obtiene la probabilidad a posteriori paracada mo<strong>de</strong>lo porp(M i |y) =p(y|M i )p(M i )p(y|M 1 )p(M 1 ) + p(y|M 2 )p(M 2 ) , (3.27)don<strong>de</strong> la expresión p(y|M i ) es la verosimilitud marginal <strong>de</strong>l mo<strong>de</strong>lo y se calculacomo∫p(M i |y) =p(y|θ i , M i )p(θ i |M i )dθ i . (3.28)El término p(y|θ i , M i ) es la función <strong>de</strong> verosimilitud para los parámetros θ i . Pararespon<strong>de</strong>r a la cuestión <strong>de</strong> cuál <strong>de</strong> los dos mo<strong>de</strong>los es superior, se pue<strong>de</strong> utilizar elfactor <strong>de</strong> Bayes (ver Kass y Raftery (1995))


B 12 = p(y|M 1)p(y|M 2 ) , (3.29)El cual apoya que M 1 si B 12 > 1. El BIC es una aproximación al factor <strong>de</strong> Bayesy permite evitar la especificación <strong>de</strong> probabilida<strong>de</strong>s a priori. En algunos lugares, laselección <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> BIC es incluso igual a la selección basada en los factores <strong>de</strong>Bayes (ver Kass y Raftery (1995) para más <strong>de</strong>talles). La fórmula <strong>de</strong> BIC esBIC = −2l(θ|y) + log(n) · p, (3.30)don<strong>de</strong> p es el número <strong>de</strong> parámetros y n el número <strong>de</strong> observaciones.3.3.3. Validación Cruzada Genaralizada (GCV)Supongamos que tenemos un mo<strong>de</strong>lo <strong>con</strong> una variable <strong>respuesta</strong> <strong>con</strong> distribuciónnormal y que solo <strong>con</strong>tiene una función no lineal, es <strong>de</strong>cir,y i = f(x i ) + ɛ i , (3.31)don<strong>de</strong> ɛ i ∼ N(0, σ 2 ). En este caso, la proyección <strong>de</strong> la matriz H y los datos ysobre los valores ajustados vienen dados porH = X(X ′ X + λP) −1 X ′ (3.32)don<strong>de</strong> X es el diseño respectivo y P es la matriz penalizada. Con el fin <strong>de</strong><strong>de</strong>terminar un valor a<strong>de</strong>cuado para el parámetro <strong>de</strong> suavizado λ se pue<strong>de</strong> utilizar lavalidación cruzada <strong>de</strong>jando fuera una observación a la vez. Es <strong>de</strong>cir, el criterioCV = 1 nn∑(y i −i=1ˆf−iλ (x i)) 2 , (3.33)reduce al mínimo λ, don<strong>de</strong> fˆ −iλ(x i) se estimó sin observación (y i , x i ). La funciónf ˆ−iλ(x i) pue<strong>de</strong> calcularse directamente a partir <strong>de</strong> la matriz H sin estimar losdiferentes mo<strong>de</strong>los n a través <strong>de</strong>ˆf −iλ (x i) =n∑j=1,j≠1H ij1 − H iiy j . (3.34)Usando esta relación, la fórmula 3.33 se pue<strong>de</strong> escribir como


CV = 1 n()n∑−iy i − ˆfλ (x 2i). (3.35)1 − H iii=1Mediante la sustitución <strong>de</strong> los elementos diagonales H iitr(H)/n se obtiene la validación cruzada generalizadapor su valor medioGCV = 1 n(n∑ y i − ˆf) 2λ (x i ). (3.36)1 − tr(H)/ni=1En un mo<strong>de</strong>lo aditivo estructurado <strong>con</strong> varios términos y <strong>con</strong> posiblementeerrores heterocedásticos la fórmula más general esGCV = 1 nn∑() 2 yi − ˆη iw i , (3.37)1 − tr(H)/ni=1don<strong>de</strong> H representa <strong>de</strong> nuevo la matriz hat para todo el mo<strong>de</strong>lo y, a<strong>de</strong>más,incluye la matriz <strong>de</strong> pesos W. Para el caso <strong>de</strong> una variable <strong>respuesta</strong> que siga undistribución no normal, el criterio GCV se pue<strong>de</strong> adaptar mediante el uso <strong>de</strong> la suma<strong>de</strong> cuadrados residual basado en el último paso <strong>de</strong>l algoritmo <strong>de</strong> puntuación (verWood (2006a)):GCV = 1 nn∑i=1( ) (ȳi − ˆη i ) 2 2d i , (3.38)1 − tr(H)/n


Capítulo 4Explorando la inci<strong>de</strong>ncia <strong>de</strong>incendios forestales totales yprovocadosLa probabilidad <strong>de</strong> incendio <strong>de</strong>pen<strong>de</strong> <strong>de</strong> dos factores: 1) Las <strong>con</strong>diciones climáticas(Andrews, 1986; Van Wagner, 1987, Dickson, et al. (2006) y 2) El tipo y estructura<strong>de</strong> la vegetación (Mermoz, et al. 2005) que en algunos casos favorece y enotros casos parece frenar su avance (Nunes, et al. 2005) y que en zonas <strong>con</strong>si<strong>de</strong>radas<strong>de</strong> referencia están totalmente relacionadas <strong>con</strong> las <strong>con</strong>diciones socioe<strong>con</strong>ómcicas(Chas, 2007; Marey-Pérez, et al. 2006; Marey- Pérez y Rodríguez-Vicente, 2008).Las <strong>con</strong>diciones meteorológicas futuras no se <strong>con</strong>ocen <strong>con</strong> exactitud, lo que invalidalos mo<strong>de</strong>los basados en factores meteorológicos en la planificación forestal, pero sipue<strong>de</strong>n ser utilizados para la simulación <strong>de</strong> previsibles escenarios. Por otra parte,la gran cantidad <strong>de</strong> datos <strong>de</strong> valores medios <strong>de</strong> las diferentes variables climáticasson <strong>con</strong>ocidos, lo que significa que pue<strong>de</strong> utilizarse en los mo<strong>de</strong>los predictores. Laexistencia <strong>de</strong> correlaciones <strong>de</strong> estas variables climáticas <strong>con</strong> parámetros <strong>de</strong> sitio talescomo longitud, latitud, altitud, pendiente y orientación implica que estos parámetrospue<strong>de</strong>n mojorar las prediciones en la elaboración <strong>de</strong> mo<strong>de</strong>los.En este capítulo se presentan aplicaciones <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> regresión <strong>STAR</strong><strong>de</strong> <strong>respuesta</strong> binomial. El objetivo principal es evaluar factores <strong>de</strong> riesgo naturalesque serán incluidos como covariables en los mo<strong>de</strong>los <strong>de</strong> regresión, los cuales sonanalizados <strong>con</strong> más <strong>de</strong>talle a lo largo <strong>de</strong> este capítulo. Para estimar dichos mo<strong>de</strong>los, seempleó la función bayesx <strong>de</strong>l paquete estadístico R2BayesX para R (R DevelopmentCore Team 2007).41


4.1. Mo<strong>de</strong>lización a partir <strong>de</strong> variables meteorológicasComo punto <strong>de</strong> partida en el análisis <strong>de</strong> los datos, en esta sección se relacionala ocurrencia <strong>de</strong> incendios forestales totales y provocados <strong>con</strong> las variables meteorológicasta media, hr y pp junto <strong>con</strong> el MDT200 que permite <strong>con</strong>ocer la altitud encada cuadrícula.4.1.1. Corrección <strong>de</strong> los datos meteorológicosUn primer paso para el mo<strong>de</strong>lado <strong>de</strong> la ocurrecia <strong>de</strong> incendios forestales a partir<strong>de</strong> variables meteorológicas, es <strong>con</strong>ocer que estación mi<strong>de</strong> las variables necesariaspara su cálculo y que a<strong>de</strong>más sea la estación más cercana que midió esa variable encada cuadrícula. Debido a la diferencia <strong>de</strong> altitud entre la estación más cercana ala cuadrícula y la cuadrícula, es necesario hacer una corrección <strong>de</strong> las variables <strong>de</strong>temperatura y precipitaciones <strong>con</strong> respeto a la diferencia <strong>de</strong> altimetría, tal y comose explica a <strong>con</strong>tinuación.1. Corrección <strong>de</strong> los datos <strong>de</strong> temperatura media:La variación <strong>de</strong> la temperatura <strong>con</strong> la altura es <strong>de</strong> 0,65 ºC/ 100 m hasta los11000 m (Núñez y Colhoun 1986), es <strong>de</strong>cir:tH = 15 ºC − 0,0065 ºC/m · H (4.1)don<strong>de</strong> tH es la temperatura <strong>de</strong>l aire a una altura H y H es la diferencia <strong>de</strong>altitud entre dos puntos.2. Corrección <strong>de</strong> los datos <strong>de</strong> precipitación:Un método simple <strong>de</strong> corrección <strong>de</strong> la precipitación (P) en función <strong>de</strong> la altitud(h), <strong>de</strong>l que es preciso saber que no <strong>con</strong>templa efectos <strong>de</strong> factores como laubicación a barlovento o sotavento en montañas próximas al mar, sería elsiguiente:P corregida (mensual) = P mensual ± 0,08 (4.2)Por lo tanto, el gradiente <strong>de</strong> precipitaciones es <strong>de</strong> un 8 % <strong>de</strong> variación por cada100 m <strong>de</strong> diferencia <strong>de</strong> cota entre la cuadrícula y el observatorio meteorológico.El principal objetivo es investigar el posible efecto espacial <strong>de</strong>l número <strong>de</strong> incendiose incendios provocados a partir <strong>de</strong> las variables meteorológicas y la altitudpor cuadrícula asociada a un <strong>con</strong>cello. A <strong>con</strong>tinuación se presentan los resultadosobtenidos en la mo<strong>de</strong>lización.


4.1.2. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales totalesEl primer análisis en este trabajo explora la evolución <strong>de</strong> los incendios totales<strong>de</strong> acuerdo a las variables meteorológicas, la altitud y el posible efecto espacial <strong>de</strong>l<strong>con</strong>cello. En este análisis se <strong>con</strong>si<strong>de</strong>ran un total <strong>de</strong> 362625 registros, incluyendo todoslos incendios ocurridos en el periodo <strong>de</strong> estudio que han sido registrados en cadauna <strong>de</strong> las cuadrículas en las que se dividió Galicia.El mo<strong>de</strong>lo se representa por:logit(P k ) =( )Pk= log =1 − P k= β 0 + f 1 (altitud) + f 2 (ta media) + f 3 (hr) + f 4 (pp)++ f estr (cd<strong>con</strong>c) + f no estr (cd<strong>con</strong>c)(4.3)Para simplificar la notación <strong>con</strong>si<strong>de</strong>ramos k como el índice <strong>de</strong>l <strong>con</strong>junto <strong>de</strong> vóxelesespacio-tiempo sobre el área <strong>de</strong> estudio y periodo, por lo tanto P k <strong>de</strong>notan laprobabilidad <strong>de</strong> ignición en el voxel k teniendo en cuenta el <strong>con</strong>junto <strong>de</strong> covariablesobservadas correspondientes a cada voxel. Nuestros mo<strong>de</strong>los seleccionados <strong>con</strong>tieneun intercepto β 0 . Los términos f i son funciones suavizadas que <strong>de</strong>scriben la relaciónno lineal entre las variables explicativas y el logit <strong>de</strong> probabilidad <strong>de</strong> la variable<strong>respuesta</strong>, estas funciones han sido estimadas usando P-splines cúbicos bayesianos<strong>de</strong> segundo or<strong>de</strong>n <strong>con</strong> 20 nudos interiores. La f estr es estimada usando campos aleatorios<strong>de</strong> Markov y f no estr usando i.i.d. efectos aleatorios Gausianos.Las Figuras 4.1 y 4.2 ilustran los efectos suavizados <strong>de</strong> las covariables altitud,ta media, hr y pp en la ocurrencia <strong>de</strong> incendio forestal para los mo<strong>de</strong>los <strong>STAR</strong> <strong>con</strong><strong>respuesta</strong> binomial. A<strong>de</strong>más, la estimación <strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong>l intercepto ylas variables explicativas junto <strong>con</strong> los intervalos <strong>de</strong> credibilidad al 95 % se muestranen el Cuadro 4.1.Variables grados libertad IC al 95 %cte 1 (-9.2360, -7.9079)altitud 2.502 Ver Figura 4.1ta media 4.069 Ver Figura 4.1hr 5.271 Ver Figura 4.2pp 1.053 Ver Figura 4.2Cuadro 4.1: Estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos <strong>de</strong> credibilidad al 80y 95 %


Los grados <strong>de</strong> libertad <strong>de</strong> cada función suavizada dan una clara indicación <strong>de</strong>la necesidad <strong>de</strong> incorporar la flexibilidad a los mo<strong>de</strong>los y a<strong>de</strong>más permite <strong>de</strong>tectarlinealidad (estimación <strong>de</strong> los grados <strong>de</strong> libertad = 1).En la Figura 4.1, el efecto <strong>de</strong> la altitud (ver panel izquierdo) muestra un efecto<strong>de</strong>creciente mo<strong>de</strong>rado <strong>de</strong> los incendios hasta aproximadamente los 300 m <strong>de</strong> altitud,<strong>con</strong> un efecto <strong>de</strong>creciente más acusado a partir <strong>de</strong> esta altitud. La estimación <strong>de</strong> losgrados <strong>de</strong> libertad <strong>de</strong> esta covariable es <strong>de</strong> 2.502 lo que nos <strong>con</strong>firma el <strong>de</strong>scensosuave y <strong>de</strong>creciente a altitu<strong>de</strong>s bajas junto <strong>con</strong> un <strong>de</strong>scenso más acusado a medidaque las altitu<strong>de</strong>s aumentan. Se pue<strong>de</strong> <strong>con</strong>cluir que, la ocurrencia <strong>de</strong> incendios pareceestar relacionada <strong>con</strong> altitu<strong>de</strong>s bajas para el periodo <strong>de</strong> estudio <strong>con</strong>si<strong>de</strong>rado. Hayque señalar también que las bandas <strong>de</strong> credibilidad son más gran<strong>de</strong>s a partir <strong>de</strong> los1000 m <strong>de</strong> altitud aproximadamente, por lo que no <strong>de</strong>be sobreinterpretarse <strong>de</strong>bidoa la incertidumbre <strong>de</strong> estos resultados, ya que existen pocos datos en el área <strong>de</strong>estudio que muestren altitu<strong>de</strong>s por encima <strong>de</strong> los 1000 metros.Figura 4.1: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la altitud (panel izquierdo) yta media (panel <strong>de</strong>recho) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad punteadasal 80 y 95 % - Ocurrencia <strong>de</strong> incendios forestales totalesLa covariable ta media (temperatura media diaria) parece tener un efecto crecienteacusado en la ocurrencia <strong>de</strong> incendios forestales hasta cierto nivel (alre<strong>de</strong>dor<strong>de</strong> 20 ◦ C), tal y como se muestra en el panel <strong>de</strong>recho <strong>de</strong> la Figura 4.1. A partir <strong>de</strong>esta temperatura, la ocurrencia <strong>de</strong> incendios para temperaturas comprendidas en-


tre 20 y 30 ◦ C aproximadamente se estabiliza, mostrando a partir <strong>de</strong> los 30 ◦ C, unefecto creciente no tan drástico como a temperaturas bajas (< 20 ◦ C). Los grados<strong>de</strong> libertad <strong>de</strong> la covariable ta media toman el valor <strong>de</strong> 4.069 (ver cuadro 4.1).Los efectos <strong>de</strong> las covariables hr y pp se muestra el la figura 4.2 en don<strong>de</strong> seobserva que los efectos <strong>de</strong> la hr (panel izquierdo) son crecientes para valores <strong>de</strong>humedad relativa bajos hasta el 35 % aproximadamente, a partir <strong>de</strong> ahí el efecto <strong>de</strong>la humedad relativa es <strong>de</strong>creciente siendo más acusado para humeda<strong>de</strong>s superioresal 75 - 80 %. Por lo tanto, la ocurrencia <strong>de</strong> incendios se asocia a porcentajes bajos <strong>de</strong>humedad relativa. Esto se <strong>de</strong>be a que la mayoría <strong>de</strong> los incendios se sitúan en zonascosteras don<strong>de</strong> las humeda<strong>de</strong>s relativas por <strong>de</strong>bajo <strong>de</strong>l 50 % no suelen ser comunes.A partir <strong>de</strong> este punto, unos incrementos en la humedad relativa se asocian a un<strong>de</strong>scenso <strong>de</strong>l número <strong>de</strong> incendios.Figura 4.2: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la hr (panel izquierdo) y pp (panel<strong>de</strong>recho) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad al 80 y 95 % - Ocurrencia<strong>de</strong> incendios forestales totalesEl efecto <strong>de</strong> la precipitación (panel <strong>de</strong>recho) tiene un efecto practicamente linealy <strong>de</strong>creciente, logicamente, la inexistencia <strong>de</strong> precipitaciones es <strong>con</strong>dición necesariapero no suficiente para la ocurrencia <strong>de</strong> incendios. Hay que señalar que las bandas<strong>de</strong> credibilidad para valores superiores a 5 l/m 2 se hacen más amplias, por lo que<strong>de</strong> nuevo, no se <strong>de</strong>be sobreinterpretar los efectos <strong>de</strong>bido a la incertidumbre <strong>de</strong> estosresultados.


La estimación <strong>de</strong> los grados <strong>de</strong> libertad para ambas covariables se recogen en elCuadro 4.1.Los efectos espaciales se divi<strong>de</strong>n en efectos estructurados que presentan unafuerte estructura espacial y efectos no estructurados que son los que están presentesa nivel local. El mapa <strong>con</strong> los efectos espaciales estructurados (ver Figura 4.3, panelizquierdo) muestra <strong>con</strong>cellos que tienen claramente menor ocurrencia <strong>de</strong> incendiosy aparecen principalmente en el Norte y Noreste <strong>de</strong> Galicia (en ver<strong>de</strong>) frente a unagran ocurrencia <strong>de</strong> incendios (en rojo) y alberga prácticamente toda la costa Oeste<strong>de</strong> Galicia excepto los <strong>con</strong>cellos <strong>de</strong> A Guardia y O Rosal, Suroeste <strong>de</strong> Galicia. Todoello <strong>de</strong> acuerdo a los datos <strong>de</strong>l periodo analizado.Figura 4.3: Efectos espaciales estructurados - Ocurrencia <strong>de</strong> incendios forestalestotalesLas probabilida<strong>de</strong>s a posteriori al 95 % <strong>de</strong> credibilidad se representa el la Figura4.3 (panel <strong>de</strong>recho). Existen <strong>con</strong>cellos <strong>con</strong> intervalos <strong>de</strong> credibilidad estrictamentepositivos (regiones en negro) o negativos (regiones en blanco). Los <strong>con</strong>cellos dibujadosen gris son <strong>con</strong>cellos no significativos <strong>de</strong> la ocurrencia <strong>de</strong> incendios forestales.Como se observa, existe una gran zona <strong>de</strong> in<strong>de</strong>finición, lo que nos sugiere la necesidad<strong>de</strong> mejorar el mo<strong>de</strong>lo.Los resultados <strong>de</strong> los efectos espaciales no estructurados para los mo<strong>de</strong>los <strong>STAR</strong>(ver Figura 4.4) no apuntan en una dirección <strong>de</strong>terminada. Los <strong>con</strong>cellos coloreadosen rosa apuntan a una mayor posibilidad <strong>de</strong> efecto local frente a los <strong>con</strong>celloscoloreados en ver<strong>de</strong> que representan una menor posibilidad <strong>de</strong> efecto local. Todos


los <strong>con</strong>cellos en gris (ver Figura 4.4, panel <strong>de</strong>recho) son <strong>con</strong>cellos no significativos<strong>de</strong> la ocurrencia <strong>de</strong> incendio forestal a escala local. Los <strong>con</strong>cellos blancos ralladosno registran dato y solo un <strong>con</strong>cello aparece como significativo que es el <strong>con</strong>cello <strong>de</strong>Chandrexa <strong>de</strong> Queixa, lo que obliga a un análisis más <strong>de</strong>tallado <strong>de</strong> cual ha sido lacausa <strong>de</strong> los incendios <strong>de</strong> este municipio que los diferencia <strong>de</strong> los <strong>de</strong> su entorno y <strong>de</strong>lresto <strong>de</strong> Galicia.Figura 4.4: Efectos espaciales no estructurados - Ocurrencia <strong>de</strong> incendios forestalestotales4.1.3. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales provocadosComo ya se comentó anteriormente, los incendios forestales provocados en Galiciasuponen más <strong>de</strong>l 80 % <strong>de</strong> los incendios forestales totales, por esa razón, ha sidonecesario tenerlos en <strong>con</strong>si<strong>de</strong>ración y <strong>con</strong>ocer su evolución en el área <strong>de</strong> estudio. Paraesta nueva mo<strong>de</strong>lización se usan los mismos registros que en la subsección anterior(362625 registros) pero ahora se tiene en cuenta la causa asociada a cada incendio,es <strong>de</strong>cir, todos los incendios causados <strong>de</strong> otra forma que no fuera intencionada, se<strong>con</strong>si<strong>de</strong>ra como “no ocurrencia” <strong>de</strong> incendio forestal y los incendios causados <strong>de</strong>forma intencionada se <strong>con</strong>si<strong>de</strong>ra como “ocurrencia” <strong>de</strong> incendio.El mo<strong>de</strong>lo se representa <strong>de</strong> la misma forma que en la sección anterior, la únicadiferencia está en la variable <strong>respuesta</strong>, cuya interpretación es ahora la ocurrencia ono ocurrencia <strong>de</strong> incendios forestales provocados y se escribe como sigue:


logit(P k ) =( )Pk= log =1 − P k= β 0 + f 1 (altitud) + f 2 (ta media) + f 3 (hr) + f 4 (pp)++ f estr (cd<strong>con</strong>c) + f estr (cd<strong>con</strong>c)(4.4)Las Figuras 4.5 y 4.6 ilustran los efectos suavizados <strong>de</strong> las covariables altitud,ta media, hr y pp en la ocurrencia <strong>de</strong> incendio forestal provocado. La estimación<strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong>l intercepto y las variables explicativas junto <strong>con</strong> losintervalos <strong>de</strong> credibilidad al 95 % se muestran en el Cuadro 4.2.Variables grados libertad IC al 95 %cte 1 (-21.4290, 0.9813)altitud 1.004 Ver Figura 4.5ta media 4.485 Ver Figura 4.5hr 3.726 Ver Figura 4.6pp 2.897 Ver Figura 4.6Cuadro 4.2: Estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos <strong>de</strong> credibilidad al 95 %Figura 4.5: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la altitud (panel izquierdo) yta media (panel <strong>de</strong>recho) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad punteadasal 80 y 95 % - Ocurrencia <strong>de</strong> incendios forestales provocados


El efecto observado <strong>de</strong> la altitud <strong>con</strong> respecto a la ocurrencia <strong>de</strong> incendiosforestales (ver Figura 4.5, panel izquierdo) es prácticamente lineal, produciendo unefecto <strong>de</strong>creciente a medida que aumenta la altitud. Aproximadamente, en altitu<strong>de</strong>sentorno a los 1000 m las bandas <strong>de</strong> credibilidad al 80 y 95 % se hacen más amplias,por lo que <strong>de</strong> nuevo, no se <strong>de</strong>be sobreinterpretar los efectos <strong>de</strong>bido a la incertidumbre<strong>de</strong> estos resultados. La estimación <strong>de</strong> los grados <strong>de</strong> libertad ha sido <strong>de</strong> 1.004, cifraque respon<strong>de</strong>n a un efecto lineal <strong>de</strong> la covariable en el mo<strong>de</strong>lo.En la Figura 4.5 también se pue<strong>de</strong> observar el efecto <strong>de</strong> la covariable ta media(panel <strong>de</strong>recho), apreciándose un efecto no lineal <strong>de</strong> la covariable ta media sobrela ocurrencia <strong>de</strong> incendios forestales provocados, que aumenta ligeramente para losincendios a medida que aumentan las temperaturas, pero en don<strong>de</strong> a temperaturasbajas el aumento creciente <strong>de</strong> los incendios es más acusado, volviendo <strong>de</strong> nuevo aacusarse a temperaturas superiores a los aproximadamente 28 ◦ C. La estimación <strong>de</strong>los grados <strong>de</strong> libertad <strong>de</strong> esta covariable para ambos mo<strong>de</strong>los se recoge en el Cuadro4.2.Figura 4.6: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la hr (panel izquierdo) y pp(panel <strong>de</strong>recho) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad punteadas al 80 y95 % - Ocurrencia <strong>de</strong> incendios forestales provocadosLos efectos observados <strong>de</strong> la covariable hr (humedad relativa media) en la ocurrencia<strong>de</strong> incendios forestales provocados (ver Figura 4.6, paneles izquierdo) muestraun efecto no lineal. Esta covariable es ligeramente creciente hasta valores <strong>de</strong>aproximadamente un 40 % don<strong>de</strong>, a partir <strong>de</strong>l 40 % <strong>de</strong> humedad relativa, vuelve a<strong>de</strong>crecer. El efecto <strong>de</strong>creciente en la ocurrencia <strong>de</strong> incendios forestales provocados esmo<strong>de</strong>rado hasta aproximadamente el 75 % <strong>de</strong> humedad relativa, siendo fuertemente<strong>de</strong>creciente <strong>de</strong>spués <strong>de</strong> esto. La ocurrencia <strong>de</strong> incendios forestales provocados parece


ser <strong>de</strong>creciente para humeda<strong>de</strong>s relativas superiores al aproximadamente 40 %.Para la covariable pp (precipitaciones) (ver Figura 4.6, panel <strong>de</strong>recho) se observauna función prácticamente lineal don<strong>de</strong> a medida que aumenta la cantidad <strong>de</strong> l/m 2<strong>de</strong> precipitación, las bandas <strong>de</strong> credibilidad al 80 y 95 % se hacen más amplias, porlo que no <strong>de</strong>be <strong>de</strong> sobreinterpretarse los efectos <strong>de</strong> la precipitación en la ocurrencia<strong>de</strong> incendios forestales provocados <strong>de</strong>bido a la incertidumbre <strong>de</strong> estos resultados.Los incendios provocados tienen una menor sensibilidad a las precipitaciones.La estimación <strong>de</strong> los grados <strong>de</strong> libertad para estas covariables (hr y pp) serecogen en el Cuadro 4.2.Figura 4.7: Efectos espaciales estructurados <strong>de</strong>l mo<strong>de</strong>lo <strong>STAR</strong> <strong>con</strong> <strong>respuesta</strong> binomial- Ocurrencia <strong>de</strong> incendios forestales provocadosLos efectos espaciales estructurados para la ocurrencia <strong>de</strong> incendios forestalesprovocados (ver Figura 4.7, panel <strong>de</strong>recho) muestran que los <strong>con</strong>cellos situados alnoroeste, oeste y suroeste (excepto la punta más saliente <strong>de</strong>l sur) presentan mayorocurrencia <strong>de</strong> incendios que los <strong>con</strong>cellos situados al noreste y este <strong>de</strong> Galicia, quese sitúan los <strong>con</strong>cellos <strong>con</strong> los valores más bajos para la variable <strong>respuesta</strong>. Los intervalos<strong>de</strong> credibilidad al 95 % se muestran en la Figura 4.7 (panel <strong>de</strong>recho) don<strong>de</strong>los <strong>con</strong>cellos en negro representan mucha probabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendiosfrente a los <strong>con</strong>cellos en blanco que representan una baja probabilidad <strong>de</strong> ocurrencia<strong>de</strong> incendios forestales provocados. Los <strong>con</strong>cellos en gris son <strong>con</strong>cellos no significativosfrente a la variable en estudio. Aumenta el número <strong>de</strong> <strong>con</strong>cellos significativos


don<strong>de</strong> las zonas núcleo parecen ser más gran<strong>de</strong>s y don<strong>de</strong> el mapa parece más claroen relación a los resultados obtenidos para todos los incendios.Figura 4.8: Efectos espaciales no estructurados <strong>de</strong>l mo<strong>de</strong>lo <strong>STAR</strong> <strong>con</strong> <strong>respuesta</strong>binomial - Ocurrencia <strong>de</strong> incendios forestales provocadosLos resultados <strong>de</strong> las efectos espaciales no estructurados (ver Figura 4.8) noapuntan en ninguna dirección específica, sin embargo se observan <strong>con</strong>cellos <strong>con</strong> efectosespaciales no estructurados mas positivos (<strong>con</strong>cellos <strong>de</strong> color rosa), lo que <strong>con</strong>tribuyea una mayor posibilidad <strong>de</strong> efecto local, pero que no son municipios significativos(<strong>con</strong>cellos <strong>de</strong> color gris) como se aprecia en en la Figura 4.8 (panel <strong>de</strong>recho).Los <strong>con</strong>cellos pintados <strong>de</strong> blanco y rayados no aportan información <strong>de</strong> ningún tipo,ya que no se obtuvo dato para po<strong>de</strong>r estimar este efecto.4.1.4. Ajuste <strong>de</strong> mo<strong>de</strong>losEl enfoque a seguir en esta sección es el ajuste <strong>de</strong> los mo<strong>de</strong>los anteriores apartir <strong>de</strong> criterios AIC (Akaike Information Criterion ), BIC (Bayesian InformationCriterion ) y GCV (Generalized Cross-Validation). En el Cuadro 4.3 se presentan los2 mo<strong>de</strong>los ajustados para las variables meteorológicas, los cuales quedan <strong>de</strong>finidospor el predictor. Los valores <strong>de</strong> AIC, BIC y GCV se exponen para los dos mo<strong>de</strong>los.También son incluidos los grados <strong>de</strong> libertad <strong>de</strong> cada mo<strong>de</strong>lo estimado.


<strong>Mo<strong>de</strong>los</strong> 2xlog-likelihood g.l. AIC BIC GCVBinomial (totales) 13632.5 160.732 13954 15623.6 0.057Binomial (provocados) 10830.9 119.137 11069.2 12306.7 0.045Cuadro 4.3: Criterio <strong>de</strong> información Akaike (AIC), criterio <strong>de</strong> información Bayesiano(BIC), y validación cruzada generalizada (GCV) para los dos mo<strong>de</strong>los.4.2. Mo<strong>de</strong>lización a partir <strong>de</strong> grupos <strong>de</strong> mo<strong>de</strong>los<strong>de</strong> combustibleComo ya se comentó anteriormente, la probabilidad <strong>de</strong> incendio <strong>de</strong>pen<strong>de</strong> <strong>de</strong>factores complejos como el tipo <strong>de</strong> estructura <strong>de</strong> la vegetación entre otros, que enalgunos casos favorece la ignición <strong>de</strong> un incendio y en otros pue<strong>de</strong> frenar su avance(Nunes, et al. 2005).En esta sección se presentan aplicaciones <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> regresión <strong>STAR</strong> parapara la ourrencia <strong>de</strong> incendios forestales totales y provocados a partir <strong>de</strong> variables<strong>de</strong> tipo <strong>de</strong> vegetación en cada cuadrícula que posteriormente se agrega por <strong>con</strong>cello.4.2.1. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales totalesPartiendo <strong>de</strong>l análisis <strong>de</strong> los datos, en este apartado se trata <strong>de</strong> mo<strong>de</strong>lizar laocurrencia <strong>de</strong> incendios forestales totales <strong>con</strong> las variables <strong>de</strong> tipos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong>combustible agrupados en sin asignar mo<strong>de</strong>lo, pastos, matorral, hojarasca bajo arboladoy por último el grupo <strong>de</strong> restos <strong>de</strong> cota y operaciones selvícolas.El mo<strong>de</strong>lo se representa por:logit(P k ) =( )Pk= log =1 − P k= β 0 + f 1 (altitud) + f 2 (Sin A signar M o<strong>de</strong>lo) + f 3 (P astos)++ f 4 (Matorral) + f 5 (Hojarasca) + f 6 (Restos)++ f estr (cd<strong>con</strong>c) + f estr (cd<strong>con</strong>c)(4.5)En don<strong>de</strong> se <strong>con</strong>si<strong>de</strong>ra k como el índice <strong>de</strong>l <strong>con</strong>junto <strong>de</strong> voxels espacio-tiemposobre el área <strong>de</strong> estudio y periodo, por lo tanto P k <strong>de</strong>notan la probabilidad <strong>de</strong>ignición en el voxel k teniendo en cuenta el <strong>con</strong>junto <strong>de</strong> covariables observadas correspondientesa cada voxel. Nuestros mo<strong>de</strong>los seleccionados <strong>con</strong>tiene un interceptoβ 0 . Los términos f i son funciones suavizadas que <strong>de</strong>scriben la relación no lineal entre


las variables explicativas y el logit <strong>de</strong> probabilidad <strong>de</strong> la variable <strong>respuesta</strong>, estasfunciones han sido estimadas usando P-splines cúbicos bayesianos <strong>de</strong> segundo or<strong>de</strong>n<strong>con</strong> 20 nudos interiores. La f estr es estimada usando campos aleatorios <strong>de</strong> Markov yf no estr usando i.i.d. efectos aleatorios Gausianos.Las Figuras 4.9, 4.10 y 4.11 ilustran los efectos suavizados <strong>de</strong> las covariablesaltitud, sin asignar mo<strong>de</strong>lo, pastos, matorral, hojarasca y restos en la ocurrencia <strong>de</strong>incendio forestal para los mo<strong>de</strong>los <strong>STAR</strong> <strong>con</strong> <strong>respuesta</strong> binomial. A<strong>de</strong>más,la estimación<strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong>l intercepto y los efectos <strong>de</strong> las covariables junto<strong>con</strong> los intervalos <strong>de</strong> credibilidad al 95 % se muestran en el Cuadro 4.4.Variables grados libertad IC al 95 %cte 1 (-4.0702, -2.8204)altitud 1.008 Ver Figura 4.9Sin Datos 3.596 Ver Figura 4.9Pasto 1.165 Ver Figura 4.10Matorral 1.013 Ver Figura 4.10Hojarasca 2.134 Ver Figura 4.11Restos 1.002 Ver Figura 4.11Cuadro 4.4: Estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos <strong>de</strong> credibilidad al 95 %Los grados <strong>de</strong> libertad <strong>de</strong> cada función suavizada dan una clara indicación <strong>de</strong>la necesidad <strong>de</strong> incorporar la flexibilidad a los mo<strong>de</strong>los y a<strong>de</strong>más permite <strong>de</strong>tectarlinealidad (estimación <strong>de</strong> los grados <strong>de</strong> libertad (edf) = 1).Los efectos <strong>de</strong> las covariables altitud y grupo <strong>de</strong> ausencia <strong>de</strong> datos se muestranen la Figura 4.9 en don<strong>de</strong> se observa que los efectos <strong>de</strong> la covariable altitud (panelizuierdo) es lineal y a su vez <strong>de</strong>crece la ocurrencia <strong>de</strong> incendios según aumenta elvalor <strong>de</strong> la altitud para el periodo <strong>con</strong>si<strong>de</strong>rado. A partir <strong>de</strong> los aproximadamente800 m <strong>de</strong> altitud las bandas <strong>de</strong> credibilidad tanto al 80 como al 95 % se hacen cadavez más amplias por lo tanto, no se <strong>de</strong>be <strong>de</strong> sobreinterpretar los efectos <strong>de</strong> la altitud<strong>de</strong>bido a la incertidumbre <strong>de</strong> estos resultados.Los efectos <strong>de</strong> la covariable Sin asignar mo<strong>de</strong>lo (ver Figura 4.9, panel <strong>de</strong>recho)es no lineal y creciente. Según aumenta la cantidad <strong>de</strong> superficie sin <strong>con</strong>ocimiento<strong>de</strong>l tipo <strong>de</strong> estructura vegetal por la cual está formada, la ocurrencia <strong>de</strong> incendiosforestales es mayor. De nuevo, las bandas <strong>de</strong> credibilidad se separan según aumentala superficie <strong>de</strong> esta variable, por lo que no se <strong>de</strong>be <strong>de</strong> sobreinterpretar los efectos<strong>de</strong>bido a la incertidumbre <strong>de</strong> estos resultados.La estimación <strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong> ambas covariables presentadas paralos dos mo<strong>de</strong>los <strong>STAR</strong> <strong>de</strong> estudio se recogen en el Cuadro 4.4.


Figura 4.9: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> altitud (figura izquierda) y grupoasociado a la variable Sin Asignar Mo<strong>de</strong>lo <strong>de</strong> tipo <strong>de</strong> combustible (figura <strong>de</strong>recha)<strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad punteadas al 80 y 95 % - Ocurrencia<strong>de</strong> incendios forestales totalesFigura 4.10: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong>l grupo Pastos (figura izquierda)y grupo Matorral (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes 80 y 95 % <strong>de</strong> bandas <strong>de</strong>credibilidad - Ocurrencia <strong>de</strong> incendios forestales totalesLos efectos <strong>de</strong> grupo <strong>de</strong> Pastos y grupo <strong>de</strong> Matorral (ver Figura 4.17) muestran


un efecto lineal creciente más acentuado para la variable matorral que en la variablepastos. A<strong>de</strong>más, hay que <strong>de</strong>stacar que la variable pasto, a medida que aumentala superficie <strong>de</strong> este tipo <strong>de</strong> combustible por cuadrícula asociada a un <strong>con</strong>cello, lasbandas <strong>de</strong> credibilidad al 80 y 95 % se van separando <strong>de</strong>l efecto <strong>de</strong> la variable, esto es<strong>de</strong>bido a la escasa cantidad en m 2 <strong>de</strong> pasto. Por el <strong>con</strong>trario, el efecto <strong>de</strong> la variablegrupo <strong>de</strong> matorral, muestra que a medida que aumenta la cantidad <strong>de</strong> superficieen cada cuadrícula <strong>de</strong> esta agrupación <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible, la ocurrencia <strong>de</strong>incendio forestal también es mayor. También cabe <strong>de</strong>stacar (ver apéndice A) que lavariable <strong>con</strong> mayor representación por vóxeles y por lo tanto mayor representaciónen las zonas <strong>de</strong> ocurrencia <strong>de</strong> incendios es el grupo <strong>de</strong> matorral.La estimación <strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong> ambas covariables estudiadas serecogen en el Cuadro 4.4.Figura 4.11: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong>l grupo <strong>de</strong> Hojarasca (figuraizquierda) y grupo Restos (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidadpunteadas al 80 y 95 % - Ocurrencia <strong>de</strong> incendios forestales totalesLos efectos <strong>de</strong> las variables grupo <strong>de</strong> hojarasca y grupo <strong>de</strong> restos se muestran ella Figura 4.11 don<strong>de</strong> se observa que la primera <strong>de</strong> las variables, grupo <strong>de</strong> hojarasca(panel <strong>de</strong> la izquierdo), presenta un efecto no lineal suave y creciente hasta valoresen torno a los 400.000 m 2 <strong>de</strong> superficie ocupada por hojarasca en don<strong>de</strong> a partir<strong>de</strong> aproximadamente <strong>de</strong> esa superficie, el efecto se estabiliza hasta el final (1 millón<strong>de</strong> m 2 <strong>de</strong> superficie). Por su parte, la segunda variable <strong>de</strong> estudio en la Figura4.11, variable grupo <strong>de</strong> restos (panel <strong>de</strong>recho), presenta un efecto lineal y <strong>con</strong>stanteentorno al cero que según aumenta la cantidad restos <strong>de</strong> corta en superficie en cadacuadrícula, las bandas <strong>de</strong> credibilidad al 80 y 95 % se hacen más amplias, lo que <strong>de</strong>


nuevo alerta <strong>de</strong> la escasa <strong>con</strong>centración en m 2 <strong>de</strong>l grupo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible<strong>de</strong> restos <strong>de</strong> cortas y/o operaciones selvícolas.Figura 4.12: Efectos espaciales estructurados - Ocurrencia <strong>de</strong> incendios forestalestotalesLos efectos espaciales estructurados para la ocurrencia <strong>de</strong> incendios forestales(ver Figura 4.12, panel izquierdo) muestran que los <strong>con</strong>cellos situados al norte ynoreste presentan la menor ocurrencia <strong>de</strong> incendios forestales que en los <strong>con</strong>cellossituados al oeste y sur <strong>de</strong> Galicia, que se sitúan los <strong>con</strong>cellos <strong>con</strong> los valores másaltos para la variable <strong>de</strong> estudio. Los intervalos <strong>de</strong> credibilidad al 95 % se muestranen la Figura 4.12 (panel <strong>de</strong>recho) don<strong>de</strong> los <strong>con</strong>cellos en negro representan muchaprobabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendios frente a los <strong>con</strong>cellos en blanco que representanuna baja probabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendios forestales provocados. Los<strong>con</strong>cellos en gris son <strong>con</strong>cellos no significativos frente a la variable en estudio.


Figura 4.13: Efectos espaciales no estructurados - Ocurrencia <strong>de</strong> incendios forestalestotalesLos resultados <strong>de</strong> las efectos espaciales no estructurados (ver Figura 4.12) noapuntan en ninguna dirección específica, sin embargo se observan <strong>con</strong>cellos <strong>con</strong> efectosespaciales no estructurados mas positivos (color rosa), lo que <strong>con</strong>tribuye a unamayor posibilidad <strong>de</strong> efecto local, pero que son municipios no significativos (colorgris) como se aprecia en en la Figura 4.12 (panel <strong>de</strong>recho). Los <strong>con</strong>cellos en blancoy rayados no aportan información <strong>de</strong> ningún tipo, ya que no se obtuvo dato parapo<strong>de</strong>r estimar este efecto.4.2.2. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales provocadosEn este apartado se trata <strong>de</strong> mo<strong>de</strong>lizar la ocurrencia <strong>de</strong> incendios forestalesprovocados <strong>con</strong> las variables <strong>de</strong> tipos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible agrupados en sinasignar mo<strong>de</strong>lo, pastos, matorral, hojarasca bajo arbolado y por último el grupo <strong>de</strong>restos <strong>de</strong> cota y operaciones selvícolas.El mo<strong>de</strong>lo se representa por:


logit(P k ) =( )Pk= log =1 − P k= β 0 + f 1 (altitud) + f 2 (Sin A signar M o<strong>de</strong>lo) + f 3 (P astos)++ f 4 (Matorral) + f 5 (Hojarasca) + f 6 (Restos)++ f estr (cd<strong>con</strong>c) + f estr (cd<strong>con</strong>c)(4.6)Las Figuras 4.14, 4.15 y 4.16 muestran los efectos suavizados <strong>de</strong> las covariables<strong>de</strong> estudio y la Tabla 4.5 se da la estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos<strong>de</strong> credibilidad al 95 % como se muestra a <strong>con</strong>tinuación:Variables grados libertad IC al 95 %cte 1 (-4.0455, -3.3717)altitud 1.058 Ver Figura 4.14Sin Datos 3.352 Ver Figura 4.14Pasto 1.037 Ver Figura 4.15Matorral 2.631 Ver Figura 4.15Hojarasca 1.012 Ver Figura 4.16Restos 1.003 Ver Figura 4.16Cuadro 4.5: Estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos <strong>de</strong> credibilidad al 95 %Las funciones <strong>de</strong> suavización <strong>de</strong> las covariables <strong>de</strong> estudio presenta unos resultadosmuy similares a los obtenidos para los incendios totales <strong>de</strong> la sección anterior.Cabe <strong>de</strong>stacar que la covariable grupo <strong>de</strong> Matorral pasa a tener ahora un efecto nolineal <strong>con</strong> un número <strong>de</strong> grados <strong>de</strong> libertad <strong>de</strong> 2.631. Esta covariable junto <strong>con</strong> lacovariable Sin Asignar Mo<strong>de</strong>lo son las que mejor explican la ocurrencia <strong>de</strong> incendiosforestales, ya que como se estudió en el apéndice A, son las covariables <strong>con</strong> mayorrepresentación por vóxeles y por lo tanto en zonas ocupadas por incendios. Ambasson funciones crecientes, según aumenta la superficie forestal, aumenta el riesgo <strong>de</strong>incendios en Galicia.


Figura 4.14: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la altitud (figura izquierda) ySin Asignar Mo<strong>de</strong>lo (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes 80 y 95 % <strong>de</strong> bandas<strong>de</strong> credibilidad - Ocurrencia <strong>de</strong> incendios forestales provocadosFigura 4.15: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong>l grupo Pastos (figura izquierda)y <strong>de</strong>l grupo Matorral (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes 80 y 95 % <strong>de</strong> bandas<strong>de</strong> credibilidad - Ocurrencia <strong>de</strong> incendios forestales provocados


Figura 4.16: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong>l grupo Hojarasca (figura izquierda)y grupo Restos (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes 80 y 95 % <strong>de</strong>bandas <strong>de</strong> credibilidad - Ocurrencia <strong>de</strong> incendios forestales provocadosEl efecto espacial estructurado (ver Figura 4.17) sige marcando la ten<strong>de</strong>ncia <strong>de</strong>mayor <strong>con</strong>centración <strong>de</strong> incendios hacia el oeste y sur <strong>de</strong> Galicia frente a la menorocurrencia <strong>de</strong> incendios cara el norte y este gallego. Los intervalos <strong>de</strong> credibilidadal 95 % (panel <strong>de</strong>recho) muestran <strong>con</strong>cellos <strong>con</strong> gran probabilidad <strong>de</strong> ocurrencia<strong>de</strong> incendios (<strong>con</strong>cellos en negro) y baja o ninguna probabilidad <strong>de</strong> ocurrencia <strong>de</strong>incendios (<strong>con</strong>cellos en blanco). Los <strong>con</strong>cellos en gris son <strong>con</strong>cellos no significativosfrente a la variable en estudio.


Figura 4.17: Efectos espaciales estructurados - Ocurrencia <strong>de</strong> incendios forestalesprovocadosFigura 4.18: Efectos espaciales no estructurados - Ocurrencia <strong>de</strong> incendios forestalesprovocados


Los resultados <strong>de</strong> las efectos espaciales no estructurados (ver Figura 4.18) noapuntan en ninguna dirección específica. Todos los <strong>con</strong>cellos son no significativos(color gris, panel <strong>de</strong>recho). Los <strong>con</strong>cellos en blanco y rayados no aportan información<strong>de</strong> ningún tipo, ya que no se obtuvo dato para po<strong>de</strong>r estimar este efecto.4.2.3. Ajuste <strong>de</strong> mo<strong>de</strong>losEn esta sección se muestra el ajuste <strong>de</strong> los mo<strong>de</strong>los <strong>STAR</strong> para la ocurrencia<strong>de</strong> incendios forestales provocados y totales a partir <strong>de</strong> las variables grupos <strong>de</strong> tipos<strong>de</strong> combustible mediante los criterios AIC (Akaike Information Criterion ), BIC(Bayesian Information Criterion ) y GCV (Generalized Cross-Validation). En elCuadro 4.6 se presentan los 2 mo<strong>de</strong>los ajustados. También son incluidos los grados<strong>de</strong> libertad <strong>de</strong> cada mo<strong>de</strong>lo estimado.<strong>Mo<strong>de</strong>los</strong> 2xlog-likelihood g.l. AIC BIC GCVBinomial (totales) 9565.87 142.573 9851.02 11026.2 0.344Binomial (provocados) 7907.5 138.982 8185.46 9329.64 0.287Cuadro 4.6: Criterio <strong>de</strong> información Akaike (AIC), criterio <strong>de</strong> información Bayesiano(BIC), y validación cruzada generalizada (GCV) para los dos mo<strong>de</strong>los seleccionados.Como se fue observando a lo largo <strong>de</strong> esta sección, las variables que aportanmayor información por voxel al mo<strong>de</strong>lo son las variables “grupo <strong>de</strong> matorral” y“grupo Sin Asignar Mo<strong>de</strong>lo”, ya que son las variables que mejor <strong>de</strong>finen el tipo <strong>de</strong>estructura predominante en Galicia. Se pue<strong>de</strong> <strong>con</strong>cluir <strong>de</strong> esta sección diciendo quelos mo<strong>de</strong>los <strong>de</strong> combustibles <strong>de</strong> Rothermel para la estimación <strong>de</strong> la ocurrencia <strong>de</strong>incendios no explican suficientemente la presencia <strong>de</strong> incendios. En el futuro comoposible mejora, se <strong>de</strong>bería trabajar <strong>con</strong> formaciones vegetales en vez <strong>de</strong> mo<strong>de</strong>los <strong>de</strong>combustible.4.3. Mo<strong>de</strong>lización a partir <strong>de</strong> variables climatológicasy grupos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustibleDespués <strong>de</strong> haber estudiado por separado en secciones anteriores las variablesmeteorológicas y <strong>de</strong> tipo <strong>de</strong> combustible, el siguiente paso es establecer un mo<strong>de</strong>loque englobe todas estas variables y así observar si el mo<strong>de</strong>lo permite estimar <strong>de</strong>forma más precisa la ocurrencia <strong>de</strong> incendios forestales totales y provocados. A<strong>con</strong>tinuación se <strong>de</strong>scriben los mo<strong>de</strong>los <strong>de</strong> regresión <strong>STAR</strong> <strong>de</strong> <strong>respuesta</strong> binomialpara la ocurrencia <strong>de</strong> incendios forestales totales y provocados que engloban todas lascovariables estudiadas anteriormente (altitud, ta media, hr, pp, Sin Asignar Mo<strong>de</strong>lo,Pastos, Matorral, Hojarasca y Restos).


4.3.1. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales totalesEn este apartado se explora la evolución <strong>de</strong> los incendios forestales totales <strong>de</strong>acuerdo a las variables meteorológicas y <strong>de</strong> tipo <strong>de</strong> combustible junto <strong>con</strong> el posibleefecto espacial <strong>de</strong>l <strong>con</strong>cello.El mo<strong>de</strong>lo se representa por:logit(P k ) =( )Pk= log =1 − P k= β 0 + f 1 (altitud) + f 2 (ta media) + f 3 (hr) + f 4 (pp)++ f 5 (Sin Asignar Mo<strong>de</strong>lo) + f 6 (P astos) + +f 7 (Matorral)++ f 8 (Hojarasca) + f 9 (Restos)++ f estr (cd<strong>con</strong>c) + f no estr (cd<strong>con</strong>c)(4.7)Para simplificar la notación <strong>con</strong>si<strong>de</strong>ramos k como el índice <strong>de</strong>l <strong>con</strong>junto <strong>de</strong> voxelsespacio-tiempo sobre el área <strong>de</strong> estudio y periodo, por lo tanto P k <strong>de</strong>notan laprobabilidad <strong>de</strong> ignición en el voxel k teniendo en cuenta el <strong>con</strong>junto <strong>de</strong> covariablesobservadas correspondientes a cada voxel. Nuestros mo<strong>de</strong>los seleccionados <strong>con</strong>tieneun intercepto β 0 . Los términos f i son funciones suavizadas que <strong>de</strong>scriben la relaciónno lineal entre las variables explicativas y el logit <strong>de</strong> probabilidad <strong>de</strong> la variable<strong>respuesta</strong>, estas funciones han sido estimadas usando P-splines cúbicos bayesianos<strong>de</strong> segundo or<strong>de</strong>n <strong>con</strong> 20 nudos interiores. La f estr es estimada usando campos aleatorios<strong>de</strong> Markov y f no estr usando i.i.d. efectos aleatorios Gausianos.Las Figuras 4.19, 4.20, 4.21 y 4.22 ilustran los efectos <strong>de</strong> las covariables para laocurrencia <strong>de</strong> incendios forestal totales <strong>con</strong> mo<strong>de</strong>los <strong>STAR</strong> <strong>de</strong> <strong>respuesta</strong> binomial.A<strong>de</strong>más,la estimación <strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong>l intercepto y las covariables junto<strong>con</strong> los intervalos <strong>de</strong> credibilidad al 80 y 95 % se muestran en el Cuadro 4.7.


Variables grados libertad IC al 95 %cte 1 (-9.3666, -7.5362)altitud 1.089 Ver Figura 4.19ta media 4.075 Ver Figura 4.19hr 5.183 Ver Figura 4.20pp 1.071 Ver Figura 4.20Sin Asignar Mo<strong>de</strong>lo 3.643 Ver Figura 4.21Pasto 1.009 Ver Figura 4.21Matorral 1.014 Ver Figura 4.22Hojarasca 2.149 Ver Figura 4.22Restos 1.001 Ver Figura 4.22Cuadro 4.7: Estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos <strong>de</strong> credibilidad al 80y 95 %Los efectos <strong>de</strong> las covariables altitud y ta media se representan en la Figura4.19. La covariable altitud presenta (ver panel izquiedo) un <strong>de</strong>scenso acusado <strong>de</strong> laocurrencia <strong>de</strong> incendios forestales a medida que aumenta su valor, esto es <strong>de</strong>bido,como ya se comentó en secciones anteriores a que en el periodo <strong>de</strong> estudio <strong>con</strong>si<strong>de</strong>radoen este trabajo, la mayoría <strong>de</strong> los incendios ocurrieron en zonas costeras en don<strong>de</strong>las altitu<strong>de</strong>s tien<strong>de</strong>n a ser bajas. El efecto <strong>de</strong> la covariable ta media (ver panel<strong>de</strong>recho) parece tener un efecto creciente a lo largo <strong>de</strong> toda la función, más acusado atemperaturas bajas, inferiores a 20 ◦ C. A partir <strong>de</strong> esta temperatura, la ocurrencia <strong>de</strong>incendios para temperaturas comprendidas entre 20 y 28 ◦ C se estabiliza, mostrandoa partir <strong>de</strong> los 28 ◦ C aproximadamente, un efecto creciente no tan drástico como entemperaturas bajas (< 20 ◦ C).


Figura 4.19: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la altitud (figura izquierda) yta media (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad punteadasal 80 y 95 % - Ocurrencia <strong>de</strong> incendios forestales totalesEl efecto <strong>de</strong> la covariable hr (ver Figura 4.20, panel <strong>de</strong>recho) es creciente paravalores bajos hasta un 30 % aproximadamente, don<strong>de</strong> este efecto pasa a ser <strong>de</strong>crecientey más acusado para valores altos <strong>de</strong> humedad relativa (entorna al 75 %).Incrementos <strong>de</strong> humedad relativa están asociados a un <strong>de</strong>scenso <strong>de</strong> ocurrencia <strong>de</strong> incendios.El efecto <strong>de</strong> la covariable pp (ver Figura 4.20, panel <strong>de</strong>recho) tiene un efectoprácticamente lineal y <strong>de</strong>creciente. La inexistencia <strong>de</strong> precipitaciones es <strong>con</strong>diciónnecesaria pero no suficiente para la ocurrencia <strong>de</strong> incendios. Hay que señalar que lasbandas <strong>de</strong> credibilidad para valores superiores a 5 l/m 2 se hacen más amplias, porlo que <strong>de</strong> nuevo, no se <strong>de</strong>be sobreinterpretar los efectos <strong>de</strong>bido a la incertidumbre<strong>de</strong> estos resultados. La estimación <strong>de</strong> los grados <strong>de</strong> libertad para ambas covariablesse recogen en el Cuadro 4.7.


Figura 4.20: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> las covariables hr (figura izquierda)y pp (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad al80 y 95 % - Ocurrencia <strong>de</strong> incendios forestales totalesLas Figuras 4.21 y 4.22 muestran el efecto <strong>de</strong> las variables <strong>de</strong> grupos <strong>de</strong> mo<strong>de</strong>los<strong>de</strong> combustibles introducidas en el mo<strong>de</strong>lo global. De ellas, cabe <strong>de</strong>stacar <strong>de</strong> nuevo,que las variables Sin Asignar Mo<strong>de</strong>lo y grupo <strong>de</strong> Matorral son las variables <strong>con</strong>mayor representación por superficie <strong>de</strong> vóxel y por lo tanto las que mejor explicanla ocurrencia <strong>de</strong> incendios forestales totales en la superficie gallega. A medida queaumenta la superficie por m 2 <strong>de</strong> vóxel, la ocurrencia <strong>de</strong> incendio es mayor.


Figura 4.21: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> la variable Sin Asignar Mo<strong>de</strong>lo(figura izquierda) y grupo <strong>de</strong> Pastos (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes 80 y95 % <strong>de</strong> bandas <strong>de</strong> credibilidad - Ocurrencia <strong>de</strong> incendios forestales totalesFigura 4.22: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> los grupos Matorral, Hojarascay Restos <strong>con</strong> sus correspondientes 80 y 95 % <strong>de</strong> bandas <strong>de</strong> credibilidad - Ocurrencia<strong>de</strong> incendios forestales totalesLos efectos espaciales se muestran en las Figuras 4.23 y 4.24. Los efectos espacialesestructurados (Figura 4.23) siguen marcando una ten<strong>de</strong>ncia <strong>de</strong> mayor ocurrencia


<strong>de</strong> incendios hacia el oeste y sur <strong>de</strong> Galicia frente a la menor ocurrencia <strong>de</strong> incendioscara el norte y este gallego. Los intervalos <strong>de</strong> credibilidad al 95 % (panel <strong>de</strong>recho)muestran <strong>con</strong>cellos <strong>con</strong> gran probabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendios (<strong>con</strong>cellos ennegro) y baja o ninguna probabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendios (<strong>con</strong>cellos en blanco).Los <strong>con</strong>cellos en gris son <strong>con</strong>cellos no significativos frente a la variable en estudio.Los resultados <strong>de</strong> las efectos espaciales no estructurados (ver Figura 4.24) no apuntanen ninguna dirección específica. Todos los <strong>con</strong>cellos son no significativos (colorgris, panel <strong>de</strong>recho) excepto uno, Chandrexa <strong>de</strong> Queixa, que obliga a un análisis más<strong>de</strong>tallado <strong>de</strong> cual ha sido la causa <strong>de</strong> incendios <strong>de</strong> este municipio que los diferencia<strong>de</strong> los <strong>de</strong> su entorno y <strong>de</strong>l resto <strong>de</strong> Galicia.Figura 4.23: Efectos espaciales estructurados - Ocurrencia <strong>de</strong> incendios forestalestotales


Figura 4.24: Efectos espaciales no estructurados - Ocurrencia <strong>de</strong> incendios forestalestotales4.3.2. Mo<strong>de</strong>lización <strong>de</strong> los incendios forestales provocadosEn este apartado se explora la evolución <strong>de</strong> los incendios forestales provocados<strong>de</strong> acuerdo a las variables meteorológicas y <strong>de</strong> tipo <strong>de</strong> combustible junto <strong>con</strong> elposible efecto espacial <strong>de</strong>l <strong>con</strong>cello.El mo<strong>de</strong>lo se representa por:logit(P k ) =( )Pk= log =1 − P k= β 0 + f 1 (altitud) + f 2 (ta media) + f 3 (hr) + f 4 (pp)++ f 5 (Sin Asignar Mo<strong>de</strong>lo) + f 6 (P astos) + +f 7 (Matorral)++ f 8 (Hojarasca) + f 9 (Restos)++ f estr (cd<strong>con</strong>c) + f no estr (cd<strong>con</strong>c)(4.8)Las Figuras 4.25, 4.26, 4.27 y 4.28 ilustran los efectos <strong>de</strong> las covariables <strong>de</strong>estudio en la ocurrencia <strong>de</strong> incendios forestales provocados <strong>con</strong> mo<strong>de</strong>los <strong>STAR</strong> <strong>de</strong><strong>respuesta</strong> binomial. A<strong>de</strong>más, la estimación <strong>de</strong> los grados <strong>de</strong> libertad <strong>de</strong>l intercepto y


los efectos <strong>de</strong> las covariables junto <strong>con</strong> los intervalos <strong>de</strong> credibilidad al al 80 y 95 %se muestran en el Cuadro 4.8.Variables grados libertad IC al 95 %cte 1 (-21.6312, 1.0767)altitud 1.002 Ver Figura 4.25ta media 4.362 Ver Figura 4.25hr 3.591 Ver Figura 4.26pp 2.912 Ver Figura 4.26Sin Asignar Mo<strong>de</strong>lo 2.783 Ver Figura 4.27Pasto 1.011 Ver Figura 4.27Matorral 3.266 Ver Figura 4.28Hojarasca 1.001 Ver Figura 4.28Restos 1.003 Ver Figura 4.28Cuadro 4.8: Estimación <strong>de</strong> los grados <strong>de</strong> libertad e intervalos <strong>de</strong> credibilidad al 95 %El efecto <strong>de</strong> la altitud <strong>con</strong> respecto a la ocurrencia <strong>de</strong> incendios forestales (verFigura 4.25, panel izquierdo) es prácticamente lineal, produciendo un efecto <strong>de</strong>crecientea medida que aumenta la altitud. Altitu<strong>de</strong>s entorno a los 1000 m, las bandas<strong>de</strong> credibilidad al 80 y 95 % se hacen más amplias. No se <strong>de</strong>be sobreinterpretarlos efectos <strong>de</strong>bido a la incertidumbre <strong>de</strong> estos resultados. El efecto <strong>de</strong> la covariableta media (Figura 4.25, panel <strong>de</strong>recho) es no lineal, aumentando la ocurrencia <strong>de</strong>incendios a medida que las temperaturas aumentan, pero en don<strong>de</strong> a temperaturasbajas el aumento creciente <strong>de</strong> los incendios es más acusado, volviendo <strong>de</strong> nuevo aacusarse a temperaturas superiores a los aproximadamente 28 ◦ C. La estimación <strong>de</strong>los grados <strong>de</strong> libertad para ambas covariables explicadas se recoge en el Cuadro 4.8.


Figura 4.25: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> las covariables altitud (figuraizquierda) y ta media (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidadpunteadas al 80 y 95 % - Ocurrencia <strong>de</strong> incendios forestales provocadosLos efectos observados <strong>de</strong> la covariable hr (humedad relativa media) en la ocurrencia<strong>de</strong> incendios forestales provocados (ver Figura 4.26, paneles izquierdo) muestraun efecto no lineal. Esta covariable es ligeramente creciente hasta valores <strong>de</strong> aproximadamenteun 35 % <strong>de</strong> humedad relativa , y que a partir <strong>de</strong>l 35 % <strong>de</strong> humedadrelativa <strong>de</strong>crece <strong>con</strong>si<strong>de</strong>rablemente. Por lo tanto, la ocurrencia <strong>de</strong> incendios forestalesprovocados parece ser creciente a humeda<strong>de</strong>s bajas y <strong>de</strong>crece para humeda<strong>de</strong>srelativas superiores al 35 % aproximadamente.La covariable pp (precipitaciones) (ver Figura 4.26, panel <strong>de</strong>recho) se observauna función prácticamente lineal y <strong>con</strong>stante don<strong>de</strong>, a medida que aumenta la cantidad<strong>de</strong> l/m 2 <strong>de</strong> precipitación, las bandas <strong>de</strong> credibilidad al 80 y 95 % se hacen másamplias, por lo que no <strong>de</strong>be <strong>de</strong> sobreinterpretarse los efectos <strong>de</strong> la precipitación enla ocurrencia <strong>de</strong> incendios forestales provocados. Los incendios provocados tienenuna menor sensibilidad a las precipitaciones.La estimación <strong>de</strong> los grados <strong>de</strong> libertad para estas covariables (hr y pp) serecogen en el Cuadro 4.8.


Figura 4.26: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> las covariables hr(figura izquierda)y pp (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes bandas <strong>de</strong> credibilidad al 80 y95 % - Ocurrencia <strong>de</strong> incendios forestales provocadosLas efectos <strong>de</strong> las funciones <strong>de</strong> suavización <strong>de</strong> las variables grupos <strong>de</strong> mo<strong>de</strong>los<strong>de</strong> combustible se muestran en las Figuras 4.27 y 4.28, don<strong>de</strong> <strong>de</strong> nuevo se observaque la variable Sin asignar mo<strong>de</strong>lo y grupo <strong>de</strong> matorral son las variables que mejorexplican la ocurrencia <strong>de</strong> incendios forestales, ya que como se estudió en el apéndiceA, son las variables <strong>con</strong> mayor representación por vóxeles y por lo tanto en zonasocupadas por incendios. Ambas son funciones crecientes, según aumenta la superficieforestal, aumenta el riesgo <strong>de</strong> incendios en Galicia. El resto <strong>de</strong> variables <strong>de</strong> tipo <strong>de</strong>combustible son funciones que a medida que aumenta la superficie por m 2 <strong>de</strong> voxelse separan cada vez más las banda <strong>de</strong> credibilidad al 80 y 95 %, por lo que no <strong>de</strong>be<strong>de</strong> sobreinterpretarse los efectos <strong>de</strong> estas variables en la ocurrencia <strong>de</strong> incendiosforestales provocados.


Figura 4.27: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> las covariables Sin Asignar Mo<strong>de</strong>lo(figura izquierda) y grupo <strong>de</strong> Pastos (figura <strong>de</strong>recha) <strong>con</strong> sus correspondientes80 y 95 % <strong>de</strong> bandas <strong>de</strong> credibilidad - Ocurrencia <strong>de</strong> incendios forestales provocadosFigura 4.28: Estimación <strong>de</strong> los efectos suavizados <strong>de</strong> las covariables Matorral, Hojarascay Restos <strong>con</strong> sus correspondientes 80 y 95 % <strong>de</strong> bandas <strong>de</strong> credibilidad -Ocurrencia <strong>de</strong> incendios forestales provocadosLos efectos espaciales estructurados (ver Figura 4.29) muestran que los <strong>con</strong>cellossituados al oeste presentan mayor ocurrencia <strong>de</strong> incendios forestales provocados


que los <strong>con</strong>cellos situados al norte y este <strong>de</strong> Galicia (ver panel izquierdo). Los intervalos<strong>de</strong> credibilidad al 95 % se muestran en la Figura 4.29 (panel <strong>de</strong>recho) don<strong>de</strong>los <strong>con</strong>cellos <strong>de</strong> color negro representan mucha probabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendiosfrente a los <strong>con</strong>cellos en blanco que representan una baja probabilidad <strong>de</strong>ocurrencia <strong>de</strong> incendios forestales provocados. Los <strong>con</strong>cellos en gris son <strong>con</strong>cellos nosignificativos frente a la variable en estudio. Aumenta el número <strong>de</strong> <strong>con</strong>cellos en Galicia<strong>con</strong> alta (oeste) y baja (norete y este) probabilidad <strong>de</strong> ocurrencia <strong>de</strong> incendiosprovocados <strong>con</strong> respecto a los mo<strong>de</strong>los estudiados en secciones anteriores.Figura 4.29: Efectos espaciales estructurados - Ocurrencia <strong>de</strong> incendios forestalesprovocadosLos resultados <strong>de</strong> las efectos espaciales no estructurados (Figura 4.30) no apuntanen ninguna dirección específica, Todos los <strong>con</strong>cellos son no significativos (colorgris, panel <strong>de</strong>recho). Los <strong>con</strong>cellos pintados <strong>de</strong> blanco y rayados no aportan información<strong>de</strong> ningún tipo, ya que no se obtuvo dato para po<strong>de</strong>r estimar este efecto.


Figura 4.30: Efectos espaciales no estructurados - Ocurrencia <strong>de</strong> incendios forestalesprovocados4.3.3. Comparativa <strong>de</strong> mo<strong>de</strong>losSe han estudiado los incendios forestales para dos variables <strong>respuesta</strong>, incendiostotales e incendios provocados, ahora es necesario <strong>con</strong>ocer el ajuste obtenido enambas mo<strong>de</strong>lizaciones tal y como se muestra en el Cuadro 4.9.<strong>Mo<strong>de</strong>los</strong> 2xlog-likelihood g.l. AIC BIC GCVBinomial (totales) 13993.4 164.997 14323.4 16065.3 0.049Binomial (provocados) 11059 141.54 11342 12836.4 0.039Cuadro 4.9: Criterio <strong>de</strong> información Akaike (AIC), criterio <strong>de</strong> información Bayesiano(BIC), y validación cruzada generalizada (GCV) para los dos mo<strong>de</strong>los seleccionados.Se <strong>con</strong>cluye afirmando que los mo<strong>de</strong>los <strong>STAR</strong> <strong>con</strong> <strong>respuesta</strong> binomial para laocurrencia <strong>de</strong> incendios provocados y totales funcionan bien. Las variables meteorológicaspue<strong>de</strong>n ser usadas para tal estimación mientras que las variables <strong>de</strong> grupos<strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustibles <strong>de</strong>ben <strong>de</strong> ser cambiadas por otro tipo <strong>de</strong> variables comopor ejemplo, las formaciones vegetales, que aporten mayor información al mo<strong>de</strong>lo.


Capítulo 5Conclusiones y Futuras Líneas <strong>de</strong>InvestigaciónComo resultado <strong>de</strong> la aplicación <strong>de</strong> las distintas técnicas <strong>de</strong> análisis exploratorioe inferencia <strong>de</strong> los mo<strong>de</strong>los <strong>STAR</strong> en la ocurrencia <strong>de</strong> incendios forestales provocadosy totales para Galicia durante la primera queincena <strong>de</strong> agosto <strong>de</strong> 2006, se hanextraído las siguientes <strong>con</strong>clusiones:1. Los mo<strong>de</strong>los <strong>de</strong> <strong>Regresión</strong> <strong>Aditivos</strong> <strong>Estructurados</strong> (<strong>STAR</strong>) son a<strong>de</strong>cuados parael mo<strong>de</strong>lado <strong>de</strong> los incendios forestales. Constituyen una aportación metodológica<strong>con</strong> ventajas sobre los clásicos mo<strong>de</strong>los <strong>de</strong> regresión logística y los másactuales GLM y GAM. A pesar <strong>de</strong> ello, como toda innovación, exige un periodo<strong>de</strong> mejora para incrementar su eficiencia predictiva. Su mayor aportaciónse encuentra en la flexibilidad <strong>de</strong>l mo<strong>de</strong>lado a la hora <strong>de</strong> incorporar variablesespaciales y temporales directamente mostrando un agregado en forma <strong>de</strong>mapa don<strong>de</strong> se explican las <strong>de</strong>pen<strong>de</strong>ncias tanto para el <strong>con</strong>junto <strong>de</strong> unida<strong>de</strong>s(efectos estructurados) como para cada unidad (efectos no estructurados). Laposibilidad <strong>de</strong> trabajar a escalas espaciales <strong>con</strong> nivel <strong>de</strong> resolución <strong>de</strong> vóxeles<strong>de</strong> 1Km × 1Km por día unido a la posibilidad <strong>de</strong> mapificar las prediciones enun rango <strong>de</strong> color, hace útil el mo<strong>de</strong>lo a efectos <strong>de</strong> planificación y gestión <strong>de</strong>incendios.2. El problema mo<strong>de</strong>lizado en este trabajo es complejo. Los incendios forestales<strong>de</strong>pen<strong>de</strong>n <strong>de</strong> gran cantidad <strong>de</strong> variables: meteorológicas, fisiográficas, uso <strong>de</strong>lsuelo y relación <strong>de</strong> este <strong>con</strong> la probabilidad <strong>de</strong> ar<strong>de</strong>r (todas estas incorporadasen nuestros mo<strong>de</strong>los), pero también <strong>de</strong> otras <strong>de</strong> tipo social, socioe<strong>con</strong>ómico,histrórico, <strong>con</strong>flictividad, etc., que presentan un comportamiento variable en elespacio y el tiempo, y que <strong>de</strong>termina en gran medida la ignición <strong>de</strong> incendioso no incendios. Los <strong>de</strong>safios futuros para la mejora <strong>de</strong> los mo<strong>de</strong>los <strong>STAR</strong> ysu aplicación a predicción <strong>de</strong> incendios está en incorporar estas variables a laescala <strong>de</strong> vóxel aquí utilizada.77


3. Trabajamos <strong>con</strong> máximo rigor, pero somos <strong>con</strong>scientes <strong>de</strong> las limitaciones quepresentan nuestros datos. Se observó que en algunos casos los efectos estimados<strong>de</strong> algunas covariables como altitud, precipitaciones, grupos <strong>de</strong> pastos, grupos<strong>de</strong> hojarasca y restos <strong>de</strong> cortas selvícolas en el tipo <strong>de</strong> combustible forestal ensuperficie eran perfectamente lineales.4. Mejoras en la computación <strong>de</strong> los datos y en la metodología <strong>con</strong>stituyen nuestralínea <strong>de</strong> investigación futura. La colaboración existente entre el grupo <strong>de</strong>investigación GRIDECMB <strong>de</strong> la USC y Thomas Kneib, nos ayudará a mejorary po<strong>de</strong>r <strong>con</strong>seguir mo<strong>de</strong>los espacio-temporales flexibles que puedan proporcionarinformación esencial para po<strong>de</strong>r pre<strong>de</strong>cir <strong>de</strong> forma más satisfactoria losincendios forestales.


Apéndice ABase <strong>de</strong> datosLa base <strong>de</strong> datos analizada en este trabajo recoge los incendios registrados enGalicia, en el periodo que engloba la primera quincena <strong>de</strong> agosto <strong>de</strong> 2006. El total<strong>de</strong> incendios registrados en estos 15 días es <strong>de</strong> 2060, <strong>de</strong> los cuales 1553 son incendiosprovocados. Se estudian 9 variables, clasificadas en dos tipos:A.1.Variables MeteorológicasLas variables meteorológicas juegan un papel muy importante en la ocurrenciay transcurso <strong>de</strong> los incendios forestales, por ello es <strong>de</strong> vital importancia la <strong>con</strong>si<strong>de</strong>ración<strong>de</strong> ellas a la hora <strong>de</strong> estudiar los incendios. La obtención <strong>de</strong> estos datosse realiza a través <strong>de</strong> las estaciones meteorológicas ubicadas por todo el territoriogallego. Durante la primera quincena <strong>de</strong> agosto <strong>de</strong> 2006, se <strong>con</strong>tó <strong>con</strong> un total <strong>de</strong>71 estaciones meteorológicas operativas. La Figura A.1 representa en el mapa <strong>de</strong>Galicia la distribución <strong>de</strong> los lugares en los que se obtuvo y no se obtuvo datos <strong>de</strong>las para todas las variables meteorológicas <strong>de</strong> estudio.79


Figura A.1: Distribución <strong>de</strong> todas las variables meteorológicas en las que se obtuvodato para la primera quincena <strong>de</strong> agosto <strong>de</strong> 2006.Como era <strong>de</strong> esperar, la Figura A.1 muestra que no tenemos datos registradospara todas las variables. Esto se <strong>de</strong>be a que solo hay 71 estaciones meteorológicasoperativas y a<strong>de</strong>más, la distancia máxima <strong>con</strong>si<strong>de</strong>rada entre cuadrícula y estaciónmeteorológica no será nunca superior a 30 Km.Las variables meteorológicas a estudiar son:A.1.1.Temperatura Media DiariaSe estudia la Temperatura Media diaria en ◦ C por voxel a partir <strong>de</strong>l dato obtenidoen cada una <strong>de</strong> las estaciones meteorológicas. En la Figura A.2 se representala distribución <strong>de</strong> temperaturas medias en los <strong>con</strong>cellos en los que se ha registradodato y en la Figura A.3 se representa un mapa en don<strong>de</strong> se observa la media <strong>de</strong>las temperaturas a partir <strong>de</strong> los datos registrados en las estaciones meteorológicasdurante los primeros 15 días <strong>de</strong> agosto <strong>de</strong> 2006.


Figura A.2: Distribución <strong>de</strong> obtención <strong>de</strong>Tª Media Diaria.Figura A.3: Media <strong>de</strong> la Tª media diaria.Primera quincena <strong>de</strong> Agosto <strong>de</strong> 2006.Se pue<strong>de</strong> afirmar que la temperatura media registrada durante toda la primeraquincena <strong>de</strong> agosto <strong>de</strong> 2006 es elevada y alcanzando valores muy altos en la mitadsur <strong>de</strong> Galicia. Los intervalos <strong>de</strong> temperaturas medias se han obtenido a partir <strong>de</strong>lmétodo <strong>de</strong> los cuantiles.A.1.2.Humedad Relativa MediaPara la obtención <strong>de</strong> los datos <strong>de</strong> humedad relativa media medido en % se utilizael mism o procedimiento que para las Tª medias. Uso <strong>de</strong> estaciones meteorológiasactivas para la época <strong>de</strong> estudio y <strong>con</strong>si<strong>de</strong>rando distancias iguales o inferiores a 30Km para registrar dato <strong>de</strong> la variable. En la Figura A.4 se representa la distribución<strong>de</strong> la humedad relativa media en los <strong>con</strong>cellos en los que se ha obtenido dato yen la Figura A.5 se muestran las humeda<strong>de</strong>s relativas medias a partir <strong>de</strong> los datosregistrados en las estaciones meteorológicas en la primera quincena <strong>de</strong> agosto <strong>de</strong>2006.


Figura A.4: Distribución <strong>de</strong> obtención <strong>de</strong>Hª Relativa Media Diaria.Figura A.5: Media <strong>de</strong> la Hª Relativa relaticadurante la primera quincena <strong>de</strong> Agosto<strong>de</strong> 2006.De nuevo no se obtiene dato <strong>de</strong> la humedad relativa para todo el área <strong>de</strong> estudiodurante la primera quincena <strong>de</strong> agosto <strong>de</strong> 2006. Los intervalos <strong>de</strong> humedad relativaobtenidos por el método <strong>de</strong> los cuantiles en la Figura A.5 muestran humeda<strong>de</strong>srelativas bajas en prácticamente todo el territorio gallego, siendo algo más elevadasen la zona norte y noroeste <strong>de</strong> Galicia.A.1.3.PrecipitacionesLa última <strong>de</strong> las variables meteorológicas a estudiar en este trabajo es la precipitaciónregistrada en l/m 2 . El procedimiento llevado a cabo para la obtención<strong>de</strong> los datos <strong>de</strong> precipitaciones a sido igual que para las variables mateorológicasanteriores. A <strong>con</strong>tinuación se muestra en la Figura A.6 la distribución <strong>de</strong> precipitacionesen los <strong>con</strong>cellos en los que se ha registrado dato y en la Figura A.7 se muestrauna media <strong>de</strong> las precipitaciones registradas en las estaciones meteorológicas en laprimera quincena <strong>de</strong> agosto <strong>de</strong> 2006.


Figura A.6: Distribución <strong>de</strong> las Precipitacionesdiarias.Figura A.7: Media <strong>de</strong> las precipitaciones.Primera quincena <strong>de</strong> Agosto <strong>de</strong> 2006.Se observa en los gráficos anteriores que no se obtiene dato <strong>de</strong> la precipitaciónpara todo el área <strong>de</strong> estudio. Cabe <strong>de</strong>stacar en la Figura A.7 que los intervalos <strong>de</strong>precipitaciones <strong>con</strong>si<strong>de</strong>rados por el método <strong>de</strong> los cuantiles son relativamente bajos,lo que quiere <strong>de</strong>cir que prácticamente hubo ausencia <strong>de</strong> precipitaciones durante todala primera quincena <strong>de</strong> agosto <strong>de</strong> 2006.A.2.Variables <strong>de</strong> grupos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible<strong>de</strong> RothermelLa correcta caracterización <strong>de</strong>l tipo <strong>de</strong> combustible forestal frente al comportamiento<strong>de</strong>l fuego es un primer paso <strong>de</strong> cara a alcanzar una eficaz gestión <strong>de</strong> losincendios. Los mo<strong>de</strong>los <strong>de</strong> combustible <strong>de</strong> Rothermel son una clasificación <strong>de</strong> losdiferentes tipos <strong>de</strong> vegetación y su comportamiento <strong>de</strong>l fuego. La clasificación <strong>de</strong>mo<strong>de</strong>los <strong>de</strong> combustible <strong>con</strong>si<strong>de</strong>ra 13 tipos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible, divididosen 4 gran<strong>de</strong>s grupos en función <strong>de</strong> cuál sea el principal medio <strong>de</strong> propagación <strong>de</strong>lfuego: pasto, matorral, hojarasca bajo arbolado y restos <strong>de</strong> corta o <strong>de</strong> tratamientosselvícolas. En este trabajo se ha incluido un quinto grupo que es la sin asignar mo<strong>de</strong>loya que existe mucha heterogeneidad en las masas gallegas y en ocasiones resultamuy difícil asignar una superficie forestal a uno <strong>de</strong> los 13 mo<strong>de</strong>los <strong>de</strong> combustiblepropuestos.Para la distribución <strong>de</strong> la superficie forestal gallega asociada a los grupos <strong>de</strong> mo<strong>de</strong>los<strong>de</strong> combustible <strong>de</strong> Rothermel, se ha hecho uso <strong>de</strong>l Cuarto Inventario ForestalNacional(IFN-4) y <strong>de</strong> esta forma se pue<strong>de</strong> <strong>con</strong>ocer el tipo <strong>de</strong> combustible existente


en cada punto <strong>de</strong>l territorio gallego. Los grupos <strong>de</strong> variables <strong>de</strong> estudio <strong>con</strong> su correspondientedistribución en 5 intervalos iguales <strong>de</strong> menor a mayor superficie porcuadrícula en Galicia se <strong>de</strong>scriben a <strong>con</strong>tiuación:A.2.1.Sin Asignar Mo<strong>de</strong>loEsta variable, como ya se comentó anteriormente, se correspon<strong>de</strong> <strong>con</strong> todasaquellas áreas forestales a las que no se le asignan un mo<strong>de</strong>lo <strong>de</strong> combustible <strong>con</strong>cretoy por <strong>con</strong>siguiente, a uno <strong>de</strong> los 4 grupos <strong>de</strong> combustibles establecidos, bien por suinmensa heterogeneidad o bien porque no se ha medido el tipo <strong>de</strong> combustible en esazona en <strong>con</strong>creto. La Figura B.1 muestra al distribución <strong>de</strong> esta variable en Galicia.Figura A.8: Distribución <strong>de</strong> la variable Sin Asignar Mo<strong>de</strong>lo en GaliciaDes<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong>l estudio <strong>de</strong> la ocurrencia <strong>de</strong> incendios forestales, esnecesario tener en cuenta esta variable ya que como se aprecia en la Figura anterior,existen muchas zonas <strong>de</strong> superficie que no se asocian a ningún mo<strong>de</strong>lo <strong>de</strong> combustibley que a su vez, la heterogeneidad <strong>de</strong> esta variable nos pue<strong>de</strong> ayudar a explicar unpoco más la ocurrencia <strong>de</strong> los incendios en Galicia.


A.2.2.Grupo <strong>de</strong> PastosLos pastos son tierras utilizadas para la producción <strong>de</strong> plantas herbáceas y otrosforrajes herbáceos que se distribuyen en Galicia <strong>de</strong> la siguiente manera:Figura A.9: Distribución <strong>de</strong> los Pastos en GaliciaUn pequeño porcentaje <strong>de</strong> la superficie forestal gallega está ocupada por pasto,algo que habrá que tener en <strong>con</strong>si<strong>de</strong>ración a la hora <strong>de</strong> mo<strong>de</strong>lizar está variable.A.2.3.Grupo <strong>de</strong> MatorralEl matorral es un campo caracterizado por una vegetación dominada por arbustos.Su distribución en Galicia se muestra a <strong>con</strong>tinuación:


Figura A.10: Distribución <strong>de</strong>l Matorral en GaliciaLa mayor parte <strong>de</strong> la superficie forestal gallega está ocupada por matorral, queacumula necromasa <strong>con</strong> la edad y presenta alto riesgo <strong>de</strong> incendio forestal, aspectomuy importante a <strong>con</strong>si<strong>de</strong>rar a la hora <strong>de</strong> estudiar la ocurrencia <strong>de</strong> incendios. Lagestión <strong>de</strong> este tipo <strong>de</strong> formaciones vegetales es necesaria <strong>con</strong> el objetivo <strong>de</strong> disminuirla posibilidad y los efectos <strong>de</strong> los incendios forestales.A.2.4.Grupo <strong>de</strong> Hojarasca bajo arboladoEste grupo engloba a los bosques <strong>de</strong>nsos sin matorral que acumulan en superficiehojarasca <strong>de</strong> los propios árboles que los forman. Su distribución es la que sigue:


Figura A.11: Distribución <strong>de</strong> la Hojarasca bajo arbolado en GaliciaUn pequeño porcentaje <strong>de</strong> toda la superfie forestal etá ocupada por este grupo<strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible.A.2.5.Grupo <strong>de</strong> Restos y/o Operaciones SelvícolasEste grupo está caracterizado por gran<strong>de</strong>s acumulaciones <strong>de</strong> restos gruesos ypesados, cubriendo todo el suelo, provocado por claras tardías, talas rasas y cortasparciales intensas en masas maduras y sobremaduras. La distribución <strong>de</strong> este grupo<strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustible es la que sigue a <strong>con</strong>tinuación:


Figura A.12: Distribución <strong>de</strong> los Restos <strong>de</strong> corta y operaciones selvícolas en GaliciaPrácticamente no se aprecian existenias <strong>de</strong> este grupo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> combustibleen Galicia, aspecto a tener en cuenta a la hora <strong>de</strong> mo<strong>de</strong>lizar estas variables.


Apéndice BSoftwarePara la realización <strong>de</strong> este trabajo se ha utilizado en software estadístico R. Sehan utilizado las siguientes librerías:BayesX: Este paquete proporciona la funcionalidad para explorar y visualizarresultados <strong>de</strong> las estimaciones obtenidas <strong>con</strong> el paquete <strong>de</strong> software BayesX enla regresión aditiva estructurada. También proporciona funciones que permitenleer, escribir y manipular objetos <strong>de</strong> mapa que se requieren en el análisisespacial realizados <strong>con</strong> BayesX.R2BayesX: Paquete interfaz <strong>de</strong> BayesX (http://www.BayesX.org) <strong>de</strong> línea<strong>de</strong> comandos binarios <strong>de</strong> R.Para programar los algoritmos que mo<strong>de</strong>lizan la ocurrencia <strong>de</strong> incendios forestalesprovocados y totales para variables meteorológicas, <strong>de</strong> tipos <strong>de</strong> mo<strong>de</strong>los <strong>de</strong>combustible y ambas, se ha hecho uso <strong>de</strong> la función:bayesx: Función principal para el ajuste <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> la librería R2BayesX.La estimación inferencial usada en este trabajo que proporciona la funciónha sido la estimación basada en el mo<strong>de</strong>lo <strong>de</strong> tecnología mixta y máximaverosimilitud restringida (REML).89


B.1.B.1.1.Un ejemplo <strong>de</strong> código R para mo<strong>de</strong>los <strong>STAR</strong>Script <strong>de</strong> la mo<strong>de</strong>lización <strong>de</strong> la ocurrencia <strong>de</strong> incendiostotales <strong>con</strong> variables climatológicas# Cargamos las libreríaslibrary(BayesX)library(R2BayesX)# Cargamos los datos: base <strong>de</strong> datos y archivo .graincendios1


B.1.3.Script para dibujar los efectos espaciales estructuradosy no estructurados# Abrir ficheros externos que generó la mo<strong>de</strong>lización.res_estr


BibliografíaAkaike, H.,(1973). Information theory and an extension of the maximum likelihoodprinciple. In B. N. Petrov & F. Csaki (Eds.), 2nd International Symposiumon Information Theory, pp. 267-281. Aka<strong>de</strong>mia Kiao, Budapest.Alonso Betanzos A., Fontela Romero O., Guijarro Berdiñas B., Hernán<strong>de</strong>zPereira E., Paz Andra<strong>de</strong> M., Jiménez E., Legido Soto J.L. & CaballasT.,(2003). An intelligent system for forest fire risk prediction and fire fighting managementin galicia. Expert Systems with Applications, 25, 2003.Andrews, P.L., (1986). BEHAVE: Fire behavior prediction and fuel mo<strong>de</strong>lingsystem-BURN subsystem, Part 1, Gen. Tech. Rep. INT-194. Og<strong>de</strong>n, UT: US Departmentof Agriculture, Forest Service, Intermountain Research Station, 130 p.BayesX Web-Seite: http://www.BayesX.orgBesag, J., York, J., & Mollie, A.,(1991). Bayesian image restoration withtwo applications in spatial statistics (with discussion). Annals of the Institute ofStatistical Mathematics 43 (1), 1-59.Biller, C.,(2000). Adaptive bayesian regression splines in semiparametric generalizedlinear mo<strong>de</strong>ls. Journal of Computational and Graphical Statistics 9, 122-140.Brezger, A. & Steiner, W.,(2006). Monotonic Regression based on BayesianP-Splines: An application to estimating price response functions from store-levelscanner data. Journal of Business and E<strong>con</strong>omic Statistics, to appear.Brillinger, D.R., Preisler, H.K. & Benoit, J.W.,(2003). Risk assessment:a forest fire example. In ”Science and Statistics: a Festschrift for Terry Speed´´. (Ed.DR Goldstein). Lecture Notes, Monograph Series, vol. 40, pp. 177–196.(Institute ofMathematical Statistics: Beechwood, OH.)Brillinger, D.R., Preisler, H.K. & Benoit, J.W.,(2006). Probabilistic riskassessment for wildfires. Environmetrics 17, 623–633. doi:10.1002/ENV.768.Burnham, K.P. & An<strong>de</strong>rson, D.R.,(1998).Mo<strong>de</strong>l Selection and Multimo<strong>de</strong>lInference. Springer.93


Cardille, J.A., Ventura, S.J. & Turner, M.G.,(2001). Environmental andsocial factors influencing wildfires in the upper midwest, United States. EcologicalApplications 11(1), 111–127. doi:10.1890/1051-0761(2001)011 [0111:EASFIW]2.0.CO;2.Cavanaugh, J.E.,(1997). Unifying the Derivations for the Akaike and CorrectedAkaike Information Criteria. Statistics and Probability Letters 33, 201-208.Chas, M.,(2007). Forest fires in galicia (spain): Threats and challenges for thefuture. Journal of Forest E<strong>con</strong>omics 13, 1 -5.Chen, Z.,(1993). Fitting multivariate regression functions by interaction splinemo<strong>de</strong>ls. Journal of the Royal Statistical Society B 55 (2), 473-491.Chuvieco, E., Salas, F.J., Carvacho, L. & Rodríguez Silva, F.,(1999).Integrated fire risk mapping. In: Chuvieco E (ed) Remote sensing of large wildfiresin the European Mediterranean Basin. Springer, Berlin, pp 61–84.Cunningham, A.A. & Martell, D.L.,(1973). A stochastic mo<strong>de</strong>l for the occurrenceof man-caused forest fires. Canadian Journal of Forest Research 3(2),282–287. doi:10.1139/X73-038.De Boor, C.,(1978). A Practical Gui<strong>de</strong> to Splines. Springer, New York.Díaz Delgado, R., Lloret, F. & Pons, X.,(2004). Spatial patterns of fireoccurrence in Catalonia, NE, Spain. Landscape Ecology, 19: 731- 745.Dickson, B.G, John W., Prather, J.W., Yaguang X., Hay<strong>de</strong>e, M., Hampton,H.M, Aumack, E.N., & Sisk, T.D. (2006). Mapping the probability oflarge fire occurrence in northern Arizona, USA. Landscape Ecology 21:747– 761.Dierckx, P.,(1995). Curve and Surface Fitting with Splines. Oxford: ClarendonPress.Eilers, P.H. & Marx, B.D.,(1996). Flexible smoothing with B-splines and Penalties.Statistical Science 11, 89-121.Fan, J. & Gijbels, I.,(1984). Local Polynomial Mo<strong>de</strong>lling and Its Applications.Chapman & Hall, London.Fahrmeir, L. & Tutz, G.,(2001). Multivariate Statistical Mo<strong>de</strong>lling Based onGeneralized Linear Mo<strong>de</strong>ls. Springer.Fahrmeir, L. & Lang, S.,(2001a). Bayesian inference for generalized addititvemixed mo<strong>de</strong>ls based on Markov random field priors. Journal of the Royal StatisticalSociety C 50, 201-220.Fahrmeir, L., Kneib, T. & Lang, S.,(2004). Penalized additive regression forspacetime data: a Bayesian perspective. Statistica Sinica 14, 731-761.


Felicísimo, A.M., (1994). <strong>Mo<strong>de</strong>los</strong> digitales <strong>de</strong>l terreno. Introduccion y aplicacionesen las ciencias ambientales. Pentalfa Ediciones. Disponible en http://www.etsimo.uniovi.es/∼ feli/pdf/libromdt.pdfFood and Agricultural Organization of the United Nations (FAO)(2007). Fire management global assessment. A thematic study prepared in the frameworkof the Global Forest Resources Assessment 2005. FAO Forestry Paper 151.Rome, 320 pp. http://www.fao.org/forestry/fra2005/en/. Accessed 6 Dec 2010.Fotheringham, A., Brunsdon, C., & Charlton, M.,(2002). GeographicallyWeighted Regression: The Analysis of Spatially Varying Relationships. Wiley, Chichester.Galiana Martín, L., Aragoneses Domínguez, C., Montiel Molina, C.,De la Cita Benito, F.,Fernán<strong>de</strong>z Ramiro, M., (2009). Caracterización <strong>de</strong>los Escenarios <strong>de</strong>l Fuego en España. Sociedad Española <strong>de</strong> Ciencias ForestalesGonzález, J.R., Palahi, M., Trasobares, A. & Pukkala, T.,(2006). A fireprobability mo<strong>de</strong>l for forest stands in Catalonia (north-east Spain). Annals of ForestScience 63, 169-176.González, J.R. & Pukkala, T.,(2007).Characterization of forest fires in Catalonia(north- east Spain) European Journal of Forest Research 126, 421-429.Green, P.J. & Silverman, B.W.,(1994). Nonparametric Regression and GeneralizedLinear Mo<strong>de</strong>ls. Chapman & Hall, London.Hardy, C.,(2005). Wildland re hazard and risk: Problems, <strong>de</strong>nitions and <strong>con</strong>text.Forest Ecology and Management 211,73 - 82.Hastie, T.J. & Tibshirani, R.J.,(1990). Generalized Additive Mo<strong>de</strong>ls. Chapmanand Hall.Hastie, T.J. & Tibshirani, R.J.,(1993). Varying-coefficient Mo<strong>de</strong>ls. Journal ofthe Royal Statistical Society B 55, 757-796.Kalabokidis, K.D., Koutsias, N., Konstantinidis, P. & Vasilakos, C.,(2007). Multivariate analysis of landscape wildfire dynamics in a Mediterraneanecosystem of Greece. Area 39(3), 392–402. doi:10.1111/J.1475-4762.2007.00756.XKammann, E. & Wand, M.,(2003). Geoadditive mo<strong>de</strong>ls. Journal of the RoyalStatistical Society C 52, 1-18.Kass, R.E. & Raftery, A.E.,(1995). Bayes factors. Journal of the AmericanStatistical Association 90 (430), 773-795.Kneib, T.,(2006). Mixed mo<strong>de</strong>l based inference in structured additive regression.PhD thesis, Dr.Hut-Verlag.


Koutsias, N., Kalabokidis, K.D. & Allgöwer, B.,(2004). ire occurrencepatterns at landscape level: beyond positional accuracy of ignition points with kernel<strong>de</strong>nsity estimation methods. Nat Resour Mo<strong>de</strong>l 17(4):359–375Lang, S. & Brezger, A.,(2004). Bayesian P-Splines. Journal of Computationaland Graphical Statistics 13, 183-212.Loa<strong>de</strong>r, C.,(1999). Local Regression and Likelihood. Springer, New York.Loehle, C.,(2004). Applying landscape principles to FIRE hazard reduction. ForestEcology and Management, 198: 261-267.MAGRAMA Web-Seite: http://www.magrama.gob.esMalamud, B.D., Morein, G. & Turcotte, D.L.,(1998). Forest fires: anexample of self-organized criticality. Science, 281, 1840-1842.Marey Pérez, M.F., Rodríguez Vicente, V., & Crecente Maseda, R.,(2006). “Using GIS to measure changes in the temporal and spatial dynamics offorestland: experiences from north-west Spain”. Forestry Vol. 79: 409-423.Marey Pérez, M.F., & Rodríguez Vicente, V., (2008). “Forest transitionin Northern Spain: Local responses on large-scale programmes of field-afforestation”.Land Use Police, Article in Press.Martell, D.L. & Belivacqua, E.,(1989). A Mo<strong>de</strong>lling seasonal variation indaily people-caused forest fire occurrence. Canadian Journal of Forest Research 19(12),1555–1563. doi:10.1139/X89-237.Martell, D.L., Otukol, S. & Stocks, B.J.,(1987). A logistic mo<strong>de</strong>l for predicingdaily people-caused forest fire occurrence in Ontario. Canadian Journal ofForest Research 17(5), 394–401. doi:10.1139/X87-068.Marx, B.D. & Eilers, P.,(1998). Direct generalized additive mo<strong>de</strong>ling with penalizedlikelihood. Computational Statistics and Data Analysis 28 (2), 193-209.Mermoz, M., Kitzberger, T., & Veblen, T.T., (2005). Landscape influenceson occurrence and spread of wildfires in Patagonian forests and shrublands. Ecology86: 2705-2715.Miller, A.,(2002). Subset Selection in Regression. Chapman and Hall.Minnich, R.A. & Bahre, C.J.,(1995). Wildland fire and chaparral succesionalong the California-baja california boundary. International Journal of WildlandFire, 5, 13-24.Moreno J.M.,(1989).Los ecosistemas terrestres mediterráneos y el fuego. PolíticaCientífica 18:46–50.


Moritz, M.A.,(2003). Spatiotemporal analysis of <strong>con</strong>trols on shrubland and fireregimes: age <strong>de</strong>pen<strong>de</strong>ncy and fire hazard. Ecology, 84, 2003.Nunes, M.C.S., Vas<strong>con</strong>celos, M.J., Pereira, J.M.C., Dasgupta, N., Alldredge,R.J. & Rego, F.C. (2005). Land cover type and fire in Portugal: dofires burn land cover selectively?. Landscape Ecology 20: 661-673.Núñez E.A. & Colhoun, A., (1986). Note on air temperature lapse rates onMount Wellington. Pap. Proc. R. Soc. Tasmania 120, pp. 11–15.Pew, K.L. & Larsen, C.P.S.,(2001).GIS analysis of spatial and temporal patternsof human-caused wildfires in the temperate rain forest of Vancouver Island, Canada.Forest Ecology and Management 140, 1–18. doi:10.1016/ S0378-1127(00)00271-1.Preisler, H.K., Brillinger, D.R., Burgan, R.E. & Benoit, J.W.,(2004).Probability based mo<strong>de</strong>ls for estimation of wildfire risk. International Journal ofWildland Fire 13, 133–142. doi:10.1071/WF02061.Preisler, H.K. & Westerling, A.L.,(2007). Statistical mo<strong>de</strong>l for forecastingmonthly large wildfire events in western United States. Journal of Applied Meteorologyand Climatology 46, 1020–1030. doi:10.1175/JAM2513.1.R Development Core Team (2007).“R: a Language and Environment for StatisticalComputing”. (R Foundation for Statistical Computing:Vienna) Available athttp://www.R-project.org [Verified 19 March 2009].Reed, W.,(1994). Estimating the Historic Probability of Stand-Replacement FireUsing the Age-Class Distribution of Undisturbed Forest. Forest Science. 40: 104–119.Reed, W.J. & Mckelvey, K.S.,(2002). Power-law behaviour and parametricmo<strong>de</strong>ls for the size-distribution of forest fires. Ecological Mo<strong>de</strong>lling, 150, 239 – 254.Riera, P. & Mogas, J.,(2004). Evaluation of a risk reduction in forest fires inMediterranean region. Forest Policy and E<strong>con</strong>omics 6: 521-528.Rigby, R.A. & Stasinopoulos, D.M,(2005). Generalized Additive Mo<strong>de</strong>ls forLocation, Scale and Shape. Applied Statistics 54, 507-554.Robin, J.G., Carrega, P. & Fox, D.,(2006). Mo<strong>de</strong>lling fire ignition in theAlpes-Maritimes Department, France. A comparison. In: Proceedings of V international<strong>con</strong>ference on forest fire research, 27–30 Nov, Figueira da Foz.Rothermel, R.C., (1983). How to predict the Spreads and intensity of forest andrange forest fires. USDA Forest Service. USA.Ruppert, D., Wand, M.P., & Carroll, R.J.,(2003). Semiparametric Regression.Cambridge University Press, Cambridge.


Schwarz, G.,(1978). Estimating the dimension of a mo<strong>de</strong>l. The Annals of Statistics6, 461-464.Tábara, D., Saurí, D. & Cerdan, R.,(2003). Forest Fire Risk Mangement andPublic Participation in Changing Socioenvironmental Conditions: a Case Study ina Mediterranean Region. Risk Analysis 23: 249-260.Thompson, W.A., Vertinsky, I., Schreier, H. & Blackwell, B.A.,(2000).Using forest fire hazard mo<strong>de</strong>lling in multiple use forest management planning, ForestEcology and Management. 134: 163–176.Van Wagner, C.E., (1987). Development and structure of the Canadian ForestFire Weather In<strong>de</strong>x System. Canadian Forest Service, Ottawa, Ontario ForestryTechnical Report nº 35.Vas<strong>con</strong>celos, M.P.P., Silva, S., Tomé, M., Alvim, M. & Pereira, J.M.C.,(2001). Spatial prediction of fire ignition probabilities: comparing logistic regressionand neural networks. Photogrammetric Engineering and Remote Sensing 67(1),73–81.Vélez, R.,(1990). Mediterranean forest fires: A regional perspective. Unasylva.162: 10-122002. Causes of fires in the Mediterranean Basin. EFI proceedings. 45:35-42.Viedma, O. Moreno, J.M. & Rieiro, I.,(2006). Interactions between landuse/land cover change forest fires and landscape structure in Sierra <strong>de</strong> Gredos (CentralSpain) Environmental Conservation 33: 212-225.Westerling, A.L., Hidalgo, H.G., Cayan, D.R. & Swetnam, T.W.,(2006).Warming and earlier spring increase western US forest wildfire activity. Science313:940–943.Wood, S.N.,(2006a). Generalized Additive Mo<strong>de</strong>ls: An Introduction with R. Chapmanand Hall.Yang, J., He H.S., Shifley, S.R. & Gustafson, E.J.,(2007). Spatial patternsof mo<strong>de</strong>rn period human-caused fire occurrence in the Missouri Ozark Highlands.For Sci 53:1–15.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!