Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 Especialización en Teledetección y Sistemas de Información Geográfica aplicados al estudio del medio ambiente TRABAJO FINAL DE APLICACION “Análisis de variables ambientales que inciden en la ocurrencia de incendios y su relación con la distribución de focos de calor a partir de la aplicación de un modelo estadístico de datos y teledetección satelital” Alumna: Solange Noelia VILLANUEVA Profesor Orientador: Olga Susana FILIPPINI 2016 Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 2 INDICE GENERAL RESUMEN……………………………………………………………………………....4 INTRODUCCIÓN…………………………………………………………………….…5 OBJETIVO GENERAL…………………………………………………………………9 OBJETIVOS ESPECÍFICOS…………………………………………………………....9 AREA DE ESTUDIO ECORREGIONES ……………………………………………………………………….…9 Región Pampeana y Espinal.......…………………………..………………..…...8 Región de Monte de Llanuras y Mesetas…...……………………………………10 Región Chaqueña……………………………………………………….………11 MARCO TEORICO TELEDETECCIÓN….……………………………………………………………………15 El espectro electromagnético…………………………………………………...16 Tipos de sensores………………………………………………………….……17 Descripción de satélite TERRA y AQUA……………………………………...19 Descripción del satélite Landsat 8. …………………….………………………23 APLICACIÓN ESTADÍSTICA Predicción de focos de calor……………………………………………………26 Modelo Lineal Generalizado………………………….……………………..…27 Descripción de datos……………………………………………………………28 METODOLOGIA Síntesis metodológica…………………………………………………………………..33 Metodología…………………………………………………………………………….34 RESULTADOS……………………………………………………………………..…35 CONCLUSION………………………………………………………………….…….49 BIBLIOGRAFIA……………………………………………………………………….50 ANEXO……………………………………………………………………………….. 54 Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 3 INDICE DE TABLAS TABLA 1. Descripción de datos Landsat 8 (LDCM)-Fuente USGS 2013…………..…24 TABLA 2. Variables ambientales………………………………………………………39 TABLA 3/ TABLA 4 /TABLA 5. Información del modelo ……………………………..40 TABLA 6. Bondad de ajuste – Zona I …………………………………………………41 TABLA 7. Bondad de ajuste – Zona II …………………………………………………42 TABLA 8. Bondad de ajuste –Zona III…………………………………..……………...42 TABLA 9. Contrastes de los efectos del modelo – Zona I …………………………...…44 TABLA 10. Contrastes de los efectos del modelo – Zona II………………………...…..45 TABLA 11. Contrastes de los efectos del modelo – Zona III…………………………...45 TABLA 12. Estimaciones de los parámetros. Zona I……………….……………….…..46 TABLA 13. Estimaciones de los parámetros. Zona II…………………………… …….47 TABLA 14. Estimaciones de los parámetros. Zona III………………………………….48 INDICE DE FIGURAS FIGURA 1 Ecorregiones de Argentina (Brown y Pacheco 2006)………………….……9 FIGURA 2 Áreas de estudio. (Elaboración propia)……………………………………...14 FIGURA 3. Espectro electromagnético (Chuvieco 2008)....………………….…………16 FIGURA 4. Ancho de banda para los sensores OLI y TIRS en Landsat 8 y ETM+ en Landsat 7 (USGS 2013)………………………………………………………..………24 FIGURA 5 Funciones de vínculo......................................................................................27 FIGURA 6. Síntesis metodológica……………………………………………………....33 FIGURA 7. Interrelación de focos de calor (2009-2013) y mapa de cobertura del suelo Variable de influencia antrópica………………………………………………………..36 FIGURA 8. Variable de influencia antrópica y focos de calor……………………...…...37 FIGURA 9. Puntos de calor y pendiente………………………………………………...38 Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 4 Resumen El territorio argentino debido a su heterogeneidad geográfica, sufre la ocurrencia de incendios, siendo una de las principales causas de modificación de ambientes. Variables de índole natural y antrópicas inciden sobre este fenómeno. Existen diversos productos satelitales elaborados para cuantificar y representar la ocurrencia de incendios que integran tecnología de sensores remotos y Sistemas de Información Geográfica (SIG) para realizar productos globales, estacionales y anuales de focos de calor a partir de imágenes MODIS. El objetivo del presente estudio fue realizar un análisis de las variables ambientales (Índice de influencia antrópica; tipo de cobertura; pendiente del terreno, temperatura y precipitaciones) a través de un análisis estadístico complementado con las herramientas de teledetección. La metodología utilizada se basó en la generación de capas de información de las áreas bajo estudio que se interrelacionaron con los focos de calor (FC), obtenidos en base al producto MOD 14 extraídos del satélite Terra MODIS y AQUA, que se complementó con técnicas de análisis estadístico; de tipo descriptiva y análisis de frecuencias basadas en el Modelo Lineal Generalizado. Se analizaron los resultados obtenidos de las distintas áreas de trabajo (Chaco Seco; Chaco Húmedo y Espinal) para evaluar las variables ambientales con mayor probabilidad de incidencia en la ocurrencia de incendios. El periodo de estudio consta de cinco años (2009-2013). Como principal resultado se hallaron las variables con mayor probabilidad de influencia sobre la ocurrencia de FC para cada área, siendo la de mayor peso de influencia el Índice de influencia antrópico, este resultado deja abierta múltiples hipótesis para continuar trabajando en relación a la temática del uso y sobre explotación de los recursos naturales. Palabras claves: Teledetección; Sistema de Información Geográfica; Estadística; Modelo Lineal Generalizado; Incendios. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 5 Introducción Los incendios constituyen fenómenos de cambio en ambientes; la evolución del fuego desde un pequeño foco, que puede extinguirse rápidamente, hasta un incendio de mayores proporciones, depende de diversas variables: la cantidad (carga), continuidad (disposición horizontal y vertical) y características del combustible vegetal (fino, grueso, inflamable o no), de la temperatura y humedad relativa del aire, de la exposición, de la pendiente, de los vientos, entre otros (Defossé, et. al., 2004). Dentro de las causas que originan los incendios, aquellas más destacadas son la que tienen relación con las actividades antrópicas. Siendo interesante analizar las condiciones naturales y las variables de influencia antrópica en el medio que hacen más probable la ocurrencia de incendios. La interrelación de variables es fundamental para la detección de incendios. Por ejemplo, en la Región Andino Patagónica se aplica el “índice de peligro de propagación de incendios forestales”, desarrollado por Rodríguez y Moretti (1988). Considera para ello variables tales como: la temperatura, la humedad relativa, el viento y los días consecutivos con o sin precipitación. Se asume que cada una de las variables utilizadas explica un determinado porcentaje del peligro total de propagación del fuego. Las dos primeras variables determinan el contenido de humedad y la resistencia a la ignición de los combustibles; la ocurrencia o no de precipitación determinan la alternancia entre periodos secos y húmedos. Los índices de peligro de incendio ayudan a evaluar la facilidad de ignición, la velocidad de propagación, la dificultad de control, y el impacto del fuego, en función de los factores fijos y variables que lo afectan (vegetación, totopografía, meteorología). Actualmente estos fenómenos pueden ser evaluados conel apoyo de la geografía aplicada la cual posee un importante auge al recibir un apoyo geotecnológico que vincula los desarrollos en cartografía y percepción remota, junto con el tratamiento estadístico multivariado. Los Sistemas de Información Geográfica (SIG) son herramientas que permiten procesar geoinformación (cuya condición básica es su referencia espacial a un determinado Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 6 sistema de coordenadas geográficas) por esta razón se han transformado en herramientas imprescindibles para la gestión y planificación del territorio, específicamente, para el planeamiento urbano según la Dirección Provincial de Ordenamiento Urbano y Territorial Sistemas de Información Geográfica para el ordenamiento territorial. Para el presente estudio se propone la interrelación de variables mediante la aplicación de una metodología de análisis estadístico e imágenes satelitales que se interrelacionarán mediante el uso de los SIG. Según Kendall (1975) el análisis multivariable es el conjunto de técnicas estadísticas que analizan simultáneamente más de dos variables. En cambio Seber (1984) se refiere al análisis multivariable como aquel orientado al estudio de vectores de variables aleatorias correlacionadas. Para Johnson y Wichern (1998) el análisis multicriterio es una bolsa mixta que contiene métodos apropiados para investigaciones científicas y tecnológicas. Asimismo la modelación estadística basada en la medición de un conjunto de parámetros y la implementación de un modelo matemático permite predecir casos de estudio particulares y expresar cuáles serán los resultados de una determinada modelación. Los métodos multivariados utilizan métodos de modelación estadística cuando realizan análisis de dependencia entre variables. El Modelo Lineal Generalizado (MLG), es la extensión natural del Modelo Lineal clásico. Inicialmente expuesto por Nelder y Wedderburn (1972), ha llegado a suponer “una auténtica revolución estadística”, convirtiéndose en una solución especialmente adecuada para modelos de dependencia con datos no métricos. En el análisis de regresión, las relaciones entre dos variables se fundamentan en modelos de respuesta, es decir, en la forma cómo una variable (y), que se puede denominar dependiente, responde a los cambios que experimenta la otra variable (x), denominada independiente. Fácilmente se puede deducir que en nuestro caso las variables independientes son, por lo general, variables ambientales. Por tanto, el objetivo de un análisis de regresión es conocer la respuesta estimada (Ey) de una especie para un valor determinado de la variable o variables ambientales consideradas. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 7 Esto se aplicará para el presente caso de estudio, considerando las variables ambientales de cada área de estudio, para confrontar con los productos de detección de incendios o anomalías térmicas de la superficie de la tierra, los cuales procesan los datos en base a umbrales establecidos a escala global, sin contemplar la regionalización de acuerdo a las diferentes variables ambientales. Los modelos estadísticos que utiliza dependen del número de variables dependientes (o respuesta de interés) y el tipo de escala de medida. El Modelo Lineal Generalizado (MLG) cubre todos los modelos que podrían utilizarse de acuerdo al número de variables y tipo de escala, pero el MLG presenta restricciones o supuestos necesarios para su aplicación. Objetivo general Identificar variables ambientales que inciden en la ocurrencia de incendios, y su relación con la distribución de focos de calor, mediante la utilización de análisis estadísticos multivariados. Objetivos específicos -Desarrollar una base de datos con las variables correspondiente a cada área de estudio que podrían tener incidencia en la ocurrencia de incendios. -Utilizar un método estadístico de análisis para cada área de estudio, justificando su uso. -Realizar un análisis que sea un aporte para evaluar las variables que tengan mayor influencia en la generación de incendios. AREA DE ESTUDIO Ecorregiones Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 8 A fines de la década del 90 se generó un mapa (Figura 1) de las ecorregiones de la Argentina (Burkart et al., 1999), basado en el mapa de regiones fitogeográficas de la Argentina de Cabrera (1976) a partir de un panel de expertos en flora y fauna de las distintas regiones geográficas de la Argentina. En este trabajo utilizamos la denominación de “Ecorregión” según los criterios establecidos en 1999 como: “Un territorio geográficamente definido en el que dominan determinadas condiciones geomorfológicas y climáticas relativamente uniformes o recurrentes, caracterizado por una fisonomía vegetal de comunidades naturales y seminatural que comparten un grupo considerable de especies dominantes, una dinámica y condiciones ecológicas generales y cuyas interacciones son indispensables para su persistencia a largo plazo”. Las mismas están definidas en función de variables climáticas, de biodiversidad y características ecológicas particulares de funcionamiento. Figura 1. Ecorregiones de Argentina (Brown y Pacheco 2006) Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 9 Áreas de estudio Área I. Se localiza entre las coordenadas: 34º 51´59” S - 65º04´29” O (Figura 2) en el Sur Oeste de Córdoba y el Sur Este de San Luis; abarca parte de la Región Pampeana (Pampa Húmeda) y del Espinal. La Región Pampeana, aproximadamente entre los 31° y 39° de Latitud Sur, presenta una división entre la denominada "Pampa Húmeda" o "Pampa Oriental" y la "Pampa Seca" o "Pampa Occidental" (Politis, 1984). Esta división estaría marcada por la isohieta de los 600 mm. Así, la subregión Pampa Húmeda se encuentra limitada hacia el Oeste por la mencionada isohieta, mientras que su límite Este está marcado por el Río Paraná, el Río de La Plata y el Océano Atlántico. Abarca una superficie aproximada de 500.000 km 2 y comprende la mayor parte de la provincia de Buenos Aires, Sur de Entre Ríos, Sur de Santa Fe, Sur de Córdoba y Sureste de San Luis (Cabrera, 1976). La Pampa Húmeda es un área constituida por planicies y praderas herbáceas cuya pendiente es muy baja, con dos sistemas serranos de escasa altitud (no mayor a los 1200 msnm), denominados Ventania y Tandilia. En términos generales, la presencia de ríos no es abundante, en cambio sí lo son las lagunas de agua dulce o salobre que se encuentran distribuidas por toda la subregión. Cabe destacar la presencia de profundos depósitos de loess de origen pleistocénico y holocénico que cubren gran parte de la subregión, los cuales han servido como material parental para la formación de suelos durante diferentes momentos del Cuaternario. Desde un punto de vista fitogeográfico el área pertenece a la Provincia Pampeana del Dominio Chaqueño, cuya vegetación dominante es la estepa o pseudoestepa de gramíneas (Cabrera, 1976). Si bien la ausencia de árboles caracterizó al ambiente pampeano, durante la época de la conquista hispánica aún era posible encontrar espesos bosques relictuales de algarrobo blanco y negro (Prosopis alba y Prosopis Nigra) como así también de chañar (Geoffrea decorticans) y Prosopis Caldén. Aunque las comunidades naturales han sidointensamente modificadas por la acción agropecuaria, aún en campos no cultivados o en aquellos que han estado por largos períodos sin cultivo pueden observarse varias especies autóctonas. La llanura está dominada por una Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 10 estepa graminosa donde predominan los géneros Stipa, Piptochaetium y Poa (Prieto 1996; Soriano et al. 1992). El Espinal es una ecoregión de la llanura Chaco Pampeana, que rodea por el Norte, Oeste y Sur a la Región Pampeana, abarcando el sur de la Provincia de Corrientes, mitad norte de Entre Ríos, una faja central de Santa Fe y Córdoba, centro y sur de San Luis, mitad este de La Pampa y sur de Buenos Aires. El paisaje predominante es de llanura plana a suavemente ondulada, ocupada por bosques bajos, sabanas y pastizales, hoy convertidos en gran parte a la agricultura. La característica de los suelos es variable; hacia el Noreste, los suelos formados sobre sedimentos loésicos son arcillosos e imperfectamente drenados. Hacia el centro-oeste y sur de la región, son mediana a pobremente desarrollados, de texturas gruesas, escasamente provistos de materia orgánica, sin presencia de capas de acumulación de arcilla y principalmente hacia el sur, con presencia de capas petrocálcicas y zonas medanosas. El clima es variable, cálido y húmedo en el Norte, templado y seco con marcados déficit hídricos, hacia el Oeste y Sur. El Espinal se puede dividir en tres subregiones: Espinal del Ñandubay, el sector mesopotámico, de clima húmedo; el de los Algarrobos, el sector central, subhúmedo, de transición entre la Pampa y el Chaco; finalmente, el del Caldén, sector semiárido, de transición entre la Pampa y el Monte. Las formaciones vegetales características son los bosques bajos de especies leñosas xerófilas, densos o abiertos, de un solo estrato, y las sabanas, alterando con pastizales puros. En general las especies vegetales comunes en el Espinal se encuentran también en otras provincias fitogeográficas del dominio Chaqueño, especialmente la Provincia Chaqueña, de la cual se considera una continuación austral empobrecida. Área II. Se encuentra localizada entre las coordenadas: 36º 38´59” S - 66º11´28” O, en el Centro Oeste de la provincia de La Pampa, abarca parte del Espinal y la región del Monte de Llanuras y Mesetas (Cabrera, 1976). Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 11 La región Monte de Llanuras y Mesetas, comprende desde el Sur de San Juan hasta Chubut. La aridez y la composición florística y faunística son bastante homogéneas en toda su extensión. El clima es cálido y seco, con gran variedad térmica diaria y entre estaciones. Las precipitaciones muestran un marcado gradiente este-oeste y son muy variables: entre 80 mm y alrededor de 300 mm anuales (con algunos registros excepcionales), aunque en pocos lugares superan los 200 mm. La estación seca dura hasta un máximo de nueve meses y las lluvias están restringidas al verano, excepto en el sur, donde tienden a distribuirse más regularmente a lo largo del año. Área III. Se localiza entre las coordenadas: 30º 48´16” S - 64º26´32” O, Noreste de Santiago del Estero, Noroeste de Santa Fé y Suroeste de Chaco, que comprende un área de transición entre el Chaco Seco y el Chaco Húmedo (Cabrera 1976). El Chaco Seco, en su mayor parte, es una vasta llanura sedimentaria, modelada esencialmente por la acción de los ríos que la atraviesan en sentido Noroeste-Sudeste, principalmente el Juramento-Salado, el Bermejo y el Pilcomayo. Sus altas cuencas se encuentran fuera de la región, en la cordillera, desde donde transportan una gran cantidad de sedimentos que forman albardones a los costados del cauce, que en forma frecuente colmatan los cauces y dan origen a la divagación de los ríos. El Chaco Seco contiene una gran diversidad faunística, aunque muchos de sus componentes han sufrido una fuerte reducción en sus poblaciones, provocada por la intervención antrópica. Los principales factores con los que el hombre ha amenazado y amenaza a la conservación de la fauna de la región son: la reducción y la fragmentación de hábitat, especialmente en las zonas aptas para la agricultura, y la caza, principalmente de algunos mamíferos mayores. El Chaco Oriental o Húmedo, con algunas diferencias en cuanto a su delimitación abarca la mitad oriental de Formosa y Chaco, el extremo Noroeste de Corrientes y el Norte de Santa Fe. Incluye la porción húmeda de las cuencas de los ríos Pilcomayo y Bermejo, los Esteros, Cañadas y Selvas de Ribera y el Alto Agrícola Chaco Formoseño, estos dos últimos dentro de la Provincia del Chaco. (Morello J.; Adámoli J., 1968). Posee dos gradientes: térmico y de precipitaciones, el primero, decreciente en sentido Norte Sur y el segundo decreciente en sentido oeste este, que condicionan la aparente Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 12 uniformidad de la zona, que se manifiesta en diversidad en cuanto a: disponibilidad de agua del sistema hídrico superficial y subterráneo, diversificación de los suelos y en la vegetación: bosque cerrado, un paisaje abierto de parques y sabanas y un horizonte de esteros y bañados enmarcados por selvas en galería. La condición climática subtropical húmedo (Bruniard, 1987) implica temperaturas media anuales desde los 23º al norte hasta los 18º al sur de la región. Las lluvias son abundantes con dos picos estacionales (otoño y verano) y un balance hídrico positivo. La vegetación, presenta la mayor diversidad del Parque Chaqueño, con la presencia de bosques fluviales, áreas deprimidas con amplio dominio de vegetación herbácea, muchas veces compartida con especies de palma en fisonomías de tipo sabánica. Las pulsaciones debidas a las inundaciones y el fuego son también una importante característica de las áreas más deprimidas. La gran variedad de ambientes del Chaco Húmedo (bosques, esteros, bañados, sabanas, pastizales, lagos y ríos) hace que se presente en la región una notable cantidad y diversidad de fauna silvestre. En su mayoría insectos, entre los vertebrados se encuentran más de cincuenta especies de peces, cuarenta de anfibios, cincuenta de reptiles, trescientas cincuenta de aves y setenta de mamíferos. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 13 Figura 2. Áreas de estudio Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 14 MARCO TEÓRICO LA TELEDETECCION La percepción remota o teledetección es una técnica que permite obtener información de objetos, áreas o fenómenos situados sobre la superficie terrestre sin mantener contacto físico con ellos. La palabra teledetección surge a principios de 1960 como traducción latina del término inglés remote sensing para designar cualquier medio de observación remota. Este término se aplicó fundamentalmente a la fotografía aérea, principal sensor de aquella época. Con el avance y la investigación en el campo de los sensores montados sobre plataformas espaciales se abre una nueva era en la adquisición de datos tanto de la superficie como de la atmósfera terrestre. Surge así lo que actualmente se conoce comoteledetección espacial. Para que la observación remota sea posible es preciso que exista algún tipo de interacción entre el objeto observado y el sensor. La captura de datos en teledetección se basa en el registro de esta radiación electromagnética por un sistema sensor a bordo de una plataforma que lo alberga. La fuente de energía que origina la radiación electromagnética podrá ser el Sol o las cubiertas terrestres (teledetección pasiva) o bien el propio sensor (teledetección activa). Se distinguen así tres tipos de radiación electromagnética en cuanto a su origen: radiación solar reflejada por los objetos, radiación terrestre emitida por los objetos y radiación emitida por el sensor y reflejada por los objetos. El primer tipo de radiación se registra en la región del visible y del infrarrojo (IR) reflejado (IR cercano e IR medio de onda corta) siendo el tipo más importante de teledetección, el segundo en el infrarrojo térmico (también en el IR medio de onda larga para objetos de alta temperatura) y el último en la región de microondas (radar) (Chuvieco, 2008). EL ESPECTRO ELECTROMAGNETICO Según la teoría ondulatoria, la energía electromagnética se transmite de un lugar a otro siguiendo un modelo armónico y continuo, a la velocidad de la luz. La radiación electromagnética se presenta como una distribución continua de longitudes de onda o de frecuencias. A pesar de lo anterior suelen establecerse una serie de bandas en donde esta radiación presenta un comportamiento similar en determinados aspectos. La organización de estas bandas de longitudes de onda o frecuencia se denomina espectro Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 15 electromagnético. Comprende desde las longitudes de onda más cortas como los rayos γ o los rayos X hasta longitudes kilométricas como las ondas de telecomunicaciones (Figura 3 ). Figura 3. Espectro electromagnético. (Chuvieco et al, 2008) Se denomina región óptica del espectro a aquel conjunto de longitudes de onda comprendidas entre 0.4 y 2.5 µm (desde el visible al SWIR). Las longitudes de onda de esta región se relacionan con los procesos de reflexión de la energía solar sobre la superficie terrestre. Aunque en teledetección también se empleen datos de otras regiones, la mayor parte de las aplicaciones se centran en la región óptica del espectro. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 16 TIPOS DE SENSORES Un sistema espacial de teledetección se compone del sensor y de la plataforma que lo sustenta. En primera instancia, los sensores se clasifican en función de la fuente de energía que origina la radiación electromagnética. En este sentido se habla de sensores pasivos, cuando se limitan a captar la radiación electromagnética procedente de una fuente de energía exterior a ellos y de sensores activos, cuando además de captar radiación emiten su propio haz de energía. Dentro de los sensores pasivos, según el procedimiento que empleen para grabar la energía recibida, se distingue entre sensores fotográficos, ópticos y de antena. Los sensores fotográficos basan su funcionamiento en la impresión de un objeto sobre emulsiones fotosensibles, con el apoyo de un sistema óptico que permite controlar las condiciones de la exposición. Dado que no permiten una cobertura sistemática de la superficie terrestre al no facilitar una transmisión a distancia de las imágenes captadas, han sido desplazados por los actuales sensores ópticos. Por otro lado, los sensores de antena o radiómetros de microondas operan a longitudes de onda largas, en la región de microondas, donde no se ven afectados por la situación atmosférica ni por las condiciones de iluminación. Por otra parte, dentro de los sensores activos se encuentran el radar y el lídar. El radar trabaja en la región de microondas y puede operar en cualquier condición atmosférica. En cambio, el lídar es un sensor activo que emite pulsos de luz polarizada entre el ultravioleta y el infrarrojo cercano. RESOLUCIONES DE UN SENSOR La resolución espacial de un sensor se refiere a la capacidad del sensor para discriminar información de detalle. La resolución se asocia al conjunto del equipo y no a cada una de sus partes, es decir, depende del efecto combinado de cada uno de los componentes de un sensor. Además, a la hora de definir la resolución de un sensor se menciona el término información de detalle, relacionado no sólo con el detalle espacial que proporciona el sensor, sino también con el número y ancho de las bandas del espectro en las que opera, con el intervalo de tiempo entre dos pasadas consecutivas y con la capacidad para distinguir variaciones en la energía que detecta. Por tanto, la resolución de un sensor puede descomponerse en espacial, espectral, radiométrica y temporal. A continuación se explica cada una de ellas. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 17 La resolución espacial hace referencia al tamaño del objeto más pequeño que puede ser distinguido sobre una imagen. En los sensores ópticos suele utilizarse el concepto de campo de visión instantáneo o IFOV, que es la sección angular, medida en radianes, observada en un momento determinado por el sensor. A menudo, en vez de recurrir al IFOV, se emplea la distancia sobre el terreno que corresponde a ese ángulo, que puede calcularse a partir de él, conociendo la distancia que separa el suelo del sensor. Esa distancia representa la longitud sobre el terreno que equivale a un píxel de la imagen, siendo la medida de resolución espacial más extendida. La resolución espacial de los distintos sensores actuales muestra un rango bastante amplio, desde la baja resolución espacial de varios kilómetros de los satélites meteorológicos hasta la resolución inferior a un metro del satélite QuickBird. La resolución de un sensor también se manifiesta a través del número y anchura de las bandas espectrales que puede discriminar. Es lo que se denomina resolución espectral. Cuanto mayor sea el número de bandas que proporcione un sensor, más fácil resultará la discriminación de cubiertas a partir de imágenes del mismo. Además, no sólo es importante el número de bandas del espectro que abarca un sensor, el ancho de las mismas es otro factor de vital importancia. Conviene contar con bandas lo suficientemente estrechas como para detectar la diferenciación espectral entre cubiertas de interés, ya que bandas de una anchura considerable proporcionarán valores de radiancia promedio, con la pérdida de información espectral que esto conlleva. No obstante, el número, anchura y localización de bandas de un sensor se relaciona con los objetivos de diseño y aplicaciones del mismo. La resolución radiométrica se refiere a la sensibilidad del sensor, es decir, a su capacidad para detectar variaciones en la radiancia espectral que recibe. En las imágenes digitales, la radiancia espectral se codifica en un número determinado de niveles digitales. Dado que se trata de una codificación digital, la resolución radiométrica suele expresarse a través del número de bits que precisa cada píxel para ser almacenado. Por ejemplo, las imágenes Landsat presentan una resolución radiométrica de 8 bits/píxel, esto significa que la radiancia espectral recibida por este sensor se codifica en 28 = 256 niveles digitales. Sin embargo, otros sensores no realizan esta codificación de la señal recibida en un número determinado de niveles digitales, sino que muestran en cada píxel el valor dela radiancia registrada por el sensor. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 18 Por último, la resolución temporal indica la frecuencia de cobertura o periodicidad con la que el sensor adquiere imágenes de la misma zona de la superficie terrestre. Ésta depende de las características orbitales de la plataforma, como la altura y la velocidad y también del diseño del propio sensor. Dado que un único sistema de teledetección no puede cubrir todas las expectativas, en lo que a resolución se refiere, los sistemas se diseñan primando un tipo de resolución concreta, condicionada por las aplicaciones y los fines a los que se destina ese sistema. La detección temprana de incendios forestales requiere sistemas de teledetección con una resolución temporal alta; además, la resolución radiométrica de los canales térmicos supone un punto importante, de cara a detectar de forma efectiva las variaciones de la temperatura superficial terrestre. En este sentido, el sensor MODIS elegido para desarrollar este estudio, por su resolución temporal, espectral y radiométrica, resulta idóneo para la detección y cartografía temprana de incendios y los datos del satélite Landsat 8. SATELITES TERRA Y AQUA TERRA El satélite Terra fue puesto en órbita el 18 de diciembre de 1999 y comenzó a recoger información el 24 de febrero de 2000. Fue lanzado desde la base militar estadounidense de Vandenberg en el cohete Atlas IIAS. Posee cinco instrumentos especializados en el estudio de la atmósfera y la detección de cambios climáticos. Estos 5 instrumentos son: - ASTER (Advanced Spaceborne Thermal Emission and Reflection Radiometer) - CERES (Clouds and the Earth’s Radiant Energy System) - MISR (Multi-angle Imaging SpectroRadiometer) - MODIS (Moderate-resolution Imaging Spectroradiometer) - MOPITT (Measurements of Pollution in the Troposphere) El ASTER es un fotosensor desarrollado conjuntamente por la NASA y el Ministerio de Industria Japonés. Se utiliza para obtener mapas detallados de la temperatura, reflectancia y elevación de la superficie terrestre. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 19 El CERES está compuesto por dos radiómetros de banda ancha, del espectro visible al infrarrojo (bandas entre 0.3 y 5 micras y entre 8 y 12 micras). Mide el equilibrio energético de la atmósfera, así como la radiación ultravioleta solar que es reflejada y absorbida por la superficie, la atmósfera y las nubes. El MISR es un instrumento que explora la superficie terrestre con nueve cámaras, cada una de ellas apuntando a un ángulo de observación diferente. Las imágenes que toma son en cuatro bandas: azul, verde, rojo e infrarrojo próximo. Este modelo de captación permite al MISR distinguir los diferentes tipos de nubes, los aerosoles y las cubiertas de la superficie terrestre. El sensor MODIS es el utilizado en este proyecto. El sensor MOPITT es un instrumento diseñado para captar datos de la baja atmósfera y observar su interacción con la biosfera marina y terrestre. SATELITES TERRA Y AQUA Y SU SENSOR MODIS 23 La órbita del Terra está diseñada para pasar el Ecuador por las mañanas de Norte a Sur (de ahí deriva el nombre que recibe dentro del programa EOS, EOS AM). Se sitúa a unos 705 kilómetros de altura y proporcionan un ancho de barrido de 2330 kilómetros. Esto permite observar toda la superficie terrestre cada uno o dos días. Por tanto, posee características muy adecuadas para mejorar el conocimiento de los procesos y de la dinámica global que experimenta nuestro planeta. Satélite Aqua El satélite Aqua fue puesto en órbita el 4 de mayo de 2002. Fue lanzado desde la base militar estadounidense de Vandenberg en el cohete Delta II Rocket. Este satélite fue el primero de la constelación A Train, formada por un total de 5 satélites. A partir de las observaciones de estos satélites se pueden construir imágenes tridimensionales de la atmósfera de la Tierra en alta resolución. Posee seis instrumentos especializados en el estudio de la atmósfera y de la superficie de agua terrestre: - AMSR-E (Advanced Microwave Scanning Radiometer-EOS) - MODIS (Moderate Resolution Imaging Spectroradiometer) - AMSU-A (Advanced Microwave Sounding Unit) Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 20 - AIRS (Atmospheric Infrared Sounder) - HSB (Humidity Sounder for Brazil) - CERES (Clouds and the Earth’s Radiant Energy System) SATELITES TERRA Y AQUA Y SU SENSOR MODIS 24 El AMSR-E es un radiómetro microondas (6.9-89 GHz) diseñado por Japón para medir la tasa de lluvia mediante la dispersión de microondas por las gotas de agua. También mide vientos y temperatura en la superficie del mar. El AMSU-A son dos medidores de microondas en 15 canales (entre 15 y 90 GHz) para realizar perfiles de temperatura. El AIRS es un espectrómetro infrarrojo (entre 3.7 y 15 micras) para realizar perfiles verticales de temperatura y humedad. También incorpora un fotómetro óptico de cuatro bandas, entre 0.4 y 1 micras. El HSB es un medidor de microondas de cuatro canales (entre 150 y 183 GHz) para obtener perfiles de humedad incluso bajo cubiertas de nubes muy espesas. El satélite Aqua proporciona, como el Terra, dos imágenes, una diurna y otra nocturna, recibiéndose la diurna entre las 12:30 y 15 horas UTC y la nocturna entre la 1 y las 3:30 horas UTC. Por tanto, junto a las dos imágenes que proporciona el satélite Terra, se cuenta con 4 imágenes diarias, dos diurnas y dos nocturnas. En las imágenes tomadas a las 13:30 y a las 2 el Principado de Asturias saldrá en el centro de la imagen. La órbita del Aqua está diseñada para pasar el Ecuador de sur a norte por las tardes (de ahí se deriva su nombra en el programa EOS, EOS PM). Se sitúa, como en el caso del Terra, a unos 705 kilómetros de altura y proporciona un ancho de barrido de 2330 kilómetros. MODIS El sensor MODIS (Moderate Resolution Imaging Spectroradiometer) se encuentra a bordo de los satélites Terra y Aqua. Estos satélites, como ya se dijo, forman parte de la misión EOS de la NASA. Proporciona una resolución radiométrica alta, de 12 bits, en 36 bandas del espectro electromagnético que abarcan longitudes de onda desde 0.4 a 14.4 μm (Tabla 1). Dos de estas bandas poseen una resolución espacial nominal (en el nadir) de 250 metros; cinco de 500 metros, y las 29 bandas restantes, de 1 kilómetro. Un espejo rotatorio de doble cara proporciona un FOV (Field Of View) de ±55°. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 21 SATELITES TERRA Y AQUA Y SU SENSOR MODIS 26 A modo de resumen, las resoluciones de este sensor son: -Resolución espectral: 36 bandas (de 0.4 a 14.4 μm) - Resolución temporal: 1-2 días - Resolución radiométrica: 12 bits - Resolución espacial: - 2 bandas de 250 metros - 5 bandas de 500 metros - 29 bandas de 1000 metros Como se observa, este sensor dispone de una gran resolución espectral, temporal y radiométrica, siendo más limitada la precisión espacial. Debido a estas resoluciones este sensor es muy adecuado, entre otras funciones, para la detección de incendios activos y para la cartografía de áreas quemadas. La gran resolución temporal, con cuatro imágenes diarias (dos diurnas y dos nocturnas), la resolución espectral, con gran cantidad de bandas en el infrarrojo térmico, y la resolución radiométrica otorgan a estesensor una gran capacidad para detectar anomalías térmicas en tiempo real. Estas resoluciones también facilitan la realización de una cartografía de áreas quemadas aproximadas y no de precisión debido a la resolución espacial. Para realizar cartografías de precisión se emplearán otros sensores con mayor resolución espacial, como por ejemplo el sensor TM disponible en el Landsat, cuya resolución espacial es de 30 metros. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 22 Descripción del Satélite LANDSAT 8 La Misión Landsat (LDCM) fue puesta en órbita el 11 de febrero de 2013. El observatorio consta de una plataforma con capacidad de carga de dos de sensores de observación terrestre, el primero de ellos denominado Operational Land Imager (OLI) y el sensor térmico infrarrojo Thermal Infrared Sensor (TIRS). OLI y TIRS recogerán los datos de forma conjunta para proporcionar imágenes coincidentes de la superficie terrestre, incluyendo las regiones costeras, hielo polar, las islas y las zonas continentales. EL LDCM continúa la secuencia de trayectoria (también conocida como “paths” o rutas de acceso) como sus antecesores Landsat 4, Landsat 5 y Landsat 7. Esto permitirá que todos los datos del LDCM sean referenciados al mismo sistema de coordenadas, continuando con el registro de datos desde hace décadas. La nave orbita de Norte a Sur durante el día, cruzando el ecuador a las 10 a.m., hora local, con una órbita aproximada de unas 438 millas (705 kilómetros) por encima de la Tierra (USGS. 2013). El satélite Landsat 8 incorpora dos instrumentos de barrido: Operational Land Imager (OLI), y un sensor térmico infrarrojo llamado Thermal Infrared Sensor (TIRS). Las bandas espectrales del sensor OLI, aunque similares a el sensor Landsat 7 ETM +, proporcionan una mejora de los instrumentos de las misiones Landsat anteriores, debido a la incorporación de dos nuevas bandas espectrales: un canal profundo en el azul visible (banda 1), diseñado específicamente para los recursos hídricos e investigación en zonas costeras, y un nuevo canal infrarrojo (banda 9) para la detección de nubes cirrus. Adicionalmente una nueva banda de control de calidad se incluye con cada producto de datos generado. Esto proporciona información más detallada sobre la presencia de características tales como las nubes, agua y nieve. Por otra parte el sensor TIRS recoge dos bandas espectrales en longitudes de onda incluidas por la misma banda en los anteriores sensores TM y ETM+ (Figura 4). Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 23 Figura 4. Ancho de banda para los sensores OLI y TIRS en Landsat 8 y ETM+ en Landsat 7 (USGS 2013) Las imágenes Landsat 8 obtenidas por el sensor (OLI) y (TIRS) constan de nueve bandas espectrales con una resolución espacial de 30 metros para las bandas de 1 a 7 y 9. Una banda nueva (1) (azul profundo) es útil para estudios costeros y aerosoles. La nueva banda (9) es útil para la detección de cirrus. La resolución para la banda 8 (pancromática) es de 15 metros. Dos bandas térmicas 10 y 11 son útiles para proporcionar temperaturas más precisas de la superficie y se toman a 100 metros de resolución (Tabla 1). El tamaño aproximado de la escena es de 170 km de norte-sur por 183 kilómetros de este a oeste (106 km por 114 km). Tabla 1. Descripción de datos Landsat 8 (LDCM) Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 24 PREDICCION DE FOCOS DE CALOR La estadística es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. Es la expresión numérica del sentido común. Luis Carcho Bart (2015). Uno de los objetivos de la Estadística es el de describir en unas pocas medidas resumen las principales características de un amplio conjunto de datos, de forma que estas medidas reflejen lo más fielmente posible las principales peculiaridades de dicho conjunto. A esta rama de la Estadística se la denomina Estadística Descriptiva. Otro de los objetivos de la Estadística es realizar conjeturas acerca de las medidas resumen de un conjunto de datos conociendo tan sólo una parte del mismo; esta rama se denomina Estadística Inferencial. Asimismo los datos son generalmente imperfectos en el sentido que aún cuando posean información útil no nos cuentan la historia completa. Es necesario contar con métodos que nos permitan extraer información a partir de los datos observados para comprender mejor las situaciones que los mismos representan. Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una investigación, desde el comienzo hasta el final. Existe el convencimiento que la estadística trata con el “análisis de datos” (quizás porque esta es la contribución más visible de la estadística), pero este punto de vista excluye aspectos vitales relacionados con el “diseño de las investigaciones”. Es importante tomar conciencia que la elección del método de análisis para un problema, se basa tanto en el tipo de datos disponibles como en la forma en que fueron recolectados. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 25 MODELO LINEAL GENERALIZADO Los Modelos lineales (regresión, ANOVA, ANCOVA) se basan en los siguientes supuestos: Los errores se distribuyen normalmente La varianza es constante La variable respuesta se relaciona linealmente con las variables independientes. En muchas ocasiones, sin embargo, nos encontramos que uno o varios de estos supuestos no se cumplen. Estos problemas se pueden llegar a solucionar mediante la transformación de la variable respuesta. Sin embargo estas transformaciones, no siempre consiguen corregir la falta de normalidad, heterocedasticidad (varianza no constante) o la no linealidad de nuestros datos. Una alternativa a la transformación de la variable respuesta, a la falta de normalidad; es el uso de los Modelos Lineales Generalizados (GLM). Específicamente, se considera la utilización del GLM cuando la variable respuesta es: -Un conteo de casos (nuestro caso de estudio) -Un conteo de casos expresados como proporciones - Una respuesta binaria El supuesto central que se ha hecho hasta el momento con los modelos lineales es que la varianza es constante (figura 5a). En el caso de los conteos, sin embargo, donde la variable respuesta está expresada en números enteros y en donde hay con frecuencia muchos ceros en los datos, la varianza podría incrementar linealmente con la media (figura 5b). Con proporciones, donde hay un conteo del número de fallos de un evento, como del número de éxitos, la varianza tendrá una forma de U invertida en relación a la media (Figura 5c). Cuando la variable respuesta siga una distribución Gamma, entonces la varianza incrementa de una manera lineal con la media (Figura 5d). Muchos de los métodos estadísticos más comunes, como la t de Student o la regresión, asumen que la varianza es constante, pero en muchas este supuesto no es aplicable y es precisamente en estos casos cuando los GLM pueden ser de gran utilidad. Los GLM tienen dos propiedades: Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 26 1. La estructura de los errores. 2. La función de vínculo Figura 5 (a, b, c y d): Función devínculo Los modelos lineales generalizados son una ampliación de los modelos lineales generales, de manera que la variable dependiente está relacionada linealmente con los factores y las covariables mediante la función de enlace. Los modelos lineales generalizados sirven para analizar los modelos estadísticos más utilizados, como la regresión lineal para las respuestas distribuidas normalmente, modelos logísticos para datos binarios, modelos loglineales para datos de recuento, modelos log-log complementario para datos de supervivencia censurados por intervalos, además de muchos otros modelos estadísticos a través de la propia formulación general del modelo. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 27 Clasificación de los métodos multivariados Métrica No Métrica Métricas No Métricas Regresión Regresión Logistica - Probit - Logit- Análisis discriminante ANOVA MANOVA Número de Variables independient es Dependen cia Correlación canónica Métrica No Métrica Análisis conjunto Una o varias Una Más de una Número de variables dependientes Análisis de Interdependencia Variables Casos / Encuestados Atributos Metricos Análisis Multidimensional Atributos no metricos Análisis de correspondencia Interdepen dencia Entidades Análisis factorial y componentes principales Análisis Cluster Fuente: Apuntes de clase Estadística aplicada”: Olga Susana Filippini DESCRIPCIÓN DE LOS DATOS Para detectar si nuestros datos son o no normales es conveniente: (1) Conocer el tipo de variable respuesta y su naturaleza; y (2) el análisis de los residuos del modelo una vez ajustado el modelo (ya sea un modelo lineal o un GLM con una distribución de errores no normal). Esto nos va a permitir observar alejamientos de la normalidad y saber cuándo es conveniente utilizar uno u otro tipo de distribuciones de errores. En el presente caso, la variable focos de calor (FC) no cumple la normalidad ni la homogeneidad de la varianza y se aplica el modelo lineal generalizado. Análisis de dependencia Número de variables dependientes Tipo de escala de medida Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 28 VARIABLES INDEPENDIENTES Coordenadas geográficas: Latitud y Longitud Día juliano: Se convirtieron las fechas de ocurrencias detectadas por el sensor en días julianos para poder contabilizar y realizar el análisis estadístico. Pendiente: Se descargo el modelo satelital de pendiente del terreno. Extraido del Earth Resources Observation and Science (EROS) (Centro de Observación y Ciencia de los Recursos de la Tierra). Expone que para aquellas áreas que caigan fuera del territorio de los Estados Unidos los datos se pueden distribuir públicamente a una resolución reducida igual a, o mayor que 3 arcosegundos (aproximadamente 90 m en el ecuador). Las áreas dentro del territorio de los Estados Unidos no están sujetas a dicha restricción y se pueden publicar con toda la resolución de 1 arco-segundo (aproximadamente 30 m en el ecuador) (Farr, 2007). Cobertura: La base de datos de cobertura fue extraída del marco de la Red Latinoamericana de Seguimiento y Estudio de los Recursos Naturales (SERENA) en respuesta a la gran necesidad existente de contar con información de cobertura del suelo, con una resolución espacial media, en la región de Latinoamérica y el Caribe. Índice antrópico, índice que mide la influencia antrópica según distancia a las ciudades, caminos, etc. Precipitaciones, obtenidas de la base de dato del Servicio Meteorológico Nacional. VARIABLE DEPENDIENTE Número de focos de calor, son obtenidos del servicio de la NASA, que los desarrolla mediante algoritmos matemáticos utilizando la información satelital. RECUENTOS: Loglineal de Poisson. Especifica la distribución de Poisson y la función de enlace de logaritmo. Binomial negativa con enlace de logaritmo. Especifica la distribución binomial negativa (con el valor 1 para el parámetro auxiliar) y la función de enlace de logaritmo. Para que el procedimiento calcule el valor del parámetro auxiliar, especifique un Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 29 modelo personalizado con distribución binomial negativa y seleccione Estimar valor en el grupo de parámetros. Distribución Esta selección especifica la distribución de la variable dependiente. La posibilidad de especificar una distribución que no sea la normal y una función de enlace que no sea la identidad es la principal mejora que aporta el modelo lineal generalizado respecto al modelo lineal general. Hay muchas combinaciones posibles de distribución y función de enlace, varias de las cuales pueden ser adecuadas para un determinado conjunto de datos, por lo que su elección puede estar guiada por consideraciones teóricas a priori y por las combinaciones que parezcan funcionar mejor. Binomial. Esta distribución es adecuada únicamente para las variables que representan una respuesta binaria o un número de eventos. Gamma. Esta distribución es adecuada para las variables con valores de escala positivos que se desvían hacia valores positivos más grandes. Si un valor de datos es menor o igual que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis. De Gauss inversa. Esta distribución es adecuada para las variables con valores de escala positivos que se desvían hacia valores positivos más grandes. Si un valor de datos es menor o igual que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis. Binomial negativa. Esta distribución considera el número de intentos necesarios para lograr k éxitos y es adecuada para variables que tengan valores enteros que no sean negativos. Si un valor de datos no es entero, es menor que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis. El valor del parámetro auxiliar de la distribución binomial negativa puede ser cualquier número mayor o igual que 0; se puede establecer en un valor fijo o dejar que lo estime el procedimiento. Cuando el parámetro auxiliar se establece en 0, utilizar esta distribución equivale a utilizar la distribución de Poisson. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 30 Normal. Es adecuada para variables de escala cuyos valores adoptan una distribución simétrica con forma de campana en torno a un valor central (la media). La variable dependiente debe ser numérica. Poisson. Esta distribución considera el número de ocurrencias de un evento de interés en un período fijo de tiempo y es apropiada para variables que tengan valores enteros que no sean negativos. Si un valor de datos no es entero, es menor que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis. Tweedie. Esta distribución es adecuada para variables que puedan representarse mediante mezclas de Poisson de distribuciones gamma; la distribución es una "mezcla" en el sentido de que combina las propiedades de distribuciones continuas (toma valores reales no negativos) y discretas (masa de probabilidad positiva en un único valor, 0). La variable dependiente debe ser numérica y los valores de los datos deben ser iguales o mayores que cero. Si un valor de datos es menor que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis. El valor fijo del parámetro de la distribuciónde Tweedie puede ser cualquier número mayor que uno y menor que dos. Multinomial. Esta distribución es adecuada para variables que representan una respuesta ordinal. La variable dependiente puede ser numérica o de cadena, y debe tener como mínimo dos valores válidos distintos de los datos. FUNCIONES DE ENLACE La función de enlace es una transformación de la variable dependiente que permite la estimación del modelo. Se encuentran disponibles las siguientes funciones: Identidad. f(x)=x. No se transforma la variable dependiente. Este enlace se puede utilizar con cualquier distribución. Log-log complementario. f(x)=log(−log(1−x)). Es apropiada únicamente para la distribución binomial. Cauchit acumulada. f(x) = tan(π (x – 0.5)), aplicada a la probabilidad acumulada de cada categoría de la respuesta. Es apropiada únicamente para la distribución multinomial. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 31 Log-log complementario acumulado. f(x)=ln(−ln(1−x)), aplicada a la probabilidad acumulada de cada categoría de la respuesta. Es apropiada únicamente para la distribución multinomial. Logit acumulado. f(x)=ln(x / (1−x)), aplicada a la probabilidad acumulada de cada categoría de la respuesta. Es apropiada únicamente para la distribución multinomial. Log-log negativo acumulado. f(x)=−ln(−ln(x)), aplicada a la probabilidad acumulada de cada categoría de la respuesta. Es apropiada únicamente para la distribución multinomial. Probit acumulada. f(x)=Φ−1(x), aplicada a la probabilidad acumulativa de cada categoría de la respuesta, donde Φ−1 es la función de distribución acumulada normal estándar inversa. Es apropiada únicamente para la distribución multinomial. Logaritmo. f(x)=log(x). Este enlace se puede utilizar con cualquier distribución. Complemento log. f(x)=log(1−x). Es apropiada únicamente para la distribución binomial. Logit. f(x)=log(x / (1−x)). Es apropiada únicamente para la distribución binomial. Binomial negativa. f(x)=log(x / (x+k −1)), donde k es el parámetro auxiliar de la distribución binomial negativa. Es apropiada únicamente para la distribución binomial negativa. Dicha función de enlace fue la elegida como adecuada para aplicar en el presente caso de estudio. Log-log negativo. f(x)=−log(−log(x)). Es apropiada únicamente para la distribución binomial. Poder de probabilidad. f(x)=[(x/(1−x))α−1]/α, if α ≠ 0. f(x)=log(x), si α=0. α es la especificación de número necesaria y debe ser un número real. Es apropiada únicamente para la distribución binomial. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 32 Probit. f(x)=Φ−1(x), donde Φ−1 es la función de distribución acumulada normal estándar inversa. Es apropiada únicamente para la distribución binomial. Potencia. f(x)=x α, si α ≠ 0. f(x)=log(x), si α=0. α es la especificación de número necesaria y debe ser un número real. Este enlace se puede utilizar con cualquier distribución. (SPSS Statistics 22.0.0). Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 33 SINTESIS METODOLOGICA A continuación en la Figura 6 se presenta una síntesis metodológica adoptada en este trabajo. Figura 6. Síntesis metodológica Selección de las imágenes satelitales del Landsat 8 para las tres zonas Búsqueda de variables auxiliares Obtención de la serie de anomalías Térmicas Integración de las variables en un Sistema de Información Geográfica, detección de áreas con susceptibilidad ambiental Selección del método estadístico Construcción de las bases de datos. Búsqueda y obtención de las variables. Filtrado de tablas Aplicación de las técnicas de Teledetección Desarrollo metodológico Prueba y error de modelos estadísticos con software SPSS Índice de influencia antrópica Precipitaciones Pendiente Fecha juliana Funciones Índice de vegetación Distribución de enlace Modelo lineal generalizado Resultados por cada zona Detección de variables de influencia por zonas Interrelación visual de variables y Focos de Calor Análisis estadístico de las variables y los focos de calor Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 34 METODOLOGÍA La metodología se realizó en dos etapas, el objetivo de la primera etapa fue la interrelación de variables y la generación de las capas de datos en un Sistema de Información Geográfico. En la segunda etapa, el objetivo fue analizar el grado de probabilidad de influencia de las variables auxiliares sobre la ocurrencia de incendios en tres ambientes bien diferenciados para su posterior estudio de la distribución espacio- temporal. Mediante la aplicación del concepto de análisis estadístico, se correlacionaron las variables que inciden en la ocurrencia de dicho fenómeno, para hallar aquellas que con mayor probabilidad sean las que ocasionen los incendios, con la intención de buscar las soluciones adecuadas que sean de ayuda para prevenir la ocurrencia de incendios. Por lo tanto para analizar la ocurrencia de incendios en las tres áreas de estudio se realizó un Modelo Lineal Generalizado, partiendo de la variable dependiente “focos de calor” (FC) y relacionándola con las variables independientes o predictoras. Para el caso se seleccionó una función de enlace mediante distintas pruebas de ensayo y error, buscando la distribución que entregue menor error o mayor significancia al modelo. En la investigación práctica nos encontramos frecuentemente con situaciones en las que una variable, Y, viene determinada por otra u otras variables, X1, X2, ... , Xk , sin que a su vez la primera determine las últimas. Podemos escribir la relación como Y = f(X1, X2, ... , Xk). La variable Y es denominada DEPENDIENTE, RESPUESTA Ó ENDÓGENA mientras que las variables X se denominan INDEPENDIENTES, PREDICTORAS O REGRESORAS. La característica más importante de los fenómenos estudiados en investigación aplicada es la variabilidad intrínseca de los resultados, de forma que, incluso en el caso de que estuviéramos ante una relación funcional perfecta, esta no se manifestaría completamente en datos observados. Por esta razón es necesario introducir en el modelo (1) un término de error procedente de: -No incluir variables importantes. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 35 -Errores aleatorios que manifiestan la variabilidad intrínseca del fenómeno y/o errores de medida. -Especificación incorrecta de la forma de la ecuación. El modelo real será entonces Donde e es el error o perturbación aleatoria y los coeficientes son los parámetros estructurales o estructura paramétrica de la relación propuesta. El modelo propuesto en el que las Xi son variables observables no aleatorias y los bi son constantes fijas desconocidas se denomina Modelo Lineal General (MLG). En el presente trabajo se validaron los supuestos y dado que no cumplieron se aplicó el Modelo Lineal Generalizado. PRIMERA ETAPA METODOLÓGICA APLICACIÓN DE LAS TÉCNICAS DE TELEDETECCIÓN Y SISTEMAS DE INFORMACIÓN GEOGRÁFICA Con la finalidad de identificar el tipo de vegetaciónasociada con los puntos de calor en cada área, se realizó la integración de la serie de puntos de calor con la cobertura vegetal mediante el producto SERENA 2008. En un principio se propuso la utilización del producto Globcover sobre cobertura de suelo, pero debido a sus características en cuanto a la resolución espacial y teniendo la posibilidad de interacción con el grupo de trabajo de la Universidad Nacional del Sur, fue posible adquirir información de cobertura de suelo con mejor resolución espacial, a través del producto SERENA 2008. El producto SERENA representa la cobertura del suelo en el 2008 a partir de compuestos mensuales de imágenes con 500 m de resolución espacial del Espectroradiómetro de Imágenes de Resolución Media (MODIS, por sus siglas en Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 36 inglés). Las 22 clases de cobertura del suelo representadas se definieron conforme a la norma del Sistema de Clasificación de la Cobertura de la Tierra (LCCS, por sus siglas en inglés), de la Organización de las Naciones Unidas para la Agricultura y la Alimentación, FAO. Dichas coberturas fueron interrelacionadas con las series de focos de calor, las cuales se descargaron en formato “shape”, considerando un periodo de 5 años (del 01 de enero de 2009 al 31 de diciembre de 2013). (Figura 7). El fenómeno de incendios está relacionado con las actividades antrópicas, debido a esta relación se consideró en la propuesta inicial las variables: distancia al área de influencias de caminos y poblados, consideradas como posibles variables de origen de conflictos. Debido a no encontrar significancia en estas variables se investigó la posibilidad de otra que pudiese cubrir este objetivo. En esta primera etapa se halló el Índice de Influencia Antrópico (HII). (http://sedac.ciesin.columbia.edu/data/set/wildareas-v2-human-footprint-eographic/data- download). El cual fue descargado e interceptado con el resto de las variables. La Huella Global Humana conforma un conjunto de datos del Proyecto Wild, Versión 2, 2005 (LWP - 2) es el Índice de Influencia humana (HII) normalizado por bioma y reino. La HII es un conjunto de datos mundial de las cuadrículas de 1 kilómetro, creado a partir de nueve capas de datos globales que cubren la presión humana población (densidad de población), uso de la tierra y la infraestructura (áreas urbanizadas, luces nocturnas, uso de la tierra/cobertura de la tierra) y acceso humano (costa, carreteras, ferrocarriles, ríos navegables). El conjunto de datos se genera por la Wildlife Conservation Society (WCS) y el Centro de la Universidad de Columbia para la Red Internacional de Información sobre Ciencias de la Tierra (CIESIN) y está disponible en el Sistema de Coordenadas Geográficas (SCG) (Figura 8). Con relación entre los focos de calor y la pendiente del terreno se obtuvo el modelo digital del terreno de las áreas, para interrelacionar la posibilidad de incidencia de altura en la ocurrencia de incendios. Procedimiento técnico: Procesamiento del Modelo SRTM generado por SEREGEO -Conversión de proyección a UTM zona 20 -Cálculo de pendiente (metros) Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 37 Generación de la base de datos completa Las variables ambientales (tabla 2) fueron llevadas a un Sistemas de Información Geográfica de cada área de estudio Tabla 2. Variables ambientales Variable Fuente Unidad Índice de influencia Antrópicas (HII) http://sedac.ciesin.columbia.edu/data/set/w ildareas-v2-human-footprint- geographic/data-download 1 Km Mapa de cobertura Serena 250 Modelo SRTM 90 m Índice de vegetación MOD13A3 http://es.slideshare.net/ciatdapa/karolina- argote-datos-modis https://lpdaac.usgs.gov/products/modis_pro ducts_table NDVI 1Km Interpolación de datos Cada variable ambiental fue llevada a un Sistema de Información Geográfica, mediante el software ARCGIS y se generó la interpolación, obteniendo como resultado una nueva base de datos completa interrelacionada. Procedimiento técnico Se unieron las bases de datos de FIRMS 2009-2011 con la base 2012-2013 mediante la herramienta “Merge” ya que fueron descargados en momentos distintos. Mediante “Espactial analisis”, “extraction”, “extract multi values to point” se interpolaron las siguientes bases: -Firms – altura: Focos de calor y altura del terreno -Firms-vegetation: Focos de calor y cobertura vegetal (Serena) -Firms-srtm: Focos de calor y Modelo Digital del Terreno -Firms-HII: Focos de calor e Índice de Influencia Antrópica -Firms-NDVI: Focos de calor e Índice de Vegetación Se cortó cada área de estudio según los polígonos (selec features), las imágenes cuyo path row corresponde al 229-79/ 229-83/ 228-85, del satélite Landsat 8, descargadas del sitio web de la NASA. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 38 SEGUNDA PARTE METODOLÓGICA Desarrollo del Modelo Lineal Generalizado Se aplicó el modelo lineal generalizado en la zona I, zona II y zona III. Se probaron varios modelos, la función de Poisson no presentó un índice de bondad de ajuste adecuado por lo tanto se escogió la función binomial negativa enlace logarítmico, que mostró ser la función con mejores indicadores de Bondad de ajuste para representar este modelo (Tabla 3 / Tabla 4/ Tabla 5). Tabla 3 - Información del modelo – Zona I Variable dependiente FC Distribución de probabilidades Binomial negativa (1) Función de enlace Log Tabla 4 - Información del modelo – Zona II Variable dependiente FC Distribución de probabilidades Binomial negativa (1) Función de enlace Log Tabla 5- Información del modelo –Zona III Variable dependiente FC Distribución de probabilidades Binomial negativa (1) Función de enlace Log En la tabla 6/ Tabla 7 y Tabla 8 se muestra la devianza para cada zona respectivamente, que expresa una aproximación de la variabilidad de los datos. Por ello, para obtener una medida de la variabilidad explicada por el modelo, se requiere comparar la devianza del modelo nulo (Null deviance) con la devianza residual (Residual deviance), esto es, una medida de cuanto de la variabilidad de la variable respuesta no es explicado por el modelo. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 39 Podemos utilizar la reducción de la devianza como una medida del ajuste del modelo a los datos. Los tests de signicación para los parámetros del modelo son también útiles para ayudarnos a simplificar el modelo. Sin embargo, un criterio comunmente utilizado es el llamado Criterio de Información de Akaike (AIC). Es un índice que evalúa tanto el ajuste del modelo a los datos como la complejidad del modelo. Cuanto más pequeño es el AIC mejor es el ajuste. El AIC es muy util para comparar modelos similares con distintos grados de complejidad o modelos iguales (mismas variables) pero con funciones de vínculo distintas. Tabla 6- Bondad de ajuste – Zona I Valor gl Valor/gl Desvianza 514,322 442 1,164 Desvianza escalada 514,322 442 Chi-cuadrado de Pearson 3715,988 442 8,407 Chi-cuadrado de Pearson escalado 3715,988 442 Log verosimilitud b -1210,469 Criterio de información de Akaike (AIC) 2438,938 AIC corregido para muestras finitas (AICC) 2439,346 Criterio de información bayesiano (BIC) 2475,941 AICconsistente (CAIC) 2484,941 Variable dependiente: FC Modelo: (Intersección), cobertura, indice_ant, precipitac a a. Los criterios de información están en forma "mejor cuanto más pequeño". b. La función de log-verosimilitud completa se muestra y se utiliza para calcular los criterios de información. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 40 Tabla 7 -Bondad de ajuste – Zona II Valor gl Valor/gl Desvianza 205,407 269 ,764 Desvianza escalada 205,407 269 Chi-cuadrado de Pearson 541,358 269 2,012 Chi-cuadrado de Pearson escalado 541,358 269 Log verosimilitud b -705,462 Criterio de información de Akaike (AIC) 1424,924 AIC corregido para muestras finitas (AICC) 1425,341 Criterio de información bayesiano (BIC) 1450,266 AIC consistente (CAIC) 1457,266 Variable dependiente: FC Modelo: (Intersección), COBERTURA, PRECIPITAC, INDICE_ANT a a. Los criterios de información están en forma "mejor cuanto más pequeño". b. La función de log-verosimilitud completa se muestra y se utiliza para calcular los criterios de información. Tabla 8 -Bondad de ajuste- Zona III Valor gl Valor/gl Desvianza 1504,631 974 1,545 Desvianza escalada 1504,631 974 Chi-cuadrado de Pearson 2453,138 974 2,519 Chi-cuadrado de Pearson escalado 2453,138 974 Log verosimilitud b -3723,408 Criterio de información de Akaike (AIC) 7460,817 AIC corregido para muestras finitas (AICC) 7460,932 Criterio de información bayesiano (BIC) 7495,037 AIC consistente (CAIC) 7502,037 Variable dependiente: FC Modelo: (Intersección), COBERTURA, INDICE_ANT, PRECIPITAC a. Los criterios de información están en forma "mejor cuanto más pequeño". b. La función de log-verosimilitud completa se muestra y se utiliza para calcular los criterios de información. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 41 La Deviance toma valor cuando se la compara con otro modelo, pero así por si sola podemos decir que en el caso de la zona I (Tabla 6) toma un valor de 514 veces la diferencia entre el “máximum likelihood” obtenible y el “maximum likelihood” retenido por el modelo. La Chi cuadrado de Pearson es la clásica medida de asociación lineal conocida. Ambas medidas de asociación (Deviance y Chi cuadrado de Pearson) presentan una razón entre su valor y sus grados de libertad aproximada. En el caso de la zona I este valor es igual a 1.1 (valor/gl). Que este valor se aproxime a 1 o sea levemente superior a 1 indica un adecuado ajuste para datos de recuento. En el caso de la zona II (tabla 7) toma un valor de 205 veces la diferencia entre el “máximum likelihood” obtenible y el “maximum likelihood” retenido por el modelo. La Chi cuadrado de Pearson es la clásica medida de asociación lineal conocida. Ambas medidas de asociación (Deviance y Chi cuadrado de Pearson) tienen una razón entre su valor y sus grados de libertad aproximado 0.76 (valor/gl). ). Que este valor se aproxime a 1 o sea levemente superior a 1 indica un adecuado ajuste para datos de recuento. En el caso de la zona III (Tabla 8) toma un valor de 974 veces la diferencia entre el “máximum likelihood” obtenible y el “maximum likelihood” retenido por el modelo. La Chi cuadrado de Pearson es la clásica medida de asociación lineal conocida. Ambas medidas de asociación (Deviance y Chi cuadrado de Pearson) tienen una razón entre su valor y sus grados de libertad aproximado 1.5 (valor/gl). ). Que este valor se aproxime a 1 o sea levemente superior a 1 indica un adecuado ajuste para datos de recuento. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 42 RESULTADOS Figura 7: Interrelación entre variable de cobertura y focos de calor Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 43 Figura 8 Interrelación entre influencia antrópica y focos de calor Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 44 Figura 9. Interrelación entre pendiente y puntos de calor Se observó mediante las imágenes en laboratorio y mediante relevamiento del terreno que en la provincia de San Luis la mayor concentración de focos de calor se generan sobre la superficie baja del área, cubierta con vegetación de tipo pastizal y bosque serrano (Figura 9). A continuación se muestra el contraste de efectos del modelo para las tres zonas respectivamente, compara el modelo ajustado con el modelo conformado con solo la intersección. Vemos que el modelo es estadísticamente significativo (P<0.01), es decir, al menos uno de los coeficientes calculados para el modelo es estadísticamente significativo para los tres casos. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 45 Tabla 9 - Contrastes de los efectos del modelo – Zona I Origen Tipo III Chi-cuadrado de Wald gl Sig. (Intersección) 7,725 1 ,005 cobertura 12,137 6 ,059 indice_ant 11,723 1 ,001 precipitac ,250 1 ,617 Variable dependiente: FC Modelo: (Intersección), cobertura, indice_ant, precipitac La zona I muestra como la variable que tiene mayor probabilidad de influir en la ocurrencia de incendios, el índice antrópico. Tabla 10 - Contrastes de los efectos del modelo – Zona II Origen Tipo III Chi-cuadrado de Wald gl Sig. (Intersección) 24,763 1 ,000 COBERTURA 7,617 4 ,107 PRECIPITAC 15,292 1 ,000 INDICE_ANT ,322 1 ,570 Variable dependiente: FC Modelo: (Intersección), COBERTURA, PRECIPITAC, INDICE_ANT La zona II, según el contraste considera la variable precipitaciones con mayor probabilidad de incidir en la ocurrencia de incendios, lo cual podría ser cierto si lo comparamos con la situación climática en la región del II. Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 46 Tabla 11. Contrastes de los efectos del modelo – Zona III Origen Tipo III Chi-cuadrado de Wald gl Sig. (Intersección) 48,648 1 ,000 COBERTURA 87,282 4 ,000 INDICE_ANT 43,128 1 ,000 PRECIPITAC 12,461 1 ,000 Variable dependiente: FC Modelo: (Intersección), COBERTURA, INDICE_ANT, PRECIPITAC En cambio, para la zona III de parque chaqueño se evidencia una fuerte influencia de las variables, índice de influencia antrópico, precipitaciones y cobertura. Según investigaciones acerca de la situación del parque Chaqueño podría ser factible, por la alta fragmentación del ecosistema, quemas intencionales para el uso del recurso suelo en agricultura, el tipo de vegetación, altamente combustible y la situación climática que contribuye a la sequía de la zona (Villanueva S. et al, 2015) Carrera de Especialización en Teledetección y Sistemas de Información Geográfica Aplicados al Estudio del Medio Ambiente Universidad Nacional de Luján 47 Otro análisis extraído del modelo hace referencia a la variable cobertura en cada zona, este es las estimaciones de los parámetros (Tabla 12 / Tabla 13 y Tabla
Compartir