Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO Programa de Maestría y Doctorado en Geografía Generación de compuestos de imágenes Landsat para la Clasificación de la cobertura de suelo en Alvarado Veracruz TESIS que para optar por el grado de: MAESTRA EN GEOGRAFÍA Presenta: Cynthia Maryoli Versañez Vences Director de Tesis: Dr. René Roland Colditz Comisión Nacional para el Conocimiento y Uso de la Biodiversidad Ciudad Universitaria, Cd. Mx. enero de 2018 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. Dedicada a José Antonio Navarrete Pacheco Agradecimientos A la Universidad Nacional Autónoma de México y al Posgrado en Geografía por permitirme ser alumna de la maestría y así aprender de mis profesores y compañeros. Al Consejo Nacional de Ciencia y Tecnología (CONACYT) por el apoyo económico otorgado la durante la maestría. Un agradecimiento muy especial a mi asesor el Dr. René Colditz por el gran apoyo y la confianza que me brindó desde el primer día en la CONABIO hasta la culminación de la tesis. Por los consejos académicos, su ejemplo de dedicación y constancia. También por facilitarme un extenso número de códigos en IDL para la exploración y tratamiento de los datos Landsat. A mis revisores: Dr. Rainer Ressl, Dra. Leticia Gómez, Mtra. Ana Rosales y Dr. Stephane Couturier por su disposición, los comentarios y las sugerencias para mejorar la tesis. A la CONABIO por el apoyo en el desarrollo de la tesis, en especial al departamento de PR y a integrantes del grupo MAD-Mex (Roberto, Amaury y Erick), quienes me auxiliaron con la aplicación de los algoritmos de LEDAPS y Fmask a cientos de escenas Landsat. A mi amada familia: Gloria, Saturnino, Mirna, Karen y Bruno por su amor incondicional, sus consejos y las risas compartidas durante tantos años. A José Antonio Navarrete Pacheco por ser mi aliado, incentivándome cada día para dar mi mejor esfuerzo. Su amor, apoyo y paciencia fueron pieza esencial para enfrentar retos durante el posgrado. A Betzaida y Yetzul por la confianza brindada y la cordialidad de recibirme en su hogar en varias ocasiones, haciendo más confortables mis días en la Ciudad de México. A mis compañeros y amigos: Alejandra, Beatriz, Patricia, Tania, Yudisleyvis, Victoria, Iván, Yordan, Andrea, Juan, Inder, Edgar, Gabriela y Samantha porque además de compartirme material bibliográfico y conocimientos, me obsequiaron su amistad e hicieron que los dos años de maestría fueran muy interesantes, agradables y divertidos junto a ellos. Contenido RESUMEN .................................................................................................................................. 1 ABSTRACT ................................................................................................................................ 2 INTRODUCCIÓN ........................................................................................................................ 3 HIPÓTESIS ................................................................................................................................ 4 OBJETIVO GENERAL .................................................................................................................. 4 OBJETIVOS ESPECÍFICOS ........................................................................................................... 4 CAPÍTULO 1. ÁREA DE ESTUDIO Y DATOS ............................................................................ 5 1.1 ÁREA DE ESTUDIO ................................................................................................................ 5 1.2 DATOS ................................................................................................................................ 7 1.2.1 Imágenes Landsat ....................................................................................................... 7 1.2.2 Mapa de referencia ...................................................................................................... 9 CAPÍTULO 2. MÉTODOS ......................................................................................................... 12 2. 1 PRE-PROCESAMIENTO ....................................................................................................... 13 2.1.1 Generación y aplicación de máscaras para excluir nubes ......................................... 14 2.1.2 Cálculo de índices espectrales .................................................................................. 17 a) Normalized Difference Vegetation Index (NDVI) .......................................................... 17 b) Modified Soil Adjusted Vegetation Index 2 (MSAVI2) .................................................. 18 c) Normalized Difference Water Index (NDWI) ................................................................ 18 d) Normalized Difference Moisture Index (NDMI) ............................................................ 19 2.1.3 Remoción de outliers ................................................................................................. 19 2.2 COMPUESTOS .................................................................................................................... 22 2.2.1 Parámetros empleados para los métodos Compuestos por “Promedio” y “Mejor Pixel” ........................................................................................................................................... 25 2.3 DISEÑO DEL MUESTREO ..................................................................................................... 29 2.4 CLASIFICACIÓN .................................................................................................................. 33 2.5 VALIDACIÓN ....................................................................................................................... 36 2.6 EVALUACIÓN CUALITATIVA .................................................................................................. 37 CAPÍTULO 3. RESULTADOS ................................................................................................... 38 3.1 DISPONIBILIDAD DE DATOS Y DATOS VÁLIDOS ....................................................................... 38 3.2 COMPUESTOS DE IMÁGENES LANDSAT ................................................................................ 41 3.3 CLASIFICACIÓN ANUAL DE COBERTURAS CON COMPUESTOS POR MEJOR PIXEL Y PROMEDIO 1993-2015 MEDIANTE ÁRBOLES DE CLASIFICACIÓN.................................................................... 56 3.3.1 EVALUACIÓN DE LA EXACTITUD DE LAS CLASIFICACIONES ANUALES CON COMPUESTOS POR MEJOR PIXEL Y CON COMPUESTOS POR PROMEDIO 1993-2015 ................................................. 57 3.3.2 COMPARACIÓN DE EXACTITUDES: CLASIFICACIÓN CON COMPUESTOS POR MEJOR PIXEL VS CLASIFICACIÓN CON COMPUESTOS POR PROMEDIO 1993-2015 ................................................. 60 3.3.3 COMPARACIÓN DE LAS EXACTITUDES ENTRE CLASIFICACIONES ANUALES POR MÉTODO DE COMPOSICIÓN .........................................................................................................................62 3.4 EVALUACIÓN CUALITATIVA DE LAS CLASIFICACIONES CON COMPUESTOS POR PROMEDIO Y COMPUESTOS POR MEJOR PIXEL .............................................................................................. 65 3.5. OTRAS CONSIDERACIONES ................................................................................................ 73 3.5.1 Filtrado ...................................................................................................................... 73 3.5.2 Potencial para análisis de cambio ............................................................................. 74 CAPÍTULO 4. DISCUSIÓN ....................................................................................................... 77 4.1 LOS COMPUESTOS OBTENIDOS ........................................................................................... 77 4.2 LAS CLASIFICACIONES DERIVADAS DE LOS COMPUESTOS ...................................................... 80 4.3. COMPOSICIÓN POR MEJOR PIXEL VS COMPOSICIÓN POR PROMEDIO .................................... 83 CAPÍTULO 5. CONCLUSIONES .............................................................................................. 85 BIBLIOGRAFÍA ........................................................................................................................ 87 ANEXO ..................................................................................................................................... 90 Índice de figuras Figura 1. Área de estudio ............................................................................................................ 6 Figura 2. Zona de estudio mostrando la cobertura del suelo según NALCMS, 30m .................. 11 Figura 3. Etapas para la generación de compuestos de imágenes Landsat, la clasificación de la cobertura del suelo y su validación ..................................................................................... 12 Figura 4. Fallo del SLC. ............................................................................................................. 13 Figura 5. Ejemplo de remoción de outliers................................................................................. 20 Figura 6. Aplicación de máscaras de nube y remoción de ouliers ............................................. 21 Figura 7. Rangos de días por temporada para formación de compuestos. ................................ 26 Figura 8. Aptitud de muestras para “Compuesto por método de Promedio”. ............................. 27 Figura 9. Superficie por clase del mapa de referencia recodificado a 5 clases. ......................... 30 Figura 10. Mapa de referencia NALCMS 2010 a 30m, recodificado a 5 clases. ........................ 32 Figura 11. Disponibilidad de imágenes Landsat para el área de estudio de 1985 a 2015 .......... 38 Figura 12. Imágenes Landsat existentes por año, satélite y sensor de 1985 a 2015 ................. 39 Figura 13. Imágenes Landsat existentes para la generación de compuestos por año y mes ..... 39 Figura 14. Distribución de pixeles válidos en porcentaje ........................................................... 40 Figura 15. Compuestos del año 2000. ....................................................................................... 42 Figura 16. Compuestos del año 2003. ....................................................................................... 44 Figura 17. Imágenes de temporada húmeda consideradas para la formación del compuesto del año 2010 por método de Mejor Pixel. ................................................................................. 45 Figura 18. Total de pixeles sin valor asignado en compuestos por método y temporada. .......... 46 Figura 19. Porcentaje de pixeles asignados a Compuestos de Mejor Pixel (CMP) por año de adquisición. ........................................................................................................................ 47 Figura 20. Detalles del Compuesto por Mejor Pixel 2010 temporada húmeda (CMP 2010-th). .. 48 Figura 21. Imágenes Landsat para CMP 1994. ......................................................................... 49 Figura 22. Año y Día del año de los pixeles que forman los compuestos por método de Mejor Pixel del año 1994 de temporada seca y húmeda (CMP-ts y CMP-th). .............................. 50 Figura 23. Calificación de los CMP del año 1994 y visualización de compuesto color de bandas (RGB 743). ......................................................................................................................... 51 Figura 24. Resultados de la constitución del Compuesto por Promedio del año 1999 de temporada seca (CP 1999-ts). ........................................................................................... 52 Figura 25. Año de origen de las muestras en porcentaje de superficie de Compuestos por Promedio (CP). .................................................................................................................. 54 file:///C:/Users/Maryo/Desktop/Archivos_tesis/TESIS_160118.docx%23_Toc503875549 file:///C:/Users/Maryo/Desktop/Archivos_tesis/TESIS_160118.docx%23_Toc503875549 Figura 26. Número de muestras en porcentaje de superficie en Compuestos por Promedio (CP). ........................................................................................................................................... 55 Figura 27. Clasificaciones de compuestos del año 2000. .......................................................... 56 Figura 28. Exactitud global de la clasificación de compuestos por Mejor Pixel y Promedio. ...... 57 Figura 29. Exactitudes del productor y usuario de CCMP y CCP. ............................................. 58 Figura 30. Promedio de exactitudes de productor y usuario de Clasificaciones de Compuestos por Promedio y Clasificaciones de Compuestos por Mejor Pixel de 1993 a 2015. .............. 59 Figura 31. Significancia estadística de las diferencias entre las clasificaciones de Compuestos por Mejor Pixel utilizando la Prueba McNemar. .................................................................. 63 Figura 32. Significancia estadística de las diferencias entre las clasificaciones de Compuestos por Promedio utilizando la Prueba McNemar. .................................................................... 64 Figura 33. Patrones de agricultura, cuerpos de agua y humedales. .......................................... 66 Figura 34. Clasificación de asentamientos humanos. ................................................................ 67 Figura 35. Rasgos de infraestructura urbana encontrados en las Clasificaciones. .................... 68 Figura 36. Efectos del fallo del SLC. .......................................................................................... 69 Figura 37. Superficie por clase de clasificaciones anuales de “Compuestos por Promedio”. ..... 71 Figura 38. Superficie por clase de clasificaciones anuales de “Compuestos por Mejor Pixel”.... 71 Figura 39. Clasificaciones del año 2010. ................................................................................... 72 Figura 40. Exactitud global de las clasificaciones sin filtrar y con filtro de mayoría (kernel de 3x3). ................................................................................................................................... 73 Figura 41. Cambios de la superficie de los manglares en México 2010-2015 ............................ 75 Figura 42. Coincidencias en zonas de cambio. ......................................................................... 76 Índice de tablas Tabla 1. Principales características de las imágenes Landsat ..................................................... 7 Tabla 2. Descripción de los bits de información para la banda 8 nombrada “lndsr.filename.hdf” (quality assurance). ............................................................................................................16 Tabla 3. Parámetros para la generación de compuestos por Promedio y por Mejor Pixel. ........ 28 Tabla 4. Recodificación del mapa NALCMS 2010 30 m. ........................................................... 29 Tabla 5. Definición de los elementos de la matriz usados en la ecuación 6. .............................. 37 Tabla 6. Compuestos generados por método y temporada. ...................................................... 41 Tabla 7. Significancia estadística de la diferencia CCMP VS CCP ............................................ 61 Tabla 8. Porcentaje de superficie según año de adquisición del mejor Pixel para Compuestos por Mejor Pixel (CMP) ........................................................................................................ 90 Tabla 9. Porcentaje de superficie según año de origen de las muestras para Compuestos por Promedio (CP) ................................................................................................................... 91 Tabla 10. Matrices de error y exactitudes por año (%) .............................................................. 92 Tabla 11. Prueba McNemar por par de años. Asignaciones correctas e incorrectas Mejor pixel (MP) vs Promedio (P) ......................................................................................................... 98 Tabla 12. Incremento en las exactitudes globales de las clasificaciones con aplicación de filtro de mayoría ......................................................................................................................... 99 Tabla 13. Equivalencias de Día del año (DOY) ....................................................................... 100 1 Resumen Este estudio explora el potencial del uso de compuestos de imagen para obtener cartografía en el sistema lagunar de Alvarado Veracruz, empleando un enfoque semi-automatizado. El mapeo de la cobertura terrestre en los trópicos se ve particularmente obstaculizado por la nubosidad frecuente, que es aún más pronunciada en los sitios costeros, y por lo tanto la falta de datos de reflectancia superficial en el dominio óptico de la percepción remota. A pesar de la existencia de limitaciones tales como nubes o artefactos técnicos en la adquisición de imágenes Landsat, debido a la falla del corrector de línea de barrido de Landsat 7 desde mayo de 2003, fue posible producir compuestos de imagen con resultados coherentes y generar mapas anuales de cobertura del suelo, utilizando los datos de referencia existentes disponibles para esta área de estudio. La generación de imágenes compuestas se examinó utilizando dos métodos: "Promedio" y "Mejor píxel", utilizando datos del período 1985 - 2015. Para cada método, las imágenes compuestas se obtuvieron para las temporadas "seca" y "húmeda". Seis bandas de reflectancia de superficie de imágenes de Landsat y cuatro índices espectrales de ambas temporadas fueron el insumo para la generación de mapas anuales de cobertura de suelo mediante la clasificación supervisada de imágenes con el algoritmo de árboles de decisión C5.0. La exactitud de cada mapa temático se evaluó estadísticamente, de los cuales el más alto alcanzó el 80% con la posibilidad de aumentar al aplicar pasos posteriores de procesamiento, como el filtrado de mayoría. Además, los resultados de las exactitudes en las clasificaciones obtenidas por cada método y para cada año se compararon para conocer estadísticamente sus diferencias, utilizando la prueba Z en la exactitud global, así como la prueba de McNemar. Los resultados muestran que existen diferencias estadísticamente significativas entre ambos métodos de composición, ya que las muestras de entrenamiento y validación, así como el algoritmo de clasificación fueron los mismos. La composición de imágenes por el método de "Promedio" obtuvo mejores resultados que el del "Mejor Pixel". El enfoque que utiliza imágenes compuestas derivadas de imágenes Landsat en el transcurso de la misma temporada para el mapeo de la cubierta terrestre se consideró apropiado. Además, proporciona los medios para corregir artefactos de la imagen, como la falla en la corrección de la línea de escaneo de las imágenes Landsat 7 ETM. 2 Abstract This study explores the potential of using image composites to obtain cartography in the lagoon system of Alvarado Veracruz, employing a semi-automated approach. Land cover mapping in the tropics is particularly hampered by frequent cloud cover, which is even more pronounced in coastal sites, thus the lack of surface reflectance data in the optical domain of remote sensing. Despite the existence of limitations such as clouds or technical artifacts in the acquisition of Landsat images, due to the failure of the scan line corrector of Landsat 7 since May 2003, it was possible to produce image composites with coherent results, and to generate annual land cover maps using existing reference data available for this study area. The generation of composite images was tested using two methods: "Mean" and "Best Pixel", using data from the 1985 – 2015 period. For each method, composited images were obtained for both "dry" and "wet" seasons, separately. Six surface reflectance bands from Landsat imagery and four spectral indices from both seasons were the input for the generation of annual land cover maps using supervised image classification with the C5.0 decision trees algorithm. The accuracy of each thematic map was statistically assessed, of which the highest reached 80% with the possibility of increasing when applying post-processing steps, such as majority filtering. In addition, the results of accuracies in the classifications obtained by each method and for each year were compared to statistically test their differences, using the Z test of the overall accuracy and the McNemar test. The results show that there are statistically significant differences between both compositing methods, because the training and validation sample locations and the classification algorithm were the same. Compositing images by the “Mean” method obtained better results than “Best Pixel”. The approach using images composites derived from Landsat images over the course of the same season for land cover mapping was deemed an appropriate. In addition, it provides the means to correct for image artefact such as the scan-line correction failure for the Landsat 7 ETM imagery. 3 Introducción La Percepción Remota se ha convertido en uno de los principales insumos para la generación de cartografía en el estudio de las cubiertas del suelo. El análisis de algunas regiones de la superficie terrestre se complica debido a que las condiciones climáticas favorecen la presencia de nubosidad, lo cual limita de manera importante este tipo de investigaciones, pues en ocasiones se cuenta con pocas imágenes libres de nubes al año o incluso en varios años. Esta limitante se aplica a todos los sensores satelitales de tipo óptico ya que, al depender del sol como fuente de energía, la cubierta nubosa restringe enormemente la adquisición de información de la superficie terrestre. En este estudio se utilizaron imágenes obtenidas por la constelación Landsat, la cual ha estado adquiriendo información sistemáticamente de la superficie terrestre a resolución espacial media, desde mediados de los 70s. Adicionalmente, los productos del acervo Landsat actualmente son gratuitos, lo que ha facilitado el acceso a la información para estudios de la cubierta terrestre, entre muchas otras aplicaciones. La generación de mapas de la cubierta del suelo con imágenes Landsat, en la región de humedales en Alvarado Veracruz, se ve limitada por la presencia de nubosidad y esto es debido en gran parte a estar situada en la vertiente del golfo, la cual cuenta con una alta presencia de humedad a lo largo del año y se acentúa por procesosestacionales. Esta situación se repite en muchos lugares del planeta, por lo que diversos investigadores han probado metodologías que permitan resolver esta limitante para la adquisición de imágenes de satélite. Una de ellas es el uso de datos de sensores activos como el radar, otra es la creación de compuestos de imágenes, los cuales integran la información de datos válidos y libres de nubes mediante técnicas que permiten seleccionar en cada imagen los pixeles que cumplen las características deseadas, y a su vez compilar esa información en una nueva imagen compuesta por pixeles de imágenes de diferentes fechas. De esa manera, es viable formar compuestos libres de nubes, siempre y cuanto se cuente con datos suficientes para ello, que muestren información para un periodo definido y puedan ser representativos de alguna zona en específico. Estos compuestos pueden generarse mediante conjuntos de imágenes agrupadas en meses, años, estaciones. Por ello los compuestos pueden ser un insumo ideal para mapear y monitorear ecosistemas. 4 Hipótesis Los compuestos de imágenes Landsat permiten generar cartografía de las coberturas de suelo para la región del Sistema Lagunar Alvarado, Veracruz, a pesar de limitantes en los datos debido a las condiciones atmosféricas que generan alta nubosidad y a los artefactos técnicos en la adquisición. Objetivo General Analizar la viabilidad del uso de compuestos estacionales para clasificaciones anuales de coberturas de suelo en el Sistema Lagunar Alvarado para un periodo de 30 años (1985-2015). Objetivos específicos Formar compuestos mediante dos métodos para la temporada húmeda y seca por cada año de la serie de tiempo de 30 años. Generar clasificaciones anuales basadas en los compuestos obtenidos y evaluar la exactitud de las clasificaciones. Comparar cuantitativa y cualitativamente las clasificaciones generadas. 5 Capítulo 1. Área de estudio y Datos 1.1 Área de estudio El área de estudio está ubicada en la llanura costera del Estado de Veracruz de Ignacio de la Llave, en la vertiente del Golfo de México. Entre las coordenadas de latitud 18º06’N y 18º58’N, y 95º24’W y 96º06’W de longitud, que equivalen a las coordenadas extremas UTM: X: 805,005m, Y: 2,101,005m para la esquina superior izquierda, y X: 880,005m, Y: 2,005,005m para la esquina inferior derecha, las coordenadas corresponden a la proyección UTM zona 14 con elipsoide WGS 84 (figura 1). El área de trabajo cubre una extensión de 5874.5 km2 (sin incluir la porción de mar que aparece en la imagen LANDSAT). La extensión del área de estudio abarca total o parcialmente 27 municipios del estado de Veracruz, correspondiendo 10 de ellos al 70% de la superficie total: Alvarado, Tlacotalpan, Cosamaloapan de Carpio, Ignacio de la Llave, Isla, Ixmatlahuacan, Tlalixcoyan, Santiago Tuxtla, Chacaltianguis y Tierra Blanca (INEGI, 2017). El clima de la zona es Aw2, correspondiente a cálido subhúmedo, con temperatura media anual mayor a 22º C y la precipitación tiene su mayor concentración en los meses de verano (García y CONABIO, 1998). El área está incluida en su totalidad en la unidad fisiográfica conocida como Llanura Costera del Golfo de México, la cual se caracteriza por tener elevaciones bajas, presentando elevaciones no mayores a los 50msnm en el área de estudio. Estas características climáticas y geomorfológicas permiten la existencia de abundantes cuerpos de agua entre los que resaltan: Laguna Alvarado, Laguna Pajarillos, Laguna Camaronera y Laguna Popuyeca. Los ríos que destacan en la zona son: Río Papaloapan, Río Limón y Río Acula (INEGI, 2015). El ambiente lagunar crea las condiciones propicias para la presencia de abundantes manglares, predominando el mangle rojo (Rizophora mangle), el mangle prieto (Avicennia germinans) y el mangle blanco (Laguncularia racemosa). Adicionalmente existen pastizales, que constituyen más de la tercera parte de superficie de la zona de estudio, los cuales son dedicados a la ganadería y representan una importante presión a las áreas con manglar (CONABIO, 2009). La zona de estudio comprende el Sistema Lagunar de Alvarado, el cual fue designado como Humedal de importancia Internacional el 2 de febrero del 2004 por la Convención sobre los humedales RAMSAR, incluye un sitio de manglar con relevancia biológica y con necesidades de rehabilitación ecológica (Vázquez et al. 2009). Además, por su alta diversidad avifaunística, 6 los humedales de Alvarado son Área de Importancia para la Conservación de las Aves “AICA”., (CIPAMEX y CONABIO, 1999). Pertenece a una Región Terrestre Prioritaria denominada “Humedales del Papaloapan”. (Arriaga et al. 2000), también a la Región Hidrológica Prioritaria “Humedales del Papaloapan, San Vicente y San Juan” (Arriaga et al. 2002) y a la Región Marina Prioritaria, “Sistema lagunar de Alvarado” (Arriaga et al. 1998). Figura 1. Área de estudio 7 1.2 Datos 1.2.1 Imágenes Landsat En este estudio se utilizaron imágenes Landsat 4 y 5 Thematic Mapper (TM) y Landsat 7 Enhanced Thematic Mapper Plus (ETM+) nivel 1, desde 1985 al 2015 del path/row 024/047, las cuales se descargaron del acervo Landsat disponible en la página del U.S. Geological Survey (https://earthexplorer.usgs.gov/). Estas imágenes están caracterizadas por tener una resolución espacial de 30 m por pixel y una revisita de 16 días por satélite. Respecto al tamaño de la escena, para Landsat 4 y Landsat 5 es de 185 km X 172 km y para Landsat 7 es de 183 km X 170km. Los productos obtenidos cuentan ya con correcciones geométrica y radiométrica, lo cual agiliza su uso. Otra particularidad importante del sensor Landsat es que son datos gratuitos y de libre acceso para la investigación científica (USGS 2017). Las características técnicas que tienen en común los sensores TM y ETM+, permiten hacer análisis de información en conjunto de años diferentes, para ello se usaron las 6 bandas ópticas de Landsat 4, 5 y 7 (bandas 1-5 y la banda 7), las cuales tienen la misma resolución temporal, espacial, radiométrica y espectral (tabla 1). En esta investigación no se incluyó Landsat 8 debido a que cuenta con bandas adicionales y el acomodo de las mismas es diferente a las de Landsat 4, 5 Y 7, así como su resolución radiométrica y espectral, lo cual no permite sistematizar su uso con las imágenes de los satélites antes mencionados. Tabla 1. Principales características de las imágenes Landsat Satélite Sensor Resolución Temporal Resolución Espacial Tamaño de la escena Resolución Radiométrica Resolución Espectral (Bandas) Landsat 1 MSS 18 días 68 m X 83 m 185 km X 185 km 6 bit 4 : 0.5 - 0.6 μm (G) 5 : 0.6 - 0.7 μm (R) 6 : 0.7 - 0.8 μm (NIR) 7 : 0.8 - 1.1 μm (NIR) Landsat 2 MSS 18 días 68 m X 83 m 185 km X 185 km 6 bit 4 : 0.5 - 0.6 μm (G) 5 : 0.6 - 0.7 μm (R) 6 : 0.7 - 0.8 μm (NIR) 7 : 0.8 - 1.1 μm (NIR) Landsat 3 MSS 18 días 68 m X 83 m 185 km X 185 km 6 bit 4 : 0.5 - 0.6 μm (G) 5 : 0.6 - 0.7 μm (R) 6 : 0.7 - 0.8 μm (NIR) 7 : 0.8 - 1.1 μm (NIR) 8 : 10.4 - 12.6 μm (T) https://earthexplorer.usgs.gov/ 8 Landsat 4 MSS 16 días 68 m X 83 m 185 km X 185 km 8 bit 4 : 0.5 - 0.6 μm (G) 5 : 0.6 - 0.7 μm (R) 6 : 0.7 - 0.8 μm (NIR) 7 : 0.8 - 1.1 μm (NIR) TM 30 m 185 km X 172 km 1 : 0.45 - 0.52 μm (B) 2 : 0.52 - 0.60 μm (G) 3 : 0.63 - 0.69 μm (R) 4 : 0.76 - 0.90 μm (NIR) 5 : 1.55 - 1.75 μm (NIR) 120 m 6 : 10.40 - 12.50 μm (T) 30 m 7 : 2.08 - 2.35 μm (MIR) Landsat 5 MSS 16 días 68 m X 83 m 185 km X 185 km 8 bit 4 : 0.5 - 0.6 μm (G) 5 : 0.6 - 0.7 μm (R) 6 : 0.7 - 0.8 μm (NIR) 7 : 0.8 - 1.1 μm (NIR) TM 30 m 185 km X 172 km 1 : 0.45 - 0.52 μm (B) 2 : 0.52 - 0.60 μm (G) 3 : 0.63 - 0.69 μm (R) 4 : 0.76 - 0.90 μm(NIR) 5 : 1.55 - 1.75 μm (NIR) 120 m 6 : 10.40 - 12.50 μm (T) 30 m 7 : 2.08 - 2.35 μm (MIR) Landsat 6 N o a l c a n z ó l a ó r b i t a o p e r a t i v a Landsat 7 ETM+ 16 días 30 m 183 km X 170 8 bit 1 : 0.45 - 0.52 μm (B) 2 : 0.52 - 0.60 μm (G) 3 : 0.63 - 0.69 μm (R) 4 : 0.77 - 0.90 μm (NIR) 5 : 1.55 - 1.75 μm (NIR) 60 m 6 : 10.40 - 12.50 μm (T) 30 m 7 : 2.08 - 2.35 μm (MIR) 15 m 8 : 0.52 - 0.90 μm (P) Landsat 8 OLI 16 días 30 m 185 km X 180 km 12 bit 1 : 0.43 - 0.45 μm (UA) 2 : 0.45 - 0.51 μm (B) 3 : 0.53 - 0.59 μm (G) 4 : 0.64 - 0.67 μm (R) 5 : 0.85 - 0.88 μm (NIR) 6 : 1.57 - 1.65 μm (SWIR1) 7 : 2.11 - 2.29 μm (SWIR 2) 15 m 8 : 0.5 - 0.68 μm (P) 30 m 9 : 1.36 - 1.38 μm (C) TIRS 100 m 10 : 10.6 - 11.19 μm (TIRS 1) 11 : 11.5 - 12.51 μm (TIRS 2) Fuente: https://landsat.gsfc.nasa.gov/a-landsat-timeline/ La resolución espectral”, indica el rango de longitud de onda y entre paréntesis la región a la que pertenece: UA=ultra azul), B=azul, G=verde, R=rojo, NIR=infrarrojo cercano, T=térmico, P=pancromática, C=cirrus, SWIR=infrarrojo de onda corta, TIRS=Infrarrojo térmico.. El swath para todas las imágenes Landsat 1,2,3,4, 5 y 8 es de 185 km y para Landsat 7 es de 183km. En la tabla no se muestra información del sistema RBV (Return Beam Vidicon) que pertenecen a Landsat 1, 2 y 3. 9 1.2.2 Mapa de referencia Se utilizó como información de referencia una porción del mapa de cobertura del suelo de América del Norte, con resolución espacial de 30 metros (NALCMS 2010 a 30m) generado como parte del proyecto del Sistema de Monitoreo del Cambio en la Cobertura de Suelo de América del Norte, o “North American Land Change Monitoring System” (NALCMS). NALCMS 2010 a 30m se publicó de forma oficial a finales del año 2017. Para este estudio de obtuvo una versión preliminar a su publicación proporcionada por la CONABIO. NALCMS es una iniciativa de colaboración cartográfica trinacional entre los gobiernos de Canadá, Estados Unidos y México (Latifovic et al. 2012). Las instituciones involucradas para el caso de México son el Instituto Nacional de Estadística y Geografía (INEGI), la Comisión Nacional para el Conocimiento y Uso de la Biodiversidad (CONABIO) y la Comisión Nacional Forestal (CONAFOR). La cartografía que generan en conjunto los 3 países tiene resolución espacial de 250m y 30m, se obtiene con procesos, insumos y leyenda estandarizados (Latifovic et al. 2012 y Colditz et al. 2014). NALCMS 2010 a 30m utiliza información del programa “Monitoring Activity Data for the Mexican REDD+”, mejor conocido como MAD-MEX para el mapeo automático de la cobertura terrestre. A continuación, se enlistan algunas características consideradas relevantes para la obtención de la cartografía del sistema MAD-MEX: El principal objetivo del sistema MAD-MEX es elaborar productos estandarizados de la cobertura del suelo, de una manera oportuna y transparente, con una determinada exactitud de clasificación, y servirá como el principal producto base para la posterior interpretación (visual) y mejoramiento de la asignación de las clases de cobertura del suelo. Los autores consideran a este como el único método viable para realizar, de manera frecuente, la actualización de la cartografía de las cubiertas del suelo a una escala de producción de 1:100,000. Para lo anterior se utilizaron todas las imágenes Landsat TM y ETM+ disponibles para el territorio mexicano, y se utilizó un enfoque orientado en objetos “mapa-a-imagen”, es decir que se utilizó la cartografía existente con alta resolución temática, para entrenar al clasificador. Se generaron “objetos” mediante la segmentación de las imágenes, y se extrajeron características de éstos mediante el cálculo de métricas multi-temporales por objeto. Posteriormente, se realizó la clasificación de los objetos mediante el uso de árboles de decisión, y finalmente se hacer 10 la agregación pertinente de clases, y la validación del producto se realiza con un inventario independiente de datos de campo (Gebhardt et al. 2014). El pre-procesamiento de MAD-MEX de las imágenes incluyó el uso de LEDAPS para calibrar cada imagen a la reflectancia en el techo de la atmósfera y reflectancia de la superficie, y el algoritmo FMASK para crear las máscaras de nubes, sombras, agua y no-data. Además, se calcularon métricas para cada objeto, derivadas tanto de los datos de series de tiempo de NDVI, así como de los datos de elevación obtenidos del Continuo Nacional de Elevaciones, generado por el INEGI. La información de referencia que usó MAD-MEX fue derivada de la Serie II (1993-1999), Serie III (2002-2004) y Serie IV (2005-2007) de Uso de suelo y Vegetación (USV) generadas por el Instituto Nacional de Estadística y Geografía (INEGI). Para generar el mapa de referencia se hizo un análisis de persistencia, el cual consistió en intersectar los mapas de las series II, III y IV, para mantener sólo la información de las clases que se mantuvieron constantes en las tres bases, y posteriormente eliminar de la información restante los outliers, que en este caso es información excluida mediante una técnica conocida como recorte iterativo del histograma o “iterative histogram trimming”, cuyo enfoque se considera como adecuado para producir elementos de imagen “puros”, como base para el entrenamiento de una clasificación (Gebhardt et al, 2014). La información utilizada para la validación de la exactitud de los productos fue tomada de diferentes inventarios nacionales de muestras (CONAFOR, COLPOS, SRA, INEGI). En la etapa de clasificación, MAD-MEX utiliza para el entrenamiento del clasificador la información restante después de la remoción de los outliers, y se aplicaron algoritmos de clasificación supervisada por árboles de decisión C5.0. Una vez obtenida la clasificación, esta se convirtió a formato raster con un tamaño de pixel de 30m, y los objetos que no superaron el umbral de la unidad mínima cartografiable (UMC) de 4 hectáreas fueron removidos por generalización. El principal insumo para la obtención del NALCMS 2010 A 30 m fue el producto MAD-MEX versión 4.3 (Gebhardt et al. 2014) generado por la CONABIO en colaboración con el INEGI y CONAFOR. El producto MAD-MEX fue editado para corregir errores como inconsistencias entre bordes; eliminación de píxeles aislados, corrección de áreas clasificadas erróneamente, los efectos debidos al fallo del Scan Line corrector (SLC) entre otros, a fin de mejorar el producto ajustando las clases a las establecidas en NALCMS (Llamas y Colditz 2017). 11 La figura 2 muestra el extracto del mapa NALCMS 2010 para el área de estudio de esta investigación, el cual tiene un tamaño de pixel de 30m y está re-proyectado a UTM. Las clases que sobresalen en cuanto a extensión son Suelo agrícola con 44.92%, Pastizal con 39.07%, Humedal con 8.67%, Cuerpo de agua con 5.44 y Asentamientos con 1.35 %. Nótese que estos porcentajes fueron calculados sin tomar en cuenta el área ocupada por el mar. Figura 2. Zona de estudio mostrando la cobertura del suelo según NALCMS, 30m 12 Capítulo 2. Métodos Este capítulo comprende 6 secciones (figura 3); la primera es sobre el pre-procesamiento de las imágenes Landsat, enfocado al tratamiento que se les aplicó a las imágenes antes de la creación de los compuestos. La segunda es la generación de compuestos por dos métodos, llamados “Mejor Pixel” y “Promedio”. La tercera corresponde al diseño del muestreo, tanto para la clasificación como para la validación. La cuarta es el proceso de clasificación mediante árboles de decisión. La quinta es la validación de resultados y la comparación de los mismos mediante pruebas estadísticas Z y McNemar. Por último, la sextaes la evaluación cualitativa de los resultados de las clasificaciones anuales. Pre-procesamiento Compuestos Diseño del Muestreo Clasificación Validación Evaluación cualitativa Imágenes Landsat 4, 5 y 7 QA (Banda 8) Remoción de outliers Fmask Creación y aplicación de máscaras LEDAPS Compuesto Mejor pixel (CMP) Temporada Seca + Temporada húmeda Compuesto Promedio (CP) Temporada Seca + Temporada húmeda Árbol de clasificación con C5.0/See5 Classifier.sav Clasificación por año con CMP (CCMP) Clasificación por año con CP (CCP) 500 muestras para validación (100 por clase) 5000 muestras de entrenamiento (500 por clase y 2500 distribuidas por proporción de área) Mapa de Referencia (NALCMS 2010 30 m) Recodificación a 5 clases Evaluación de exactitud CCP y CCMP Matriz de error Exactitud global Prueba McNemar Prueba Z Comparación de las exactitudes Similitud espectral Compilación imágenes Landsat por año Bandas 1 a 5 y 7) e índices (NDVI, MSAVI2, NDWI y NDMI) Índices espectrales Área por clase Ejemplos de patrones espaciales de coberturas Figura 3. Etapas para la generación de compuestos de imágenes Landsat, la clasificación de la cobertura del suelo y su validación 13 2. 1 Pre-procesamiento Para el pre-procesamiento, se descargaron todas las imágenes Landsat TM y ETM+ disponibles para el periodo 1985-2015 de la página del U.S. Geological Survey (https://earthexplorer.usgs.gov/), y se calculó la cantidad de imágenes que deberían existir en el acervo si los sensores produjeran las imágenes con la regularidad con que fueron programados (cada 16 días), esto calculando el total de días desde el lanzamiento e inicio de funcionamiento de los mismos hasta el final de operación, dentro del periodo antes definido. El conjunto de imágenes Landsat descargado de 1985 a 2015, fue organizado por años, y se recortaron las imágenes ajustando a las coordenadas extremas X=805,005, Y=2,101,005 y X=880,005, Y=2,005,005, el tamaño del pixel se conservó en 30m, y se descartaron las imágenes que estaban totalmente cubiertas de nubes. A las que no tenían nubosidad o incluso con pequeñas zonas despejadas, se les distinguió como “imágenes usables”. Las imágenes Landsat 7 a partir de mayo 2003 presentan un efecto de bandeado conocido como “gaps” que son franjas de datos inválidos causados por el fallo del instrumento SLC (Scan Line Corrector), estas franjas aparecen en patrones de zigzag que son más pronunciados en los bordes de las escenas, los cuales representan aproximadamente un 22 % de pérdida de datos por escena, pero el efecto de bandeado es diferente en cada una de ellas. En la figura 4A se puede ver el escaneo de líneas antes y después del fallo de instrumento SLC y en la figura 4B se observa un ejemplo del efecto del bandeado producido por el fallo del SLC en zona de manglares de Alvarado, Veracruz. A B Figura 4. Fallo del SLC. (A) Barrido con y sin SLC (Fuente: https://landsat.usgs.gov/slc-products- background) y (B) Efecto del fallo del SLC en imagen Landsat 7 de 18 de octubre del 2006. https://earthexplorer.usgs.gov/) https://landsat.usgs.gov/slc-products-background https://landsat.usgs.gov/slc-products-background 14 A las imágenes usables se les aplicaron dos filtros importantes para remover nubes, sombras de nubes y datos afectados por el fallo del SLC. El primer filtro consistió en la generación de máscaras con el código LEDAPS y el algoritmo Fmask que se explican en la sección 2.1.1 y, el segundo en la remoción de outliers (pixeles con valores anómalos), basándose en la respuesta de reflectancia de los pixeles a través de una serie de tiempo (sección 2.1.3) y auxiliándose de 4 índices espectrales: Normalized Difference Vegetation Index, Modified Soil Adjusted Vegetation Index, Normalized Difference Water Index y Normalized Difference Moisture Index los cuales se exponen en la sección 2.1.2. 2.1.1 Generación y aplicación de máscaras para excluir nubes La identificación y eliminación de datos con nubes, sus sombras y los gaps o bandeado, que se deben a los artefactos de Landsat 7, es un paso indispensable antes del análisis de series de tiempo y formación de compuestos de imágenes. Para eliminar esas zonas o elementos, investigadores han aplicado diferentes estrategias: Kennedy et al. (2010), para enmascarar nubes, humo, nieve y proyección de sombras, emplearon una estrategia basada en contrastar cada imagen en la serie de tiempo con una sola imagen de referencia, auxiliándose con los elementos de la transformada Tasseled-cap o también conocida como Kauth-Thomas, aumentado y disminuyendo las componentes de brillo, verdor y humedad. Por otro lado, Potapov et al. (2011) usaron el algoritmo de clasificación y árbol de regresión (CART) (Breiman et al. 1984) como herramienta principal para el procesamiento previo de datos para enmascarar nubes y sombras. Roy et al. (2010), utilizan el código Automatic Cloud Cover Assessment Algorithm (ACCA) para generar máscaras, además de árboles de clasificación para definir pixeles como “no nublados”, “nublados” y “adyacentes a pixeles turbios”. Griffiths et al. (2013) y White et al. (2014), emplean el algoritmo Fmask para enmascarar nubes y sombras de nubes. En este estudio, uno de los primeros procesamientos que se aplicaron a las imágenes de satélite es el que se conoce como Landsat Surface Reflectance Quality Assurance Extraction o “Extracción de Garantía de Calidad para Reflectancia de Superficie de Landsat” (QA), el cual se originó por el interés de producir Registros de Datos Climáticos o CDRs por sus siglas en inglés, los cuales se pueden extraer de las imágenes Landsat adquiridas a partir de 1984 al presente. El primero de dichos registros en desarrollarse fue el LSRP (Landsat Surface Reflectance Product), este producto incluye información de calidad de datos en una estructura empacada en 15 ciertos bits de información de productos derivados de la reflectancia superficial de la imagen. Dicha información no es accesible con los programas convencionales de procesamiento de datos de teledetección, ni tampoco con los Sistemas de Información Geográfica (SIGs), por lo que es necesario realizar un post-procesamiento a las imágenes para poder hacer accesible esta información de calidad a los paquetes antes mencionados (Jones et al. 2013). La extracción de la información de la reflectancia superficial y otros atributos se lleva a cabo mediante la utilización del código LEDAPS (Landsat Ecosystem Disturbance Adaptive Processing System, Masek et al. 2006). Una vez extraída la información de reflectancia superficial y asociados, estos se almacena en la Banda 8 (lndsr_QA) de cada respectiva escena en formato HDF (Hierarchical Data Format), el cual ya es accesible a múltiples paquetes que utilizan información espacial existente, como son los datos MODIS de los instrumentos Aqua y Terra. No obstante, aún no se puede acceder a la información de calidad pues ésta viene empacada en código binario, por lo que aún es necesario aplicar un procesamiento más. La herramienta LDOPE (Land Data Operational Product Evaluation) originalmente fue diseñada para procesar información MODIS (Roy et al. 2002), sin embargo, al estar la Banda 8 de Landsat en el mismo formato que los datos MODIS, se puede utilizar de igual manera para desempacar la información de calidad y finalmente obtener los valores que muestran la tabla 2, entre los cuales se encuentran los que permitirán crear máscaras para remover pixeles con presencia de nubes y presencia de sombra de nubes, entreotros elementos (Jones et al. 2013). La tabla 2, describe los parámetros que se miden en cada uno de los bits extraídos de la imagen. (USGS, 2013). La última columna indica la selección propia de parámetros usados en la primer mascara generada basada en la capa de Calidad (QA). Con el procesamiento antes descrito se obtuvo una máscara para cada imagen Landsat, en la que se indicaban los pixeles en los que había nubes y sombras de nubes. La segunda máscara de nubes se obtuvo por Fmask (Zhu y Woodcock, 2012), el cual es un algoritmo utilizado para la detección de nubes y sus sombras en las imágenes Landsat, ésta técnica la han empleado diferentes investigadores (Griffiths et al. 2013; White et al. 2014 y Hermosilla et al. 2015). Los insumos de este método son el producto de reflectancia en el techo de la atmósfera de Landsat (TOA) y el brillo de la temperatura (TB). El primer cálculo en Fmask consiste en usar reglas basadas en propiedades físicas de las nubes para separar pixeles con potencial de ser ocupados por nubes (Potential Cloud Pixels o PCPs) de los que representan pixeles sin nubes. A continuación, se calculan probabilidades de temperatura normalizada, variabilidad espectral y brillo, y son combinadas para producir una máscara de probabilidad para nubes sobre tierra y sobre agua de manera separada. Entonces, los PCPs y la máscara de 16 probabilidad de nubes son utilizadas de manera conjunta para producir la capa de información que exprese el potencial de nubes. Para un conjunto de datos de referencia utilizados para validar Fmask de manera global, este método tiene una exactitud de hasta 96.4% (Zhu y Woodcock, 2012). Tabla 2. Descripción de los bits de información para la banda 8 nombrada “lndsr.filename.hdf” (quality assurance). No de bit Nombre del parámetro Interpretación valor 0 Interpretación valor 1 Selección 0 Unused --- --- 1 Valid data yes no 2 ACCA-based cloud mask clear cloudy 3 Unused --- --- 4 ACCA-based snow mask snow absent snow present 5 DEM-based land/water mask water land 6 Dense dark vegetation (DDV) DDV absent DDV present 7 Unused --- --- 8 Surface reflectance-based cloud mask clear cloudy X 9 Cloud shadow mask cloud shadow absent cloud shadow present X 10 Surface reflectance-based snow mask snow absent snow present X 11 Spectral test-based land/water mask water land 12 Adjacent cloud adjacent cloud absent adjacent cloud present X 13 Unused --- --- 14 Unused --- --- 15 Unused --- --- Fuente: Jones et al. 2013. Al tener las máscaras Fmask y la generada con la banda de calidad (banda 8), éstas se combinaron con la regla “o” (or) para posteriormente utilizarlas a fin de eliminar esos pixeles que contenían nubes, sombras de nubes, y efectos de “gaps” (huecos) detectados en cada una de ellas, y el valor de relleno para los datos removidos fue de 20,000 para facilitar su identificación y remoción al estar fuera del rango de datos válidos. 17 2.1.2 Cálculo de índices espectrales Para la identificación de algunas cubiertas del suelo es conveniente calcular índices espectrales, los cuales permiten reconocer objetos en la superficie terrestre de acuerdo a su comportamiento espectral/radiométrico diferenciado. En este estudio se calcularon cuatro índices espectrales: Los dos primeros son Normalized Difference Vegetation Index (NDVI) y Modified Soil Adjusted Vegetation Index 2 (MSAVI2), enfocados al estudio de la vegetación (ecuaciones 1 y 2). Es conveniente el cálculo de índices de vegetación, ya que la información espectral contenida en una sola banda no es suficiente para caracterizar y estudiar la vegetación. Es por eso que se realizan operaciones entre bandas, pues la respuesta espectral característica de la vegetación en ciertas regiones del espectro electromagnético permite que mediante cálculos entre bandas se obtengan productos que faciliten su estudio. Por otro lado, debido a la presencia de cuerpos de agua y humedales, se optó por calcular un índice que ayudara a delimitar las zonas con agua mediante el Normalized Difference Water Index (NDWI) (ecuación 3). Y por último el Normalized Difference Moisture Index (NDMI) que auxilia en la estimación del contenido de humedad de la vegetación (ecuación 4). a) Normalized Difference Vegetation Index (NDVI) El NDVI o índice de vegetación de diferencia normalizada, es un índice extensivamente utilizado para el estudio de múltiples características de la vegetación, es derivado a partir del cociente calculado de las bandas ubicadas en el rojo e infrarrojo cercano, y brinda una estimación de la vegetación midiendo la reflectancia a nivel de pixel (Lunneta et al. 2006). Su fórmula es: 𝑁𝐷𝑉𝐼 = 𝑁𝐼𝑅−𝑅𝐸𝐷 𝑁𝐼𝑅+𝑅𝐸𝐷 (1) Donde NIR es la banda con información de reflectancia del infrarrojo cercano y RED la banda con información de reflectancia del Rojo. Las bandas de Landsat de los sensores TM y ETM+ que se usaron para el cálculo de este índice fueron 4 y 3 respectivamente. 18 b) Modified Soil Adjusted Vegetation Index 2 (MSAVI2) La segunda modificación al índice de vegetación ajustado al suelo (MSAVI2) trata de minimizar la influencia del brillo del suelo en la lectura de información espectral de vegetación. El índice SAVI original trata de hacer esto, ya sea estableciendo una línea que caracterice el brillo del suelo o mediante un parámetro de ajuste del suelo. Este parámetro depende de la cantidad (densidad) de vegetación y suelo, y se determina empíricamente, aunque también puede medirse o modelarse (Huete 1988; Gao et al. 2000). Con respecto al MSAVI2, este elimina la necesidad de encontrar la línea del suelo a partir del feature space o incluso especificar el factor de corrección para el brillo del suelo. Este índice fue desarrollado por Qi et al. (1994) obteniendo la siguiente fórmula: 𝑀𝑆𝐴𝑉𝐼2 = 2∗𝑁𝐼𝑅+1−√(2∗𝑁𝐼𝑅+1)2−8∗(𝑁𝐼𝑅−𝑅𝐸𝐷) 2 ( 2 ) Para obtener este índice se usaron las bandas 3 y 4 de los sensores TM y ETM+. c) Normalized Difference Water Index (NDWI) El índice para agua de diferencia normalizada surge de la necesidad de estudiar los cuerpos de agua de manera independiente de las otras cubiertas que los rodean; anteriormente se ha utilizado la banda infrarroja para poder hacer la delineación de dichas cubiertas, sin embargo, este método confina las otras cubiertas (no-agua), pero no las elimina, por lo que su presencia aún es fuente de ruido en el estudio de los cuerpos de agua y sus características (turbidez, corrientes, calidad del agua, materia en suspensión etc.). El NDWI elimina todos los rasgos de las cubiertas que no son agua, permitiendo así el estudio más enfocado en los cuerpos de agua y sus características (McFeeters, 1996). La fórmula para calcular el NDWI es: 𝑁𝐷𝑊𝐼 = 𝐺𝑅𝐸𝐸𝑁−𝑁𝐼𝑅 𝐺𝑅𝐸𝐸𝑁+𝑁𝐼𝑅 ( 3 ) Donde GREEN es la banda que captura reflectancia en la porción verde del espectro electromagnético y NIR se refiere a la porción del infrarrojo cercano. Este índice se calculó con las bandas 2 y 4 de los sensores TM y ETM+. 19 d) Normalized Difference Moisture Index (NDMI) Aun cuando la palabra humedad está contenida en el nombre de este índice, Wilson y Sader (2002) afirman que el término se utiliza y sigue siendo utilizado por no contar con uno mejor. Al utilizar la banda del infrarrojo medio permite una mayor absorción de la longitud de onda del agua, la diferencia entre la banda del infrarrojo medio y la del infrarrojo cercano se considera que es debida a la absorción de agua por las hojas (Wilson y Sader, 2002). La fórmula para su cálculo es la siguiente: 𝑁𝐷𝑀𝐼 = (𝑁𝐼𝑅)−(𝑆𝑊𝐼𝑅1) (𝑁𝐼𝑅)+(𝑆𝑊𝐼𝑅1) ( 4 ) Para el cálculo de este índice se usaron las bandas 4 y 5 de los sensores TM y ETM+. Además de ayudar a caracterizarciertos objetos en el terreno, los índices espectrales son muy útiles en estudios de series de tiempo pues permiten observar el comportamiento de un pixel en un rango de tiempo, aunado a eso permiten identificar datos inválidos o que no son de interés para esta investigación. Estos 4 índices se calcularon y usaron en la etapa de remoción de outliers y también para la generación de compuestos. 2.1.3 Remoción de outliers Se presentaron casos en que las máscaras de nubes, sombras de nubes y datos no válidos, no fueron suficientes para eliminar pixeles que los contenían, debido a ello se hizo una remoción adicional de pixeles conocidos como outliers o datos atípicos. El proceso para eliminar outliers, consistió en identificar aquellos valores de pixel que no seguían un trayecto espectral común al del resto mediante el uso de una serie temporal de promedios. Se prepararon carpetas con los 4 índices espectrales (NDVI, MSAVI2, NDWI y NDMI) y 6 bandas ópticas por cada fecha. Calculando el trayecto espectral de cada pixel en los diferentes índices y bandas, se indicaba cada que un valor se reconocía como outlier. Al ubicar los pixeles candidatos a ser outlier, se especificó una frecuencia en el que la suma de bandas e índices que han indicado que el pixel es un outlier sea de al menos 5. Es decir que, en aquel stack, o conjunto de bandas e índices, donde 5 veces o más se identificara un outlier, indica que el pixel 20 se contabilizaría como no válido y se eliminará en esa fecha. También se incluyó una regla como excepción de eliminación de outliers y esta consistió en no eliminar aquellos candidatos a outliers que se encontraban continuos cuando estos eran un conjunto de 3 pixeles o más, los cuales podrían deberse a una zona de cambio y no a valores atípicos. La figura 5A, muestra los promedios anuales de NDVI de un pixel de manglar para el periodo 1985-2015, el cual está ubicado entre la laguna Pajarillos y la laguna de Alvarado (columna 1029 y fila 982). En la figura 5B, el mismo pixel con el cálculo de promedios de NDVI, pero sin los outliers. Día del año A Año Día del año B Figura 5. Ejemplo de remoción de outliers. (A) Promedios anuales de NDVI de un pixel de manglar y (B) Promedios anuales de NDVI de un pixel de manglar sin outliers. Las líneas negras son los promedios mensuales de NDVI, los años están representados por colores, de lado izquierdo la paleta de equivalencias. V a lo r d ig it a l N D V I V a lo r d ig it a l N D V I 21 Un ejemplo de la remoción de pixeles con nubes y sombras se observa en una porción de la imagen Landsat 5 del 22 de junio del 2001, al este de la localidad de Amatitlán Veracruz, que corresponde a una escena con nubes en un compuesto RGB 743. La figura 6A es la imagen Landsat original, la figura 6B es la máscara binaria combinada en color gris, generada para cubrir nubes y sombras principalmente con la Banda 8 y Fmask, en ella se observa que algunas sombras de nubes no se enmascararon, por lo cual en la figura 6C) se muestra en color amarillo aquellos pixeles identificados como outliers los cuales se eliminaron por similitud espectral. Con esos dos procesos de remoción de datos no válidos, los pixeles de la imagen libres de nubes, sombras de nubes y datos erróneos por el efecto del fallo SLC, pueden ser usados en la generación de compuestos. Cada pixel sin valor debido al enmascaramiento de nubes, sombras de nubes y bandeado, así como por la remoción de outliers fue rellenado con el valor 20,000. A B C Figura 6. Aplicación de máscaras de nube y remoción de ouliers. (A) Imagen original Landsat 5 del 22 de junio del 2001, fecha en la que en esa zona hay nubes presentes y sus sombras, (B) Aplicación de máscaras de nubes y sombras de nubes marcadas en color gris y (C) Remoción de outliers señalados en color amarillo. 22 2.2 Compuestos Los procedimientos para obtener compuestos de imagen (composite en inglés), se aplican a series temporales de datos de imágenes que son geométricamente correctos, con el objetivo de producir un único conjunto de datos que sea representativo (Wolfe et al. 1998.) En la generación de compuestos, existe una selección de pixeles de diferentes imágenes en diferentes fechas cumpliendo criterios definidos. (Roy et al. 2000). Inicialmente los compuestos se formaban para estudios globales con datos de sensores de órbita polar de amplio campo de visión, cuya resolución se considera gruesa como AVHRR y después con datos MODIS (Wolfe et al. 1998) ya que la resolución temporal de estas fuentes de teledetección permitía seleccionar entre un gran conjunto de datos, a diferencia de imágenes satelitales de alta resolución espacial que son poco accesibles y costosas. Con la implementación del libre acceso a los datos Landsat en 2008, varios investigadores han estudiado la cobertura de la superficie terrestre mediante series temporales, empleando los principios de la formación de compuestos desarrollados con MODIS y AVHRR, para el estudio y mapeo de la superficie terrestre a una escala más fina. Esto se ha logrado adecuando la metodología a la utilización de información de diferentes sensores o implementando algoritmos para la identificación de cambios, como por ejemplo perturbaciones forestales o incendios (Huang et al. 2010 y Kennedy et al. 2010). Huang et al. (2010), exponen un enfoque automatizado con series de tiempo Landsat en el que proponen el algoritmo VCT (Vegetation Change Tracker) para analizar disturbios forestales en diferentes sitios de Estados Unidos, demostrando que es capaz de detectar la mayoría de los eventos de perturbación como fuego o incluso tala selectiva con intervalo temporal bienal desde 1984 a 2006. Por otro lado, para el noroeste del Pacífico de Estados Unidos también a partir de series temporales Landsat, Kennedy et al. (2010), presentan un enfoque para extraer las trayectorias espectrales de cambios de la superficie terrestre, como perturbación/recuperación de bosques, esto con el desarrollo de un algoritmo llamado LandTrendr (Landsat-based detection of Trends in Disturbance and Recovery) con imágenes Landsat de julio y agosto desde 1985 hasta 2007, cuya estrategia fue la segmentación temporal de trayectorias espectrales para la producción de mapas de cambio basado en el análisis de tendencias de reflectancia. Algunas propuestas que presentan investigadores para la formación de compuestos con diversas técnicas son Roy et al. (2010); Griffiths et al. (2013); White et al. (2014); Anaya et al. (2015). La 23 integración de compuestos Landsat de tipo mensual, estacional y anual para Estados Unidos con datos de diciembre 2007 a noviembre 2008, son expuestos por Roy et al. (2010), también con un enfoque de procesamiento automatizado, cuyos criterios de composición se enfocaron en la selección de observaciones de superficie válidas con mínimo de nubes, nieve y contaminación atmosférica incorporando diversos criterios preferenciales como Máximo NDVI o temperatura máxima de brillo. Por su parte, Griffiths et al. (2013) proponen un algoritmo de composición Landsat para Europa del Este basado en pixel para la cartografía de la cobertura, que consiste en un esquema de ponderación paramétrico para usar de manera flexible las características de cada pixel en una composición optimizada. Las 3 funciones de los parámetros de decisión que utilizaron son; 1) el año de adquisición, 2) el día del año y 3) la distancia a las nubes, con estos parámetros, se calcula una puntuación para cada observación disponible. Obtienen 3 compuestos anuales de los años 2000, 2005 y 2010, logrados con datos de ± 2 años al año correspondiente al año objetivo. Encontraron que la optimizaciónde la consistencia fenológica es más relevante que el propio año objetivo para lograr compuestos radiométricamente consistentes en ambiente templado. White et al. (2014) generan un compuesto anual del mejor pixel disponible en Canadá del año 2010, y demuestran el potencial de productos Landsat para aplicaciones de series de tiempo con 15 años de datos Landsat de 1998 a 2012 para la provincia de Saskatchewan y la isla de Terranova. Se calculó la suma de puntuaciones por pixel basado en 4 criterios: 1) Sensor, 2) día del año, 3) distancia a la nube/o sombra de nube y 4) opacidad. A su vez, proponen una terminología para distinguir 3 tipos de compuestos basados en pixeles; 1) compuesto “anual” usando datos de un sólo año), 2) compuestos “multianual o plurianual” formados por datos de varios años y 3) compuestos con valores proxy los cuales son obtenidos mediante algún cálculo por ejemplo por regresión lineal. Anaya et al. (2015), presentan un enfoque de reconstrucción de serie anual de datos MODIS para clasificar la cubierta del suelo en Colombia, que incluye regiones de cobertura de nubes frecuentes mediante la generación de mapas multianuales con árboles de decisión. Se incluyen variables auxiliares como elevación, datos de imagen radar, y precipitación. Se probó que la exactitud de los mapas aumentaba cuando se agregaron datos de ± 2 años y también agregando datos de elevación, con la integración de datos multianuales se puede hacer una mejor reconstrucción de los patrones fenológicos de las clases de vegetación. Otros autores generan compuestos con el propósito de detectar cambios (Hansen el al. 2008; Potapov et al. 2011; Potapov et al. 2012 y Hermosilla et al. 2015). Para la Cuenca del Congo, Hansen et al. (2008) presentan un método automatizado para el monitoreo sistemático de la cobertura forestal y el cambio a resolución múltiple usando imágenes Landsat 4, 5 y 7 desde 1984 hasta 2003 y productos de temperatura superficial y de reflectancia de la superficie de MODIS de 24 2000 al 2003. Para el caso de Rusia, Potapov et al. (2011), desarrollaron un método de composición plurianual para cartografiar la cobertura de bosque boreal y el cambio usando imágenes Landsat entre los años 2000 y 2005. Con datos de 1999 al 2007, auxiliándose de datos MODIS para la normalización radiométrica de los datos Landsat (al igual que Hansen et al. 2008.) y usando arboles de clasificación. Asignando un código de calidad por pixel con un enfoque preferencial de fecha, etiquetado de pixeles según su calidad para distinguir observaciones libres de nubes. Después con las observaciones candidatas por pixel se usó un enfoque del valor de la mediana de reflectancia de las bandas roja, infrarroja cercana e infrarroja media. En la creación del compuesto final se usaron los valores de mediana de banda infrarroja cercana. Se obtuvieron métricas con los valores de las bandas, así como NDVI y datos auxiliares MODIS. Se selecciona la imagen de la fecha correspondiente al valor mediano de la banda infrarroja cercana ente los pixeles candidatos con las mejores observaciones después de la aplicación de varios filtros. Para la República Democrática del Congo, Potapov et al. (2012), cuantifican la cobertura forestal y las pérdidas, durante la década 2000-2010, utilizando un conjunto de datos de series temporales Landsat y con el apoyo de datos MODIS y la implementación de un algoritmo de árbol de clasificación para la detección de cambio. Una vez más, el algoritmo de procesamiento de datos y mapeo se trata de una evolución del enfoque de Hansen et al. (2008). Evalúan la calidad por pixel, y crean compuestos plurianuales, la composición de imágenes se realizó durante dos intervalos de años de 2000 a 2005 y de 2005 a 2010, el objetivo fue seleccionar las imágenes de la temporada de crecimiento forestal y consideraron 3 periodos diferentes de días del año para los compuestos según la ubicación de los diferentes bosques. Además, se crearon 3 grupos de métricas espectrales, uno para evaluar la reflectancia en percentiles, el segundo grupo con valores medios de reflectancia para observaciones entre percentiles seleccionados, y el tercero usando pendientes de la regresión lineal de los valores de reflectancia. Hermosilla et al. (2015) presentan compuestos por mejor pixel de Canadá, con datos Landsat de 1998 y 2010, y obtienen métricas de cambio del periodo 2000 al 2010. Su objetivo fue presentar y demostrar un protocolo para generar compuestos del mejor pixel disponible, en áreas grandes sin vacíos de datos espaciales o temporales, usando “valores proxy” para caracterizar la cubierta terrestre y el cambio- retomando la propuesta de White et al. (2014). Primero identifican los cambios espectrales y posteriormente se derivan métricas para caracterizar esos cambios y finalmente se asignan los valores proxy para el llenado de datos. También valores ruidosos o anómalos son llenados con valores proxy. 25 Con todo lo desarrollado por los diferentes investigadores en torno a compuestos, es indudable el potencial que actualmente tienen las series de tiempo Landsat para la generación de cartografía, así como la identificación de cambio. De acuerdo con White et al. (2014), la composición de imágenes basada en píxeles con imágenes Landsat es un nuevo paradigma en la ciencia de la teledetección, que aplica una serie de reglas definidas por el usuario para aprovechar el amplio archivo de Landsat y generar compuestos de imagen libres de nubes, que sean consistentes fenológicamente y radiométricamente en áreas extensas. Una de las ventajas de los procesos de composición es la posibilidad de adecuar su construcción a las zonas de estudio y personalizar según los objetivos. Los compuestos basados en el mejor pixel disponible y válido tienen la particularidad de que es posible ir ajustando variables, puntuaciones, ventanas temporales, etc. (Griffiths et al. 2013). Pero es importante no olvidar que al tratarse de una fusión o integración de datos la forma en que son seleccionados pueden tener repercusiones importantes tal como lo ha demostrado (Roy, 2000) con compuestos de datos MODIS y AVHRR en dónde expone el impacto que tienen referente al incremento de contraste de bordes asociados al número de orbitas para la composición, los registros de datos faltantes y el ángulo zenital de vista e iluminación asociada, así como sus consecuencias de errores de detección de cambios. Siguiendo la terminología de White et al. (2014) en esta investigación se generan compuestos “Multi-year BAP (Best-available-pixel)”, que son compuestos multi-anual del mejor pixel disponible. Ajustando el DOY a la zona de estudio como se describe en los parámetros de cada método y temporada. La ventana temporal de los compuestos varía según los dos métodos aquí empleados, así como algunas particularidades que se detallan más adelante. Un método de compuesto es de tipo BAP y un segundo método de formación de compuestos se genera del promedio entre muestras disponibles y válidas que sean representativas a un año objetivo. 2.2.1 Parámetros empleados para los métodos Compuestos por “Promedio” y “Mejor Pixel” En esta investigación, la generación de compuestos se realizó a nivel de pixel, y se obtuvieron por dos métodos: Promedio (CP) y Mejor pixel (CMP), los parámetros generales y las ventanas de tiempo para su formación son diferentes. Ambos en su generación dan preferencia a los datos que están dentro del año objetivo (año 0), que es el año de interés o en su defecto al dato válido más cercano a este, pero dentro del rango de años permitido. En el CMP son válidos aquellos valores que entran en el rango desde 1 año anterior y hasta 1 posterior al año objetivo y en el CP son válidos desde 2 años anteriores y hasta dos años posteriores. 26 Se generaron dos compuestos por cada uno de losmétodos para cada año; uno para temporada seca y otro para la húmeda. En el CP se especificó un periodo de la temporada seca del 20 de enero al 31 de mayo (días del año 20-151) y temporada húmeda desde 4 de julio a 30 de noviembre (días del año 185-334). En el CMP, se estableció con un periodo de la temporada seca de 19 de febrero hasta 30 de mayo (días del año 50-150) y temporada húmeda de 3 de agosto a 26 de noviembre (días del año 215-330). En la figura 7 se puede ver el rango de las temporadas para cada método de generación de compuesto. Además, los CMP requieren un día del año o “DOY” específico por temporada denominados dry peak y wet peak, los cuales también se muestran en la figura 7. La construcción de los Compuestos por Promedio requiere de un rango de días por temporada más amplio, debido a que es necesario un número suficiente de muestras por pixel para poder promediar, por lo que el rango de cada temporada para los Compuestos por Promedio inicia 30 días antes, y al promediar se reduce el efecto de usar un rango más amplio de días. Por otro lado, para la construcción de los Compuestos por Mejor Pixel se acotaron las temporadas, esto es porque no se deseaba que los compuestos incluyeran pixeles de fuera de la temporada. Como consecuencia de lo anterior las temporadas del método de compuesto por Mejor Pixel inician 30 días después que las temporadas definidas para método de Compuesto por Promedio. Figura 7. Rangos de días por temporada para formación de compuestos. En color azul los días del año para las temporadas seca y húmeda del compuesto por método de Promedio y en color naranja los días del año para las temporadas seca y húmeda del compuesto por método de Mejor Pixel. Además, la ubicación del “dry peak” y “wet peak” del compuesto por Mejor Pixel. 27 Un requerimiento importante en el caso del CP es cumplir con un mínimo de 5 muestras por pixel y que a su vez cumplan con estar dentro de dos desviaciones estándar, si esto no se cumple se excluye el dato del cálculo. Cuando un dato cae fuera de dos desviaciones estándar es considerado un valor excluido para el cálculo del compuesto, excepto cuando no se logran juntar las muestras mínimas de 5 aun incrementando los años, pero si éstas son ≥ 2, serán promediadas e identificadas con otra etiqueta como muestras especiales. Tratándose de 5 años es más probable que se tenga una medición por cada temporada al año y esto favorece la formación del compuesto a nivel pixel. En la figura 8 se ejemplifica para un pixel n, como en el año 0 o año objetivo para generar el compuesto, se tienen sólo dos datos, aumentando un año anterior y posterior, las muestras incrementan a seis, pero tres de ellas son datos de tipo valor excluido, así que aún faltan otras dos para reunir el mínimo de cinco muestras, y estas sólo se logran aumentando un segundo año anterior y otro posterior. Figura 8. Aptitud de muestras para “Compuesto por método de Promedio”. Por otro lado, el método del CMP no requiere un mínimo de muestras, ya que se evalúan todos los datos disponibles dentro de las ventanas de tiempo permitido. Los compuestos por el método del Mejor Pixel se generan con base en 3 criterios a los que se asignaron factores de peso. Estos criterios y sus pesos son: 28 1) Importancia del año = 0.5 2) Importancia estacional = 0.25 3) Importancia espectral = 0.25 El criterio de la importancia del año evalúa a los pixeles que se encuentran dentro o lo más cercano posible al año objetivo, así los pixeles del año 0 tienen una asignación de uno y éste es multiplicado por el valor de 0.5 (que es el criterio de importancia del año). La importancia estacional se refiere a la cercanía con el “dry peak” o el “wet peak”, los cuales son las fechas ideales para la formación de los compuestos en temporada seca y húmeda (Figura 7). El dry peak, se especificó al 10 de abril (día 100 del año) y el wet peak para el 7 de septiembre (día 250 del año). De igual manera los pixeles que están en la posición del peak correspondiente reciben la calificación de 1 el cual se multiplica por 0.25. Estos puntos altos (dry peak y wet peak) se definieron con base en la respuesta espectral de la zona, observando los máximos NDVI en una serie de tiempo. Y el tercer criterio es la importancia espectral, que considera la calidad espectral del pixel, ya sea el valor de NDVI mas alto o el valor más bajo en la banda roja. Con esos 3 criterios, se asigna una calificación final a los pixeles candidatos y se elige al que tenga la mejor puntuación para conservar su valor en la imagen final del CMP. El puntaje máximo que puede alcanzar cada Mejor Pixel es de 1. El resumen de las parametrizaciones de los métodos empleados para la generación de compuestos se observa en la tabla 3. Tabla 3. Parámetros para la generación de compuestos por Promedio y por Mejor Pixel. Parámetros Promedio (CP) Mejor Pixel (CMP) Rango de años permitidos ±2 ±1 Rango DOY Temporada seca 20-151 50-150 Rango DOY Temporada húmeda 185-334 215-330 Mínimo de muestras 5 N/A DOY Dry peak N/A 100 DOY Wet peak N/A 250 Factores de peso N/A Año, estacionalidad y aptitud espectral DS permitidas 2 NA DOY=”Day of year”, día del año. DS= Desviaciones estándar 29 2.3 Diseño del muestreo Para la clasificación de los compuestos se diseñó un único sistema de muestreo con los dos métodos empleados (Mejor Pixel y Promedio) a fin de obtener un set de muestras para la fase de entrenamiento y otro de validación usados en todas las clasificaciones. El mapa que se usó como base para generar el de referencia fue NALCMS a 30 m, el cual se re-proyectó para trabajar todos los datos en la misma proyección que las imágenes (UTM) y posteriormente se hizo una recodificación de clases. La superficie del recorte de la zona es de 7,200 km2, de la cual la zona de mar constituía un 18.41 % del rectángulo, pero esta porción fue omitida. En cuanto a la revisión de la superficie por clase y el porcentaje respecto a la zona de estudio de pixeles con valores sin tomar en cuenta el mar, se observó que las clases de los bosques, matorrales y suelo desnudo figuraban cada uno con menos del 1% por esa razón se agregaron a la clase de “No data” para prescindir de ellos en el proceso de clasificación posterior. La recodificación y exclusión de clases quedó de la siguiente manera (tabla 4). Tabla 4. Recodificación del mapa NALCMS 2010 30 m. Código Clases Nalcms % Recodificación a 5 clases 0 Mar N/A No data 3 Bosque de latifoliadas perennifolio tropical o subtropical 0.13 No data 4 Bosque de latifoliadas caducifolio tropical o subtropical 0.08 No data 5 Bosque de latifoliadas caducifolio templado o subpolar 0.00 No data 6 Bosque mixto 0.00 No data 7 Matorral tropical o subtropical 0.25 No data 8 Matorral templado o subpolar 0.00 No data 9 Pastizal tropical o subtropical 39.07 3 14 Humedal 8.67 4 15 Suelo agrícola 44.92 5 16 Suelo desnudo 0.07 No data 17 Asentamiento humano 1.36 1 18 Cuerpo de agua 5.44 2 30 La superficie en kilómetros cuadrados y los porcentajes finales por clase del mapa de referencia prescindiendo del mar y los datos descartados se muestran en la figura 9. Clase Km2 % Pastizal tropical o subtropical 2294.90 39.28 Humedal 509.30 8.72 Suelo agrícola 2638.94 45.17 Asentamiento humano 79.82 1.37 Cuerpo de agua 319.59 5.46 Total 5842.55 100 Figura 9. Superficie por clase del mapa de referencia recodificado a 5 clases. La clase “No data” corresponde a 1357.45 Km2, incluye el mar, pequeñas porciones de bosques, matorrales y suelo desnudo, pero no se muestra en el gráfico Al unificar y recodificar las clases se obtuvo un mapa de referencia que se utilizó para la etapa de entrenamiento en el proceso de clasificación y en la etapa de validación.
Compartir