Logo Studenta

Generacion-de-compuestos-de-imagenes-LANDSAT-para-la-clasificacion-de-la-cobertura-de-suelo-en-Alvarado-Veracruz

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO 
 
Programa de Maestría y Doctorado en Geografía 
 
 
Generación de compuestos de imágenes Landsat para la Clasificación de la 
cobertura de suelo en Alvarado Veracruz 
 
 
TESIS 
que para optar por el grado de: 
MAESTRA EN GEOGRAFÍA 
 
 
 
Presenta: 
Cynthia Maryoli Versañez Vences 
 
 
Director de Tesis: 
Dr. René Roland Colditz 
Comisión Nacional para el Conocimiento y Uso de la Biodiversidad 
 
 
 
Ciudad Universitaria, Cd. Mx. enero de 2018 
 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 
 
 
Dedicada a 
 
 
 José Antonio Navarrete Pacheco 
 
 
Agradecimientos 
 
 
A la Universidad Nacional Autónoma de México y al Posgrado en Geografía por permitirme ser 
alumna de la maestría y así aprender de mis profesores y compañeros. Al Consejo Nacional de 
Ciencia y Tecnología (CONACYT) por el apoyo económico otorgado la durante la maestría. 
 
Un agradecimiento muy especial a mi asesor el Dr. René Colditz por el gran apoyo y la confianza 
que me brindó desde el primer día en la CONABIO hasta la culminación de la tesis. Por los 
consejos académicos, su ejemplo de dedicación y constancia. También por facilitarme un extenso 
número de códigos en IDL para la exploración y tratamiento de los datos Landsat. 
 
A mis revisores: Dr. Rainer Ressl, Dra. Leticia Gómez, Mtra. Ana Rosales y Dr. Stephane 
Couturier por su disposición, los comentarios y las sugerencias para mejorar la tesis. 
 
A la CONABIO por el apoyo en el desarrollo de la tesis, en especial al departamento de PR y a 
integrantes del grupo MAD-Mex (Roberto, Amaury y Erick), quienes me auxiliaron con la 
aplicación de los algoritmos de LEDAPS y Fmask a cientos de escenas Landsat. 
 
A mi amada familia: Gloria, Saturnino, Mirna, Karen y Bruno por su amor incondicional, sus 
consejos y las risas compartidas durante tantos años. 
 
A José Antonio Navarrete Pacheco por ser mi aliado, incentivándome cada día para dar mi mejor 
esfuerzo. Su amor, apoyo y paciencia fueron pieza esencial para enfrentar retos durante el 
posgrado. 
 
A Betzaida y Yetzul por la confianza brindada y la cordialidad de recibirme en su hogar en varias 
ocasiones, haciendo más confortables mis días en la Ciudad de México. 
 
A mis compañeros y amigos: Alejandra, Beatriz, Patricia, Tania, Yudisleyvis, Victoria, Iván, 
Yordan, Andrea, Juan, Inder, Edgar, Gabriela y Samantha porque además de compartirme 
material bibliográfico y conocimientos, me obsequiaron su amistad e hicieron que los dos años 
de maestría fueran muy interesantes, agradables y divertidos junto a ellos. 
Contenido 
 
 
RESUMEN .................................................................................................................................. 1 
ABSTRACT ................................................................................................................................ 2 
INTRODUCCIÓN ........................................................................................................................ 3 
HIPÓTESIS ................................................................................................................................ 4 
OBJETIVO GENERAL .................................................................................................................. 4 
OBJETIVOS ESPECÍFICOS ........................................................................................................... 4 
CAPÍTULO 1. ÁREA DE ESTUDIO Y DATOS ............................................................................ 5 
1.1 ÁREA DE ESTUDIO ................................................................................................................ 5 
1.2 DATOS ................................................................................................................................ 7 
1.2.1 Imágenes Landsat ....................................................................................................... 7 
1.2.2 Mapa de referencia ...................................................................................................... 9 
CAPÍTULO 2. MÉTODOS ......................................................................................................... 12 
2. 1 PRE-PROCESAMIENTO ....................................................................................................... 13 
2.1.1 Generación y aplicación de máscaras para excluir nubes ......................................... 14 
2.1.2 Cálculo de índices espectrales .................................................................................. 17 
a) Normalized Difference Vegetation Index (NDVI) .......................................................... 17 
b) Modified Soil Adjusted Vegetation Index 2 (MSAVI2) .................................................. 18 
c) Normalized Difference Water Index (NDWI) ................................................................ 18 
d) Normalized Difference Moisture Index (NDMI) ............................................................ 19 
2.1.3 Remoción de outliers ................................................................................................. 19 
2.2 COMPUESTOS .................................................................................................................... 22 
2.2.1 Parámetros empleados para los métodos Compuestos por “Promedio” y “Mejor Pixel”
 ........................................................................................................................................... 25 
2.3 DISEÑO DEL MUESTREO ..................................................................................................... 29 
2.4 CLASIFICACIÓN .................................................................................................................. 33 
2.5 VALIDACIÓN ....................................................................................................................... 36 
2.6 EVALUACIÓN CUALITATIVA .................................................................................................. 37 
CAPÍTULO 3. RESULTADOS ................................................................................................... 38 
3.1 DISPONIBILIDAD DE DATOS Y DATOS VÁLIDOS ....................................................................... 38 
3.2 COMPUESTOS DE IMÁGENES LANDSAT ................................................................................ 41 
3.3 CLASIFICACIÓN ANUAL DE COBERTURAS CON COMPUESTOS POR MEJOR PIXEL Y PROMEDIO 
1993-2015 MEDIANTE ÁRBOLES DE CLASIFICACIÓN.................................................................... 56 
3.3.1 EVALUACIÓN DE LA EXACTITUD DE LAS CLASIFICACIONES ANUALES CON COMPUESTOS POR 
MEJOR PIXEL Y CON COMPUESTOS POR PROMEDIO 1993-2015 ................................................. 57 
3.3.2 COMPARACIÓN DE EXACTITUDES: CLASIFICACIÓN CON COMPUESTOS POR MEJOR PIXEL VS 
CLASIFICACIÓN CON COMPUESTOS POR PROMEDIO 1993-2015 ................................................. 60 
3.3.3 COMPARACIÓN DE LAS EXACTITUDES ENTRE CLASIFICACIONES ANUALES POR MÉTODO DE 
COMPOSICIÓN .........................................................................................................................62 
3.4 EVALUACIÓN CUALITATIVA DE LAS CLASIFICACIONES CON COMPUESTOS POR PROMEDIO Y 
COMPUESTOS POR MEJOR PIXEL .............................................................................................. 65 
3.5. OTRAS CONSIDERACIONES ................................................................................................ 73 
3.5.1 Filtrado ...................................................................................................................... 73 
3.5.2 Potencial para análisis de cambio ............................................................................. 74 
CAPÍTULO 4. DISCUSIÓN ....................................................................................................... 77 
4.1 LOS COMPUESTOS OBTENIDOS ........................................................................................... 77 
4.2 LAS CLASIFICACIONES DERIVADAS DE LOS COMPUESTOS ...................................................... 80 
4.3. COMPOSICIÓN POR MEJOR PIXEL VS COMPOSICIÓN POR PROMEDIO .................................... 83 
CAPÍTULO 5. CONCLUSIONES .............................................................................................. 85 
BIBLIOGRAFÍA ........................................................................................................................ 87 
ANEXO ..................................................................................................................................... 90 
 
 
 
 
 
 
Índice de figuras 
 
Figura 1. Área de estudio ............................................................................................................ 6 
Figura 2. Zona de estudio mostrando la cobertura del suelo según NALCMS, 30m .................. 11 
Figura 3. Etapas para la generación de compuestos de imágenes Landsat, la clasificación de la 
cobertura del suelo y su validación ..................................................................................... 12 
Figura 4. Fallo del SLC. ............................................................................................................. 13 
Figura 5. Ejemplo de remoción de outliers................................................................................. 20 
Figura 6. Aplicación de máscaras de nube y remoción de ouliers ............................................. 21 
Figura 7. Rangos de días por temporada para formación de compuestos. ................................ 26 
Figura 8. Aptitud de muestras para “Compuesto por método de Promedio”. ............................. 27 
Figura 9. Superficie por clase del mapa de referencia recodificado a 5 clases. ......................... 30 
Figura 10. Mapa de referencia NALCMS 2010 a 30m, recodificado a 5 clases. ........................ 32 
Figura 11. Disponibilidad de imágenes Landsat para el área de estudio de 1985 a 2015 .......... 38 
Figura 12. Imágenes Landsat existentes por año, satélite y sensor de 1985 a 2015 ................. 39 
Figura 13. Imágenes Landsat existentes para la generación de compuestos por año y mes ..... 39 
Figura 14. Distribución de pixeles válidos en porcentaje ........................................................... 40 
Figura 15. Compuestos del año 2000. ....................................................................................... 42 
Figura 16. Compuestos del año 2003. ....................................................................................... 44 
Figura 17. Imágenes de temporada húmeda consideradas para la formación del compuesto del 
año 2010 por método de Mejor Pixel. ................................................................................. 45 
Figura 18. Total de pixeles sin valor asignado en compuestos por método y temporada. .......... 46 
Figura 19. Porcentaje de pixeles asignados a Compuestos de Mejor Pixel (CMP) por año de 
adquisición. ........................................................................................................................ 47 
Figura 20. Detalles del Compuesto por Mejor Pixel 2010 temporada húmeda (CMP 2010-th). .. 48 
Figura 21. Imágenes Landsat para CMP 1994. ......................................................................... 49 
Figura 22. Año y Día del año de los pixeles que forman los compuestos por método de Mejor 
Pixel del año 1994 de temporada seca y húmeda (CMP-ts y CMP-th). .............................. 50 
Figura 23. Calificación de los CMP del año 1994 y visualización de compuesto color de bandas 
(RGB 743). ......................................................................................................................... 51 
Figura 24. Resultados de la constitución del Compuesto por Promedio del año 1999 de 
temporada seca (CP 1999-ts). ........................................................................................... 52 
Figura 25. Año de origen de las muestras en porcentaje de superficie de Compuestos por 
Promedio (CP). .................................................................................................................. 54 
file:///C:/Users/Maryo/Desktop/Archivos_tesis/TESIS_160118.docx%23_Toc503875549
file:///C:/Users/Maryo/Desktop/Archivos_tesis/TESIS_160118.docx%23_Toc503875549
Figura 26. Número de muestras en porcentaje de superficie en Compuestos por Promedio (CP).
 ........................................................................................................................................... 55 
Figura 27. Clasificaciones de compuestos del año 2000. .......................................................... 56 
Figura 28. Exactitud global de la clasificación de compuestos por Mejor Pixel y Promedio. ...... 57 
Figura 29. Exactitudes del productor y usuario de CCMP y CCP. ............................................. 58 
Figura 30. Promedio de exactitudes de productor y usuario de Clasificaciones de Compuestos 
por Promedio y Clasificaciones de Compuestos por Mejor Pixel de 1993 a 2015. .............. 59 
Figura 31. Significancia estadística de las diferencias entre las clasificaciones de Compuestos 
por Mejor Pixel utilizando la Prueba McNemar. .................................................................. 63 
Figura 32. Significancia estadística de las diferencias entre las clasificaciones de Compuestos 
por Promedio utilizando la Prueba McNemar. .................................................................... 64 
Figura 33. Patrones de agricultura, cuerpos de agua y humedales. .......................................... 66 
Figura 34. Clasificación de asentamientos humanos. ................................................................ 67 
Figura 35. Rasgos de infraestructura urbana encontrados en las Clasificaciones. .................... 68 
Figura 36. Efectos del fallo del SLC. .......................................................................................... 69 
Figura 37. Superficie por clase de clasificaciones anuales de “Compuestos por Promedio”. ..... 71 
Figura 38. Superficie por clase de clasificaciones anuales de “Compuestos por Mejor Pixel”.... 71 
Figura 39. Clasificaciones del año 2010. ................................................................................... 72 
Figura 40. Exactitud global de las clasificaciones sin filtrar y con filtro de mayoría (kernel de 
3x3). ................................................................................................................................... 73 
Figura 41. Cambios de la superficie de los manglares en México 2010-2015 ............................ 75 
Figura 42. Coincidencias en zonas de cambio. ......................................................................... 76 
 
 
 
 
 
 
 
 
 
 
Índice de tablas 
 
Tabla 1. Principales características de las imágenes Landsat ..................................................... 7 
Tabla 2. Descripción de los bits de información para la banda 8 nombrada “lndsr.filename.hdf” 
(quality assurance). ............................................................................................................16 
Tabla 3. Parámetros para la generación de compuestos por Promedio y por Mejor Pixel. ........ 28 
Tabla 4. Recodificación del mapa NALCMS 2010 30 m. ........................................................... 29 
Tabla 5. Definición de los elementos de la matriz usados en la ecuación 6. .............................. 37 
Tabla 6. Compuestos generados por método y temporada. ...................................................... 41 
Tabla 7. Significancia estadística de la diferencia CCMP VS CCP ............................................ 61 
Tabla 8. Porcentaje de superficie según año de adquisición del mejor Pixel para Compuestos 
por Mejor Pixel (CMP) ........................................................................................................ 90 
Tabla 9. Porcentaje de superficie según año de origen de las muestras para Compuestos por 
Promedio (CP) ................................................................................................................... 91 
Tabla 10. Matrices de error y exactitudes por año (%) .............................................................. 92 
Tabla 11. Prueba McNemar por par de años. Asignaciones correctas e incorrectas Mejor pixel 
(MP) vs Promedio (P) ......................................................................................................... 98 
Tabla 12. Incremento en las exactitudes globales de las clasificaciones con aplicación de filtro 
de mayoría ......................................................................................................................... 99 
Tabla 13. Equivalencias de Día del año (DOY) ....................................................................... 100 
 
 
 
1 
 
Resumen 
 
Este estudio explora el potencial del uso de compuestos de imagen para obtener cartografía en 
el sistema lagunar de Alvarado Veracruz, empleando un enfoque semi-automatizado. El mapeo 
de la cobertura terrestre en los trópicos se ve particularmente obstaculizado por la nubosidad 
frecuente, que es aún más pronunciada en los sitios costeros, y por lo tanto la falta de datos de 
reflectancia superficial en el dominio óptico de la percepción remota. 
A pesar de la existencia de limitaciones tales como nubes o artefactos técnicos en la adquisición 
de imágenes Landsat, debido a la falla del corrector de línea de barrido de Landsat 7 desde mayo 
de 2003, fue posible producir compuestos de imagen con resultados coherentes y generar mapas 
anuales de cobertura del suelo, utilizando los datos de referencia existentes disponibles para esta 
área de estudio. 
La generación de imágenes compuestas se examinó utilizando dos métodos: "Promedio" y "Mejor 
píxel", utilizando datos del período 1985 - 2015. Para cada método, las imágenes compuestas se 
obtuvieron para las temporadas "seca" y "húmeda". Seis bandas de reflectancia de superficie de 
imágenes de Landsat y cuatro índices espectrales de ambas temporadas fueron el insumo para 
la generación de mapas anuales de cobertura de suelo mediante la clasificación supervisada de 
imágenes con el algoritmo de árboles de decisión C5.0. 
La exactitud de cada mapa temático se evaluó estadísticamente, de los cuales el más alto alcanzó 
el 80% con la posibilidad de aumentar al aplicar pasos posteriores de procesamiento, como el 
filtrado de mayoría. Además, los resultados de las exactitudes en las clasificaciones obtenidas 
por cada método y para cada año se compararon para conocer estadísticamente sus diferencias, 
utilizando la prueba Z en la exactitud global, así como la prueba de McNemar. Los resultados 
muestran que existen diferencias estadísticamente significativas entre ambos métodos de 
composición, ya que las muestras de entrenamiento y validación, así como el algoritmo de 
clasificación fueron los mismos. La composición de imágenes por el método de "Promedio" obtuvo 
mejores resultados que el del "Mejor Pixel". 
El enfoque que utiliza imágenes compuestas derivadas de imágenes Landsat en el transcurso de 
la misma temporada para el mapeo de la cubierta terrestre se consideró apropiado. Además, 
proporciona los medios para corregir artefactos de la imagen, como la falla en la corrección de la 
línea de escaneo de las imágenes Landsat 7 ETM. 
2 
 
Abstract 
 
This study explores the potential of using image composites to obtain cartography in the lagoon 
system of Alvarado Veracruz, employing a semi-automated approach. Land cover mapping in the 
tropics is particularly hampered by frequent cloud cover, which is even more pronounced in coastal 
sites, thus the lack of surface reflectance data in the optical domain of remote sensing. 
Despite the existence of limitations such as clouds or technical artifacts in the acquisition of 
Landsat images, due to the failure of the scan line corrector of Landsat 7 since May 2003, it was 
possible to produce image composites with coherent results, and to generate annual land cover 
maps using existing reference data available for this study area. 
The generation of composite images was tested using two methods: "Mean" and "Best Pixel", 
using data from the 1985 – 2015 period. For each method, composited images were obtained for 
both "dry" and "wet" seasons, separately. Six surface reflectance bands from Landsat imagery 
and four spectral indices from both seasons were the input for the generation of annual land cover 
maps using supervised image classification with the C5.0 decision trees algorithm. 
The accuracy of each thematic map was statistically assessed, of which the highest reached 80% 
with the possibility of increasing when applying post-processing steps, such as majority filtering. 
In addition, the results of accuracies in the classifications obtained by each method and for each 
year were compared to statistically test their differences, using the Z test of the overall accuracy 
and the McNemar test. The results show that there are statistically significant differences between 
both compositing methods, because the training and validation sample locations and the 
classification algorithm were the same. Compositing images by the “Mean” method obtained better 
results than “Best Pixel”. 
The approach using images composites derived from Landsat images over the course of the same 
season for land cover mapping was deemed an appropriate. In addition, it provides the means to 
correct for image artefact such as the scan-line correction failure for the Landsat 7 ETM imagery. 
 
 
3 
 
Introducción 
 
La Percepción Remota se ha convertido en uno de los principales insumos para la generación 
de cartografía en el estudio de las cubiertas del suelo. El análisis de algunas regiones de la 
superficie terrestre se complica debido a que las condiciones climáticas favorecen la presencia 
de nubosidad, lo cual limita de manera importante este tipo de investigaciones, pues en 
ocasiones se cuenta con pocas imágenes libres de nubes al año o incluso en varios años. Esta 
limitante se aplica a todos los sensores satelitales de tipo óptico ya que, al depender del sol 
como fuente de energía, la cubierta nubosa restringe enormemente la adquisición de 
información de la superficie terrestre. 
 
En este estudio se utilizaron imágenes obtenidas por la constelación Landsat, la cual ha estado 
adquiriendo información sistemáticamente de la superficie terrestre a resolución espacial media, 
desde mediados de los 70s. Adicionalmente, los productos del acervo Landsat actualmente son 
gratuitos, lo que ha facilitado el acceso a la información para estudios de la cubierta terrestre, 
entre muchas otras aplicaciones. 
La generación de mapas de la cubierta del suelo con imágenes Landsat, en la región de 
humedales en Alvarado Veracruz, se ve limitada por la presencia de nubosidad y esto es debido 
en gran parte a estar situada en la vertiente del golfo, la cual cuenta con una alta presencia de 
humedad a lo largo del año y se acentúa por procesosestacionales. Esta situación se repite en 
muchos lugares del planeta, por lo que diversos investigadores han probado metodologías que 
permitan resolver esta limitante para la adquisición de imágenes de satélite. Una de ellas es el 
uso de datos de sensores activos como el radar, otra es la creación de compuestos de 
imágenes, los cuales integran la información de datos válidos y libres de nubes mediante 
técnicas que permiten seleccionar en cada imagen los pixeles que cumplen las características 
deseadas, y a su vez compilar esa información en una nueva imagen compuesta por pixeles de 
imágenes de diferentes fechas. De esa manera, es viable formar compuestos libres de nubes, 
siempre y cuanto se cuente con datos suficientes para ello, que muestren información para un 
periodo definido y puedan ser representativos de alguna zona en específico. Estos compuestos 
pueden generarse mediante conjuntos de imágenes agrupadas en meses, años, estaciones. 
Por ello los compuestos pueden ser un insumo ideal para mapear y monitorear ecosistemas. 
 
 
4 
 
 
Hipótesis 
 
Los compuestos de imágenes Landsat permiten generar cartografía de las coberturas de suelo 
para la región del Sistema Lagunar Alvarado, Veracruz, a pesar de limitantes en los datos debido 
a las condiciones atmosféricas que generan alta nubosidad y a los artefactos técnicos en la 
adquisición. 
 
 
Objetivo General 
 
Analizar la viabilidad del uso de compuestos estacionales para clasificaciones anuales de 
coberturas de suelo en el Sistema Lagunar Alvarado para un periodo de 30 años (1985-2015). 
 
 
Objetivos específicos 
 
 Formar compuestos mediante dos métodos para la temporada húmeda y seca por cada 
año de la serie de tiempo de 30 años. 
 Generar clasificaciones anuales basadas en los compuestos obtenidos y evaluar la 
exactitud de las clasificaciones. 
 Comparar cuantitativa y cualitativamente las clasificaciones generadas. 
 
5 
 
Capítulo 1. Área de estudio y Datos 
 
1.1 Área de estudio 
 
El área de estudio está ubicada en la llanura costera del Estado de Veracruz de Ignacio de la 
Llave, en la vertiente del Golfo de México. Entre las coordenadas de latitud 18º06’N y 18º58’N, 
y 95º24’W y 96º06’W de longitud, que equivalen a las coordenadas extremas UTM: X: 
805,005m, Y: 2,101,005m para la esquina superior izquierda, y X: 880,005m, Y: 2,005,005m 
para la esquina inferior derecha, las coordenadas corresponden a la proyección UTM zona 14 
con elipsoide WGS 84 (figura 1). El área de trabajo cubre una extensión de 5874.5 km2 (sin 
incluir la porción de mar que aparece en la imagen LANDSAT). 
 
La extensión del área de estudio abarca total o parcialmente 27 municipios del estado de 
Veracruz, correspondiendo 10 de ellos al 70% de la superficie total: Alvarado, Tlacotalpan, 
Cosamaloapan de Carpio, Ignacio de la Llave, Isla, Ixmatlahuacan, Tlalixcoyan, Santiago Tuxtla, 
Chacaltianguis y Tierra Blanca (INEGI, 2017). El clima de la zona es Aw2, correspondiente a 
cálido subhúmedo, con temperatura media anual mayor a 22º C y la precipitación tiene su mayor 
concentración en los meses de verano (García y CONABIO, 1998). El área está incluida en su 
totalidad en la unidad fisiográfica conocida como Llanura Costera del Golfo de México, la cual 
se caracteriza por tener elevaciones bajas, presentando elevaciones no mayores a los 50msnm 
en el área de estudio. Estas características climáticas y geomorfológicas permiten la existencia 
de abundantes cuerpos de agua entre los que resaltan: Laguna Alvarado, Laguna Pajarillos, 
Laguna Camaronera y Laguna Popuyeca. Los ríos que destacan en la zona son: Río 
Papaloapan, Río Limón y Río Acula (INEGI, 2015). El ambiente lagunar crea las condiciones 
propicias para la presencia de abundantes manglares, predominando el mangle rojo (Rizophora 
mangle), el mangle prieto (Avicennia germinans) y el mangle blanco (Laguncularia racemosa). 
Adicionalmente existen pastizales, que constituyen más de la tercera parte de superficie de la 
zona de estudio, los cuales son dedicados a la ganadería y representan una importante presión 
a las áreas con manglar (CONABIO, 2009). 
 
La zona de estudio comprende el Sistema Lagunar de Alvarado, el cual fue designado como 
Humedal de importancia Internacional el 2 de febrero del 2004 por la Convención sobre los 
humedales RAMSAR, incluye un sitio de manglar con relevancia biológica y con necesidades 
de rehabilitación ecológica (Vázquez et al. 2009). Además, por su alta diversidad avifaunística, 
6 
 
los humedales de Alvarado son Área de Importancia para la Conservación de las Aves “AICA”., 
(CIPAMEX y CONABIO, 1999). Pertenece a una Región Terrestre Prioritaria denominada 
“Humedales del Papaloapan”. (Arriaga et al. 2000), también a la Región Hidrológica Prioritaria 
“Humedales del Papaloapan, San Vicente y San Juan” (Arriaga et al. 2002) y a la Región Marina 
Prioritaria, “Sistema lagunar de Alvarado” (Arriaga et al. 1998). 
 
 
 
Figura 1. Área de estudio 
 
7 
 
1.2 Datos 
1.2.1 Imágenes Landsat 
 
En este estudio se utilizaron imágenes Landsat 4 y 5 Thematic Mapper (TM) y Landsat 7 
Enhanced Thematic Mapper Plus (ETM+) nivel 1, desde 1985 al 2015 del path/row 024/047, las 
cuales se descargaron del acervo Landsat disponible en la página del U.S. Geological Survey 
(https://earthexplorer.usgs.gov/). Estas imágenes están caracterizadas por tener una resolución 
espacial de 30 m por pixel y una revisita de 16 días por satélite. Respecto al tamaño de la 
escena, para Landsat 4 y Landsat 5 es de 185 km X 172 km y para Landsat 7 es de 183 km X 
170km. Los productos obtenidos cuentan ya con correcciones geométrica y radiométrica, lo cual 
agiliza su uso. Otra particularidad importante del sensor Landsat es que son datos gratuitos y 
de libre acceso para la investigación científica (USGS 2017). 
 
Las características técnicas que tienen en común los sensores TM y ETM+, permiten hacer 
análisis de información en conjunto de años diferentes, para ello se usaron las 6 bandas ópticas 
de Landsat 4, 5 y 7 (bandas 1-5 y la banda 7), las cuales tienen la misma resolución temporal, 
espacial, radiométrica y espectral (tabla 1). En esta investigación no se incluyó Landsat 8 
debido a que cuenta con bandas adicionales y el acomodo de las mismas es diferente a las de 
Landsat 4, 5 Y 7, así como su resolución radiométrica y espectral, lo cual no permite sistematizar 
su uso con las imágenes de los satélites antes mencionados. 
 
 
 
 
Tabla 1. Principales características de las imágenes Landsat 
Satélite Sensor 
Resolución 
Temporal 
Resolución 
Espacial 
Tamaño de la 
escena 
Resolución 
Radiométrica 
Resolución 
Espectral (Bandas) 
Landsat 1 MSS 18 días 68 m X 83 m 185 km X 185 km 6 bit 
 4 : 0.5 - 0.6 μm (G) 
 5 : 0.6 - 0.7 μm (R) 
 6 : 0.7 - 0.8 μm (NIR) 
 7 : 0.8 - 1.1 μm (NIR) 
Landsat 2 MSS 18 días 68 m X 83 m 185 km X 185 km 6 bit 
 4 : 0.5 - 0.6 μm (G) 
 5 : 0.6 - 0.7 μm (R) 
 6 : 0.7 - 0.8 μm (NIR) 
 7 : 0.8 - 1.1 μm (NIR) 
Landsat 3 MSS 18 días 68 m X 83 m 185 km X 185 km 6 bit 
 4 : 0.5 - 0.6 μm (G) 
 5 : 0.6 - 0.7 μm (R) 
 6 : 0.7 - 0.8 μm (NIR) 
 7 : 0.8 - 1.1 μm (NIR) 
 8 : 10.4 - 12.6 μm (T) 
https://earthexplorer.usgs.gov/
8 
 
Landsat 4 
MSS 
16 días 
68 m X 83 m 185 km X 185 km 
8 bit 
 4 : 0.5 - 0.6 μm (G) 
 5 : 0.6 - 0.7 μm (R) 
 6 : 0.7 - 0.8 μm (NIR) 
 7 : 0.8 - 1.1 μm (NIR) 
TM 
30 m 
185 km X 172 km 
 1 : 0.45 - 0.52 μm (B) 
 2 : 0.52 - 0.60 μm (G) 
 3 : 0.63 - 0.69 μm (R) 
 4 : 0.76 - 0.90 μm (NIR) 
 5 : 1.55 - 1.75 μm (NIR) 
120 m 6 : 10.40 - 12.50 μm (T) 
30 m 7 : 2.08 - 2.35 μm (MIR) 
Landsat 5 
MSS 
16 días 
68 m X 83 m 185 km X 185 km 
8 bit 
 4 : 0.5 - 0.6 μm (G) 
 5 : 0.6 - 0.7 μm (R) 
 6 : 0.7 - 0.8 μm (NIR) 
 7 : 0.8 - 1.1 μm (NIR) 
TM 
30 m 
185 km X 172 km 
 1 : 0.45 - 0.52 μm (B) 
 2 : 0.52 - 0.60 μm (G) 
 3 : 0.63 - 0.69 μm (R) 
 4 : 0.76 - 0.90 μm(NIR) 
 5 : 1.55 - 1.75 μm (NIR) 
120 m 6 : 10.40 - 12.50 μm (T) 
30 m 7 : 2.08 - 2.35 μm (MIR) 
Landsat 6 
 
 
N o a l c a n z ó l a ó r b i t a o p e r a t i v a 
 
 
 
Landsat 7 ETM+ 16 días 
30 m 
183 km X 170 8 bit 
 1 : 0.45 - 0.52 μm (B) 
 2 : 0.52 - 0.60 μm (G) 
 3 : 0.63 - 0.69 μm (R) 
 4 : 0.77 - 0.90 μm (NIR) 
 5 : 1.55 - 1.75 μm (NIR) 
60 m 6 : 10.40 - 12.50 μm (T) 
30 m 7 : 2.08 - 2.35 μm (MIR) 
15 m 8 : 0.52 - 0.90 μm (P) 
Landsat 8 
OLI 
16 días 
30 m 
185 km X 180 km 12 bit 
 1 : 0.43 - 0.45 μm (UA) 
 2 : 0.45 - 0.51 μm (B) 
 3 : 0.53 - 0.59 μm (G) 
 4 : 0.64 - 0.67 μm (R) 
 5 : 0.85 - 0.88 μm (NIR) 
 6 : 1.57 - 1.65 μm (SWIR1) 
 7 : 2.11 - 2.29 μm (SWIR 2) 
15 m 8 : 0.5 - 0.68 μm (P) 
30 m 9 : 1.36 - 1.38 μm (C) 
TIRS 
100 m 10 : 10.6 - 11.19 μm (TIRS 1) 
 11 : 11.5 - 12.51 μm (TIRS 2) 
Fuente: https://landsat.gsfc.nasa.gov/a-landsat-timeline/ 
La resolución espectral”, indica el rango de longitud de onda y entre paréntesis la región a la que pertenece: UA=ultra 
azul), B=azul, G=verde, R=rojo, NIR=infrarrojo cercano, T=térmico, P=pancromática, C=cirrus, SWIR=infrarrojo de 
onda corta, TIRS=Infrarrojo térmico.. El swath para todas las imágenes Landsat 1,2,3,4, 5 y 8 es de 185 km y para 
Landsat 7 es de 183km. En la tabla no se muestra información del sistema RBV (Return Beam Vidicon) que 
pertenecen a Landsat 1, 2 y 3. 
 
 
 
 
9 
 
1.2.2 Mapa de referencia 
 
Se utilizó como información de referencia una porción del mapa de cobertura del suelo de 
América del Norte, con resolución espacial de 30 metros (NALCMS 2010 a 30m) generado como 
parte del proyecto del Sistema de Monitoreo del Cambio en la Cobertura de Suelo de América 
del Norte, o “North American Land Change Monitoring System” (NALCMS). NALCMS 2010 a 
30m se publicó de forma oficial a finales del año 2017. Para este estudio de obtuvo una versión 
preliminar a su publicación proporcionada por la CONABIO. 
 
NALCMS es una iniciativa de colaboración cartográfica trinacional entre los gobiernos de 
Canadá, Estados Unidos y México (Latifovic et al. 2012). Las instituciones involucradas para el 
caso de México son el Instituto Nacional de Estadística y Geografía (INEGI), la Comisión 
Nacional para el Conocimiento y Uso de la Biodiversidad (CONABIO) y la Comisión Nacional 
Forestal (CONAFOR). La cartografía que generan en conjunto los 3 países tiene resolución 
espacial de 250m y 30m, se obtiene con procesos, insumos y leyenda estandarizados (Latifovic 
et al. 2012 y Colditz et al. 2014). 
 
NALCMS 2010 a 30m utiliza información del programa “Monitoring Activity Data for the Mexican 
REDD+”, mejor conocido como MAD-MEX para el mapeo automático de la cobertura terrestre. 
A continuación, se enlistan algunas características consideradas relevantes para la obtención 
de la cartografía del sistema MAD-MEX: 
 El principal objetivo del sistema MAD-MEX es elaborar productos estandarizados de la 
cobertura del suelo, de una manera oportuna y transparente, con una determinada 
exactitud de clasificación, y servirá como el principal producto base para la posterior 
interpretación (visual) y mejoramiento de la asignación de las clases de cobertura del 
suelo. Los autores consideran a este como el único método viable para realizar, de 
manera frecuente, la actualización de la cartografía de las cubiertas del suelo a una 
escala de producción de 1:100,000. Para lo anterior se utilizaron todas las imágenes 
Landsat TM y ETM+ disponibles para el territorio mexicano, y se utilizó un enfoque 
orientado en objetos “mapa-a-imagen”, es decir que se utilizó la cartografía existente con 
alta resolución temática, para entrenar al clasificador. Se generaron “objetos” mediante 
la segmentación de las imágenes, y se extrajeron características de éstos mediante el 
cálculo de métricas multi-temporales por objeto. Posteriormente, se realizó la 
clasificación de los objetos mediante el uso de árboles de decisión, y finalmente se hacer 
10 
 
la agregación pertinente de clases, y la validación del producto se realiza con un 
inventario independiente de datos de campo (Gebhardt et al. 2014). 
 El pre-procesamiento de MAD-MEX de las imágenes incluyó el uso de LEDAPS para 
calibrar cada imagen a la reflectancia en el techo de la atmósfera y reflectancia de la 
superficie, y el algoritmo FMASK para crear las máscaras de nubes, sombras, agua y 
no-data. Además, se calcularon métricas para cada objeto, derivadas tanto de los datos 
de series de tiempo de NDVI, así como de los datos de elevación obtenidos del Continuo 
Nacional de Elevaciones, generado por el INEGI. 
 La información de referencia que usó MAD-MEX fue derivada de la Serie II (1993-1999), 
Serie III (2002-2004) y Serie IV (2005-2007) de Uso de suelo y Vegetación (USV) 
generadas por el Instituto Nacional de Estadística y Geografía (INEGI). Para generar el 
mapa de referencia se hizo un análisis de persistencia, el cual consistió en intersectar 
los mapas de las series II, III y IV, para mantener sólo la información de las clases que 
se mantuvieron constantes en las tres bases, y posteriormente eliminar de la información 
restante los outliers, que en este caso es información excluida mediante una técnica 
conocida como recorte iterativo del histograma o “iterative histogram trimming”, cuyo 
enfoque se considera como adecuado para producir elementos de imagen “puros”, como 
base para el entrenamiento de una clasificación (Gebhardt et al, 2014). La información 
utilizada para la validación de la exactitud de los productos fue tomada de diferentes 
inventarios nacionales de muestras (CONAFOR, COLPOS, SRA, INEGI). 
 En la etapa de clasificación, MAD-MEX utiliza para el entrenamiento del clasificador la 
información restante después de la remoción de los outliers, y se aplicaron algoritmos 
de clasificación supervisada por árboles de decisión C5.0. Una vez obtenida la 
clasificación, esta se convirtió a formato raster con un tamaño de pixel de 30m, y los 
objetos que no superaron el umbral de la unidad mínima cartografiable (UMC) de 4 
hectáreas fueron removidos por generalización. 
 
El principal insumo para la obtención del NALCMS 2010 A 30 m fue el producto MAD-MEX 
versión 4.3 (Gebhardt et al. 2014) generado por la CONABIO en colaboración con el INEGI y 
CONAFOR. El producto MAD-MEX fue editado para corregir errores como inconsistencias entre 
bordes; eliminación de píxeles aislados, corrección de áreas clasificadas erróneamente, los 
efectos debidos al fallo del Scan Line corrector (SLC) entre otros, a fin de mejorar el producto 
ajustando las clases a las establecidas en NALCMS (Llamas y Colditz 2017). 
 
11 
 
La figura 2 muestra el extracto del mapa NALCMS 2010 para el área de estudio de esta 
investigación, el cual tiene un tamaño de pixel de 30m y está re-proyectado a UTM. Las clases 
que sobresalen en cuanto a extensión son Suelo agrícola con 44.92%, Pastizal con 39.07%, 
Humedal con 8.67%, Cuerpo de agua con 5.44 y Asentamientos con 1.35 %. Nótese que estos 
porcentajes fueron calculados sin tomar en cuenta el área ocupada por el mar. 
 
 
Figura 2. Zona de estudio mostrando la cobertura del suelo según NALCMS, 30m 
12 
 
Capítulo 2. Métodos 
 
Este capítulo comprende 6 secciones (figura 3); la primera es sobre el pre-procesamiento de las 
imágenes Landsat, enfocado al tratamiento que se les aplicó a las imágenes antes de la creación 
de los compuestos. La segunda es la generación de compuestos por dos métodos, llamados 
“Mejor Pixel” y “Promedio”. La tercera corresponde al diseño del muestreo, tanto para la 
clasificación como para la validación. La cuarta es el proceso de clasificación mediante árboles 
de decisión. La quinta es la validación de resultados y la comparación de los mismos mediante 
pruebas estadísticas Z y McNemar. Por último, la sextaes la evaluación cualitativa de los 
resultados de las clasificaciones anuales. 
 
 Pre-procesamiento Compuestos 
 
 
 
 
 
 
 
 Diseño del Muestreo Clasificación 
 
 
 
 
 
 
 Validación Evaluación cualitativa 
 
 
 
 
 
 
Imágenes Landsat 4, 5 y 7 
QA (Banda 8) 
Remoción 
de outliers 
 
Fmask 
Creación y aplicación de máscaras 
LEDAPS 
Compuesto 
Mejor pixel 
(CMP) 
Temporada Seca 
+ Temporada 
húmeda 
Compuesto 
Promedio 
(CP) 
Temporada Seca 
+ Temporada 
húmeda 
Árbol de clasificación 
con C5.0/See5 
Classifier.sav 
Clasificación por 
año con CMP 
(CCMP) 
 
Clasificación por 
año con CP 
(CCP) 
500 muestras para 
validación 
(100 por clase) 
5000 muestras de 
entrenamiento (500 por 
clase y 2500 distribuidas 
por proporción de área) 
Mapa de 
Referencia 
(NALCMS 
2010 30 m) 
 
Recodificación 
a 5 clases 
Evaluación de exactitud CCP y CCMP 
Matriz de 
error 
Exactitud global 
Prueba McNemar 
Prueba Z 
Comparación de 
las exactitudes 
Similitud 
espectral 
Compilación 
imágenes Landsat 
por año 
Bandas 1 a 5 y 7) 
 e índices (NDVI, 
MSAVI2, NDWI y 
NDMI) 
Índices 
espectrales 
Área por clase 
Ejemplos de patrones 
espaciales de coberturas 
Figura 3. Etapas para la generación de compuestos de imágenes Landsat, la clasificación 
de la cobertura del suelo y su validación 
13 
 
2. 1 Pre-procesamiento 
 
Para el pre-procesamiento, se descargaron todas las imágenes Landsat TM y ETM+ disponibles 
para el periodo 1985-2015 de la página del U.S. Geological Survey 
(https://earthexplorer.usgs.gov/), y se calculó la cantidad de imágenes que deberían existir en 
el acervo si los sensores produjeran las imágenes con la regularidad con que fueron 
programados (cada 16 días), esto calculando el total de días desde el lanzamiento e inicio de 
funcionamiento de los mismos hasta el final de operación, dentro del periodo antes definido. 
 
El conjunto de imágenes Landsat descargado de 1985 a 2015, fue organizado por años, y se 
recortaron las imágenes ajustando a las coordenadas extremas X=805,005, Y=2,101,005 y 
X=880,005, Y=2,005,005, el tamaño del pixel se conservó en 30m, y se descartaron las 
imágenes que estaban totalmente cubiertas de nubes. A las que no tenían nubosidad o incluso 
con pequeñas zonas despejadas, se les distinguió como “imágenes usables”. 
 
Las imágenes Landsat 7 a partir de mayo 2003 presentan un efecto de bandeado conocido 
como “gaps” que son franjas de datos inválidos causados por el fallo del instrumento SLC (Scan 
Line Corrector), estas franjas aparecen en patrones de zigzag que son más pronunciados en 
los bordes de las escenas, los cuales representan aproximadamente un 22 % de pérdida de 
datos por escena, pero el efecto de bandeado es diferente en cada una de ellas. En la figura 4A 
se puede ver el escaneo de líneas antes y después del fallo de instrumento SLC y en la figura 
4B se observa un ejemplo del efecto del bandeado producido por el fallo del SLC en zona de 
manglares de Alvarado, Veracruz. 
 
 
A B 
Figura 4. Fallo del SLC. (A) Barrido con y sin SLC (Fuente: https://landsat.usgs.gov/slc-products-
background) y (B) Efecto del fallo del SLC en imagen Landsat 7 de 18 de octubre del 2006. 
https://earthexplorer.usgs.gov/)
https://landsat.usgs.gov/slc-products-background
https://landsat.usgs.gov/slc-products-background
14 
 
A las imágenes usables se les aplicaron dos filtros importantes para remover nubes, sombras 
de nubes y datos afectados por el fallo del SLC. El primer filtro consistió en la generación de 
máscaras con el código LEDAPS y el algoritmo Fmask que se explican en la sección 2.1.1 y, el 
segundo en la remoción de outliers (pixeles con valores anómalos), basándose en la respuesta 
de reflectancia de los pixeles a través de una serie de tiempo (sección 2.1.3) y auxiliándose de 
4 índices espectrales: Normalized Difference Vegetation Index, Modified Soil Adjusted 
Vegetation Index, Normalized Difference Water Index y Normalized Difference Moisture Index 
los cuales se exponen en la sección 2.1.2. 
 
 
2.1.1 Generación y aplicación de máscaras para excluir nubes 
 
La identificación y eliminación de datos con nubes, sus sombras y los gaps o bandeado, que se 
deben a los artefactos de Landsat 7, es un paso indispensable antes del análisis de series de 
tiempo y formación de compuestos de imágenes. Para eliminar esas zonas o elementos, 
investigadores han aplicado diferentes estrategias: Kennedy et al. (2010), para enmascarar 
nubes, humo, nieve y proyección de sombras, emplearon una estrategia basada en contrastar 
cada imagen en la serie de tiempo con una sola imagen de referencia, auxiliándose con los 
elementos de la transformada Tasseled-cap o también conocida como Kauth-Thomas, 
aumentado y disminuyendo las componentes de brillo, verdor y humedad. Por otro lado, Potapov 
et al. (2011) usaron el algoritmo de clasificación y árbol de regresión (CART) (Breiman et al. 
1984) como herramienta principal para el procesamiento previo de datos para enmascarar 
nubes y sombras. Roy et al. (2010), utilizan el código Automatic Cloud Cover Assessment 
Algorithm (ACCA) para generar máscaras, además de árboles de clasificación para definir 
pixeles como “no nublados”, “nublados” y “adyacentes a pixeles turbios”. Griffiths et al. (2013) 
y White et al. (2014), emplean el algoritmo Fmask para enmascarar nubes y sombras de nubes. 
 
En este estudio, uno de los primeros procesamientos que se aplicaron a las imágenes de satélite 
es el que se conoce como Landsat Surface Reflectance Quality Assurance Extraction o 
“Extracción de Garantía de Calidad para Reflectancia de Superficie de Landsat” (QA), el cual se 
originó por el interés de producir Registros de Datos Climáticos o CDRs por sus siglas en inglés, 
los cuales se pueden extraer de las imágenes Landsat adquiridas a partir de 1984 al presente. 
El primero de dichos registros en desarrollarse fue el LSRP (Landsat Surface Reflectance 
Product), este producto incluye información de calidad de datos en una estructura empacada en 
15 
 
ciertos bits de información de productos derivados de la reflectancia superficial de la imagen. 
Dicha información no es accesible con los programas convencionales de procesamiento de 
datos de teledetección, ni tampoco con los Sistemas de Información Geográfica (SIGs), por lo 
que es necesario realizar un post-procesamiento a las imágenes para poder hacer accesible 
esta información de calidad a los paquetes antes mencionados (Jones et al. 2013). La extracción 
de la información de la reflectancia superficial y otros atributos se lleva a cabo mediante la 
utilización del código LEDAPS (Landsat Ecosystem Disturbance Adaptive Processing System, 
Masek et al. 2006). Una vez extraída la información de reflectancia superficial y asociados, estos 
se almacena en la Banda 8 (lndsr_QA) de cada respectiva escena en formato HDF (Hierarchical 
Data Format), el cual ya es accesible a múltiples paquetes que utilizan información espacial 
existente, como son los datos MODIS de los instrumentos Aqua y Terra. No obstante, aún no 
se puede acceder a la información de calidad pues ésta viene empacada en código binario, por 
lo que aún es necesario aplicar un procesamiento más. La herramienta LDOPE (Land Data 
Operational Product Evaluation) originalmente fue diseñada para procesar información MODIS 
(Roy et al. 2002), sin embargo, al estar la Banda 8 de Landsat en el mismo formato que los 
datos MODIS, se puede utilizar de igual manera para desempacar la información de calidad y 
finalmente obtener los valores que muestran la tabla 2, entre los cuales se encuentran los que 
permitirán crear máscaras para remover pixeles con presencia de nubes y presencia de sombra 
de nubes, entreotros elementos (Jones et al. 2013). La tabla 2, describe los parámetros que se 
miden en cada uno de los bits extraídos de la imagen. (USGS, 2013). La última columna indica 
la selección propia de parámetros usados en la primer mascara generada basada en la capa de 
Calidad (QA). Con el procesamiento antes descrito se obtuvo una máscara para cada imagen 
Landsat, en la que se indicaban los pixeles en los que había nubes y sombras de nubes. 
 
La segunda máscara de nubes se obtuvo por Fmask (Zhu y Woodcock, 2012), el cual es un 
algoritmo utilizado para la detección de nubes y sus sombras en las imágenes Landsat, ésta 
técnica la han empleado diferentes investigadores (Griffiths et al. 2013; White et al. 2014 y 
Hermosilla et al. 2015). Los insumos de este método son el producto de reflectancia en el techo 
de la atmósfera de Landsat (TOA) y el brillo de la temperatura (TB). El primer cálculo en Fmask 
consiste en usar reglas basadas en propiedades físicas de las nubes para separar pixeles con 
potencial de ser ocupados por nubes (Potential Cloud Pixels o PCPs) de los que representan 
pixeles sin nubes. A continuación, se calculan probabilidades de temperatura normalizada, 
variabilidad espectral y brillo, y son combinadas para producir una máscara de probabilidad para 
nubes sobre tierra y sobre agua de manera separada. Entonces, los PCPs y la máscara de 
16 
 
probabilidad de nubes son utilizadas de manera conjunta para producir la capa de información 
que exprese el potencial de nubes. Para un conjunto de datos de referencia utilizados para 
validar Fmask de manera global, este método tiene una exactitud de hasta 96.4% (Zhu y 
Woodcock, 2012). 
 
Tabla 2. Descripción de los bits de información para la banda 8 nombrada “lndsr.filename.hdf” (quality 
assurance). 
No de 
bit 
Nombre del parámetro Interpretación valor 
0 
Interpretación valor 
1 
Selección 
0 Unused --- --- 
1 Valid data yes no 
2 ACCA-based cloud mask clear cloudy 
3 Unused --- --- 
4 ACCA-based snow mask snow absent snow present 
5 DEM-based land/water mask water land 
6 Dense dark vegetation (DDV) DDV absent DDV present 
7 Unused --- --- 
8 Surface reflectance-based cloud mask clear cloudy X 
9 Cloud shadow mask cloud shadow absent cloud shadow present X 
10 Surface reflectance-based snow mask snow absent snow present X 
11 Spectral test-based land/water mask water land 
12 Adjacent cloud adjacent cloud absent adjacent cloud present X 
13 Unused --- --- 
14 Unused --- --- 
15 Unused --- --- 
Fuente: Jones et al. 2013. 
 
 
Al tener las máscaras Fmask y la generada con la banda de calidad (banda 8), éstas se 
combinaron con la regla “o” (or) para posteriormente utilizarlas a fin de eliminar esos pixeles que 
contenían nubes, sombras de nubes, y efectos de “gaps” (huecos) detectados en cada una de 
ellas, y el valor de relleno para los datos removidos fue de 20,000 para facilitar su identificación 
y remoción al estar fuera del rango de datos válidos. 
 
17 
 
2.1.2 Cálculo de índices espectrales 
 
Para la identificación de algunas cubiertas del suelo es conveniente calcular índices espectrales, 
los cuales permiten reconocer objetos en la superficie terrestre de acuerdo a su comportamiento 
espectral/radiométrico diferenciado. 
 
En este estudio se calcularon cuatro índices espectrales: Los dos primeros son Normalized 
Difference Vegetation Index (NDVI) y Modified Soil Adjusted Vegetation Index 2 (MSAVI2), 
enfocados al estudio de la vegetación (ecuaciones 1 y 2). Es conveniente el cálculo de índices 
de vegetación, ya que la información espectral contenida en una sola banda no es suficiente 
para caracterizar y estudiar la vegetación. Es por eso que se realizan operaciones entre bandas, 
pues la respuesta espectral característica de la vegetación en ciertas regiones del espectro 
electromagnético permite que mediante cálculos entre bandas se obtengan productos que 
faciliten su estudio. Por otro lado, debido a la presencia de cuerpos de agua y humedales, se 
optó por calcular un índice que ayudara a delimitar las zonas con agua mediante el Normalized 
Difference Water Index (NDWI) (ecuación 3). Y por último el Normalized Difference Moisture 
Index (NDMI) que auxilia en la estimación del contenido de humedad de la vegetación (ecuación 
4). 
 
a) Normalized Difference Vegetation Index (NDVI) 
 
El NDVI o índice de vegetación de diferencia normalizada, es un índice extensivamente utilizado 
para el estudio de múltiples características de la vegetación, es derivado a partir del cociente 
calculado de las bandas ubicadas en el rojo e infrarrojo cercano, y brinda una estimación de la 
vegetación midiendo la reflectancia a nivel de pixel (Lunneta et al. 2006). Su fórmula es: 
𝑁𝐷𝑉𝐼 =
𝑁𝐼𝑅−𝑅𝐸𝐷
𝑁𝐼𝑅+𝑅𝐸𝐷
 (1) 
 
Donde NIR es la banda con información de reflectancia del infrarrojo cercano y RED la banda 
con información de reflectancia del Rojo. Las bandas de Landsat de los sensores TM y ETM+ 
que se usaron para el cálculo de este índice fueron 4 y 3 respectivamente. 
 
 
18 
 
b) Modified Soil Adjusted Vegetation Index 2 (MSAVI2) 
 
La segunda modificación al índice de vegetación ajustado al suelo (MSAVI2) trata de minimizar 
la influencia del brillo del suelo en la lectura de información espectral de vegetación. El índice 
SAVI original trata de hacer esto, ya sea estableciendo una línea que caracterice el brillo del 
suelo o mediante un parámetro de ajuste del suelo. Este parámetro depende de la cantidad 
(densidad) de vegetación y suelo, y se determina empíricamente, aunque también puede 
medirse o modelarse (Huete 1988; Gao et al. 2000). Con respecto al MSAVI2, este elimina la 
necesidad de encontrar la línea del suelo a partir del feature space o incluso especificar el factor 
de corrección para el brillo del suelo. Este índice fue desarrollado por Qi et al. (1994) obteniendo 
la siguiente fórmula: 
 
𝑀𝑆𝐴𝑉𝐼2 =
2∗𝑁𝐼𝑅+1−√(2∗𝑁𝐼𝑅+1)2−8∗(𝑁𝐼𝑅−𝑅𝐸𝐷)
2
 ( 2 ) 
 
Para obtener este índice se usaron las bandas 3 y 4 de los sensores TM y ETM+. 
 
c) Normalized Difference Water Index (NDWI) 
 
El índice para agua de diferencia normalizada surge de la necesidad de estudiar los cuerpos de 
agua de manera independiente de las otras cubiertas que los rodean; anteriormente se ha 
utilizado la banda infrarroja para poder hacer la delineación de dichas cubiertas, sin embargo, 
este método confina las otras cubiertas (no-agua), pero no las elimina, por lo que su presencia 
aún es fuente de ruido en el estudio de los cuerpos de agua y sus características (turbidez, 
corrientes, calidad del agua, materia en suspensión etc.). El NDWI elimina todos los rasgos de 
las cubiertas que no son agua, permitiendo así el estudio más enfocado en los cuerpos de agua 
y sus características (McFeeters, 1996). La fórmula para calcular el NDWI es: 
𝑁𝐷𝑊𝐼 =
𝐺𝑅𝐸𝐸𝑁−𝑁𝐼𝑅
𝐺𝑅𝐸𝐸𝑁+𝑁𝐼𝑅
 ( 3 ) 
 
Donde GREEN es la banda que captura reflectancia en la porción verde del espectro 
electromagnético y NIR se refiere a la porción del infrarrojo cercano. 
Este índice se calculó con las bandas 2 y 4 de los sensores TM y ETM+. 
19 
 
d) Normalized Difference Moisture Index (NDMI) 
 
Aun cuando la palabra humedad está contenida en el nombre de este índice, Wilson y Sader 
(2002) afirman que el término se utiliza y sigue siendo utilizado por no contar con uno mejor. Al 
utilizar la banda del infrarrojo medio permite una mayor absorción de la longitud de onda del 
agua, la diferencia entre la banda del infrarrojo medio y la del infrarrojo cercano se considera 
que es debida a la absorción de agua por las hojas (Wilson y Sader, 2002). La fórmula para su 
cálculo es la siguiente: 
 
𝑁𝐷𝑀𝐼 =
(𝑁𝐼𝑅)−(𝑆𝑊𝐼𝑅1)
(𝑁𝐼𝑅)+(𝑆𝑊𝐼𝑅1)
 ( 4 ) 
 
Para el cálculo de este índice se usaron las bandas 4 y 5 de los sensores TM y ETM+. 
 
Además de ayudar a caracterizarciertos objetos en el terreno, los índices espectrales son muy 
útiles en estudios de series de tiempo pues permiten observar el comportamiento de un pixel en 
un rango de tiempo, aunado a eso permiten identificar datos inválidos o que no son de interés 
para esta investigación. Estos 4 índices se calcularon y usaron en la etapa de remoción de 
outliers y también para la generación de compuestos. 
 
2.1.3 Remoción de outliers 
 
Se presentaron casos en que las máscaras de nubes, sombras de nubes y datos no válidos, no 
fueron suficientes para eliminar pixeles que los contenían, debido a ello se hizo una remoción 
adicional de pixeles conocidos como outliers o datos atípicos. El proceso para eliminar outliers, 
consistió en identificar aquellos valores de pixel que no seguían un trayecto espectral común al 
del resto mediante el uso de una serie temporal de promedios. 
 
Se prepararon carpetas con los 4 índices espectrales (NDVI, MSAVI2, NDWI y NDMI) y 6 
bandas ópticas por cada fecha. Calculando el trayecto espectral de cada pixel en los diferentes 
índices y bandas, se indicaba cada que un valor se reconocía como outlier. Al ubicar los pixeles 
candidatos a ser outlier, se especificó una frecuencia en el que la suma de bandas e índices 
que han indicado que el pixel es un outlier sea de al menos 5. Es decir que, en aquel stack, o 
conjunto de bandas e índices, donde 5 veces o más se identificara un outlier, indica que el pixel 
20 
 
se contabilizaría como no válido y se eliminará en esa fecha. También se incluyó una regla como 
excepción de eliminación de outliers y esta consistió en no eliminar aquellos candidatos a 
outliers que se encontraban continuos cuando estos eran un conjunto de 3 pixeles o más, los 
cuales podrían deberse a una zona de cambio y no a valores atípicos. La figura 5A, muestra los 
promedios anuales de NDVI de un pixel de manglar para el periodo 1985-2015, el cual está 
ubicado entre la laguna Pajarillos y la laguna de Alvarado (columna 1029 y fila 982). En la figura 
5B, el mismo pixel con el cálculo de promedios de NDVI, pero sin los outliers. 
 
 
 
 
 Día del año 
 A 
 
 
 
Año 
 
 
 Día del año 
 B 
Figura 5. Ejemplo de remoción de outliers. (A) Promedios anuales de NDVI de un pixel de manglar y 
(B) Promedios anuales de NDVI de un pixel de manglar sin outliers. Las líneas negras son los promedios 
mensuales de NDVI, los años están representados por colores, de lado izquierdo la paleta de equivalencias. 
V
a
lo
r 
d
ig
it
a
l 
N
D
V
I 
V
a
lo
r 
d
ig
it
a
l 
N
D
V
I 
21 
 
 
Un ejemplo de la remoción de pixeles con nubes y sombras se observa en una porción de la 
imagen Landsat 5 del 22 de junio del 2001, al este de la localidad de Amatitlán Veracruz, que 
corresponde a una escena con nubes en un compuesto RGB 743. La figura 6A es la imagen 
Landsat original, la figura 6B es la máscara binaria combinada en color gris, generada para 
cubrir nubes y sombras principalmente con la Banda 8 y Fmask, en ella se observa que algunas 
sombras de nubes no se enmascararon, por lo cual en la figura 6C) se muestra en color amarillo 
aquellos pixeles identificados como outliers los cuales se eliminaron por similitud espectral. Con 
esos dos procesos de remoción de datos no válidos, los pixeles de la imagen libres de nubes, 
sombras de nubes y datos erróneos por el efecto del fallo SLC, pueden ser usados en la 
generación de compuestos. Cada pixel sin valor debido al enmascaramiento de nubes, 
sombras de nubes y bandeado, así como por la remoción de outliers fue rellenado con el valor 
20,000. 
 
 
 
 
A 
 
B 
 
C 
Figura 6. Aplicación de máscaras de nube y remoción de ouliers. (A) Imagen original Landsat 5 del 22 
de junio del 2001, fecha en la que en esa zona hay nubes presentes y sus sombras, (B) Aplicación de 
máscaras de nubes y sombras de nubes marcadas en color gris y (C) Remoción de outliers señalados en 
color amarillo. 
 
 
 
 
22 
 
 
2.2 Compuestos 
 
Los procedimientos para obtener compuestos de imagen (composite en inglés), se aplican a 
series temporales de datos de imágenes que son geométricamente correctos, con el objetivo de 
producir un único conjunto de datos que sea representativo (Wolfe et al. 1998.) En la generación 
de compuestos, existe una selección de pixeles de diferentes imágenes en diferentes fechas 
cumpliendo criterios definidos. (Roy et al. 2000). Inicialmente los compuestos se formaban para 
estudios globales con datos de sensores de órbita polar de amplio campo de visión, cuya 
resolución se considera gruesa como AVHRR y después con datos MODIS (Wolfe et al. 1998) ya 
que la resolución temporal de estas fuentes de teledetección permitía seleccionar entre un gran 
conjunto de datos, a diferencia de imágenes satelitales de alta resolución espacial que son poco 
accesibles y costosas. 
 
Con la implementación del libre acceso a los datos Landsat en 2008, varios investigadores han 
estudiado la cobertura de la superficie terrestre mediante series temporales, empleando los 
principios de la formación de compuestos desarrollados con MODIS y AVHRR, para el estudio y 
mapeo de la superficie terrestre a una escala más fina. Esto se ha logrado adecuando la 
metodología a la utilización de información de diferentes sensores o implementando algoritmos 
para la identificación de cambios, como por ejemplo perturbaciones forestales o incendios (Huang 
et al. 2010 y Kennedy et al. 2010). Huang et al. (2010), exponen un enfoque automatizado con 
series de tiempo Landsat en el que proponen el algoritmo VCT (Vegetation Change Tracker) para 
analizar disturbios forestales en diferentes sitios de Estados Unidos, demostrando que es capaz 
de detectar la mayoría de los eventos de perturbación como fuego o incluso tala selectiva con 
intervalo temporal bienal desde 1984 a 2006. Por otro lado, para el noroeste del Pacífico de 
Estados Unidos también a partir de series temporales Landsat, Kennedy et al. (2010), presentan 
un enfoque para extraer las trayectorias espectrales de cambios de la superficie terrestre, como 
perturbación/recuperación de bosques, esto con el desarrollo de un algoritmo llamado 
LandTrendr (Landsat-based detection of Trends in Disturbance and Recovery) con imágenes 
Landsat de julio y agosto desde 1985 hasta 2007, cuya estrategia fue la segmentación temporal 
de trayectorias espectrales para la producción de mapas de cambio basado en el análisis de 
tendencias de reflectancia. 
Algunas propuestas que presentan investigadores para la formación de compuestos con diversas 
técnicas son Roy et al. (2010); Griffiths et al. (2013); White et al. (2014); Anaya et al. (2015). La 
23 
 
integración de compuestos Landsat de tipo mensual, estacional y anual para Estados Unidos con 
datos de diciembre 2007 a noviembre 2008, son expuestos por Roy et al. (2010), también con un 
enfoque de procesamiento automatizado, cuyos criterios de composición se enfocaron en la 
selección de observaciones de superficie válidas con mínimo de nubes, nieve y contaminación 
atmosférica incorporando diversos criterios preferenciales como Máximo NDVI o temperatura 
máxima de brillo. Por su parte, Griffiths et al. (2013) proponen un algoritmo de composición 
Landsat para Europa del Este basado en pixel para la cartografía de la cobertura, que consiste 
en un esquema de ponderación paramétrico para usar de manera flexible las características de 
cada pixel en una composición optimizada. Las 3 funciones de los parámetros de decisión que 
utilizaron son; 1) el año de adquisición, 2) el día del año y 3) la distancia a las nubes, con estos 
parámetros, se calcula una puntuación para cada observación disponible. Obtienen 3 compuestos 
anuales de los años 2000, 2005 y 2010, logrados con datos de ± 2 años al año correspondiente 
al año objetivo. Encontraron que la optimizaciónde la consistencia fenológica es más relevante 
que el propio año objetivo para lograr compuestos radiométricamente consistentes en ambiente 
templado. White et al. (2014) generan un compuesto anual del mejor pixel disponible en Canadá 
del año 2010, y demuestran el potencial de productos Landsat para aplicaciones de series de 
tiempo con 15 años de datos Landsat de 1998 a 2012 para la provincia de Saskatchewan y la isla 
de Terranova. Se calculó la suma de puntuaciones por pixel basado en 4 criterios: 1) Sensor, 2) 
día del año, 3) distancia a la nube/o sombra de nube y 4) opacidad. A su vez, proponen una 
terminología para distinguir 3 tipos de compuestos basados en pixeles; 1) compuesto “anual” 
usando datos de un sólo año), 2) compuestos “multianual o plurianual” formados por datos de 
varios años y 3) compuestos con valores proxy los cuales son obtenidos mediante algún cálculo 
por ejemplo por regresión lineal. Anaya et al. (2015), presentan un enfoque de reconstrucción de 
serie anual de datos MODIS para clasificar la cubierta del suelo en Colombia, que incluye 
regiones de cobertura de nubes frecuentes mediante la generación de mapas multianuales con 
árboles de decisión. Se incluyen variables auxiliares como elevación, datos de imagen radar, y 
precipitación. Se probó que la exactitud de los mapas aumentaba cuando se agregaron datos de 
± 2 años y también agregando datos de elevación, con la integración de datos multianuales se 
puede hacer una mejor reconstrucción de los patrones fenológicos de las clases de vegetación. 
Otros autores generan compuestos con el propósito de detectar cambios (Hansen el al. 2008; 
Potapov et al. 2011; Potapov et al. 2012 y Hermosilla et al. 2015). Para la Cuenca del Congo, 
Hansen et al. (2008) presentan un método automatizado para el monitoreo sistemático de la 
cobertura forestal y el cambio a resolución múltiple usando imágenes Landsat 4, 5 y 7 desde 1984 
hasta 2003 y productos de temperatura superficial y de reflectancia de la superficie de MODIS de 
24 
 
2000 al 2003. Para el caso de Rusia, Potapov et al. (2011), desarrollaron un método de 
composición plurianual para cartografiar la cobertura de bosque boreal y el cambio usando 
imágenes Landsat entre los años 2000 y 2005. Con datos de 1999 al 2007, auxiliándose de datos 
MODIS para la normalización radiométrica de los datos Landsat (al igual que Hansen et al. 2008.) 
y usando arboles de clasificación. Asignando un código de calidad por pixel con un enfoque 
preferencial de fecha, etiquetado de pixeles según su calidad para distinguir observaciones libres 
de nubes. Después con las observaciones candidatas por pixel se usó un enfoque del valor de la 
mediana de reflectancia de las bandas roja, infrarroja cercana e infrarroja media. En la creación 
del compuesto final se usaron los valores de mediana de banda infrarroja cercana. Se obtuvieron 
métricas con los valores de las bandas, así como NDVI y datos auxiliares MODIS. Se selecciona 
la imagen de la fecha correspondiente al valor mediano de la banda infrarroja cercana ente los 
pixeles candidatos con las mejores observaciones después de la aplicación de varios filtros. Para 
la República Democrática del Congo, Potapov et al. (2012), cuantifican la cobertura forestal y las 
pérdidas, durante la década 2000-2010, utilizando un conjunto de datos de series temporales 
Landsat y con el apoyo de datos MODIS y la implementación de un algoritmo de árbol de 
clasificación para la detección de cambio. Una vez más, el algoritmo de procesamiento de datos 
y mapeo se trata de una evolución del enfoque de Hansen et al. (2008). Evalúan la calidad por 
pixel, y crean compuestos plurianuales, la composición de imágenes se realizó durante dos 
intervalos de años de 2000 a 2005 y de 2005 a 2010, el objetivo fue seleccionar las imágenes de 
la temporada de crecimiento forestal y consideraron 3 periodos diferentes de días del año para 
los compuestos según la ubicación de los diferentes bosques. Además, se crearon 3 grupos de 
métricas espectrales, uno para evaluar la reflectancia en percentiles, el segundo grupo con 
valores medios de reflectancia para observaciones entre percentiles seleccionados, y el tercero 
usando pendientes de la regresión lineal de los valores de reflectancia. 
 
Hermosilla et al. (2015) presentan compuestos por mejor pixel de Canadá, con datos Landsat de 
1998 y 2010, y obtienen métricas de cambio del periodo 2000 al 2010. Su objetivo fue presentar 
y demostrar un protocolo para generar compuestos del mejor pixel disponible, en áreas grandes 
sin vacíos de datos espaciales o temporales, usando “valores proxy” para caracterizar la cubierta 
terrestre y el cambio- retomando la propuesta de White et al. (2014). Primero identifican los 
cambios espectrales y posteriormente se derivan métricas para caracterizar esos cambios y 
finalmente se asignan los valores proxy para el llenado de datos. También valores ruidosos o 
anómalos son llenados con valores proxy. 
 
25 
 
Con todo lo desarrollado por los diferentes investigadores en torno a compuestos, es indudable 
el potencial que actualmente tienen las series de tiempo Landsat para la generación de 
cartografía, así como la identificación de cambio. De acuerdo con White et al. (2014), la 
composición de imágenes basada en píxeles con imágenes Landsat es un nuevo paradigma en 
la ciencia de la teledetección, que aplica una serie de reglas definidas por el usuario para 
aprovechar el amplio archivo de Landsat y generar compuestos de imagen libres de nubes, que 
sean consistentes fenológicamente y radiométricamente en áreas extensas. Una de las ventajas 
de los procesos de composición es la posibilidad de adecuar su construcción a las zonas de 
estudio y personalizar según los objetivos. Los compuestos basados en el mejor pixel disponible 
y válido tienen la particularidad de que es posible ir ajustando variables, puntuaciones, ventanas 
temporales, etc. (Griffiths et al. 2013). Pero es importante no olvidar que al tratarse de una fusión 
o integración de datos la forma en que son seleccionados pueden tener repercusiones 
importantes tal como lo ha demostrado (Roy, 2000) con compuestos de datos MODIS y AVHRR 
en dónde expone el impacto que tienen referente al incremento de contraste de bordes asociados 
al número de orbitas para la composición, los registros de datos faltantes y el ángulo zenital de 
vista e iluminación asociada, así como sus consecuencias de errores de detección de cambios. 
Siguiendo la terminología de White et al. (2014) en esta investigación se generan compuestos 
“Multi-year BAP (Best-available-pixel)”, que son compuestos multi-anual del mejor pixel 
disponible. Ajustando el DOY a la zona de estudio como se describe en los parámetros de cada 
método y temporada. La ventana temporal de los compuestos varía según los dos métodos aquí 
empleados, así como algunas particularidades que se detallan más adelante. Un método de 
compuesto es de tipo BAP y un segundo método de formación de compuestos se genera del 
promedio entre muestras disponibles y válidas que sean representativas a un año objetivo. 
 
2.2.1 Parámetros empleados para los métodos Compuestos por “Promedio” y “Mejor 
Pixel” 
 
En esta investigación, la generación de compuestos se realizó a nivel de pixel, y se obtuvieron 
por dos métodos: Promedio (CP) y Mejor pixel (CMP), los parámetros generales y las ventanas 
de tiempo para su formación son diferentes. Ambos en su generación dan preferencia a los 
datos que están dentro del año objetivo (año 0), que es el año de interés o en su defecto al dato 
válido más cercano a este, pero dentro del rango de años permitido. En el CMP son válidos 
aquellos valores que entran en el rango desde 1 año anterior y hasta 1 posterior al año objetivo 
y en el CP son válidos desde 2 años anteriores y hasta dos años posteriores. 
26 
 
Se generaron dos compuestos por cada uno de losmétodos para cada año; uno para temporada 
seca y otro para la húmeda. En el CP se especificó un periodo de la temporada seca del 20 de 
enero al 31 de mayo (días del año 20-151) y temporada húmeda desde 4 de julio a 30 de 
noviembre (días del año 185-334). En el CMP, se estableció con un periodo de la temporada 
seca de 19 de febrero hasta 30 de mayo (días del año 50-150) y temporada húmeda de 3 de 
agosto a 26 de noviembre (días del año 215-330). En la figura 7 se puede ver el rango de las 
temporadas para cada método de generación de compuesto. Además, los CMP requieren un 
día del año o “DOY” específico por temporada denominados dry peak y wet peak, los cuales 
también se muestran en la figura 7. 
 
La construcción de los Compuestos por Promedio requiere de un rango de días por temporada 
más amplio, debido a que es necesario un número suficiente de muestras por pixel para poder 
promediar, por lo que el rango de cada temporada para los Compuestos por Promedio inicia 30 
días antes, y al promediar se reduce el efecto de usar un rango más amplio de días. Por otro 
lado, para la construcción de los Compuestos por Mejor Pixel se acotaron las temporadas, esto 
es porque no se deseaba que los compuestos incluyeran pixeles de fuera de la temporada. 
Como consecuencia de lo anterior las temporadas del método de compuesto por Mejor Pixel 
inician 30 días después que las temporadas definidas para método de Compuesto por 
Promedio. 
 
 
Figura 7. Rangos de días por temporada para formación de compuestos. En color azul los días del 
año para las temporadas seca y húmeda del compuesto por método de Promedio y en color naranja los 
días del año para las temporadas seca y húmeda del compuesto por método de Mejor Pixel. Además, la 
ubicación del “dry peak” y “wet peak” del compuesto por Mejor Pixel. 
27 
 
 
Un requerimiento importante en el caso del CP es cumplir con un mínimo de 5 muestras por 
pixel y que a su vez cumplan con estar dentro de dos desviaciones estándar, si esto no se 
cumple se excluye el dato del cálculo. Cuando un dato cae fuera de dos desviaciones estándar 
es considerado un valor excluido para el cálculo del compuesto, excepto cuando no se logran 
juntar las muestras mínimas de 5 aun incrementando los años, pero si éstas son ≥ 2, serán 
promediadas e identificadas con otra etiqueta como muestras especiales. Tratándose de 5 años 
es más probable que se tenga una medición por cada temporada al año y esto favorece la 
formación del compuesto a nivel pixel. En la figura 8 se ejemplifica para un pixel n, como en el 
año 0 o año objetivo para generar el compuesto, se tienen sólo dos datos, aumentando un año 
anterior y posterior, las muestras incrementan a seis, pero tres de ellas son datos de tipo valor 
excluido, así que aún faltan otras dos para reunir el mínimo de cinco muestras, y estas sólo se 
logran aumentando un segundo año anterior y otro posterior. 
 
 
Figura 8. Aptitud de muestras para “Compuesto por método de Promedio”. 
 
 
 
Por otro lado, el método del CMP no requiere un mínimo de muestras, ya que se evalúan todos 
los datos disponibles dentro de las ventanas de tiempo permitido. Los compuestos por el 
método del Mejor Pixel se generan con base en 3 criterios a los que se asignaron factores de 
peso. Estos criterios y sus pesos son: 
28 
 
 
1) Importancia del año = 0.5 
2) Importancia estacional = 0.25 
3) Importancia espectral = 0.25 
 
El criterio de la importancia del año evalúa a los pixeles que se encuentran dentro o lo más 
cercano posible al año objetivo, así los pixeles del año 0 tienen una asignación de uno y éste 
es multiplicado por el valor de 0.5 (que es el criterio de importancia del año). La importancia 
estacional se refiere a la cercanía con el “dry peak” o el “wet peak”, los cuales son las fechas 
ideales para la formación de los compuestos en temporada seca y húmeda (Figura 7). El dry 
peak, se especificó al 10 de abril (día 100 del año) y el wet peak para el 7 de septiembre (día 
250 del año). De igual manera los pixeles que están en la posición del peak correspondiente 
reciben la calificación de 1 el cual se multiplica por 0.25. Estos puntos altos (dry peak y wet 
peak) se definieron con base en la respuesta espectral de la zona, observando los máximos 
NDVI en una serie de tiempo. Y el tercer criterio es la importancia espectral, que considera la 
calidad espectral del pixel, ya sea el valor de NDVI mas alto o el valor más bajo en la banda 
roja. Con esos 3 criterios, se asigna una calificación final a los pixeles candidatos y se elige al 
que tenga la mejor puntuación para conservar su valor en la imagen final del CMP. El puntaje 
máximo que puede alcanzar cada Mejor Pixel es de 1. El resumen de las parametrizaciones de 
los métodos empleados para la generación de compuestos se observa en la tabla 3. 
 
Tabla 3. Parámetros para la generación de compuestos por Promedio y por Mejor Pixel. 
Parámetros Promedio (CP) Mejor Pixel (CMP) 
Rango de años permitidos ±2 ±1 
Rango DOY Temporada seca 20-151 50-150 
Rango DOY Temporada húmeda 185-334 215-330 
Mínimo de muestras 5 N/A 
DOY Dry peak N/A 100 
DOY Wet peak N/A 250 
Factores de peso N/A Año, estacionalidad y aptitud espectral 
DS permitidas 2 NA 
DOY=”Day of year”, día del año. DS= Desviaciones estándar 
29 
 
 
2.3 Diseño del muestreo 
 
Para la clasificación de los compuestos se diseñó un único sistema de muestreo con los dos 
métodos empleados (Mejor Pixel y Promedio) a fin de obtener un set de muestras para la fase 
de entrenamiento y otro de validación usados en todas las clasificaciones. El mapa que se usó 
como base para generar el de referencia fue NALCMS a 30 m, el cual se re-proyectó para 
trabajar todos los datos en la misma proyección que las imágenes (UTM) y posteriormente se 
hizo una recodificación de clases. 
 
La superficie del recorte de la zona es de 7,200 km2, de la cual la zona de mar constituía un 
18.41 % del rectángulo, pero esta porción fue omitida. En cuanto a la revisión de la superficie 
por clase y el porcentaje respecto a la zona de estudio de pixeles con valores sin tomar en 
cuenta el mar, se observó que las clases de los bosques, matorrales y suelo desnudo figuraban 
cada uno con menos del 1% por esa razón se agregaron a la clase de “No data” para prescindir 
de ellos en el proceso de clasificación posterior. La recodificación y exclusión de clases quedó 
de la siguiente manera (tabla 4). 
 
 
Tabla 4. Recodificación del mapa NALCMS 2010 30 m. 
Código Clases Nalcms % Recodificación a 5 clases 
0 Mar N/A No data 
3 Bosque de latifoliadas perennifolio tropical o subtropical 0.13 No data 
4 Bosque de latifoliadas caducifolio tropical o subtropical 0.08 No data 
5 Bosque de latifoliadas caducifolio templado o subpolar 0.00 No data 
6 Bosque mixto 0.00 No data 
7 Matorral tropical o subtropical 0.25 No data 
8 Matorral templado o subpolar 0.00 No data 
9 Pastizal tropical o subtropical 39.07 3 
14 Humedal 8.67 4 
15 Suelo agrícola 44.92 5 
16 Suelo desnudo 0.07 No data 
17 Asentamiento humano 1.36 1 
18 Cuerpo de agua 5.44 2 
 
30 
 
La superficie en kilómetros cuadrados y los porcentajes finales por clase del mapa de referencia 
prescindiendo del mar y los datos descartados se muestran en la figura 9. 
 
 
 
 
Clase Km2 % 
Pastizal tropical o subtropical 2294.90 39.28 
Humedal 509.30 8.72 
Suelo agrícola 2638.94 45.17 
Asentamiento humano 79.82 1.37 
Cuerpo de agua 319.59 5.46 
Total 5842.55 100 
 
 
Figura 9. Superficie por clase del mapa de referencia recodificado a 5 clases. La clase “No data” 
corresponde a 1357.45 Km2, incluye el mar, pequeñas porciones de bosques, matorrales y suelo desnudo, 
pero no se muestra en el gráfico 
 
 
Al unificar y recodificar las clases se obtuvo un mapa de referencia que se utilizó para la etapa 
de entrenamiento en el proceso de clasificación y en la etapa de validación.

Otros materiales