Valdiviezo Na JC

Análisis Espectral de Imágenes
Multicanal basado en Transformaciones
Reticulares Matriciales
por
Juan Carlos Valdiviezo Navarro

Tesis sometida como requisito parcial para
obtener el grado de
DOCTOR EN CIENCIAS EN LA
ESPECIALIDAD DE ÓPTICA
en el
Instituto Nacional de Astrofísica, Óptica
y Electrónica
Diciembre 2011
Tonantzintla, Puebla
Asesor:
Dr. Gonzalo J. Urcid Serrano, INAOE
⃝
c INAOE 2011
El autor otorga al INAOE el permiso para
reproducir y distribuir copias en su totalidad o
en partes de esta tesis.

Abstract
Image spectrometers, instruments that simultaneously register the spatial and spectral infor-
mation of an area under study, have given solution to problems related with the identication
of materials comprising a scene. However, one of the fundamental problems in the analysis of
spectral images is that many spectral pixels are conformed by spectral mixtures of dierent
materials. This research work is oriented toward the autonomous determination of constituent
materials of a scene from spectral images acquired at dierent wavelength intervals. Assuming
the spectrum collected at each image pixel is a linear combination of constituent materials
spectra, the objective is to determine a set of pixels with the spectrum of one material that can
be used to represent the mixtures. Geometrically, the spectral mixtures can be represented as
a convex set whose vertices correspond to those pixels with the spectrum of one material, while
any other pixel will be represented by the combination of pure pixels at dierent proportions.
The scaled column vectors of lattice transforms WXX and MXX allow to extract the vertices
of a minimum convex set enclosing most of the spectral pixels belonging to a multichannel
image, which are associated with the constituent materials spectra. In fact, once these vertices
have been determined, it is possible to quantify the spectral mixtures at each image pixel. This
study begins with the use of lattice transforms for the autonomous segmentation of satured
colors from color images. After, we extend the proposed technique for the analysis of multi-
spectral and hiperspectral images. In the multispectral case, we present results of pigments
identication from the multispectral collection of the Archimedes Palimpsest. In the second
case we present results in the determination of natural resources from two hyperspectral scenes
registered by a remote sensor.
i
Resumen
El uso de espectrómetros de imagen, los cuales registran simultáneamente la información es-

pacial y espectral de una zona, ha ayudado en la solución de problemas relacionados con la
identicación de los materiales que conforman la escena. Uno de los problemas fundamen-
tales en el análisis de imágenes espectrales es que muchos de sus pixeles contienen una mezcla
de espectros de diversos materiales. El presente trabajo de investigación está orientado a la
determinación autónoma de los materiales que conforman una escena, a partir de imágenes
adquiridas en distintas porciones del espectro electromagnético. Para ello se considera que el
espectro captado en cada pixel de la imagen es una combinación lineal de espectros de los
materiales constituyentes de la escena. Geométricamente estas mezclas se pueden representar
como un conjunto convexo en donde los vértices corresponden a los pixeles con el espectro de
un único material, mientras que cualquier otro pixel estará representado por la combinación de
estos pixeles puros en distintas proporciones. Las columnas escaladas de las transformaciones
reticulares matriciales WXX y MXX permiten determinar los vértices de un conjunto convexo
mínimo que encierra a los pixeles de una imagen multicanal. A su vez, estos vértices están
asociados a los espectros de los materiales constituyentes. Una vez que se han determinado los
pixeles espectrales más puros se pueden cuanticar las mezclas en cada pixel de la imagen. El
presente estudio se inicia aplicando el método propuesto para la segmentación de colores satu-
rados en imágenes de tres canales. Posteriormente trasladamos la técnica al caso de imágenes
multiespecrales e hiperespectrales. En el primer caso se presentan resultados en la separación
de pigmentos a partir de los datos multiespectrales del palimpsesto de Arquímedes. En el se-
gundo caso se presentan resultados en la determinación de los recursos naturales a partir de
dos escenas cuyas imágenes fueron registradas por un sensor remoto.
ii
Prólogo
El desarrollo de este trabajo de investigación ha sido motivado por la necesidad de

desarrollar nuevas técnicas para la interpretación de datos multidimensionales. A este respecto
se pueden mencionar el creciente auge en las técnicas óptico-digitales para el procesamiento
de imágenes y, en particular, las crecientes aplicaciones de los métodos espectrales para la
identicación y monitoreo de materiales. El tratamiento matemático que se presenta en las
siguientes líneas se ha aplicado al caso más simple, que corresponde a las imágenes en tres
canales; su aplicabilidad se ha extendido al caso de imágenes multicanal, en el que el análisis
se vuelve más complicado debido a la cantidad de información. Por otra parte, durante el
desarrollo de este trabajo se ha tratado de complementar esta discusión con los aspectos
físicos que están involucrados tanto en la captura de los datos, como en el análisis de los
mismos.
Es mi deseo agradecer primeramente a la gente de México, quien a través del CONA-
CYT, me han brindado el apoyo necesario para realizar mis estudios de doctorado, mediante
la Beca No. 175027. Asimismo expreso mi gratitud al INAOE por brindarme los conocimientos
y las herramientas necesarias para desarrollarme tanto profesional como humanamente. Este
agradecimiento está también dirigido a los profesores y administrativos, así como a aquellos
que silenciosamente realizan su labor a diario y que hacen posible que los estudiantes teng-
amos espacios adecuados: a las personas de intendencia. Aprovecho también para agradecer el
tiempo, la paciencia y los comentarios oportunos que mis sinodales: Dr. Félix Aguilar Valdés,
Dr. Javier Báez Rojas, Dr. Juan Manuel Ramírez Cortés, Dr. Jorge Castro Ramos y Dr. Al-
fonso Padilla Vivanco han brindado a un servidor, mismos que han ayudado a que este trabajo
sea más completo. Por último expreso mi agradecimiento y admiración al Dr. Gonzalo Urcid
iii
Serrano porque a lo largo de estos años sus conocimientos, consejos y apoyo me han ayudado
a cumplir esta meta, ahora más que un asesor de tesis es un amigo y un colega. A mis padres,
familia y amigos mi cariño y admiración porque con su apoyo hemos construido un sueño.
Juan Carlos Valdiviezo Navarro,

Noviembre 7 de 2011.
J. C. Valdiviezo INAOE iv
Dedicatorias
Al Ser Supremo quien me ha acompañado en cada instante de mi vida y quien me

ha dado la oportunidad de cumplir este sueño.
A mis padres: Rogelio Valdiviezo Román y Mercedes Navarro Martínez quienes con
su amor y ejemplo me han enseñado a caminar por la vida.
A mis hermanos: Rocío, Gloria Estefanía y Luis Enrique, mi inspiración y mis

maestros quienes me han enseñado las cosas bellas de la vida.
A mis abuelitos: Estela, María de la Luz y Antero porque su sabio caminar me ha

enseñado que las dicultades se superan con esfuerzo y voluntad.
A todos mis amigos que han sido parte de mi familia sin importar las distancias
o fronteras: Georgina, Nora, Sarah, Konni y los señores Josena, Rosario e Isidro
porque con su cariño las distancias se han vuelto relativas.
El aprendizaje es el inicio de la riqueza, es el inicio de la salud, es el inicio de la
espiritualidad. Investigando y aprendiendo es donde todos los procesos milagrosos
comienzan.
Jim Rohn
v
Índice general
1. Introducción 1
1.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1. Objetivos particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Avances recientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1. Técnicas basadas en geometría convexa . . . . . . . . . . . . . . . . . . 5
1.5. Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1. Propuesta de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.2. Estructura del trabajo de tesis . . . . . . . . . . . . . . . . . . . . . . . 10
2. Fundamentos de Espectroscopía 16
2.1. Principios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1. La radiación electromagnética . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2. Interacción materia-energía . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.3. Espectros de emisión y absorción . . . . . . . . . . . . . . . . . . . . . 19
2.1.4. Reectancia, absortancia y transmitancia . . . . . . . . . . . . . . . . . 21
2.1.5. Características espectrales de la vegetación . . . . . . . . . . . . . . . . 21
2.2. Espectrómetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1. Resolución del monocromador . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.2. Espectrómetro de línea BRC111A . . . . . . . . . . . . . . . . . . . . 27
2.2.3. Calibración del instrumento . . . . . . . . . . . . . . . . . . . . . . . . 29
vi
ÍNDICE GENERAL
2.3. Registro espectral de materiales . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.3.1. Espectros de vegetación . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.2. Mezclas espectrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4. Espectrómetros de imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3. Fundamento Matemático 47
3.1. Álgebra reticular minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1.1. Ejemplos de retículos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.1.2. Conceptos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.1.3. Operaciones matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.4. Independencia reticular . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2. Geometría de conjuntos convexos . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2.1. Convexidad e independencia afín . . . . . . . . . . . . . . . . . . . . . 53
3.2.2. Simplex multidimensionales . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2.3. Modelo de mezclado lineal . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3. Memorias asociativas reticulares . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1. Propiedades algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.2. Propiedades geométricas . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.3. Criterios para evaluar independencia afín . . . . . . . . . . . . . . . . . 62
3.3.4. Determinación de puntos extremos con W y M . . . . . . . . . . . . . 64
4. Segmentación de Imágenes a Color 70

4.1. Concepto de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1.1. El método de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.1.2. El algoritmo de cuencas . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2. Espacios de color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.3. Segmentación basada en W y M . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.4. Ejemplos de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5. Comparación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
J. C. Valdiviezo INAOE vii

ÍNDICE GENERAL
5. Análisis de Imágenes Multiespectrales 95

5.1. Imágenes multiespectrales de documentos antiguos . . . . . . . . . . . . . . . . 95
5.2. Registro multiespectral de una escena . . . . . . . . . . . . . . . . . . . . . . . 97
5.2.1. Técnicas de estimación de la reectancia espectral . . . . . . . . . . . . 99
5.2.2. El Palimpsesto de Arquímedes . . . . . . . . . . . . . . . . . . . . . . . 100
5.3. Métodos autónomos de análisis . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.3.1. Análisis de componentes principales . . . . . . . . . . . . . . . . . . . . 102
5.3.2. Agrupación con medias-K . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.3.3. El método W y M aplicado al caso multiespectral . . . . . . . . . . . . 104
5.4. Determinación de pigmentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.4.1. Implementación numérica . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.4.2. Comparación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6. Procesado de Imágenes Hiperespectrales 114

6.1. Registro hiperespectral de una escena . . . . . . . . . . . . . . . . . . . . . . . 114
6.1.1. Fundamentos físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.1.2. Resolución espacial y espectral . . . . . . . . . . . . . . . . . . . . . . . 116
6.1.3. Técnicas de estimación de la reectancia . . . . . . . . . . . . . . . . . 117
6.1.4. Instrumentos hiperespectrales . . . . . . . . . . . . . . . . . . . . . . . 119
6.2. Determinación de puntos extremos . . . . . . . . . . . . . . . . . . . . . . . . 120
6.2.1. Análisis de componentes de vértices . . . . . . . . . . . . . . . . . . . . 120
6.2.2. El método W y M aplicado al caso hiperespectral . . . . . . . . . . . . 120
6.3. Ejemplos de aplicación de sensado remoto . . . . . . . . . . . . . . . . . . . . 121
6.4. Separación espectral y comparación de resultados . . . . . . . . . . . . . . . . 127
6.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7. Conclusiones 135
7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.2. Aportaciones de esta investigación . . . . . . . . . . . . . . . . . . . . . . . . . 138
J. C. Valdiviezo INAOE viii

ÍNDICE GENERAL
7.2.1. Dirección del trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . 140
J. C. Valdiviezo INAOE ix
Índice de guras
2.1. Espectro electromagnético en orden creciente de longitud de onda. . . . . . . . 18

2.2. Espectro de absorción de la clorola a y b. . . . . . . . . . . . . . . . . . . . . 23
2.3. Componentes ópticos de un espectrómetro. . . . . . . . . . . . . . . . . . . . . 24
2.4. Estructura de un espectrómetro de prisma elemental, W denota el ancho del
haz de iluminación y P1 dene el primer plano principal. . . . . . . . . . . . . 25
2.5. Perl de una rejilla líneal de difracción con N líneas; d es el periodo de la rejilla
y s es la separación entre líneas. . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6. Espectro de emisión de la fuente de iluminación. . . . . . . . . . . . . . . . . . 28
2.7. Diagrama de conexión de los componentes del espectrómetro de línea BRC111A. 28
2.8. Arreglo utilizado para vericar la calibración por longitud de onda. . . . . . . 29
2.9. Espectro de energía transmitida para el ltro pasa-bandas con λ0 = 450 nm. . . . . . . . . 31
2.10. Espectro de energía transmitida para el ltro pasa-bandas con λ0 = 650 nm. . . . . . . . . 32
2.11. Espectro de energía transmitida para el ltro pasa-altas con frecuencia de corte en 515 nm. . 33
2.12. Espectro de energía transmitida para el ltro pasa-altas con frecuencia de corte en 715 nm. . 36
2.13. Arreglo utilizado para el registro de espectros de vegetación. . . . . . . . . . . 36
2.14. Espectros de energía reejada para una hoja de alcanfor en estados amarillo y seco. . . . . 37
2.15. Espectros de energía reejada registrada durante tres días para una hoja de pino. . . . . . 37
2.16. Espectro de energía reejada para una hoja de pasto verde. . . . . . . . . . . . . . . . . 38
2.17. Espectro de energía reejada para una hoja de pasto seco. . . . . . . . . . . . . . . . . 38
2.18. Espectro de energía reejada para una hoja de árbol rojiza de la familia del pino. . . . . . 39
2.19. Espectro de energía reejada para una hoja de bugambilia. . . . . . . . . . . . . . . . . 39
x
ÍNDICE DE FIGURAS
2.20. Espectro de energía reejada registrado a partir de la cáscara de un jitomate rojo. . . . . . 40

2.21. Espectro de energía reejada para la cáscara de una mandarina. . . . . . . . . . . . . . 40
2.22. Espectro mezclado obtenido a partir de una hoja verde y una amarilla. . . . . . . . . . . 41
2.23. Espectro mezclado obtenido a partir de una hoja verde y otra amarilla. En esta gráca f (λ)
es una función cuyos coecientes aproximan la forma del espectro mezclado. . . . . . . . . 41
2.24. Diagrama óptico del espectrómetro de imagen MIVIS. . . . . . . . . . . . . . . 44
3.1. Ejemplos de simplex para k = 1, . . . , 4 . . . . . . . . . . . . . . . . . . . . . . 56
4.1. Representación del espacio de color RGB. . . . . . . . . . . . . . . . . . . . . . . . . 75

4.2. Representación del espacio de color HSI. . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.3. Representación del espacio de color L*a*b*, donde L* representa la luminancia o el eje de
escala de grises, mientras que a* y b* denen la saturación y el color. . . . . . . . . . . . 77

4.4. Primera la, izquierda a derecha: imagen en color RGB utilizada en el Ejemplo 4.1, imágenes en
tonos de gris de las fracciones de color determinadas a partir de las columnas de W . Segunda
la: fracciones de color determinadas a partir de las columnas de M . La correspondencia entre
el nivel de gris asignado y el valor numérico es el siguiente: 1 = blanco, 0.5 = gris medio, 0.33
= gris oscuro y 0 = negro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.5. Fila superior: imágenes de color ejemplares; segunda a cuarta las: imágenes en tonos de gris
representando las fracciones de los colores saturados seleccionados a partir de W y M. . . . 83

4.6. Izquierda: distribución en el espacio de los diferentes vectores de color en la imagen del mandril
de la g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1 , w2 , w3 } y
M = {m1 , m2 , m3 } que encierran diferentes subconjuntos de X. . . . . . . . . . . . . . 84

4.7. Fila superior: imágenes de color ejemplares; segunda a cuarta las: imágenes de colores seg-
mentados para las guras ejemplares (resultado de umbralización y enmascaramiento). . . . 85

4.8. Primera la: imagen de color en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente;
segunda la: imágenes conformadas por las segmentaciones de los pimientos rojos y verdes y
las porciones de luz reejada producidas por W y M para cada espacio de color. . . . . . . 87
J. C. Valdiviezo INAOE xi
ÍNDICE DE FIGURAS
4.9. Primera la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,
con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas
e imagen de los pimientos cuantizada a 16 niveles de gris; segunda la: imágenes de bordes
producidos por ltros de Sobel para las imágenes de la primera la. . . . . . . . . . . . . 88

4.10. Primera columna: imágenes en color RGB; segunda a quinta columnas: imágenes conformadas
por las segmentaciones producidas por W y M en los espacios RGB, I1I2I3, HSI y L*a*b*,
respectivamente. Las principales regiones de interès se han cuantizado. . . . . . . . . . . 90
5.1. Registro multiespectral de un documento antiguo usando un arreglo de ltros. . . . . . . 98

5.2. Izquierda: imagen en color verdadero de la porción del palimpsesto utilizada para los experi-
mentos. Derecha: imagen en falso color realizada mediante la composición de las componentes
C1 y C2 obtenidas mediante PCA. . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.3. Curvas espectrales de los puntos extremos determinados a partir de W y M. La correspon-
dencia de estos puntos es: pigmento 1 = w11 , pigmento 2 = m1 y cuero = m11 . . . . . . . 109
5.4. Imágenes de las abundancias de los materiales constituyentes del palimpsesto determinados
a partir de W y M. Izquierda: texto escrito en el siglo XII (pigmento 2); centro: texto escrito
en el siglo X (pigmento 1); derecha: cuero del manuscrito. . . . . . . . . . . . . . . . . 110

5.5. Resultados de segmentación de los pigmentos presentes en el palimpsesto de Arquímedes.
Primera la, de izquierda a derecha: subimagen del manuscrito desplegada en color verdadero,
composición en falso color utilizando PCA. Segunda la, izquierda a derecha: resultados del
agrupamiento por medias-K , mapas de abundancia que corresponden a los dos tipos de es-
critura determinados por el método W M. . . . . . . . . . . . . . . . . . . . . . . . 111
6.1. Dos tipos de sistemas de barrido usados para capturar una escena hiperespectral; el
número de bandas espectrales está determinado por los detectores que cubren inter-
valos de longitudes de onda (λ) especícos. . . . . . . . . . . . . . . . . . . . . . . 116

6.2. Imágenes a color de la escena hiperespectral registrada sobre la costa del Golfo de México.
Izquierda: imagen formada por la combinación de las bandas 54 (rojo), 34 (verde) y 14 (azul).
Derecha: combinación de bandas 81 (rojo), 217 (verde) y 54 (azul). . . . . . . . . . . . . 123
J. C. Valdiviezo INAOE xii

ÍNDICE DE FIGURAS
6.3. Espectros de tres puntos extremos determinados con W y M en el cubo hiperespectral del
Golfo de México. Los valores de columna seleccionados a partir de W ∪M son: w2 , w24 , w54 . 125
6.4. Espectros de tres puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespec-
tral del Golfo de México. Los vectores columna sj para j = 1, . . . , 5 indican las columnas
correspondientes de S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.5. Imágenes a color de la escena hiperespectral de Beltsville. Izquierda: imagen formada por la
combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81
(rojo), 54 (verde) y 34 (azul). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6.6. Espectros de cuatro puntos extremos determinados con W y M en el cubo hiperespectral de
Beltsville. Los vectores columna seleccionados a partir de W ∪M son: w24 , w37 , w47 , w64 . 128
6.7. Espectros de cuatro puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral
de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes
de la matriz S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.8. Mapas de abundancia en color de los recursos naturales determinados con la identicación
autónoma de puntos extremos en el cubo hiperspectral del Golfo de México. Izquierda: abun-
dancias de cuatro puntos extremos determinados con W y M, cuya distribución de colores
corresponde a amarillo = w2 , magenta = w24 , verde = w43 , azul = w54 . Derecha: abundan-
cias de tres puntos extremos determinados con VCA cuya distribución de colores es amarillo
= s4 , magenta = s2 , verde = s3 . Áreas más brillantes representan mayor concentración del
recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

6.9. Mapas de abundancia en color de los tipos de vegetación obtenidos con la identicación
autónoma de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundan-
cias de cuatro puntos extremos determinados con WM cuya distribución de colores corre-
sponde a magenta = w24 , amarillo = w67 , azul = m46 , verde = m62 . Derecha: abundancias de
cuatro puntos extremos determinados con VCA, cuya distribución de colores es magenta = s2 ,
amarillo = s3 , azul = s5 , verde = s7 . Áreas más brillantes representan mayor concentración
del recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
J. C. Valdiviezo INAOE 1
Capítulo 1
Introducción
En este primer capítulo se presenta el área de estudio en el que se desarrollará este trabajo de
tesis y plantea el problema que se quiere resolver. Subsecuentemente se presentan los objetivos
generales y particulares que se desean alcanzar por medio de esta investigación. En una sección
siguiente se hace una descripción de técnicas conocidas y que han sido reportadas para resolver
en forma alternativa el problema considerado. Finalmente, para cerrar este capítulo, se hace
una descripción de la propuesta de solución, base de esta investigación.
1.1. Antecedentes
El creciente surgimiento de dispositivos que realizan el registro de imágenes en distintos

escenarios y para diversas aplicaciones ha hecho necesario el desarrollo de nuevas técnicas para
el análisis y procesamiento de las imágenes. Este auge se debe a que las imágenes captadas
por un sensor proporcionan información útil sobre los objetos presentes en la escena. Especí-
camente, una imagen se puede considerar como una función f (x, y) que conlleva información
de la energía radiada por una fuente de luz que ilumina la escena i(x, y) y la energía reejada
por los objetos, denominada reectancia r(x, y). De esta manera, debido a que la reectancia
de los objetos varía con la longitud de onda que emite la fuente de iluminación, el registro
de imágenes en porciones del espectro electromagnético distintas a la visible provee mayor
información acerca de los objetos presentes.
1
1.1. ANTECEDENTES
En años recientes, los instrumentos conocidos como espectrómetros han sido acoplados
a sistemas ópticos formadores de imagen, surgiendo así los denominados espectrómetros de
imagen ; este desarrollo conjunto ha permitido el avance en las técnicas para la adquisición de
imágenes en diferentes porciones del espectro electromagnético. Estos dispositivos registran
en forma de imagen la energía reejada o esparcida por un área u objeto, en un determinado
intervalo de longitudes de onda, ∆λ. De acuerdo con el número de bandas adquiridas, estos
dispositivos se pueden clasicar en: multiespectrales si el instrumento es capaz de registrar
decenas de bandas espectralmente anchas en intervalos distintos que no necesariamente son
continuos, o hiperespectrales cuando el instrumento adquiere cientos de bandas cuasi contiguas
y espectralmente angostas.
Una característica importante de las imágenes adquiridas con estas técnicas es que, al
apilar cada una de las bandas espectrales, se forma un cubo de datos en el que cada pixel
es considerado como un vector con información de las n bandas que conforman el cubo. Así,
cada pixel de la imagen contiene información de la reectancia de los objetos en diferentes
porciones del espectro electromagnético. Esta información o espectro colectado en cada pixel
puede ser utilizado para diferenciar e identicar los objetos presentes en dicha imagen. Esta
característica ha hecho posible que las imágenes multiespectrales e hiperespectrales puedan
ser utilizadas para gran cantidad de aplicaciones en áreas diversas.
En un principio, los espectrómetros de imagen fueron desarrollados para el monitoreo
y cuanticación de recursos naturales utilizando plataformas aéreas [2]; posteriormente, estos
instrumentos fueron aplicados con éxito en microscopía, biología y medicina para la detec-
ción de anomalías en células y tejidos orgánicos [15]. En los últimos años, los dispositivos
multiespectrales e hiperespectrales han demostrado ser una valiosa herramienta para la iden-
ticación de pigmentos en pinturas arqueológicas, así como en el realce de escrituras ocultas
en manuscritos antiguos que han sido preservados por el paso del tiempo [3, 8, 22]. Las apli-
caciones mencionadas son relevantes ya que representan técnicas no invasivas que permiten
analizar una escena mediante el registro único de su reectancia espectral.
1.2. PLANTEAMIENTO DEL PROBLEMA
1.2. Planteamiento del problema
En una imagen adquirida mediante técnicas espectrales existen dos parámetros impor-
tantes que se deben considerar para realizar un análisis apropiado: la resolución espacial y la
resolución espectral. La resolución espacial se reere al detalle mínimo que puede ser registrado
por la óptica del instrumento. La resolución espacial está también relacionada con el tamaño
físico que abarca un pixel de la imagen sobre la escena registrada. La resolución espectral se
reere al ancho espectral de las bandas registradas. Así por ejemplo, los dispositivos hipere-
spectrales, que tienen una alta resolución espectral, realizan el registro de cientos de bandas
espectralmente angostas donde ∆λ ≤ 10 nm, que permiten comparar directamente el espectro
colectado en cualquier pixel de la imagen con algún espectro de referencia. Esta es una ven-
taja importante sobre los dispositivos multiespectrales, en los que la resolución espectral está
alrededor de 50 nm. Por su parte, la resolución espacial está en función de los componentes
ópticos y el mecanismo de adquisición que se utilice para el registro de la imagen. Ambas car-
acterísticas están relacionadas con el tipo de aplicación para el cual se requiere el instrumento
como, por ejemplo, monitoreo terrestre o análisis citológicos.
En diversas aplicaciones orientadas a la identicación de los materiales presentes en la
imagen, el proceso se diculta debido a la presencia de espectros mezclados en muchos de los
pixeles; estas mezclas pueden originarse por dos razones. Primero, cuando la resolución espacial
del dispositivo es baja los pixeles de la imagen cubren una extensión física grande, lo que
conlleva a que la reectancia colectada esté compuesta por mezclas de espectros de diferentes
materiales en la zona. Además, las mezclas espectrales pueden ser causadas por la naturaleza
misma de los materiales que puedan estar combinados en una mezcla homogénea, como es el
caso del agua de mar o la arena. Por tanto la dicultad en el análisis de imágenes adquiridas
con técnicas espectrales radica en la determinación de pixeles en la imagen que contengan el
espectro de reectancia de un único material. Al conjunto de pixeles que contienen el espectro
más puro de un único material se les denomina miembros nales o puntos extremos [14].
En algunas aplicaciones donde se tiene conocimiento de los objetos que conforman la
escena es posible registrar el espectro de éstos con un espectrómetro de campo y utilizarlo para
identicarlos en la imagen. Sin embargo, en muchas otras aplicaciones se requiere determinar
1.3. OBJETIVO GENERAL
estos pixeles puros directamente desde la imagen, lo que hace necesario el uso de una técnica
autónoma para determinar el conjunto de puntos extremos.
Por otra parte, con el propósito de cuanticar los componentes presentes en una escena
es necesario representar las mezclas de espectros utilizando una representación matemática.
Un modelo frecuentemente utilizado para este análisis es el modelo de mezclado lineal con
restricciones (MLR), en el cual se considera que el espectro de reectancia medido en un pixel

corresponde a la mezcla lineal de los pixeles más puros en la zona en proporcionos o fracciones
distintas denominadas abundancias. Las restricciones planteadas en este modelo consisten en
que todas las abundancias deben ser cantidades positivas y que deben sumar la unidad.
De esta manera, el problema en la determinación del conjunto de puntos extremos se
puede apreciar desde un punto de vista geométrico al considerar que los pixeles espectrales
más puros denen un conjunto convexo en el que cualquier otro pixel mezclado reside en el
interior de este conjunto.
1.3. Ob jetivo General
Aplicar las técnicas y propiedades desarrolladas en el contexto del álgebra reticular mini-
max para el análisis y segmentación de imágenes en color, multiespectrales e hiperespectrales
con base a la localización de sus puntos extremos.
1.3.1. Objetivos particulares

1. Determinar los puntos extremos en una imagen en color usando propiedades del álgebra
reticular, representar las mezclas de color presentes usando el modelo de mezclado lineal
y, posteriormente, segmentarla.
2. Determinar los puntos extremos para el análisis de imágenes multiespectrales, en par-

ticular los diferentes pigmentos presentes en imágenes multiespectrales de documentos
antiguos.
3. Adquirir un conjunto de espectros en el laboratorio utilizando un espectrómetro de línea
1.4. AVANCES RECIENTES
para vericar el modelo MLR.
4. Comparar el desempeño de un método conocido para el análisis de imágenes hiperespec-

trales con el método propuesto.
1.4. Avances recientes
En años recientes diversas técnicas basadas en geometría convexa han sido desarrolladas
con el propósito de determinar, de manera autónoma, el conjunto de pixeles más puros, que
a su vez corresponde a los materiales que conforman la imagen. Cada técnica está basada en
algun criterio particular de selección. En las siguientes líneas serán descritos los métodos más
importantes.
1.4.1. Técnicas basadas en geometría convexa

Estas técnicas han sido desarrollada para la determinación de puntos extremos en
imágenes hiperespectrales y comparten un fundamento geométrico, basado en el modelo MLR
y consiste en la representación de los pixeles espectrales n-dimensionales de la imagen como
un conjunto convexo, donde sus vértices corresponden a los puntos extremos.
Índice de pureza de pixel (Pixel purity index, PPI). El método realiza una reducción
de bandas del cubo de datos y continúa mediante repetidas proyecciones de los datos sobre
vectores unitarios aleatorios no paralelos (llamados skewers ). Los puntos extremos en cada
proyección se marcan y se almacena en un contador, el número de veces que un pixel se
determina como extremo. El resultado nal del conteo se utiliza para identicar los pixeles
más puros en la escena y éstos, a su vez, se comparan con espectros de referencia [4, 5]. Debido a
que no hay un criterio para seleccionar el número de vectores unitarios, este procedimiento debe
realizarse a prueba y error, lo que resulta en una alta complejidad computacional. Además,
esta técnica no garantiza que los vectores nales generados sean puntos extremos, por lo que
puede considerarse como una aproximación.
Análisis de cono convexo (Convex cone analysis, CCA). La técnica toma de base el hecho
de que cantidades físicas, como la radiancia, son estrictamente no-negativas y asume que los
vectores formados por estos espectros residen dentro de una región convexa. Así, con uno de
sus vértices en el origen, esta región dene un cono. De esta manera, el objetivo es encontrar
la frontera de esta región convexa. En el procedimiento se calcula una matriz de correlación a
partir de la imagen y se calculan los eigenvectores de la matriz por medio de la descomposición
de valores singulares (singular value decomposition, SVD). En esta descomposición se utiliza
una matriz de correlación y se seleccionan los eigenvectores relacionados con los eigenvalores
más grandes. La combinación lineal de estos eigenvectores produce vectores no-negativos. Es
posible entonces encontrar un conjunto de coecientes que produzcan una combinación lineal
y que contengan algunos elementos igual a cero y los demás estrictamente no-negativos. Estos
puntos representan los vértices del cono, cuyos espectros pueden ser usados como miembros
nales. Al utilizar esta técnica se necesita conocer a priori el número de componentes de
interés, el cual no debe ser mayor a la dimensionalidad de los datos. Asimismo, la complejidad
computacional del algoritmo es alta [13].
Algoritmo N-FINDR. Este método está basado en el hecho de que en un arreglo n-dimensional
de pixeles espectrales los pixeles puros denen el simplex de volumen más grande. La técnica
determina el conjunto de pixeles que forman el volumen más grande posible al inar un sim-
plex dentro de los datos. Siendo la entrada el cubo de datos completo, el algoritmo comienza
con un conjunto aleatorio de vectores y una matriz E de miembros nales. Para realizar una
buena estimación, cada pixel de la imagen debe ser evaluado; para ello, se calcula el volumen
de cada uno reemplazando cada punto extremo por un pixel en la posición del primero. Si el
reemplazo resulta en un incremento del volumen, el pixel reemplaza al punto extremo dado.
El procedimiento se repite hasta que no haya más reemplazos de puntos extremos. Una vez
que los pixeles puros se han encontrado, sus espectros pueden ser usados para separar las
mezclas en la imagen original. Una dicultad con este método se presenta cuando hay pixeles
mezclados cuyo brillo es más alto que los pixeles puros, entonces el algoritmo los selecciona
como puntos extremos [23].
Análisis de componentes de vértices (Vertex component analysis, VCA). Esta técnica no

supervizada está basada en la descomposición de valores singulares y el análisis de componentes
principales como subprocedimientos [16]. En particular este algoritmo asume la existencia de
pixeles puros y explota el hecho de que los puntos extremos son vértices de un simplex,
por lo que la transformación afín de un simplex es también un simplex. La técnica proyecta
iterativamente los datos en una dirección ortogonal al subespacio ocupado por los puntos
extremos ya determinados. El nuevo espectro del miembro nal es el extremo de la proyección,
entonces el lazo principal continúa hasta que todos los puntos extremos dados son agotados.
Algoritmo de crecimiento de un simplex. Este método está inspirado en el algoritmo

N-FINDR y toma de base sus limitaciones para mejorarlas. Primero, para estimar el número de
miembros nales requeridos p, el método utiliza el concepto de dimensionalidad virtual (VD)
[7]. De esta manera, el algoritmo encuentra un simplex de dimensión p − 1 con el volumen más
grande al crecer gradualmente varios simplex vértice por vértice. Es decir, en lugar de hacer
el intento por encontrar directamente un simplex con p vértices y con el máximo volumen, el
método primero encuentra un simplex con dos vértices con el volumen más grande; a partir
de éste se comienzan a crecer nuevos simplex. De esta manera, el método sólo tiene que
encontrar un miembro nal a la vez hasta que alcance el número deseado de miembros nales,
p, el cual ha sido estimado mediante VD. A diferencia del algoritmo N-FINDR que inicializa
la matriz E con pixeles aleatorios, el algoritmo de crecimiento de un simplex resuelve esta
dicultad al seleccionar cuidadosamente los vectores para inicializar el algoritmo. Aunque el
algoritmo presenta una mayor complejidad computacional, los miembros nales determinados
son similares a los obtenidos por VCA [8].
Un simplex que encierra el volumen mínimo (Minimum volume enclosing simplex,
MVES). Este método comienza con un simplex de volumen más grande e iterativamente mueve
sus caras hacia la nube de datos1 . En la técnica se utilizan análisis convexo y técnicas de
optimización para desarrollar un algoritmo de separación hiperespectral. El uso del análisis
convexo está motivado por el hecho de que conceptos tales como casco afín y casco convexo,
1 Esta idea fue propuesta por Craig et al. en [9].
1.5. METODOLOGÍA
son adecuados para el análisis de este problema. El procedimiento realizado por el método
se resume como sigue. Primero se realiza una reducción en la dimensionalidad de los pixeles
observados por medio de un concepto de análisis convexo denominado ajuste de conjunto afín.
El problema de hallar el volumen mínimo fue modicado a un problema de minimizar el volu-

men de un simplex sujeto a la condición de que todos los pixeles de dimensión reducida estén
encerrados por éste. Entonces se emplea el criterio de separación de Craig para formular la
separación como un problema de optimización. La función objetivo del MVES no es convexa,
pero el problema puede ser manejado en una manera cíclica al resolver una secuencia de prob-
lemas de programación lineal. Una ventaja de este método es que no necesitan haber pixeles
puros en la imagen [6].
1.5. Metodología
Con el desarrollo de este trabajo de investigación el problema que se desea resolver es el

de determinar el conjunto de pixeles más saturados, en el caso de una imagen en color, así como
aquellos que contengan la mayor pureza espectral en una imagen multi- o hiperespectral y que
puedan ser usados para representar las mezclas en la imagen. La segmentación de imágenes
de tres canales representa el punto de partida en el que se considera que la imagen ha sido
adquirida utilizando tres ltros de banda ancha, centrados en las longitudes de onda del rojo
(700 nm), verde (546 nm) y azul (435 nm) [12]. De esta manera, el objetivo será determinar los
pixeles que contengan la mayor saturación en las longitudes consideradas. Una vez que sean
determinados los pixeles puros en una escena se tendrá información suciente para separar
los diversos componentes que presenten características espectrales semejantes dentro de la
imagen. Además, cualquier combinación de éstos será posible de estimar a partir del modelo
de mezclado lineal. Los alcances de este trabajo incluyen un estudio acerca de los métodos
para determinar, en cada pixel de la imagen, ya sean fracciones de color o las abundancias de
materiales según corresponda al tipo de imagen.
Parte complementaria en el desarrollo de este trabajo de investigación será el registro

de espectros de diversos tipos de vegetación, así como de mezclas espectrales obtenidas en el
1.5. METODOLOGÍA
laboratorio a través del espectrómetro de línea BWTek. El registro de espectros de vegetación

ayuda a comprender los factores que contribuyen a alteraciones en su forma debido a cambios
físicos como la temperatura o humedad. Además, la idea de realizar mezclas espectrales permite
corroborar el modelo de mezclado lineal para representar las mezclas de espectros de los
diferentes materiales presentes en una escena. Por tanto, con este trabajo experimental se
podrá tener una idea más clara del proceso de adquisición de pixeles mezclados en imágenes
multi- e hiperespectrales.
En el caso de imágenes multiespectrales de documentos antiguos, las imágenes que han

sido consideradas para el análisis espectral han sido registradas por el proyecto del Palimpsesto
de Arquímedes y se encuentran disponsibles con nes de investigación en [1] y [3]. Estas
imágenes fueron registradas utilizando diodos emisores de luz (light emitting diodes, LEDs) que
emiten radiación en diferentes longitudes de onda. La porción del espectro electromagnético
que se ha registrado comprende de 365 a 870 nm, con una resolución espectral alrededor de
30 nm, siendo más angosta en ciertas porciones y más ancha en otras [10].
Por otra parte, existen imágenes de sensado remoto que pueden ser utilizadas para
localizar y cuanticar los recursos naturales presentes en una escena. Las imágenes frecuente-
mente utilizadas por su disponibilidad son aquellas que han sido adquiridas utilizando el
espectrómetro de imagen AVIRIS (Airborne Visible and Infrared Imaging Spectrometer ) [2]. El
instrumento registra imágenes en las porciones del espectro que comprenden de 400 a 2500
nm, con una resolución espectral de 10 nm. Una imagen adquirida en un área determinada
consta de 5 escenas; a su vez, cada una de estas escenas está formada por 512 líneas × 614
pixeles × 224 bandas espectrales, en donde los valores de reectancia están escalados por un
factor de 10000. Debido a que el instrumento se coloca en una plataforma aérea, cada pixel
de la imagen corresponde a un área terrestre de 20 × 20 = 400 m2 . Las imágenes que están
disponibles para investigación han sido registradas sobre las zonas geográcas de Cuprite en
Nevada, además de Moet Field y Jasper Ridge en California, las cuales son importantes para
el estudio de minerales, asentamientos humanos y tipos de vegetación, respectivamente. En
esta investigación se ha considerado el uso de dos imágenes recientemente registradas por un
sensor remoto de la compañía SpecTir, cuyas características serán discutidas más adelante.
1.5. METODOLOGÍA
1.5.1. Propuesta de solución

En este trabajo de investigación se utilizarán desarrollos recientes del álgebra reticular
minimax y su relación con la geometría de conjuntos convexos para la determinación de

puntos extremos en imágenes a color, multiespectrales e hiperespectrales. En el análisis se toma
de base el modelo de mezclado lineal para describir las mezclas espectrales en las imágenes
utilizadas. Así, el objetivo de la técnica presentada consistirá en extraer desde cualquier imagen
el conjunto de puntos extremos que puedan ser utilizados para calcular sus correspondientes
abundancias en la imagen. Además, cualquier pixel de la imagen se podrá representar como
una combinación lineal de éstos.
Basado en el álgebra reticular minimax, el cálculo de dos memorias asociativas reticu-
lares matriciales, conocidas como memorias min-W y max-M , permitirá obtener un conjunto
de puntos extremos relacionados con la imagen. Especícamente, dada una imagen con n
número de bandas, lo único que se requiere es calcular las memorias W y M y sus corre-
spondientes columnas escaladas. El conjunto formado por las columnas escaladas y las cotas
vectoriales mínima y máxima denen los vértices del conjunto convexo mínimo que es capaz
de encerrar a todos los pixeles de la imagen. De ahí que estas columnas puedan ser utilizadas
para calcular las fracciones de los puntos extremos en cada pixel de la imagen.
Las memorias asociativas reticulares fueron introducidas como un nuevo paradigma
en el almacenamiento y recuperación de imágenes afectadas por ruido [18, 19]. Posterior-
mente se propuso utilizar algunas de sus propiedades para determinar miembros nales en
imágenes hiperespectrales [11]. Más recientemente, algunas otras aplicaciones han estado ori-
entadas a la determinación de conjuntos reticularmente independientes [20, 32]. Finalmente,
con el propósito de realizar una comparación cuantitativa de los resultados obtenidos con el
método propuesto, se realiza una comparación con aquellos determinados con el análisis de
componentes de vértices (VCA), descrito en p. 7.
1.5.2. Estructura del trabajo de tesis

La estructura de este documento es la siguiente. En el capítulo 2 se introducen los
fundamentos físicos de los procesos de interacción entre materia y energía, los cuales son
1.5. METODOLOGÍA
la base de la espectroscopía. Enseguida se describen algunos aspectos de instrumentación

que son importantes para conocer el funcionamiento de los espectrómetros. Más adelante se
presentan los resultados obtenidos al realizar el registro de espectros de energía reejada para
diversos tipos de vegetación en diferentes condiciones de vitalidad. El capítulo concluye con
una explicación de un instrumento moderno que se utiliza para registrar múltiples imágenes
de las características espectrales de una escena.
El capítulo 3 inicia con una breve explicación acerca de la geometría de conjuntos
convexos y su representación en espacios multidimensionales. Más adelante se dan los conceptos
y las propiedades del álgebra reticular minimax, que conforman la base matemática de esta
investigación. Después se denen las memorias asociativas reticulares y se mencionan sus
principales propiedades, así como algunas de sus aplicaciones. Finalmente se plantea el vínculo
existente entre la geometría de conjuntos convexos y los vectores columna de las memorias
asociativas reticulares escaladas.
El capítulo 4 inicia con una descripción del procedimiento de análisis que será utilizado
para realizar la segmentación de imágenes en color a partir de las memorias autoasociativas
reticulares. Posteriormente se propone el uso de otros espacios de color para mejorar los re-
sultados que se obtienen con la técnica propuesta. Finalmente, los resultados de segmentación
obtenidos se presentan y se realiza una comparación cuantitativa con algunas otras técnicas
conocidas en la literatura.
En el capítulo 5 se realiza el análisis multiespectral de una de las páginas del palimpses-
to de Arquímedes. Primeramente se realiza una descripción de la instrumentación, utilizada
para registrar la imagen multiespectral del documento, así como algunas técnicas empleadas
para estimar la reectancia espectral. Enseguida se describe la aplicación de las memorias
autoasociativas reticulares para el caso multiespectral. Al nalizar este capítulo se presentan
los resultados de la distribución de pigmentos obtenidos para este tipo de imagen y se realiza
una comparación con el análisis de componentes principales y el agrupamiento con medias-k .
En el capítulo 6 se realiza el análisis de dos imágenes hiperespectrales registradas
por un espectrómetro de imagen de la compañía SpecTir. A partir de la descripción de la
instrumentación y el proceso de calibración de estos dispositivos se realiza una descripción de
1.5. METODOLOGÍA
las características de los datos hiperespectrales. Más adelante, se introduce una modicación
necesaria al método basado en las memorias autoasociativas para poder determinar el conjunto
de puntos extremos en este tipo de imágenes. Subsecuentemente, los mapas de abundancias
de los materiales se presentan para cada punto extremo determinado. Este capítulo concluye
mediante una comparación de los puntos extremos determinados con el método W y M y
el algoritmo VCA. El trabajo de tesis naliza con el capítulo 7 en el que se resumen las
conclusiones principales y se comenta la dirección del trabajo futuro.
Bibliografía
[1] Archimedes Palimpsest, The Archimedes Palimpsest Project, www.archimedespalimpsest.net,

2008.
[2] Aviris JPL., AVIRIS home page, www.aviris.jpl.nasa.gov, 1997.
[3] Bearman G., Zuckerman B., Zucherman K., Chiu J., Multi-spectral digital imaging of Dead Sea
scrolls and other ancient documents, JPL Technical Report, California Institute of Technology,
1995.
[4] Boardman J.W., Automated spectral unmixing of AVIRIS data using convex geometry concepts,
AVIRIS Workshop Proceedings, JPL Publication, Vol. 1, No. 4, pp. 1114, 1993.
[5] Boardman J.W. and Kruse F.A., Automated spectral analysis: A geological example using
AVIRIS data, Northern Grapevine Mountains, Nevada, Proc. 10th Thematic Conference, Ge-
ologic Remote Sensing, San Antonio, TX, 1994.
[6] Chan T.H., Chi C.Y., Huang Y.M., Ma W.K., A convex analysis based minimum-volume enclos-
ing simplex algorithm for hyperspectral unmixing, IEEE Trans. on Signal Processing, Vol. 57,
No. 11, pp. 4418-4432, 2009.
[7] Chang C.-I, Hyperspectral Imaging: Techniques for Spectral Detection and Classication, Vol. 1,
Kluwer Academic, New York, NY, 2003.
[8] Chang C.I., Wu C.C., Liu W.M., Ouyang Y.C., A new growing method for simplex based ex-
traction endmember algorithm, IEEE Trans. on Geoscience and Remote Sensing, Vol. 44, No.
10, pp. 28042819, 2006.
13
BIBLIOGRAFÍA
[9] Craig M.D.,Minimum-volume transforms for remotely sensed data, IEEE Trans. Geoscience and
Remote Sensing, Vol. 32, No. 3, pp. 542552, 1994.
[10] Easton R.L., Knox K.T., Christens-Barry W.A., Multispectral imaging of the Archimedes
Palimpsest, Proc. 32nd AIPR, pp. 111118, 2003.
[11] Graña M., Gallego J., Hyperspectral image analysis with associative morphological memories,
IEEE Proc.: ICIP, Vol. 7803, pp. 549552, 2003.
[12] Gonzalez R.C., Woods R.E., Digital Image Processing, 3rd edition, Pearson Education, pp. 331,
567569, 2008.
[13] Ifarraguerri A., Chang C.-I, Multispectral and hyperspectral image analysis with convex cones,
IEEE Trans. on Geoscience and Remote Sensing, Vol. 37, No. 2, pp. 756770, 1999.
[14] Keshava N., A Survey of spectral unmixing algorithms, Lincoln Laboratoy Journal, Vol. 14, No.
1, pp. 5574, 2003.
[15] More K.A., Spectrometers. In: Encyclopedia of Modern Optics, Robert D. Guenther editor, Vol.
1, pp. 324336, Elsevier, Academic Press, 2005.
[16] Nascimento J.M.P., Bioucas-Díaz J.M., Vertex component analysis: a fast algorithm to unmix
hyperspectral data, IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 4, pp. 898910,
2005.
[17] Plaza A., Martínez P., Pérez R., Plaza J., Spatial/spectral endmember extraction by multidi-
mensional morphological operations, IEEE Trans. on Geoscience and Remote Sensing, Vol. 49,
No. 9, pp. 20252041, 2002.
[18] Ritter G. X., Sussner P., Diaz de Leon J. L., Morphological associative memories, IEEE Trans.
Neural Networks, Vol. 9, No. 2, pp. 281293, 1998.
[19] Ritter G.X., Urcid G., Iancu L., Reconstruction of patterns from noisy inputs using morpho-
logical associative memories, Jour. of Math. Imag. and Vis., Vol. 19, No. 2, pp. 95111, 2003.
[20] Ritter G.X., Schmalz M.S., Urcid G., Ecient autonomous endmember determination using
lattice auto-associative memories, WSC Proc. of the 10th Joint Conference on Information Sci-
ences, pp. 16321638, 2007.
BIBLIOGRAFÍA
[21] Valdiviezo J.C., Urcid G., Hyperspectral endmember detection based on strong lattice indepen-
dence, SPIE Proc.: Applications of Digital Image Processing XXX, Vol. 6696, pp. 669625:112,
2007.
[22] Ware G.A., Chabries D.M., Christiansen R.W., Brady J.E., Martin C.E., Multispectral Analysis
of Ancient Maya Pigments: Implications for the Naj Tunich Corpus, IEEE Proc.: IGARSS, Vol
6, pp. 24892491, 2000.
[23] Winter M.E., N-FINDR: An algorithm for fast autonomous spectral endmember determination
in hyperspectral data, SPIE Proc.: Imaging Spectrometry V, pp. 266275, 1999.
Capítulo 2
Fundamentos de Espectroscopía
En este capítulo se introducen los fundamentos físicos de la emisión y absorción de energía

radiante, que serán útilies para comprender los capítulos subsecuentes. En particular, se hace
una descripción de los procesos fundamentales de interacción entre materia y energía; enseguida
se presenta una descripción de los instrumentos utilizados para medir espectros de energía y
se presentan algunos aspectos de su adquisición en el laboratorio utilizando un espectrómetro
de línea particular. Por último, se presenta la descripción de un espectrómetro de imagen.
2.1. Principios
La espectroscopía es un área de estudio importante cuyas técnicas han sido aplicadas con
éxito en áreas diversas como astronomía, biología, química y, en los últimos años, la percepción
remota. Formalmente, la espectroscopía consiste en el estudio de la materia y su interacción
con la energía radiante o radiación [15]. Las primeras aplicaciones de este campo de estudio
están relacionadas con la identicación de sustancias a partir del espectro de energía emitido
o absorbido. En la actualidad, las aplicaciones de la espectroscopía incluyen la medición de la
composición química, así como las propiedades físicas de diversos materiales.
16
2.1. PRINCIPIOS
2.1.1. La radiación electromagnética

Nuestros ojos son capaces de detectar una pequeña parte de la energía radiante existente
en la naturaleza y que hemos denominado luz visible; sin embargo, ésta corresponde a una
pequeña porción de la radiación electromagnética que es posible detectar con otros dispositivos.
La radiación electromagnética se ha clasicado en base a su energía o frecuencia, en lo que se
conoce como espectro electromagnético. Una clasicación del espectro en orden creciente de
energía es la siguiente: ondas de radio, microondas, infrarrojo, luz visible, ultravioleta, rayos X
y rayos gamma; mientras que las ondas de radio y las microondas poseen la menor cantidad de
energía, los rayos gamma son el tipo de radiación con la mayor energía. Además, una propiedad
importante que comparten todas las formas de radiación electromagnética es su velocidad de
propagación en el espacio libre; a esta velocidad se le conoce como velocidad de la luz c y su
valor es 299, 793 km/s [15]. Otra característica importante de la radiación electromagnética es
que su comportamiento puede ser descrito tanto como el de una onda como de un conjunto
de partículas.
Desde el punto de vista clásico de las ecuaciones de Maxwell, la radiación electromag-
nética es considerada como una onda sinusoidal compuesta por un campo eléctrico E y un
campo magnético B vibrando en planos perpendiculares uno respecto del otro. Estos campos
están en fase y sus magnitudes se representan como E y B , respectivamente. Además, cada
onda electromagnética está caracterizada por su longitud de onda λ (distancia entre picos)
y su frecuencia ν (número de ciclos por segundo), las cuales se relacionan con la velocidad
de la luz mediante λν = c. Es importante observar que, conforme aumenta la longitud de
onda, disminuye la frecuencia o energía. En la gura 2.1 se presentan las distintas bandas que
conforman el espectro electromagnético.
2.1.2. Interacción materia-energía

La radiación electromagnética que interactúa con la materia puede sufrir diversos cam-
bios que dependen de la constitución física y química de los materiales que han sido expuestos
a esta radiación [14]. Al considerar una onda electromagnética que viaja en el espacio libre
y se encuentra en la frontera con algún medio material, parte de ella será reejada en la
2.1. PRINCIPIOS
22 19 16 13 11 9
10 10 10 10 10 10 10 3
n(Hz)
Rayos Rayos UV IR Micro Radio

Gamma X ondas
l(m)
-15 -11
10 10 10-8 10-6 10-3 10-1 10 5
l(nm) 400 700
Figura 2.1: Espectro electromagnético en orden creciente de longitud de onda.
frontera y la otra parte será transmitida al medio material dependiendo de su constitución.

Los fenómenos conocidos como reexión, transmisión, absorción y emisión se describen en las
siguientes líneas.
La reexión ocurre en la frontera que divide a los dos medios materiales y su dirección
dependerá tanto del ángulo de incidencia de la onda, así como de la rugosidad de la supercie.
Si la supercie es suave comparada con la longitud de onda incidente, la reexión será de
manera especular; en caso contrario, si la supercie es rugosa, la energía será dispersada en
diversas direcciones.
El fenómeno de transmisión de la onda electromagnética al medio causa un cambio en
su dirección de propagación, el cual se debe a una disminución de su velocidad al entrar a un
medio más denso. La ecuación que relaciona los ángulos de incidencia θ1 y refracción θ2 con
los índices de refracción de dos medios materiales n1 y n2 , respectivamente, está dada por la
ley de Snell-Descartes,
n1 sin θ1 = n2 sin θ2 . (2.1)
Por otra parte, la radiación transmitida puede ser absorbida por las moléculas del
material en ciertas longitudes de onda; a este fenómeno se le conoce como absorción y depende
de la constitución química del material. Finalmente, la energía que es absorbida por el material
se transforma en energía calórica que aumenta su temperatura; a su vez, esta energía puede
2.1. PRINCIPIOS
ser emitida en forma de radiación. A dicho fenómeno se le conoce como emisión, en donde la
longitud de onda emitida dependerá de la temperatura del material.
2.1.3. Espectros de emisión y absorción

Los primeros espectros de luz que fueron registrados datan del siglo XVII con los
experimentos de Isaac Newton, en los que descubre que la luz se dispersa en distintos colores
al pasar a través de un prisma. Más tarde se descubrió que un arreglo de alambres paralelos
e igualmente espaciados también eran capaces de dispersar luz. Estos descubrimientos cons-
tituyen los fundamentos de la espectroscopía y han permitido el desarrollo de instrumentos
para producir espectros de aborción y emisión a partir de algún material.
Durante el siglo XIX, diversos experimentos no pudieron ser explicados desde el punto
de vista clásico en el que la materia interactúa con la energía en forma continua. Así, los
trabajos de diversos cientícos como Planck y Bohr sugirieron que en muchas procesos de
interacción, la energía electromagnética podía ser tratada como un conjunto de partículas o
cuantos, cuya energía E está dada por:
E = hν, (2.2)
donde h = 6,626 × 10−34 J·s es la constante de Planck y ν es equivalente a la frecuencia de

la onda [15]. Basado en estos postulados, Niels Bohr propuso uno de los primeros modelos
atómicos que dieron una clara explicación al fenómeno de absorción y emisión de energía. En
este modelo atómico los electrones se consideran partículas pequeñas con carga negativa que se
mueven alrededor del núcleo del átomo, cargado positivamente. La interacción entre el núcleo
y los electrones mantienen al electrón en órbita. Este movimiento está restringido a intervalos
bien denidos a partir del núcleo y que se pueden pensar como niveles de energía permitidos.
Para explicar los espectros de emisión, Bohr descubrió que los átomos obedecen tres reglas
básicas.
1. Los electrones sólo tienen ciertos niveles de energía que corresponden a distancias desde
el núcleo. En estos niveles de energía, el electrón no perderá o absorberá energía.
2.1. PRINCIPIOS
2. Las órbitas más cercanas al núcleo tienen energía más baja.
3. Los átomos tienden a estar en el estado de energía más bajo posible, llamado estado
base.
En efecto, para que un electrón cambie a un nivel de energía más alto se necesita aplicar una
determinada cantidad de energía. Si la cantidad de energía recibida es suciente, el electrón
cambiará a un nuevo estado como resultado de una absorción. Una vez que el electrón está
en una órbita más alta, éste posee energía potencial. Después de un tiempo corto el electrón
regresa a un nivel de energía más bajo, emitiendo radiación. La cantidad de radiación emitida
es una función del fotón de energía absorbido.
En la actualidad se ha comprobado que cuando una molécula interacciona con la ra-
diación, un cuanto de energía o fotón se emite o absorbe. Así, el cambio de energía para
una molécula entre los niveles E1 y E2 , donde E1 ≥ E2 , puede ocurrir suministrando la en-
ergía apropiada ∆E = E1 − E2 . La frecuencia de emisión o absorción de radiación para una
transición entre estos estados de energía está dada por,
E1 − E2
ν= . (2.3)
h
Lo anterior explica que para una molécula que se encuentra en el estado E2 y recibe radiación
electromagnética con frecuencia ν , la energía será absorbida y la molécula pasará al estado E1
[2]. Las absorciones de energía ocurren cuando la frecuencia de la energía incidente es igual a
la frecuencia de resonancia del átomo o molécula.
Los procesos de emisión y absorción selectiva de energía son utilizados para determinar
la composición química de las moléculas e identicar a los materiales. Al realizar un muestreo
de las líneas de energía emitidas por un material en función de la longitud de onda incidente
se tiene un espectro de emisión. Por otra parte, si el muestreo se realiza tomando en cuenta
las líneas de absorción en función de la longitud de onda incidente, el espectro se conoce como
espectro de absorción [2, 3].
2.1. PRINCIPIOS
2.1.4. Reectancia, absortancia y transmitancia

Las cantidades radiométricas de reectancia, absortancia y transmitancia se utilizan
con frecuencia en espectroscopía y en sensado remoto para representar la cantidad de ujo
radiante incidente que entra o sale de alguna supercie. La ecuación que establece una relación
para la cantidad total de ujo radiante incidente sobre una supercie, Φi(λ) , en una longitud
de onda λ, debe considerar la cantidad de ujo reejado por la supercie Φr(λ) , la cantidad
de ujo absorbido Φα(λ) y la cantidad de ujo transmitido a través de la supercie Φτ (λ) (por
ejemplo en unidades de W/cm2 ), ésto es,
Φi(λ) = Φr(λ) + Φα(λ) + Φτ (λ) . (2.4)
Estas cantidades radiométricas están basadas en la cantidad de energía radiante incidente a

una supercie en cualquier ángulo. Por tanto, se denen la reectancia r(λ), la transmitancia
τ (λ) y la absortancia α(λ), como la razón entre el ujo radiante reejado, transmitido o
absorbido, respectivamente por una supercie, y el ujo incidente a ésta, las cuales están
denidas por las relaciones
Φr(λ) Φτ (λ) Φα(λ)

r(λ) = , τ (λ) = , α(λ) = . (2.5)
Φi(λ) Φi(λ) Φi(λ)
En efecto, tomando en cuenta las cantidades radiométricas antes denidas, se puede

escribir la ec. (2.4) como:
i(λ) = r(λ) + α(λ) + τ (λ) = 1. (2.6)
Esta ecuación implica que la energía radiante incidente debe conservarse ya sea que se reeje,
se trasmita a través del material, se disperse y sea absorbida para luego ser transformada en
alguna otra forma de energía.
2.1.5. Características espectrales de la vegetación

La vegetación constituye uno de los objetivos de estudio de esta investigación ya que nos
permite analizar los factores que controlan la reectancia en las hojas como, por ejemplo, la
pigmentación y la humedad, así como estudiar las diferencias en la forma del espectro adquirido
2.1. PRINCIPIOS
debido a cambios en las condiciones físicas, como la temperatura o vitalidad de la muestra.

La vegetación absorbe gran cantidad de la energía radiante incidente que corresponde a la
porción visible debido a la fotosíntesis. Además, aproximadamente la mitad del ujo radiante
incidente que corresponde al infrarrojo cercano es reejado por ella [10].
La fotosíntesis es un proceso de almacenamiento de energía que tiene lugar en las hojas
y en otras partes verdes de las plantas en presencia de luz. Este proceso se inicia cuando la
luz del sol llega a los cloroplastos, que son pequeños cuerpos en la hoja que contienen una
sustancia verde llamada clorola. La energía luminosa se almacena en una molécula simple de
azúcar (glucosa) que se produce por el bióxido de carbono (CO2 ) y el agua (H2 0) absorbida
por la planta. Cuando el dióxido de carbono y el agua se combinan, lo que forma una molécula
de azúcar (C6 H12 O6 ) en un cloroplasto, se libera gas de oxígeno (O2 ).
La energía electromagnética proveniente del sol interactúa con los pigmentos, el agua
y los espacios intercelulares dentro de la hoja de la planta. La cantidad de ujo radiante
reejado por la hoja (Φr ), el ujo absorbido (Φα ), y la cantidad de ujo radiante transmitido
a través de la hoja (Φτ ) pueden ser medidos cuidadosamente. En base a la ec. (2.4), la energía
reejada por la supercie de la hoja es igual a la energía incidente menos la energía absorbida
y la transmitida por la hoja. Tomando en cuenta la ec. (2.6), la relación entre la reectancia
espectral de la hoja con la absortancia y transmitancia dentro de la hoja puede escribirse de
la siguiente manera:
r(λ) = i(λ) − α(λ) − τ (λ), (2.7)
donde la energía reejada por la supercie de la hoja es igual a la energía incidente menos
la energía absorbida directamente por la planta para realizar la fotosíntesis y la cantidad de
energía transmitida a través de la hoja.
Los factores dominantes que controlan la reectancia de las hojas en la porción visible
del espectro son los pigmentos conocidos como clorola a, b y β -caroteno. De esta manera,
cuando un fotón de luz llega a una molécula, ésta reeja algo de la energía o puede absorberla y
así entrar dentro de un estado excitado. Cada molécula absorbe o reeja sus propias longitudes
de onda características. En una planta verde común, las moléculas han evolucionado para
absorber longitudes de onda en la porción visible (350 a 700 nm) y son denominadas pigmentos.
2.2. ESPECTRÓMETROS
El espectro de absorción para un pigmento particular describe las longitudes de onda a las
cuales éste puede absorber luz y entrar a un estado excitado. Los pigmentos de clorola son
los más importantes en la planta pues absorben en las longitudes de onda de 430 y 660 nm
(clorola a ), y en 450 y 650 nm (clorola b ); estos espectros de absorción se pueden ver en la
gura 2.2. En efecto, la absorción más baja de las longitudes de onda verdes, comparada con
aquellas que corresponden al rojo y azul, hacen que las plantas en estado saludable las veamos
verdes.
clorofila b
clorofila a
Absortancia
Longitud de onda (nm)
Figura 2.2: Espectro de absorción de la clorola a y b.
2.2. Espectrómetros
El instrumento utilizado para medir la energía reejada o emitida por un material en

función de la longitud de onda se denomina espectrómetro. El elemento encargado de dispersar
la energía electromagnética de entrada se conoce como monocromador, mismo que puede ser un
prisma o una rejilla de difracción [1]. Los elementos ópticos que conforman un espectrómetro se
ilustran en la gura 2.3. Básicamente, el funcionamiento de estos instrumentos es el siguiente:
una fuente de luz ilumina a una rendija de entrada y, por medio de una lente o espejo, el frente
de onda es colimado. Entonces la radiación se dispersa al pasar a través del monocromador y
con ello la dirección de propagación de los rayos depende de la longitud de onda. Finalmente, la
radiación se enfoca nuevamente y el espectro consiste en una serie de imágenes monocromáticas
de la rendija de entrada. A la salida del instrumento es posible utilizar algún sistema de
detección para registrar el espectro.
fuente de elemento elemento

iluminación rendija colimador espectro
dispersor de enfoque
Figura 2.3: Componentes ópticos de un espectrómetro.
Los espectrómetros pueden registrar espectros de absorción o emisión dependiendo de

la posición en la que se coloque la muestra. Para los espectrómetros de emisión, la radiación de
interés es aquella que sale de la muestra ya que los fotones interactúan con sus componentes
y entonces son reemitidos a diferentes longitudes de onda, como es el caso de la uorescen-
cia o fosforescencia. De esta manera, para poder determinar la longitud de onda emitida es
necesario posicionar el monocromador después de la muestra. En el caso de los espectrómetros
de absorción, la muestra se coloca después del monocromador y con ello se determinan las
longitudes de onda que fueron absorbidas por sus componentes.
Con el paso del tiempo, los sistemas de detección utilizados para registrar la radiación
de salida de un espectrómetro han ido cambiando. En sus inicios, los espectrómetros requerían
del uso de placas fotográcas para registrar el espectro de algún material. En la actualidad,
el desarrollo de nuevos detectores ha permitido reemplazar estas placas por detectores de u-
jo radiante, como los fotomultiplicadores, o por arreglos de dispositivos acoplados por carga
(coupled-charge devices, CCD). A los instrumentos que utilizan un arreglo lineal de fotodetec-
tores para realizar el registro del espectro de salida se les denomina espectrómetros de línea.
i1 d
i'
2
i
'
1 i
2
W
n P1
B
Figura 2.4: Estructura de un espectrómetro de prisma elemental, W denota el ancho del haz
de iluminación y P1 dene el primer plano principal.
2.2.1. Resolución del monocromador

El monocromador de un espectrómetro tiene la función de separar las distintas longi-
tudes de onda que conforman a la radiación de entrada. De esta manera es posible utilizar un
prisma o una rejilla dependiendo del poder de resolución que se requiere para el instrumento.
En el caso de un prisma dispersor, la luz colimada entrante1 se dispersa a diferentes ángulos
debido a la dependencia de la longitud de onda con el índice de refracción. Además, la distor-
sión de la imagen de la rendija de entrada se evita mediante el uso de iluminación de ondas
planas. Sin embargo, aún con este tipo de iluminación, la imagen de la rendija es curva ya que
no todos los rayos pueden atravesar el prisma en su primer plano principal.
Dado un prisma ajustado a la posición de desviación mínima, como el que se muestra
en la gura 2.4, debe cumplirse que:
′ ′
i1 = i2 = α/2 e i1 = i2 = (δm + α)/2, (2.8)
′ ′
donde i1 e i2 son los ángulos de entrada y salida, i1 e i2 son los ángulos internos de refracción,
α es el ángulo del prisma y δm es el denominado ángulo de desviación mínima. Para ángulos
pequeños, i.e., si θ ≤ 50 , la expresión para el ángulo de desviación mínima es la siguiente:
δm = α(n − 1). (2.9)

1 se entiende por luz colimada a aquella en la que los rayos son mutuamente paralelos y se propagan con un
mismo ancho W a lo largo de cualquier trayectoria.
d
s
Figura 2.5: Perl de una rejilla líneal de difracción con N líneas; d es el periodo de la rejilla y
s es la separación entre líneas.
donde n es el índice de refracción del vidrio. Por otra parte, la dispersión angular resultante
se dene como dδm /dλ = (B/W )(dn/dλ), siendo B la longitud de la base del prisma, W el
ancho del haz de iluminación y n el índice de refracción. De acuerdo al criterio de Rayleigh se
dene el poder de resolución de un instrumento, Pr , como la longitud de onda más pequeña
que se puede resolver, dividida entre la longitud promedio en esa región espectral, ésto es,
λ λ dδm λ B dn
Pr = = = . (2.10)
∆λ dδm dλ dδm W dλ
El límite de resolución depende de la difracción debido al ancho del haz nito o a la

apertura efectiva del prisma, la cual es rectangular, por lo que
λ λ B dn dn
Pr = = · =B· . (2.11)
∆λ λ/W W dλ dλ
La ecuación anterior indica que, dado algún tipo de vidrio, el poder de resolución de un
prisma depende sólamente del máximo grosor del vidrio atravesado por los rayos y del índice
de refracción, siendo independiente del ángulo del prisma [12].
En el caso de considerar una rejilla de difracción con N líneas, como la que se muestra
en la gura 2.5, se obtiene que la separación entre un máximo primario de orden m y un
mínimo vecino está dada por ∆p = λ/N d. Si la longitud de onda se cambia por una cantidad
∆λ, el máximo de orden m está desplazado por una cantidad
′ |m|
∆p= ∆λ. (2.12)
d
Suponiendo que las líneas de longitud de onda λ ± 12 ∆λ estarán resueltas cuando el máximo
de una longitud coincida con el primer mínimo de la otra, se tiene en el límite de resolución
′
en el orden m que ∆p = ∆ p, y según [4],
λ ∆pN d|m|
= = |m|N. (2.13)
∆λ ∆′ p d
Así, el poder de resolución para una rejilla es igual al producto del orden m y el número de
líneas N en la rejilla.
2.2.2. Espectrómetro de línea BRC111A

Con el objetivo de realizar el registro espectral de diversos materiales en el laboratorio
se ha utilizado un espectrómetro de línea de la serie BRC111A, fabricado por la compañía
BWTek. Las partes que conforman el instrumento son: un espectrómetro, una fuente de ilumi-
nación de halógeno-tungsteno y una punta de prueba de bra óptica. Además, el instrumento
cuenta con un programa para controlar y visualizar los espectros registrados; el puerto de
comunicación para esta interfaz es el canal universal serial (universal serial bus, USB).
Los componentes ópticos del espectrómetro conforman un arreglo de tipo Czerny-
Turnerhaz de haz cruzado. El sistema de detección de este dispositivo lo constituyen 2048
elementos CCD que cubren la región espectral desde 350 a 1050 nm a una resolución alrede-
dor de 0.42 nm. Algunas especicaciones técnicas se presentan en la Tabla 2.1. Respecto a la
fuente de iluminación de halógeno-tungsteno, la radiación que emite se encuentra en la porción
visible a infrarrojo cercano (visible - near infrared, VIS-NIR), con una potencia de salida de 5
W; la gura 2.6 despliega el espectro de emisión de la fuente. El voltaje de alimentación para
esta fuente es de 6 V de corriente directa.
Tabla 2.1: Parámetros del espectrómetro de línea BRC111A
Parámetro Especicación
Intervalo espectral 350 a 1050 nm
Tamaño del CCD 14 × 200µm
F# del espectrógrafo 3.0
Rejilla 700 líneas/mm
Dimensiones 97 × 65 × 32 mm
Tiempo de integración 9-65535 ms
Interfaz puerto USB 2.0
Figura 2.6: Espectro de emisión de la fuente de iluminación.
Respecto a la punta de prueba de bra óptica, su estructura bifurcada permite conectar

uno de los extremos a la fuente de iluminación, mientras el otro se conecta al espectrómetro.
Además, en su interior, la punta está conformada por siete bras, seis de las cuales tienen
un diámetro de 200 µm y que se utilizan para iluminar la muestra; la otra bra, localizada
en el centro y con diámetro ligeramente más grande, registra el espectro. De esta manera, la
punta de prueba ilumina al objeto de estudio y simultáneamente registra el espectro de la luz
reejada. La gura 2.7 presenta el diagrama de conexiones de los componentes que conforman
el espectrómetro.
Fuente de Punta de
iluminación Objeto
prueba
Espectrómetro Computadora
Figura 2.7: Diagrama de conexión de los componentes del espectrómetro de línea BRC111A.
2.2.3. Calibración del instrumento

Un primer experimento que se realizó fue el de vericar la calibración por longitud de
onda del espectrómetro. Para ello se determinó la respuesta de transmisión para un conjunto
de 7 ltros interferométricos pasabandas fabricados por Melles Griot.2 El arreglo utilizado se
muestra en la gura 2.8. El procedimiento realizado para esta calibración es el siguiente. La
radiación proveniente de la fuente de tungsteno se hace incidir en forma normal a una de las
caras del ltro; la energía que se transmite a través del ltro es registrada por medio de la
punta de prueba, en la que uno de sus extremos se conecta al espectrómetro. El software de
adquisición permite ver la gráca del espectro adquirido, así como la longitud de onda central
(λ0 ) transmitida para cada uno de los ltros. Estas longitudes de onda fueron comparadas
con aquellas longitudes de onda centrales de transmisión reportadas por el fabricante en las
hojas de datos [11]. Las guras 2.9 y 2.10 presentan los espectros de transmisión para los
ltros centrados en (a) λ0 = 450 nm (azul) y (b) λ0 = 650 nm (naranja), respectivamente. Los
resultados en la determinación de las longitudes de onda central se resumen en la Tabla 2.2.
Figura 2.8: Arreglo utilizado para vericar la calibración por longitud de onda.
2 Los ltros pasabandas utilizados son de forma circular con un diámetro de 4.5 cm, cuentan con un ancho
de banda aproximado de 10 nm al 50 % de transmisión, cubriendo el rango espectral visible.
Tabla 2.2: Comparación de las longitudes de onda especicadas por el fabricante y las determinadas por
medio del espectrómetro BRC111A para un conjunto de ltros interferométricos fabricados por Melles Griot.
Filtro λ0 especicada λ0 determinada Error |Error relativo|

002-400 401.66 401.70 ± 0.04 9.9 ×10−5
004-450 452.12 451.80 ± 0.32 70.8 ×10−5
006-500 502.22 502.20 ± 0.02 3.9 ×10−5
008-550 552.38 552.60 ± 0.22 39.8 ×10−5
018-600 602.12 602.90 ± 0.78 29.5 ×10−5
022-650 652.06 653.10 ± 1.04 1.6 ×10−3
024-700 702.97 704.80 ± 1.80 2.6 ×10−3
Tabla 2.3: Comparación de las frecuencias de corte especicadas por el fabricante y aquellas determinadas
por medio del espectrómetro BRC111A para un conjunto de ltros pasa altas de Newport.
Filtro D0 esp. (nm) D0 det. (nm) Error |Error relativo|

OG515 515 515.6 ± 0.6 11.6 ×10−4
OG550 550 550.4 ± 0.4 7.2 ×10−4
RG610 610 611.2 ± 1.2 19.6 ×10−4
RG715 715 714.9 ± 0.1 1.4 ×10−4
RG780 780 781.2 ± 1.2 15.4 ×10−4
RG830 830 831.1 ± 1.1 13.2 ×10−4
RG850 850 848.6 ± 1.4 16.5 ×10−4
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.9: Espectro de energía transmitida para el ltro pasa-bandas con λ0 = 450 nm.
Además de caracterizar la respuesta del conjunto de ltros interferométricos se deter-

minó el espectro de radiación transmitida y las frecuencias de corte para 7 ltros pasa-altas
fabricados por Newport y que abarcan diferentes porciones del espectro electromagnético [13].3
Las guras 2.11 y 2.12 presentan los espectros de transmisión para los ltros con frecuencias
de corte en 515 nm y 715 nm, respectivamente. De acuerdo a las Tablas 2.2 y 2.3, para todos
los casos las frecuencias determinadas con el espectrómetro prácticamente coinciden con las
especicadas en las respectivas hojas de datos.
2.3. Registro espectral de materiales
Una vez vericada la calibración del instrumento se realizó, a manera de ejemplo, el

registro de espectros de ciertos tipos de vegetación. Para ello, con el objetivo de determinar la
3 Los ltros pasa-altas utilizados para este experimento son de forma cuadrada con una longitud de 5 cm
por lado.
Figura 2.10: Espectro de energía transmitida para el ltro pasa-bandas con λ0 = 650 nm.
distancia óptima a la cual se debía colocar la punta de prueba sobre el material bajo estudio,
se realizó un primer experimento utilizando una base movible. La punta de prueba se fue
desplazando gradualmente, usando un micrómetro, en distancias entre 0 y 15 mm por encima
de la muestra. De acuerdo a los resultados obtenidos, el rango de tolerancia en el que el
espectro conserva su forma está entre 0 y 1 mm.
El proceso de adquisición de espectros se inicia primeramente con el registro de un
espectro oscuro ; enseguida se realiza el registro espectral de un material de referencia y, por
último, el espectro del material bajo estudio. El espectro oscuro se puede registrar colocando
la punta de prueba sobre una supercie oscura o apagando la fuente de iluminación y tiene
la función de corregir los espectros adquiridos pues elimina el efecto de la luz presente en
el ambiente. Por su parte, el espectro de referencia se puede obtener a partir de un blanco
estándar (spectralón), que se caracteriza por tener alta reectancia en una amplia porción
del espectro electromagnético; este espectro se utiliza para convertir los datos de intensidad
relativa a valores de reectancia espectral. Además, ambos espectros se utilizan para realizar
Figura 2.11: Espectro de energía transmitida para el ltro pasa-altas con frecuencia de corte en 515 nm.
mediciones de color de las muestras. El último paso consiste en registrar el espectro de energía
reejada del material. En efecto, el software de adquisición del instrumento permite registrar
y visualizar los espectros en tiempo real.
2.3.1. Espectros de vegetación

Los tipos de vegetación utilizados en los experimentos que se presentan a continuación
pertenecen a hojas verdes o amarillas de las especies: alcanfor, pasto, pino y bugambilia,4
además de cáscaras de jitomate y mandarina. La gura 2.13 presenta el arreglo que se ha
utilizado para la adquisición de espectros de luz reejada para los distintos tipos de vegetación;
en la gura 2.14 se presenta el espectro registrado para una hoja de alcanfor en estados de
vitalidad verde y amarillo, mientras que en la gura 2.15 se muestra el espectro colectado
para una hoja del árbol de pino y que fue registrado a lo largo de tres días para observar los
cambios en la forma del espectro debidos a pérdidas en su vitalidad.
4 Las muestras fueron recolectadas el 11 de noviembre de 2009 en las instalaciones del INAOE.
Las grácas anteriores caracterizan la respuesta espectral típica de una planta verde
saludable, en donde las bandas de absorción fuertes se presentan en las regiones azul (λ = 450
nm) y roja (λ = 650 nm), con un pico de energía reejada en la región verde del espectro visible
(0.08 en 550 nm). Aproximadamente el 0.8 de la energía incidente en la porción infrarroja
cercana es reejada por la hoja en λ = 720 nm. Por otra parte, conforme disminuye la inuencia
de la clorola en el espectro obtenido para las hojas amarillas, cantidades más grandes de luz
verde y roja son reejadas por la hoja, lo que resulta en una apariencia amarilla.
En las guras 2.16 y 2.17 se presentan los espectros de energía reejada para una hoja
de pasto verde y una de pasto seca. Al igual que en el caso anterior, el máximo de energía
reejada en la porción visible se localiza en λ = 550 nm. Cuando la hoja de pasto pierde su
vitalidad, la forma de la curva espectral se modica completamente, presentando un máximo
para la región visible localizado en λ = 650 nm.
En las guras 2.18 y 2.19 se presentan los espectros de energía reejados que corre-
sponden a una hoja rojiza del árbol de la familia del pino y a uno de los pétalos de la planta
conocida como bugambilia roja, respectivamente. En el primer caso el espectro está caracter-
izado por absorciones máximas en las longitudes de onda de 550 nm y 600 nm del espectro
visible. El máximo de reexión se localiza alrededor de 700 nm, lo cual explica el color rojizo
presente en la hoja. El segundo espectro presenta una forma parecida al caso anterior, con la
diferencia de que el espectro es plano en las longitudes de onda verde y azul; el máximo de
reexión se presenta alrededor de 710 nm, lo que origina la coloración guinda en el pétalo de
la planta.
Por otra parte, en las guras 2.20 y 2.21 se presentan las curvas espectrales de la energía
reejada por la cáscara de un jitomate, así como el exterior de una mandarina, respectivamente.
En el primer caso, el espectro registrado presenta un intervalo máximo de energía reejada
aproximadamente entre 630 y 720 nm, el cual es relativamente plano; en el espectro de la
derecha se puede observar que, aunque la forma de la gráca es similar al obtenido para la
hoja rojiza de la gura anterior, una de las diferencias radica en que el máximo de energía
reejada se presenta en 650 nm, lo cual explica la coloración naranja que se aprecia en la
cáscara de mandarina.
2.3.2. Mezclas espectrales

De acuerdo a lo discutido en el Capítulo 1, muchos de los pixeles espectrales que son
registrados por un sensor remoto contienen la mezcla de espectros de diversos materiales. Para
simular la forma en que se presentan dichas mezclas se realizaron los siguientes experimentos.
En primer lugar, la punta de prueba se colocó en la distancia focal de una lente convergente
con f=5 cm para extender el campo de visión de la punta de prueba, lo que permitiría colocar
diversos materiales dentro del campo de visión. Sin embargo, debido a que la distancia de
detección de la punta está limitada a 1 cm, con este arreglo no se obtuvieron resultados
adecuados. En el siguiente experimento se emplearon materiales pequeños (alrededor de 2 mm
por lado) mezclados de manera homogénea para que la punta de prueba pudiera registrar el
espectro combinado de dichos meteriales. De esta manera, en un primer caso se utilizaron
fragmentos de una hoja verde y una seca, los cuales se colocaron, en la misma proporción,
en un porta objetos para colectar el espectro correspondiente. El espectro adquirido mediante
este procedimiento se presenta en la gura 2.22.
En un segundo caso se utilizaron fragmentos pequeños de otro tipo de vegetación
en estados amarillo y verde, los cuales se han denotado respectivamente como espectro A y
espectro B. Las dos muestras de vegetación se mezclaron y la punta de prueba se colocó sobre
las muestras para registrar el espectro correspondiente. La gura 2.23 presenta los espectros de
la vegetación A y B, además del espectro mezclado adquirido con el procedimiento descrito. Por
último, para comprobar que el espectro mezclado se puede representar como una combinación
lineal de los espectros A y B se determinó una función f (λ) con dos coecientes particulares
para aproximar la forma del espectro mezclado. La función que mejor aproxima esta curva está
representada por f (λ) =0.8A+0.2B . En la gura se muestra, en línea punteada, la función
que aproxima esta mezcla espectral. De acuerdo a estos resultados, una combinación lineal
de los espectros de los materiales permite realizar una primera aproximación a las mezclas
espectrales.
Figura 2.12: Espectro de energía transmitida para el ltro pasa-altas con frecuencia de corte en 715 nm.
Figura 2.13: Arreglo utilizado para el registro de espectros de vegetación.
Figura 2.14: Espectros de energía reejada para una hoja de alcanfor en estados amarillo y seco.
Figura 2.15: Espectros de energía reejada registrada durante tres días para una hoja de pino.
Figura 2.16: Espectro de energía reejada para una hoja de pasto verde.
Figura 2.17: Espectro de energía reejada para una hoja de pasto seco.
Figura 2.18: Espectro de energía reejada para una hoja de árbol rojiza de la familia del pino.
Figura 2.19: Espectro de energía reejada para una hoja de bugambilia.
Figura 2.20: Espectro de energía reejada registrado a partir de la cáscara de un jitomate rojo.
Figura 2.21: Espectro de energía reejada para la cáscara de una mandarina.
Figura 2.22: Espectro mezclado obtenido a partir de una hoja verde y una amarilla.
Figura 2.23: Espectro mezclado obtenido a partir de una hoja verde y otra amarilla. En esta gráca f (λ) es
una función cuyos coecientes aproximan la forma del espectro mezclado.
2.4. ESPECTRÓMETROS DE IMAGEN
2.4. Espectrómetros de imagen
El avance conjunto de la tecnología para formar imágenes y la espectroscopía ha per-

mitido el surgimiento de sistemas de adquisición espectral; estos instrumentos, denominados
espectrómetros de imagen, son capaces de formar la imagen de las características espectrales
de un objeto bajo estudio, en múltiples bandas que cubren una amplia región del espectro
electromagnético. Los espectrómetros de imagen han hecho posible la adquisición de datos en
cientos de bandas simultáneamente. Además, debido a la alta precisión de los datos adquiridos,
diversos problemas en áreas como sensado remoto, biología, medicina, entre otros, pueden ser
investigados con gran detalle.
Los espectrómetros de imagen surgieron en los años 80s como una herramienta en la
identicación de los recursos naturales de la supercie de la tierra, en aplicaciones de sensado
remoto. Los precursores de estos instrumentos son los sistemas multiespectrales que utilizan
un arreglo de ltros de banda ancha para registrar imágenes de una escena geográca en
distintas porciones del espectro electromagnético. Por ejemplo el escudriñador multiespectral
LANDSAT (LANDSAT multispectral scanner, MMS), es un sistema optomecánico que utiliza
conjuntos de ltros y elementos detectores discretos para captar la energía reejada por la
supercie terrestre en las porciones visible e infrarrojo cercano. A diferencia de estos sistemas,
los espectrómetros de imagen tienen la capacidad de proporcionar un espectro de reectancia
de alta resolución para cada pixel de la imagen. Lo anterior representa una gran ventaja ya
que el espectro de reectancia registrado puede ser usado para identicar una gran cantidad
de materiales que cubren la supercie terrestre.
En forma general, los elementos que conforman un espectrómetro de imagen son: un
sistema optomecánico que se encarga de captar el ujo radiante reejado, uno o varios espec-
trómetros para separar las distintas longitudes de onda y un arreglo de detectores sensibles
a diferentes longitudes de onda, que forman el conjunto de imágenes. El sistema colector de
luz es importante ya que permite escudriñar el campo de visión instantáneo (instantaneous
eld of view, IFOV) del espectrómetro sobre una escena. En efecto, existen diversas congura-
ciones para registrar la energía reejada. Por ejemplo, en aplicaciones de sensado remoto, el
movimiento de la plataforma aérea es utilizado como parte del sistema de barrido a lo largo
de la escena. Además, otro tipo de espectrómetros de imagen utiliza un ltro espacial lineal
variable colocado sobre un arreglo bidimensional de fotodetectores. Aunque el costo de estos
sistemas es más elevado que los anteriores, proporcionan imágenes bien calibradas ya que cada
elemento detector forma la imagen de la escena en una banda espectral determinada.
De acuerdo al número de bandas adquiridas, un espectrómetro de imagen se puede clasi-
car en las categorías siguientes. Se habla de un sistema multiespectral cuando el instrumento
registra decenas de bandas espectralmente anchas (∼ 50 nm) y separadas; un instrumento se
dice hiperespectral cuando registra cientos de bandas cuasi continuas y espectralmente angostas
(∼ 10 nm). Por su parte, un sistema puede ser ultraespectral cuando es capaz de registrar miles
de bandas contiguas y espectralmente muy angostas (∼ 2 nm). Los sistemas anteriores están
caracterizados por la resolución espectral, que indica el número y el ancho de las bandas re-
gistradas y la resolución espacial, que es una medida del detalle mínimo que puede ser captado
por un instrumento.
Ejemplo: el espectrómetro de imagen MIVIS. Este sistema de espectrómetro de imagen

multiespectral visible e infrarrojo, por las siglas Multispectral Visible and Infrared Imaging
Spectrometer (MIVIS), ha sido desarrollado por SenSyTech Imaging Group para el Consejo
Nacional de Investigación de Italia. El instrumento consta de cuatro espectrómetros y utiliza
un sistema de barrido por línea. En la Tabla 2.4 se presentan el número de bandas y el rango
espectral de cada espectrómetro y en la gura 2.24 se presenta el diagrama óptico de este
instrumento.
Tabla 2.4: Especicaciones técnicas del espectrómetro MIVIS.
Espectrómetro Rango espectral (nm) Bandas

1 433 − 833 20
2 1150 − 1550 8
3 2000 − 2500 64
4 8200 − 12700 10
En este espectrómetro de imagen, un espejo rotatorio de 45◦ barre una línea de pix-
eles sobre la supercie. Cada pixel generado es colimado por medio de un espejo parabólico
rejilla de difracción Espectrómetro

rejilla de difracción
filtro
detectores lente
lente
filtro
lente lente
retardador filtro
arreglo de
detectores
rejilla de difracción filtros dicróicos
espejo Paraboloide
rotatorio espejos secundario
Paraboloide
primario
Sistema apertura
de barrido
Figura 2.24: Diagrama óptico del espectrómetro de imagen MIVIS.
montado en un telescopio Gregoriano. Entonces, el haz colimado es reejado, por medio de

un ensamble Pfund (ltros dicróicos), hacia un banco que contiene cuatro espectrómetros.
Una apertura en el ensamble Pfund dene un IFOV común para cada pixel. El haz colimado
se divide hacia cuatro espectrómetros, ya sea por espejos metálicos o por ltros dicróicos.
Los espejos metálicos reejan longitudes de onda largas y transmiten las cortas. Las capas
dieléctricas múltiples causan interferencia tal que la luz se reeja en las longitudes de onda
cortas y se transmite para las largas. Después de dividir el haz en cuatro bandas (visible,
infrarrojo cercano, infrarrojo medio e infrarrojo térmico) cada banda se dispersa en su propio
espectrómetro. El intervalo de longitudes de onda que abarca cada espectrómetro está basada
en la sensibilidad de diferentes arreglos de fotodetectores usados en cada espectrómetro [12].
Bibliografía
[1] Ball D.W., The Basics of Spectroscopy, Tutorial Texts in Optical Engineering, SPIE Press, Vol.
TT49, pp. 3340, 2001.
[2] Banwell C.N., Fundamentos de Espectroscopía Molecular, Ediciones del Castillo, S.A., Madrid,
España, pp. 411, 1997.
[3] Beer R., Remote sensing by fourier transform spectroscopy, John Wiley and Sons, pp. 4446,
5254, 130133, 1992.
[4] Born M. and Wolf E., Principles of Optics, 7th edition, Cambridge University Press, pp. 446453,
2003.
[5] BWTek Inc., BWSpec 3.24 User Manual, Doc# 290020018, 2007.
[6] BWTek Inc., BRC111A Spectrometer User Manual, 2007.
[7] Clark G. L., The Encyclopedia of Spectroscopy, Reinhold Publishing Corporation, pp. 17, 1960.
[8] Hecht E., Óptica, 3a edición, Addison Wesley, pp. 86124, 2000.
[9] Huebshman M.L., Schultz R.A., Garner H.R., Hyperspectral imaging. In: Encyclopedia of Mod-
ern Optics, Robert D. Guenther editor, Vol. 1, pp. 134143, Elsevier, Academic Press, 2005.
[10] Jensen J.R., Remote Sensing of the Environment: an Earth Resource Perspective, 2nd edition,
Pearson Prentice Hall, 2007.
[11] Melles Griot, Visible Band-Pass Filters Technical Data, 2004.
45
BIBLIOGRAFÍA
[12] More K.A., Spectrometers. In: Encyclopedia of Modern Optics, Robert D. Guenther editor, Vol.
[13] Newport Inc., High-Pass Filters Technical Data Sheet, 2000.
[14] Smith R.B., Introduction to Remote Sensing, Tutorial by Microimages, Inc., Lincoln, NE, 2001.
[15] Stuart B., Infrared Spectroscopy: Fundamentals and Applications, John Wiley, pp. 612, 2004.
Capítulo 3
Fundamento Matemático
En este capítulo se introducen las operaciones del álgebra reticular minimax, así como las
memorias asociativas reticulares. Se continúa con una descripción de conceptos emanados de
la teoría de conjuntos convexos que serán de gran utilidad para comprender los capítulos sub-
secuentes. Una propiedad importante a destacar será la relación existente entre las memorias
autoasociativas reticulares y los conjuntos convexos ya que ello hace posible que se pueda
determinar un conjunto de puntos extremos a partir de una imagen cualquiera.
3.1. Álgebra reticular minimax
En los últimos años, las operaciones basadas en el álgebra de retículos han sido apli-
cadas en áreas diversas de la ingeniería industrial, ciencias de la computación y en el análisis y
procesamiento digital de imágenes [5, 6, 19]. En estas aplicaciones, las operaciones matriciales
de suma y multiplicación del álgebra lineal son reemplazadas por las operaciones correspondi-
entes del álgebra reticular, cuyas propiedades han permitido establecer nuevas e interesantes
técnicas.
El concepto de retículo fue creado para generalizar y unicar ciertas relaciones entre
subconjuntos de un conjunto dado, entre subestructuras de una estructura algebraica tales
como grupos, y entre estructuras geométricas tales como subespacios de espacios topológicos.
El desarrollo de la teoría de retículos comenzó en 1930 con los trabajos de Garrett Birkho [2];
47
3.1. ÁLGEBRA RETICULAR MINIMAX
en la actualidad, numerosas investigaciones han ampliado su tratamiento teórico y extendido

su aplicabilidad. Una propiedad de gran utilidad en la teoría de retículos, que se conoce como
dualidad, permite denir conceptos duales a partir de la inversión del orden dado en una
denición. Un ejemplo de dualidad son las relaciones numéricas mayor que y menor que.
En las siguientes líneas se denen algunos conceptos fundamentales del álgebra reticular.
Sea Y un conjunto parcialmente ordenado con orden parcial denotado en general por
≼. Una cota superior de un subconjunto X de Y , si existe, es un elemento y ∈ Y tal que
x ≼ y ∀x ∈ X . La cota superior mínima o supremo, sup(X), es una cota superior y0 ∈ Y
de X tal que y0 ≼ y para cada cota superior y de X . De esta manera, si sup(X) existe,
entonces es única. El concepto de cota mínima y cota inferior máxima o ínmo, denotada
por ı́nf(X), se denen de manera dual. Basado en lo anterior, un retículo es un conjunto
parcialmente ordenado L cuyos elementos x, y tienen un ínmo, denotado por x ∧ y , y un
supremo, denotada por x ∨ y . Un retículo L es completo cuando existen ı́nf(X) y sup(X)
para cada uno de sus subconjuntos X .
Las operaciones binarias de ∨ y ∧ sobre retículos tienen varias propiedades importantes,
algunas de ellas son análogas a aquellas de la multiplicación y adición ordinarias. Si (X, ≼) es
un conjunto parcialmente ordenado, entonces las operaciones ∨ y ∧ satisfacen las siguientes
propiedades.
1. x ∧ x = x, x ∨ x = x (idempotencia)
2. x ∧ y = y ∧ x, x ∨ y = y ∨ x (conmutatividad)
3. x ∧ (y ∧ z) = (x ∧ y) ∧ z, x ∨ (y ∨ z) = (x ∨ y) ∨ z (asociatividad)
4. x ∧ (x ∨ y) = x ∨ (x ∧ y) = x (absorción)
5. Si X tiene un elemento mínimo O, entonces O ∧ x = O y O ∨ x = x ∀x ∈ X
6. Si X tiene un elemento máximo I , entonces I ∧ x = x y I ∨ x = I ∀x ∈ X
En las relaciones anteriores no se hace explícito que el conjunto parcialmente ordenado

sea un retículo. En efecto, Birkho probó que estas propiedades caracterizan completamente
a un retículo.
3.1.1. Ejemplos de retículos

El conjunto R de los números reales junto con las relaciones de menor o igual (≤) es
un conjunto totalmente ordenado. Por ejemplo, dado cualquier par x, y ∈ R, entonces
ocurre que tanto x ≤ y o y ≤ x. Si x ∨ y = máx{x, y} y x ∧ y = mín{x, y} ∀x, y ∈ R,
entonces R junto con las operaciones de ∨ y ∧ es un retículo totalmente ordenado que
denotamos como (R, ∨, ∧). Este retículo no es completo.
Sea R±∞ = R ∪ {−∞, ∞}, el conjunto de números reales con los símbolos ∞ y −∞
adjuntos. Entonces (R±∞ , ∨, ∧) es un retículo completo con ∞ como el elemento más
grande y −∞ como el elemento más pequeño.
El conjunto R≥0
∞ = R ∪ {0, ∞} con la relación ≤ es un retículo completo. Aquí 0 es
+
el elemento más pequeño e ∞ el elemento más grande. (R≥0

∞ , ∨, ∧) es un subretículo de
(R±∞ , ∨, ∧). El dual de este retículo se obtiene al reemplazar ≤ con la relación de ≥.
3.1.2. Conceptos generales

Como una extensión de la teoría de retículos a matrices y vectores, Cuninghame-
Green desarrolló un novedoso cálculo matricial basado en la suma-min y la suma-max [6]. A
este conjunto de operaciones se le ha denominado álgebra reticular minimax. En lo siguiente
deniremos las operaciones del álgebra minimax basadas en el retículo (R±∞ , ∨, ∧, +). Además,
dado un conjunto nito X de vectores n-dimensionales cuyas componentes son números reales,
al usar la notación de columnas podemos denotar a este conjunto como X = {x1 , . . . , xk } ∈ Rn
donde k es el número de vectores.
Sean x, y ∈ Rn±∞ dos vectores columna n-dimensionales tales que x = (x1 , . . . , xn )T y
y = (y1 , . . . , yn )T , donde el superíndice indica transposición; la desigualdad x ≤ y signica
que ∀i, xi ≤ yi . Si x ̸≤ y entonces existe un índice i tal que xi > yi . El valor mínimo de
∧ ∧
un vector está denido como x = ni=1 xi . Similarmente, el valor máximo de un vector es
∨ ∨
el escalar x = ni=1 xi . El conjugado aditivo de un vector columna x está denido como el
vector x∗ = −xT = (−x1 , . . . , −xn ).
Se dene la suma escalar para un vector x = (x1 , . . . , xn )T y un escalar a ∈ R±∞ como

a + x = (a + x1 , . . . , a + xn )T . Las operaciones de suma, mínimo y máximo entre dos vectores
cualesquiera están denidas respectivamente ∀ i = 1, . . . , n de la siguiente manera:
(x + y)i = xi + yi ; (x ∧ y)i = xi ∧ yi ; (x ∨ y)i = xi ∨ yi . (3.1)
La suma externa minimax de dos vectores x ∈ Rm

±∞ e y ∈ R±∞ , es la matriz de m × n
n
denida por,
 
x1 + y 1 · · · x1 + y n
 .. .. .. 
x ⊕ yT = 
 . . . .
 (3.2)
xm + y 1 · · · x m + y n
3.1.3. Operaciones matriciales

Dadas dos matrices: A = (aij ), B = (bij ) ∈ R±∞ de tamaño m×n, se denen el máximo
y el mínimo de A y B como las matrices, A ∨ B y A ∧ B , cuyas componentes ij se denen
respectivamente por,
(A ∨ B)ij = aij ∨ bij ; (A ∧ B)ij = aij ∧ bij . (3.3)
Para una matriz A de m × p y una matriz B de p × n con entradas de R±∞ , se dene

la suma-max de A y B como la matriz C = A ∨ B , siendo
∨
p
cij = (aik + bkj ) = (ai1 + b1j ) ∨ (ai2 + b2j ) ∨ . . . ∨ (aip + bpj ). (3.4)
k=1
La operación dual sobre las matrices A y B se denomina suma-min y se denota como

la matriz C = A ∧ B , donde
∧
p
cij = (aik + bkj ) = (ai1 + b1j ) ∧ (ai2 + b2j ) ∧ . . . ∧ (aip + bpj ). (3.5)
k=1
Nótese que la suma-max y la suma-min son similares al producto matricial del álgebra lin-
eal, con la diferencia de que la suma y multiplicación son reemplazadas por las operaciones
generalizadas de máximo o mínimo de sumas, respectivamente.
Si A = (aij ) ∈ R±∞ es una matriz de m × n, entonces la matriz conjugada A∗ es

la matriz A∗ = (a∗ij ) de n × m, donde a∗ij = −aji es el conjugado aditivo. Por lo tanto las
siguientes relaciones se verican,
A ∧ B = (A∗ ∨ B ∗ )∗ y (A ∧ B)∗ = B ∗ ∨ A∗ . (3.6)
3.1.4. Independencia reticular

Las ideas de independencia reticular e independencia reticular fuerte de un conjunto
de vectores son propiedades matemáticas fundamentales para aplicaciones en reconocimiento
de patrones basadas en el álgebra reticular [21, 22, 31]. Especícamente, estas ideas se han
utilizado para la construcción de memorias asociativas reticulares robustas ante ruido aleatorio
[21, 30], y recientemente para la determinación de puntos extremos en imágenes hiperespec-
trales [8, 9]. El concepto de dependencia reticular es el análogo del concepto de dependencia
lineal en los espacios vectoriales del álgebra lineal.
Denición 3.1. Si X = (x1 , . . . , xk ) es un subconjunto de Rn , entonces una combinación
minimax de este subconjunto, denotada como C(X), es cualquier vector x ∈ Rn±∞ que puede
ser escrito como cualquiera de las dos expresiones duales siguientes:
∨∧
k ∧∨
k
x= ξ
(aξj + x ) ; x= (bξi + xξ ) (3.7)
j∈J ξ=1 i∈I ξ=1
donde I, J son conjuntos nitos de índices y aξj , bξi ∈ R±∞ son familias nitas de escalares.
∑k
La combinación minimax anterior es similar a la combinación lineal de vectores ξ=1 aξ xξ
con la excepción de la dualidad. De esta manera, cualquier combinación nita que involucre
los operadores de máximo y mínimo y los vectores de la forma a + xξ , b + xξ donde a, b ∈ R±∞
y xξ ∈ X , es una combinación minimax.
Denición 3.2. Un vector x ∈ Rn se dice que es dependiente reticular en X = (x1 , . . . , xk ) si

y solo si x = C(x1 , . . . , xk ), es decir, x es una combinación minimax formada con los patrones
de X . Un patrón es independiente reticular (IR) si y solo si no es dependiente reticular.
La propiedad de independencia reticular entre vectores implica que x no puede ser es-
crito como una combinación minimax de vectores, lo que implica que dicho vector no cumplirá
con cualesquiera de las dos igualdades expresadas en la ec. (3.7) para conjuntos de índices ar-
bitrarios y escalares correspondientes. De todas las posibles combinaciones minimax se pueden
derivar criterios especícos para evaluar independencia reticular dado un conjunto nito de
vectores. La forma más simple se tiene haciendo aξj = 0 = bξi para todo i ∈ I, j ∈ J y para
todo ξ ∈ {1, . . . , k} [31]. Por tanto, dos casos particulares surgen como criterios para evaluar
independencia reticular:
1. Un conjunto de vectores X = (x1 , . . . , xk ) es reticularmente independiente si y solo si

∨
para todo η = 1, . . . , k existe un índice de la j ∈ {1, . . . , n} tal que xηj > ξ̸=η xξj ∀ξ ̸= η .
2. Un conjunto de vectores X = (x1 , . . . , xk ) es reticularmente independiente si y solo si

∧
para todo η = 1, . . . , k existe un índice de la j ∈ {1, . . . , n} tal que xηj < ξ̸=η xξj ∀ξ ̸= η .
Cualquiera de estos dos criterios puede ser utilizado para evaluar la propiedad de
independencia reticular de un conjunto de vectores. El criterio 1 ha sido utilizado como la base
matemática de la técnica de núcleos [27, 28]. Asimismo, para aplicaciones en reconocimiento
de patrones, ambos criterios se han denido como condiciones de independencia morfológica
en sentidos erosivo y dilatativo, respectivamente [8].

Denition 3.3 Un conjunto de vectores X = (x1 , . . . , xk ) ⊂ Rn se dice que es max-dominante,
dualmente min-dominante, sí y sólo si para cada η ∈ {1, . . . , k}, existe un índice jη ∈ {1, . . . , n}
tal que, se satisfacen las igualdades izquierda o derecha, respectivamente,
∨
k ∧
k
xηjη − xηi = (xξjη − xξi ) ; xηjη − xηi = (xξjη − xξi ) ∀i ∈ {1, . . . , n}. (3.8)
ξ=1 ξ=1
De acuerdo con las deniciones anteriores, max-dominancia implica que, para cada
vector η ∈ {1, . . . , k}, debe existir un índice j , dependiendo de η , tal que xηj − xηi ≥ xξj − xξi ,
3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS
equivalentemente xηj − xξj ≥ xηi − xξi . De manera similar, min-dominancia implica que, para
cada vector η ∈ {1, . . . , k}, debe existir un índice j tal que xηj − xηi ≤ xξj − xiξ , equivalentemente
xηj − xξj ≤ xηi − xξi .
Denición 3.4. Un conjunto de vectores X = (x1 , . . . , xk ) posee la característica de inde-
pendencia reticular fuerte (IRF) sí y sólo si las siguientes dos condiciones son satisfechas: el
conjunto X es reticularmente independiente y X es max dominante o min dominante.
3.2. Geometría de conjuntos convexos
El estudio de los conjuntos convexos pertenence a un área de las matemáticas relati-

vamente reciente. Aunque algunos resultados importantes datan de nales del siglo XIX, el
primer estudio sistemático fue escrito por los alemanes Bonnesen y Fenchel, titulado Theo-
rie der Konvexen Körper en 1934 [4]. En años recientes se descubrieron diversas aplicaciones
de conjuntos convexos, particularmente en el campo de optimización, lo que ha motivado su
estudio. En las siguientes líneas se describirán algunas deniciones y teoremas derivados de
la teoría de conjuntos convexos que serán útiles para el análisis presentado en los capítulos
subsecuentes [3, 16, 25]. Para ser consistentes con la notación utilizada hasta ahora, cualquier
punto en el espacio Euclidiano se denotará como un vector x ∈ Rn .
3.2.1. Convexidad e independencia afín
Denición 3.5. Un conjunto S es convexo si para cada par de puntos x, y en S el segmento

de línea recta que une a estos dos puntos reside completamente en S .
Denición 3.6. Sea λi ∈ R con i = 1, . . . , k y suponga que λ1 + λ2 + · · · + λk = 1. Entonces a

y = λ1 x1 + λ2 x2 + · · · + λk xk se le denomina una combinación afín de los puntos x1 , . . . , xk .
Si, además de la condición anterior, se requiere que λi ≥ 0 ∀i, entonces y se denomina una
combinación convexa de x1 , . . . , xk .
Consecuentemente un conjunto es convexo sí y sólo si es cerrado bajo combinaciones
convexas de pares de sus elementos. Además, se dice que un conjunto S es afín sí y sólo si
cualquier combinación afín de puntos de S reside en S [16].
Denición 3.7. Un conjunto nito de vectores x1 , . . . , xm es dependiente afín si existen

números reales λ1 , . . . , λk , no todos cero, tales que λ1 + · · · + λk = 0 y λ1 x1 + · · · + λk xk = 0
(origen del sistema coordenado). De otra forma, el conjunto es independiente afín.
El concepto de independencia lineal está relacionado con independencia afín. Sean

{x1 , . . . , xn } un conjunto de vectores, decimos que son linealmente dependientes si existen
números a1 , a2 , . . . , an , no todos iguales a cero, tales que a1 x1 + a2 x2 + · · · + an xn = 0.
Si tales números no existen, entonces los vectores son linealmente independientes. Algunas
propiedades de los vectores linealmente independientes son: (1) un conjunto de vectores es
linealmente independiente sí y sólamente si ninguno es combinación lineal de los demás, (2)
si un conjunto de vectores es linealmente independiente cualquier subconjunto suyo también
∑k
lo es. Nótese que en la denición de dependencia afín se tiene que i=1 λi = 0, lo cual es
∑
consistente con la denición 3.6 para x = λ1 x1 + · · · + λk xk , con ki=1 λi = 1; lo anterior se
cumple sí y sólo si x − λ1 x1 − · · · − λk xk = 0, siendo la suma de todos los coecientes del
lado izquierdo igual a cero. De esta manera, los conceptos de dependencia lineal y afín están
relacionados ya que dependencia lineal implica dependencia afín.
Denición 3.8. El casco convexo de un conjunto S es la intersección de todos los conjuntos

convexos que contienen a S y se denota como H(S).
Denición 3.9. El casco afín de un conjunto S es la intersección de todos los conjuntos anes
que contienen a S y se denota como A(S).
Claramente el conjunto S es convexo sí y sólo si S =H(S); S es afín sí y sólo si S =A(S).

Dicho de otra manera, H(S) es el conjunto convexo más pequeño que contiene a S mientras
que A(S) es el conjunto afín más pequeño que contiene a S .
Teorema 3.1. Para cualquier conjunto S , el casco convexo H(S) consiste de todas las com-
binaciones convexas de los elementos de S .
El teorema anterior no establece ninguna restricción sobre el número de puntos de S

requeridos para hacer la combinación. El siguiente teorema es básico en el estudio de conjuntos
convexos y fue demostrado primero por Caratheodory en 1907. El teorema establece que en
un espacio n-dimensional, el número de puntos de S en la combinación convexa no tiene que
ser mayor a n + 1 [16].
Teorema 3.2 (Caratheodory). Si S es un subconjunto no vacío del espacio Euclidiano n-

dimensional Rn , entonces cualquier x ∈ H(S) puede ser expresado como una combinación
convexa de a lo más n + 1 puntos de S .
Debido a que el casco convexo de un conjunto convexo S es igual al conjunto de todas

las combinaciones convexas de puntos de S , el teorema anterior puede ser enunciado de la
siguiente forma: x ∈ H(S) sí y sólo si x está en el casco convexo de a lo más n+1 puntos de
S.
3.2.2. Simplex multidimensionales

Se conoce como politopo o politopo convexo al casco convexo de un conjunto nito de
puntos. La clase más simple de politopos es el simplex, cuya denición formal es la siguiente.
Denición 3.10. Si S = {x1 , . . . , xk+1 } y dim(S) = k , entonces a H(S) se le denomina un

simplex k-dimensional y los puntos x1 , . . . , xk+1 son sus vértices.
La denición anterior implica que un simplex es la estructura convexa mínima con

k + 1 vértices y que es capaz de encerrar un subespacio de dimensión k . El requisito de que
la dimensión de S = {x1 , . . . , xk+1 } sea igual a k es equivalente a requerir que los vectores
x1 , . . . , xk+1 sean independientemente afínes. En efecto se debe recordar que un conjunto
S = {x0 , x1 , . . . , xk } ⊂ Rn se dice independientemente afín sí y sólo si el conjunto {xj − x0 :
j = 1, . . . , k} es linealmente independiente.
Algunos ejemplos de simplex son los siguientes. Un simplex de dimensión cero está rep-
resentado por un punto; un simplex de dimensión uno corresponde a una línea recta, mientras
que en dos dimensiones el simplex es un triángulo; de manera análoga, el caso de un sim-
5
x
4
x
2 2 2
x x x
2
x x
4
3
x x
3
3
x
1
1 1 x
1
x
x
1
x x
S0 S
1
S2 S3 S4
Figura 3.1: Ejemplos de simplex para k = 1, . . . , 4
plex tridimensional corresponde a un tetraedro. En general, un simplex k -dimensional puede

construirse de la siguiente manera:
0-simplex S 0 : un punto único {x1 }

1-simplex S 1 : H(S 0 ∪ {x2 }) donde x2 ∈
/ A(S 0 )
2-simplex S 2 : H(S 1 ∪ {x3 }) donde x3 ∈
/ A(S 1 )
..
.
k -simplex S k : H(S k−1 ∪ {xk+1 }) donde xk+1 ∈

/ A(S k−1 ).
El simplex S 0 está representado por un punto. Al unir un punto x2 que no está en

S 0 , se obtiene el segmento de línea S 1 , técnicamente se toma el casco convexo de S 0 ∪ {x2 }.
Al unir el punto x3 que no está en la línea que contiene S 1 , se obtiene el triángulo S 2 . De
manera similar, al unir el punto x4 que no está en el plano de S 2 se obtiene el tetraedro S 3 . Si
unimos un punto x5 (que no está en el espacio 3D de S 3 ) con S 3 , se obtiene el pentatopo S 4 .
Es fácil observar que, conforme aumenta la dimensionalidad del espacio, se vuelve más difícil
representar el simplex. En la gura 3.1 se presentan los k -simplex para k = 0 . . . 4. Así por
ejemplo S 4 tiene 5 vértices, cualquier conjunto formado por 4 de ellos determinan una cara en
forma de tetraedro. En la gura se ha enfatizado la cara con vértices {x1 , x2 , x4 , x5 }.
Un punto x en un simplex S = H{x1 , . . . , xk } puede ser expresado como una combi-
∑
nación lineal convexa de los vértices; es decir, x = k+1
i=1 αi x . De esta manera, cada punto en
i
el simplex H(S) tiene una única representación como una combinación de sus vértices.
Denición 3.11. Sea H(S) el simplex k -dimensional que contiene al punto x. Si la única
representación de x como una combinación convexa de los vértices está dada por x = λ1 x1 +
· · · + λk+1 xk+1 , entonces los números λ1 , . . . , λk+1 se denominan las coordenadas baricéntricas
de x.
3.2.3. Modelo de mezclado lineal

Los conceptos de simplex y su representación en espacios multidimensionales han sido
aplicados en el análisis de imágenes hiperespectrales para representar las mezclas de espectros
de diferentes objetos captadas en la apertura del sensor [13]. Para ello, el modelo de mezclado
lineal con restricciones (MLR) permite representar los datos mezclados como una combinación
convexa de los vértices del simplex que los encierra; es decir,
∑
p
x= ai si + r = Sa + r (3.9)
i=1
∑
p
ai = 1 ; ai ≥ 0 ∀i. (3.10)
i=1
donde x ∈ Rn es el espectro medido sobre n bandas, S = {s1 , s2 , . . . , sp } es una matriz de

tamaño n × p cuyas columnas son los puntos extremos o vértices del simplex que encierra
a los datos, (a1 , a2 , . . . , ap )T es un vector p-dimensional cuyas entradas son las abundancias
fraccionales correspondientes presentes en x y r es un vector de ruido aditivo.
En efecto, el objetivo de la representación anterior es determinar el vector de abundan-
cias a, conociendo la matriz S . Bajo la suposición de que r = 0, la solución más simple que
minimiza ∥x−Sa∥2 = ∥r∥2 está dada por la estimación de mínimos cuadrados sin restricciones
expresada como sigue:
a = S + x = (S T S)−1 S T x, (3.11)
donde S + denota la matriz pseudoinversa de Moore-Penrose. Esta estimación existe cuando

hay más bandas que columnas y cuando S es de rango completo. La solución irrestricta puede
ser reforzada para incorporar las condiciones de positividad (ai ≥ 0 ∀i) y aditividad completa
3.3. MEMORIAS ASOCIATIVAS RETICULARES
∑p
( i=1 ai = 1) impuestas por el modelo. El satisfacer la condición de aditividad completa
requiere del uso de multiplicadores de Lagrange de la forma siguiente.
aL = a − (S T S)−1 Z T [Z(S T S)−1 Z T ]−1 (Za − b). (3.12)
donde Z es un vector la de tamaño 1 × p con todos sus elementos igual a uno y b = 1 [13].
Lo anterior tiene el efecto de restringir que la solución de mínimos cuadrados resida en el
∑
hiperplano cuya ecuación es pi=1 ai = 1.
Satisfacer la condición de positividad no es tan sencillo en la práctica ya que el min-
imizar ∥x − Sa∥2 manteniendo ai ≥ 0, ∀i = 1, . . . , p, cae en el dominio de la programación
cuadrática con desigualdades lineales como restricciones. Una alternativa comúnmente uti-
lizada es el algoritmo de estimación de mínimos cuadrados no negativa (non-negative least
square estimation, NNLS)[15]. La aproximación consiste en estimar iterativamente a y, en

cada iteración, encontrar una solución mínima cuadrada para aquellos coecientes de a que
son negativos usando sólo las columnas asociadas de S . Es importante mencionar que en la
práctica satisfacer ambas restricciones simultáneamente resulta difícil. Sin embargo, ya se han
desarrollado técnicas híbridas que permitan encontrar una solución para a sujeta a las dos
restricciones mencionadas [11].
3.3. Memorias asociativas reticulares
El surgimiento y desarrollo de las memorias asociativas reticulares, como un nuevo

paradigma en redes neuronales articiales, ha brindado solución a diversos problemas en el
reconocimiento de patrones, tales como la asociación y la recuperación de patrones afectados
por ruido [20, 21, 26, 29]. En este contexto, los patrones se representan como vectores columna
xj ∈ R; cada componente xji con i = 1, . . . , n, representa una característica determinada del
patrón, por ejemplo, caracteres, curvatura o señal de intensidad. Enseguida se da primera-
mente una introducción a las memorias asociativas convencionales y después se presentan las
memorias asociativas reticulares, las cuales realizan el cómputo neuronal basado en el álgebra
reticular minimax.
Dados dos conjuntos de vectores X = (x1 , . . . , xk ) y Y = (y1 , . . . , yk ) con asociaciones

dadas por {(xξ , yξ ) ∈ Rn × Rm : ξ = 1, . . . , k }, una memoria asociativa M debe ser capaz
de recuperar un patrón de salida yξ cuando se le presenta un patrón de entrada xξ o una
versión con ruido de ésta. Anderson y Kohonen propusieron una de las primeras memorias
matriciales de correlación basadas en redes neuronales lineales [1, 14]. De las memorias asocia-
tivas propuestas en la literatura, la red de Hopeld es una de las más conocidas [12]. En estos
modelos, una memoria asociativa M se construye a partir de la suma del producto externo de
los patrones asociados yξ e xξ ; ésto es,
ξ ξ
 ξ ξ

y x . . . y x
∑k ∑k
 .
1 1
.
1 n
.. 
M= ξ ξ T
y (x ) =  .. .. .  (3.13)
 .
ξ=1 ξ=1 ξ ξ ξ ξ
ym x1 . . . y m xn
∑k
En este caso, la entrada ij -ésima de M está dada por µij = ξ=1 yiξ xξj . Si los patrones
de entrada x1 , . . . , xk son ortonormales, ésto es

 1 si i = j
(x ) · x =
j T i
(3.14)
 0 si i ̸= j
entonces, la recuperación de los patrones de salida y1 , . . . , yk es perfecta, ya que
∑ ∑
M xi = [yj (xj )T ]xi + [yi (xi )T ]xi = yj [(xj )T · xi ] + yi [(xi )T · xi ] = yi . (3.15)
j̸=i j̸=i
Sin embargo, en la mayoría de las aplicaciones, los patrones x1 , . . . , xk no son ortonor-

males, por lo que es necesario realizar procesos de ortonormalización o ltrado usando funciones
de activación para recuperar los patrones deseados [22].
Las memorias asociativas reticulares son similares a las memorias clásicas con la difer-
encia de que están basadas en las operaciones del álgebra minimax. Sean (x1 , y1 ), . . . , (xk , yk )
k pares de vectores, con xξ ∈ Rn y yξ ∈ Rm para ξ = 1 . . . , k , conjuntados en un par matricial
(X, Y ). Para almacernar los k pares de vectores en una memoria asociativa reticular (MAR),
de tamaño m × n, se utiliza un proceso de almacenamiento similar al de las memorias de cor-

relación pero reemplazando el producto externo en la ec. (3.13) con la suma externa minimax
de la ec. (3.2).
Denición 3.12. Las memorias min -WXY y max -MXY , ambas de tamaño m × n, que al-
macenan un conjunto de asociaciones (X, Y ), así como sus componentes ij están denidas,
respectivamente, por las expresiones
∧
k ∧
k
∗
WXY = Y ∧ X = [y ⊕ (−x ) ] ;
ξ ξ T
wij = (yiξ − xξj ), (3.16)
ξ=1 ξ=1
∨
k ∨
k
∗
MXY = Y ∨ X = [y ⊕ (−x ) ] ;
ξ ξ T
mij = (yiξ − xξj ). (3.17)
ξ=1 ξ=1
Las memorias reticulares anteriores denidas para X ̸= Y se denominan memorias
hetero-asociativas reticulares (MHAR) y para X = Y se denominan memorias auto-asociativas

reticulares (MAAR). Por lo tanto, para recuperar un patrón de salida yξ dado el patrón de
entrada xξ se hace uso de los operaciones suma-min y suma-max denidas en la sección
anterior. Así, yξ = WXY ∨ xξ o equivalentemente yξ = MXY ∧ xξ .
3.3.1. Propiedades algebraicas

Las memorias auto-asociativas reticulares constituyen el fundamento teórico del méto-
do que se emplea en esta investigación, por lo que es necesario mencionar algunas de sus
propiedades algebráicas. En base a las ecs. (3.16) y (3.17) con Y = X , WXX y MXX son
matrices cuadradas de tamaño n × n. Además, la memoria WXX se caracteriza por tener en-
tradas con valores negativos. Para evitar aglomerar la notación, a partir de ahora las memorias
auto-asociativas reticulares se denotarán simplemente como W y M , respectivamente. En las
siguientes líneas se presentan algunas propiedades algebráicas de estas memorias [22, 23, 31].
Diagonal principal nula. Las diagonales principales de W y M , denotadas como wii y

∧
mii respectivamente, están conformadas enteramente por ceros i.e. wii = kξ=1 (xξi −xξi ) =
∨
0 = kξ=1 (xξi − xξi ) = mii .
Dualidad. Para Y = X se tiene que X ∧ X ∗ = (X ∗ )∗ ∧ X ∗ = (X ∨ X)∗ , entonces

M = W ∗ . Por lo tanto, la memoria min -W y la memoria max -M son duales en el sentido
de conjugación matricial.
Capacidad de almacenamiento. Para cualquier patrón de entrada xξ se tiene que

WXX ∨ xξ = xξ = MXX ∧ xξ . De esta forma, no existen restricciones en la dimensión o
en el número de patrones que puedan ser almacenados en W o M .
Dominancia máxima y mínima en la diagonal. Sean wij y mij las entradas de W

y M , respectivamente. Si i, j ∈ {i, . . . , n}, se cumple entonces que wij + wji ≤ wil y
mij + mji ≥ mii . De esta forma, W es diagonalmente max-dominante, mientras que M
es diagonalmente min-dominante.
Conjunto de puntos jos. Dados un conjunto de vectores X = (x1 , . . . , xk ) y una

transformación T : Rn → Rn , entonces x ∈ Rn se denomina punto jo de T sí y sólo
si T (x) = x. Esta igualdad se satisface para todo vector xξ ∈ X dado que WXX ∨ xξ =
xξ = MXX ∧ xξ . De este modo, W y M comparten el mismo conjunto de puntos jos
denotado como F (X).
3.3.2. Propiedades geométricas

Dado un conjunto de vectores X = (x1 , . . . , xk ) ∈ Rn , a partir de los cuales se contruyen
las memorias WXX y MXX , las reescribimos respectivamente como W = {w1 , . . . , wn } y M =
{m1 , . . . , mn } para explicitar sus vectores columna. Es posible entonces construir un casco
convexo n-dimensional que sea capaz de encerrar a todos o a la mayoría de los vectores en
el espacio dado. Geométricamente estos puntos serán los vértices de un simplex que deben
satisfacer la condición de independencia afín. Para determinar los vértices del simplex a partir
de los vectores columna de W y M , es necesario realizar un escalamiento aditivo sobre los
vectores de ambas memorias para trasladar los valores negativos de WXX al ortante positivo
del espacio Rn . Este escalamiento se realiza en base a los vectores cota máxima y cota mínima
que se denen a continuación.
Denición 3.13. Sean X = (x1 , . . . , xk ) un subconjunto nito de Rn . Las cotas vectoriales

∧ ∨
mínima y máxima están dadas respectivamente por v = kξ=1 xξ y u = kξ=1 xξ ; sus corre-
spondientes entradas se calculan, respectivamente como
∧
k ∨
k
vi = xξi ; ui = xξi i = 1, . . . , n. (3.18)
ξ=1 ξ=1
Por tanto, el escalamiento aditivo resulta en dos nuevas matrices, denotadas respectiva-
mente como W y M , cuyos vectores columna están denidos por
w i = w i + ui ; mi = mi + vi i = 1...,n. (3.19)
Algunas características importantes que resultan de este escalamiento son las siguientes[23]:
1) W y M conservan las propiedades respectivas de dominancia máxima y mínima en la diago-
nal, 2) diag(W ) = u y diag(M ) = v, 3) geométricamente los conjuntos formados por {W ∪ u}
o {M ∪ v} corresponden a los puntos extremos o vértices de dos simplex n-dimensionales que
encierran a subconjuntos de X y 4) el conjunto de puntos M ∪ W ∪ {v, u} forma un politopo
convexo B con 2(n + 1) vértices que contienen a X .
3.3.3. Criterios para evaluar independencia afín

Aunque en casos excepcionales es importante notar que los vectores columna de las
MAAMs no necesariamente satisfacen la propiedad de independencia afín, en cuyo caso, re-
sulta necesario utilizar criterios particulares para vericar esta propiedad. A continuación, se
presentan dos criterios que pueden ser utilizados para determinar un subconjunto independi-
ente afín a partir de W o M .
Criterio I. Este criterio está basado en la siguiente conjetura, la cual fue establecida origi-
nalmente como un teorema en [22, 23].
Conjetura 3.1. Si X = (x1 , . . . , xk ) ⊂ Rn es reticularmente independiente fuerte, entonces

X es independiente afín.
De acuerdo con esta conjetura es posible utilizar la propiedad de independencia reticular

fuerte para derivar un subconjunto de vectores independientes afín y que además sean los
vértices del conjunto convexo. De acuerdo con las propiedades de las memorias reticulares,
W es diagonalmente max-dominante, mientras que M es diagonalmente min-dominante ; de
esta manera, para obtener un conjunto independiente reticular fuerte es suciente evaluar la
propiedad de independencia reticular (IR). El siguiente teorema provee un método para obtener
un conjunto de vectores que satisface independencia reticular fuerte a partir del conjunto de
puntos jos F (X).
Teorema 3.3. Sea X = (x1 , . . . , xk ) ⊂ Rn y sean W y M los vectores que conforman las
columnas de WXX y MXX , respectivamente, entonces existen V ⊂ W y N ⊂ M tal que V
y N son independientes reticulares fuertes y F (V ) = F (N ) = F (X) o equivalentemente,
WVV = WXX y MNN = MXX .
Demostración. Dado que W es max-dominante, lo único que se necesita demostrar es la exis-

tencia de un conjunto independiente reticular V tal que WV V = WXX . Sea W = {w1 , . . . , wn }
y el conjunto W1 = W \{w1 }. Si WW1 W1 = WXX , hacer V1 = W1 , de otra forma V1 = W . Por
lo tanto, si V1 = W1 , entonces w1 ∈
/ V1 cuando w1 es dependiente reticular, y w1 ∈ V1 cuando
w1 es independiente reticular. En cualquier caso se tiene que WV1 V1 = WXX . Enseguida, hacer
V2 = V1 \{w2 } si WV2 V2 = WXX , de otra forma hacer V2 = V1 . De nuevo, en cualquier caso se
tendrá WV2 V2 = WXX . Se continúa de esta forma hasta Vn = Vn−1 \{wn } si WVn Vn = WXX , de
otra forma hacer Vn = Vn−1 . Una vez que W ha sido evaluado, hacer V = Vn . Por construcción,
V ⊆ W es un subconjunto independiente reticular para el cual WV V = WXX . Dado que V es
también max-dominante se tiene por lo tanto que V es independiente reticular fuerte .
A partir de la demostración de este teorema surge un método para derivar una base
independiente reticular fuerte para cualquier conjunto de patrones X [24]. El procedimiento
consiste en construir la memoria WXX , y formar el conjunto W . Entonces remover cualquier
conjunto de patrones dependientes reticulares de W usando el método antes descrito y así
obtener el conjunto de patrones V con independencia reticular fuerte.
Criterio II. Este criterio está fundamentado en el siguiente teorema que provee cuatro
igualdades para probar computacionalmente la independencia afín de los conjuntos W =
{w1 , . . . , wn } y M = {m1 , . . . , mn } y que ha sido demostrado recientemente en [24]. En esta

discusión wi y mi denotan la i-ésima la de W y M , respectivamente, en tanto que el vector
c denota un vector constante.
Teorema 3.4. Si j, l ∈ {1, . . . , n}, entonces las siguientes armaciones son equivalentes: (1)
wj − wl = c, (2) wl = wj , (3) mj − ml = c, y (4) ml = mj .
El siguiente teorema, en conjunción con el Teorema 3.4, provee un método simple y

ecaz para derivar un conjunto de vectores independientes afín a partir de W y M . En este
tratamiento, dado el conjunto J = {1, . . . , n}, se denota a J ′ como un subconjunto arbitrario
de J .
Teorema 3.5. W ′ ⊂ W es independientemente afín sí y sólo si wj ̸= wl para todos los

distintos pares {j, l} ⊂ J ′ . Similarmente, M ′ ⊂ M es independientemente afín sí y sólo si
mj ̸= ml para todos los distintos pares {j, l} ⊂ J ′ .
En los teoremas anteriores se establecen las condiciones necesarias para determinar

vectores independientes afín a partir de las memorias sin escalamiento. De esta manera, lo
único que se tiene que vericar es que dos vectores de W o M no sean iguales. Dado que el
escalamiento aditivo preserva la dominancia máxima y mínima en las diagonales de W y M , un
resultado fundamental derivado a partir de los teoremas dados es que, si wj ̸= wl ∀{j, l} ⊂ J ,
entonces cualquier subconjunto no vacío de W o M puede servir como un conjunto de puntos
extremos.
3.3.4. Determinación de puntos extremos con W y M

−
→
Sea una imagen I(x, y, λ ), donde x = 1, . . . m e y = 1, . . . q representan sus coordenadas
−
→
espaciales y λ hace explícita su dependencia con la longitud de onda y que puede tomar los
−
→
valores de λ ∈ Rn con n ≥ 3, dependiendo del número de bandas presentes en la imagen. El
objetivo consiste en encontrar p vectores de dimensión 1 × n cuyas coordenadas baricéntricas
correspondan a los vértices de H(I) que encierra a la mayoría de los datos. Estos puntos
extremos servirán para representar cualquier pixel dentro del conjunto convexo usando el
modelo MLR y se podrán estimar las abundancias fraccionales de los puntos extremos en cada
pixel de la imagen.
Las propiedades algebráicas y geométricas de las MAAMs permiten determinar un
conjunto de puntos extremos o vértices del simplex de dimensión n a partir de la imagen
→
−
bajo estudio. Primero es necesario modicar la imagen I(x, y, λ ) de tal manera que cada
pixel se represente como un conjunto X = (x1 , x2 , . . . , xmq ) ∈ Rn . A partir del conjunto X se
construyen WXX y MXX y se realiza el escalamiento aditivo para obtener las matrices W y M .
El último paso consiste en utilizar cualquiera de los criterios I o II para vericar independencia
afín entre los vectores columna derivados de cada memoria autoasociativa reticular.
En resumen, para determinar el conjunto de puntos extremos de una imagen multicanal
−
→
I(x, y, λ ) se realizan los siguientes pasos:
→
−
1. Cambiar la imagen I(x, y, λ ) al conjunto de pixeles espectrales X = (x1 , x2 , . . . , xmq ) ⊂
Rn .
2. Calcular WXX y MXX a partir de X
3. Calcular las cotas vectoriales u y v de X .
4. Obtener las matrices escaladas W y M .
5. Vericar que W o M son independientes anes.
6. En el modelo MLR hacer S = W o S = M y calcular el vector a para cada pixel espectral.
En efecto, el método W y M es capaz de determinar el conjunto de puntos extremos que

forman un simplex que encierra los datos de la imagen bajo análisis sin importar su tamaño
y dimensión espectral.
Bibliografía
[1] Anderson J.A., A simple neural network generating an interactive memory, Mathematical Bio-
sciences, Vol. 14, pp. 197220, 1972.
[2] Birkho G., Lattice Theory, 3rd ed, American Mathematical Society, Providence RI, 1967.
[3] Boyd S. and Vandenberghe L., Convex Optimization, Cambridge University Press, 2004.
[4] Bonnesen T. and Fenchel W., Theorie der Konvexen Körper, Springer-Verlag, Berlin; reprinted
Chelsea, NY, 1948.
[5] Cuninghame-Green R., Describing industrial processes with interference and approximating their
steady-state behaviour, Oper. Research Quart., pp. 95100, 1962.
[6] Cuninghame-Green R., Minimax algebra and applications. In: Advances in Imaging & Electron
Physics, P. Hawkes editor, Vol. 90, pp. 1121, Academic Press, New York, NY, 1995.
[7] Graña M., Raducanu B., Increasing the robustness of heteroassociative morphological memo-
ries for practical applications Proc. 6th International Symposium on Mathematical Morphology,
Sidney, Australia, pp. 379388, 2002.
[8] Graña M., Sussner P., Ritter G.X., Innovative applications of associative morphological memories
for image processing and pattern recognition, Mathware & Soft Computing, Vol. 10, pp. 155168,
2003.
[9] Graña M., Gallego J., Associative morphological memories for endmember induction, IEEE
Proc.: IGARSS, Vol. 6, pp. 37573759, 2003.
66
BIBLIOGRAFÍA
[10] Graña M., Maldonado O., Vicente D., Morphological independence and hyperspectral image
indexing, SPIE Proc.: Mathematical Methods in Pattern and Image Analysis, Vol. 5916, pp. 1
10, 2005.
[11] Heinz D.C., Chang C.I., Fully constrained least square linear spectral mixture for material
quantication in hyperspectral imagery, Transactions on Geoscience and Remote Sensing, Vol.
39, No. 3, pp. 529545, 2001.
[12] Hopeld J.J., Neural networks and physical systems with emergent collective computational
abilities, Proc. of the National Academy of Sciences, pp. 25542558 1982.
[13] Keshava N. and Mustard J.F., Spectral unmixing, IEEE Signal Processing Magazine, Vol. 19,
pp. 4457, 2002.
[14] Kohonen T., Correlation Matrix Memory, IEEE Transactions on Computers, Vol. C-21, No. 4,
pp. 353359, 1972.
[15] Lawson C.L., Hanson R.J., Solving least squares problems, Prentice-Hall, Englewood Clis, NJ,
Chap. 23, 1974.
[16] Lay S.R., Convex Sets and Their Applications, Dover Publications, 2007.
[17] Ritter G.X., Image algebra with applications. Unpublished manuscript, available via anony-
mous ftp://cis.u.edu./pub/src/ia/documents, 1994.
[18] Ritter G.X., Wilson J.N., Handbook of computer vision algorithms in image algebra, CCR Press
Inc, Florida, USA, pp. 289308, 1996.
[19] Ritter G.X.,Lattice algebra and Minimax algebra, in Image Algebra, unpublished manuscript
available via anonymous ftp from ftp://ftp.cise.ufl.edu/pub/scr/ia/documents, Center for
Computer Vision and Visualization, CISE Department, University of Florida, Gainesville FL,
pp. 121135, 1999.
[20] Ritter G.X., Sussner P., Diaz de León J.L.,Morphological associative memories, IEEE Trans.
on Neural Networks, Vol. 9, No. 2, pp. 281293, 1998.
BIBLIOGRAFÍA
[21] Ritter G.X., Urcid G., Iancu L.,Reconstruction of patterns from noisy inputs using morphological
associative memories, Journal of Mathematical Imaging and Vision, Vol. 19, pp. 95111, 2003.
[22] Ritter G.X., Gader P.,Fixed point of lattice transforms and lattice associative memories. In:
Advances in Imaging and Electron Physics, P. Hawkes ed., Vol. 144, Elsevier, San Diego, CA.
pp.165242, 2006.
[23] Ritter G.X., Urcid G., Schmalz M.S., Autonomous single-pass endmember approximation using
lattice auto-associative memories, Neurocomputing, Vol. 72, No. 10-12, pp. 21012110, 2009.
[24] Ritter G.X., Urcid G., Lattice algebra approach to endmember determination in hyperspec-
tral imagery, Advances in Imaging and Electron Physics, P. Hawkes ed., Vol. 160, pp. 113169,
Elsevier Inc, Academic Press, 2010.
[25] Serra J., Image Analysis and Mathematical Morphology, Academic Press, New York, NY, Chap.
4, 1982.
[26] Sussner P., Valle M.E., Gray-scale morphological associative memories, IEEE Transactions on
Neural Networks, Vol. 17, No. 3, pp. 559570, 2006.
[27] Urcid G., Ritter G.X., Kernel computation in morphological associative memories for grayscale
image recollection, IASTED Proc.: 5th Int. Conf. on Signal and Image Processing, Honolulu, HI,
pp. 450455, 2003.
[28] Urcid G., Ritter G.X., Iancu L., Kernel computation in morphological bidirectional associative
memories, LNCS Proc.: Progress in Pattern Recognition, Speech, and Image Analysis, Springer,
Vol. 2095, pp. 563570, 2003.
[29] Urcid G. and Ritter G.X., Noise masking for pattern recall using a single lattice matrix auto-
associative memory, IEEE Proc.: International Conference on Fuzzy Systems, Vancouver, British
Columbia, Canada, pp. 187194, September 2006.
[30] Urcid G., Ritter G.X., Noise Masking for Pattern Recall using a Single Lattice Matrix Associative
Memory. In: Computational Intelligence based on Lattice Theory, Kaburlasos, V.G. and Ritter,
G.X. eds., Vol. 67, Springer, Heidelberg, Germany, pp. 7998, 2007.
BIBLIOGRAFÍA
[31] Urcid-S G., Valdiviezo-N. J.C., Generation of lattice independent vector sets for pattern recog-
nition applications, SPIE Proc.: Mathematics of Data/Image Pattern Recognition, Compression,

Coding and Encryption X, with Applications, Vol. 6700-12, San Diego, CA, 2007.
[32] Valdiviezo J.C., Urcid G., Hyperspectral endmember detection based on strong lattice indepen-
dence, SPIE Proc.: Applications of Digital Image Processing XXX, Vol. 6696, pp. 669625:112,
San Diego, CA, 2007.
Capítulo 4
Segmentación de Imágenes a Color
El método basado en W y M puede ser utilizado de manera eciente como una técnica de
segmentación para imágenes en color. En el siguiente capítulo se describe el uso de dicha
técnica aplicada a diversas imágenes en color RGB de dominio público. Los resultados de
segmentación obtenidos se comparan con los obtenidos por otras técnicas reportadas en la
literatura. Finalmente, se realiza una cuanticación de los resultados producidos al transformar
las imágenes RGB a los espacios de color I1I2I3, HSI, y L*a*b*.
4.1. Concepto de segmentación
En diversas aplicaciones orientadas al procesamiento y análisis de imágenes, la seg-

mentación es un proceso previo a la representación de objetos o regiones de interés en la
imagen. La segmentación consiste en subdividir una imagen en un conjunto nito de regiones
cuyos pixeles comparten atributos bien denidos. Los algoritmos de segmentación fueron orig-
inalmente desarrollados para imágenes en niveles de gris y están basados en una de las dos
propiedades básicas de los valores de intensidad: discontinuidad y similitud. Estas técnicas
han sido modicadas, mejoradas o extendidas para funcionar adecuadamente en imágenes en
color o en sus respectivas transformaciones a otros espacios.
Denición 4.1. Sea X un conjunto nito con k elementos y P un predicado lógico respecto
70
4.1. CONCEPTO DE SEGMENTACIÓN
de un atributo cuanticable. Una segmentación de X es una familia de subconjuntos {Ri } de

X , con ki elementos para i = 1, . . . , q , que satisfacen las siguientes propiedades:
1. Ri ∩ Rj = ∅ para i ̸= j (no hay intersección entre subconjuntos distintos).

∪ ∑
2. qi=1 Ri = X y qi=1 ki = k (la unión de subconjuntos forma la imagen completa).
3. Para cualquier i, Ri es un conjunto conexo.
4. ∀i, P(Ri ) = verdad (los elementos en un subconjunto comparten el mismo atributo).
5. ∀i ̸= j , P(Ri ∪ Rj ) = falso (los elementos en la unión de subconjuntos no comparten

los mismos atributos).
La segmentación de imágenes a color ha sido desarrollada desde diferentes perspectivas

que pueden clasicarse en las siguientes categorías: 1) segmentación basada en pixeles, 2)
área, 3) bordes y 4) en la física de las imágenes. Algunos compendios de estas técnicas se
pueden consultar en [17] y [20], mientras que tratamientos más recientes se pueden consultar
en [4, 10]. Los algoritmos basados en pixeles incluyen las técnicas que utilizan el histograma y
aquellas de análisis por agrupamiento de datos en diferentes espacios de color. En particular,
la umbralización óptima [2] es una técnica basada en el histograma. Las técnicas basadas en
área incluyen el crecimiento de regiones y el método de división y unión (split and merge ); de
esta última se puede mencionar el uso de modelos de campos aleatorios de Markov [9, 15]. Por
otra parte, en las técnicas basadas en detección de bordes se pueden mencionar a los métodos
locales y la extensión de la transformación de cuencas (watershed ); esta transformación y la
aproximación de zona plana para la segmentación de imágenes a color fueron originalmente
desarrolladas, respectivamente en [13] y [5]. Las técnicas basadas en física utilizan modelos
físicos que permitan particionar una imagen en regiones que corresponden a supercies y
objetos; el tratamiento matemático que éstas utilizan incluye un modelo que describa los
cambios en la reexión de la luz de materiales conocidos y que es empleado para segmentar
las imágenes.
Además de las técnicas anteriores, existen otras más recientes que contemplan la fusión
de varios métodos de segmentación con la nalidad de mejorar los resultados; un ejemplo de
estas técnicas es la aplicación de la cerradura morfológica y la dilatación adaptativa para la
umbralización del histograma de color [16]. El uso del algoritmo de cuencas para el agrupamien-
to de color con etiquetamiento de Markov ha sido desarrollado en [6]. Recientemente se han
propuesto técnicas alternativas basadas en computación suave que realizan la segmentación de
imágenes a color [21]; un tratamiento más amplio sobre estas técnicas y su uso en diferentes
espacios de color se puede consultar en [8, 14]. En las siguientes subsecciones se presentan
dos técnicas de segmentación por agrupamiento y que han sido utilizadas para comparar los
resultados obtenidos con el método propuesto.
4.1.1. El método de distancias

Esta técnica de segmentación útil y sencilla ha sido implementada para separar objetos
de un color o rango de colores determinado, en una imagen en color RGB (red, green, blue ). A
partir de un color promedio elegido en una región de interés, la técnica se basa en clasicar
cada pixel de la imagen tomando en cuenta la presencia o ausencia del color especicado.
Denición 4.2. Sea R el conjunto de pixeles que pertenece a la región de interés. El vector
medio z y la matriz de covarianza1 C calculados a partir de R están expresados respectivamente
por
1∑ 1∑
κ κ
z= xi ; C= xi xTi − zzT , (4.1)
κ i=1 κ i=1
donde κ denota el número de pixeles en R y xi ∈ R. De esta manera, el proceso de seg-

mentación se realiza por medio de alguna medida de distancia que permita clasicar a cada
pixel en la imagen como parte de dicha región; es decir, siendo x ∈ R3 un vector arbitrario en
el espacio RGB se dice que x es similar a z si la distancia entre ellos es menor a un umbral
especicado, τ . Las distancias Euclidiana (dE ) y de Mahalanobis (dM ) pueden utilizarse para
esta tarea y están denidas respectivamente como sigue
dE (x, z) = [(x − z)T (x − z)]1/2 (4.2)
dM (x, z) = [(x − z)T C−1 (x − z)]1/2 . (4.3)

1 La covarianza indica el sentido de la correlación entre variables y que a partir de la matriz de covarianza
se puede derivar una transformación lineal para decorrelacionar los datos.
La localización de los puntos dE (x, z) ≤ τ dene una esfera sólida de radio τ . Los puntos
contenidos dentro o sobre la supercie de la esfera satisfacen el criterio de color especicado.
Por su parte, la localización de los puntos dM (x, z) ≤ τ describe un cuerpo elíptico sólido con
la propiedad de que sus ejes principales están orientados en la dirección de extensión máxima
de los datos.
4.1.2. El algoritmo de cuencas

Este procedimiento de segmentación fue originalmente desarrollado para su uso en
imágenes en tonos de gris [1, 12] y posteriormente se propuso una extensión para el caso de
imágenes a color [13], la cual se ha utilizado ampliamente en los últimos años. En esta técnica
se considera el caso más simple de una imagen de intensidad como una supercie topográca
en donde cada tono de gris es interpretado como una altitud; así, la idea del algoritmo puede
entenderse como un proceso de inundación o llenado de esta supercie topográca. Para re-
alizar las inundaciones, en cada mínimo del relieve se abre un hueco por donde puede uir
agua. Cuando el agua ha uido a través de los huecos y el nivel se ha incrementado a velocidad
constante, el relieve se convierte en un lago.
En una imagen digital los huecos o semillas para el proceso de llenado pueden deter-
minarse al calcular el mínimo del gradiente de la imagen. Comenzando con estas semillas se
establece una jerarquía para el crecimiento de las regiones basado en las diferencias entre los
valores de intensidad de la semilla y de los pixeles vecinos. Primeramente, todos los pixeles
vecinos de una semilla obtienen la misma etiqueta que ella si sus diferencias de intensidad
son cero. Después, todos los pixeles vecinos de una semilla obtienen la misma etiqueta si sus
diferencias de intensidad son 1. Entonces el nivel de diferencias se incrementa aún más y el
procedimiento se continúa hasta que todos los pixeles en la imagen hayan sido etiquetados.
Cuando este esquema se aplica a la segmentación de imágenes a color las semillas en la
imagen pueden ser determinadas al calcular los mínimos de los gradientes en los tres canales.
Además, la diferencia entre los valores de intensidad es reemplazada por una diferencia de
color entre dos pixeles. En diversas aplicaciones es necesario realizar un proceso previo de
ltrado de la imagen original para evitar lo que se conoce como sobre-segmentación.
4.2. ESPACIOS DE COLOR
4.2. Espacios de color
De acuerdo a la teoría de colores triestímulo, el color de un objeto puede ser representado

utilizando tres componentes que resultan de utilizar tres ltros de colores f (λ) con λ=630 nm
(rojo), 550 nm (verde), 420 nm (azul) sobre la radiancia de la luz L(λ). Las cantidades de rojo,
verde y azul necesarias para formar algún color particular se denominan valores triestímulos
denotados por X, Y, Z respectivamente. De esta manera, para cualquier longitud de onda en

el espectro visible, los valores triestímulos necesarios para producir el color correspondiente
a esa longitud de onda pueden ser obtenidos directamente de curvas o tablas que han sido
obtenidas a través de diferentes experimentos [18].
Un espacio de color es una representación utilizada para especicar y visualizar los
colores de una forma estándar y generalmente aceptada. En estas representaciones se utilizan
tres ejes coordenados que describen la posición del color dentro del espacio. Existen diferentes
espacios de color que estan dirigidos tanto a dispositivos de cómputo (monitores e impresoras),
como para aplicaciones donde el objetivo es la manipulaciòn del color. Entre los espacios
más utilizados en el primer caso se pueden mencionar el RGB (red, green, blue ) empleado en
monitores de color y cámaras de video, así como los sistemas CMY (cyan, magenta, yellow ) y
CMYK (cyan, magenta, yellow, black ) empleados en los sistemas de impresión. Por otra parte,
el modelo HSI (hue, saturation, intensity ) permite describir e interpretar los colores de una
forma cercana a la forma en que los humanos percibimos el color. En las siguientes líneas se
describen cuatro sistemas de color que serán de utilidad para la comparación de los resultados.
El espacio de color RGB

En este modelo cada color aparece en sus componentes espectrales primarias de rojo
(red, R), verde (green, G) y azul (blue, B) y está basado en el sistema coordenado cartesiano en
donde el subespacio de interés es un cubo (ver gura 4.1). Los valores R,G,B están localizados
en tres de las esquinas del cubo y los colores magenta, cian y amarillo están ubicados en las
otras tres esquinas. La escala de grises, comprendida desde el origen (negro) hasta la esquina
más alejada (blanco), se extiende a lo largo de la línea que une estos dos puntos. Los distintos
colores son puntos dentro o sobre el cubo y están denidos como vectores ∈ R3 que se extienden
desde el origen del sistema.
Figura 4.1: Representación del espacio de color RGB.
Las imágenes representadas en este sistema consisten en tres canales, una para cada
color primario. Si consideramos cada una de estas componentes como una imagen de 8 bits, el
número de bits utilizado para representar cada pixel de color será de 24 bits. El número total
de colores en una imagen RGB de 24 bits es, por tanto, (28 )3 = 16, 777, 216 colores.
Modelo de color I1I2I3

El modelo de color I1I2I3 es una medida de decorrelación entre los canales RGB, cuyo
propósito es el de extraer las características más importantes del color [9]. Las ecuaciones de
transformación entre el espacio de color RGB y el modelo I1I2I3 son las siguientes:
R+G+B R−B 2G − R − B
I1 = , I2 = , I3 = . (4.4)
3 2 4
El espacio de color HSI

Es un sistema utilizado para representar los colores de manera análoga al que realiza el
sistema visual humano, es decir, por medio del tono, saturación e intensidad [8]. El tono (hue,
H) es el color mismo como descrito por su longitud de onda, la saturación (saturation, S) es
la cantidad de color que está presente (pureza relativa o cantidad de luz blanca mezclada con
el tono) y la intensidad (intensity, I) es la cantidad de luz. El espacio en el que estos valores
son gracados puede representarse por un cono o doble cono circular o hexagonal cuyo eje es
la progresión de escala de grises de negro a blanco, de acuerdo a como se ilustra en la gura
4.2; la distancia desde el eje central es la saturación y la dirección del vector es el tono. Una
característica importante de este sistema es que separa la información del color de una manera
que corresponde a la respuesta del sistema visual humano; por ejemplo, el uso del tono para
el proceso de segmentación regularmente corresponde con el de la percepción humana.
Figura 4.2: Representación del espacio de color HSI.
Diversas técnicas de procesamiento de imágenes pueden presentar ventajas al utilizar el

sistema de color HSI, lo que implica realizar una conversión entre espacios de color. Dada una
imagen RGB, la trasformación al espacio HSI se realiza por medio de las siguientes expresiones:
1 mı́n(R, G, B)
I = (R + G + B) ; S = 1 − , (4.5)
3 I
( )
2B − R − G R − G
H = arctan √ , √ . (4.6)
6 6
El espacio de color L*a*b*

Un espacio geométricamente simple y que es fácil de tratar matemáticamente es el
modelo L*a*b* [19]. Este espacio es perceptualmente uniforme siendo L* la luminancia o el eje
de escala de grises, a* y b* son dos ejes ortogonales que juntos denen la saturación y el color.
El eje de lumiancia toma los valores entre 0 y 100 siendo 0 el negro ideal y 100 el blanco de
referencia. De acuerdo a como se muestra en la gura 4.3, el eje a* reccorre desde el rojo (+a*)
al verde (-a*) y el eje b* desde el amarillo (+b*) al azul (-b*). Estos ejes ofrecen un compromiso
práctico entre la simplicidad de modelo RGB y los espacios que son más siológicos como el
HSI, los cuales son utilizados en muchos sistemas que manejan color.
Figura 4.3: Representación del espacio de color L*a*b*, donde L* representa la luminancia o el eje de escala
de grises, mientras que a* y b* denen la saturación y el color.
A partir de las coordenadas triestímulos XY Z se puede construir el espacio L*a*b*,

por medio de las expresiones siguientes:
L∗ = 25(100Y /Y0 )1/3 − 16, (4.7)

[ ]
a∗ = 500 (X/X0 )1/3 − (Y /Y0 )1/3 , (4.8)
[ ]
b∗ = 200 (Y /Y0 )1/3 − (Z/Z0 )1/3 . (4.9)
4.3. SEGMENTACIÓN BASADA EN W Y M
donde X0 , Y0 , Z0 son las valores triestímulos para el blanco de referencia. Además, los valores
X, Y, Z puden ser producidos a partir de las coordenadas RGB por medio de una transformación
lineal. La matriz para el sistema de recepción NTSC se ha utilizado para este propósito y está
denida por     
X 0.607 0.174 0.200 R
    
 Y  =  0.299 0.587 0.114   G  (4.10)
    
Z 0.000 0.066 1.116 B
4.3. Segmentación basada en W y M

Dada una imagen de color A de m × q pixeles el objetivo del algoritmo de segmentación
propuesto consiste en determinar los pixeles más saturados (con mayor pureza de color) que
permitan separar las mezclas de color presentes en la imagen. Para ello, primeramente se
construye el conjunto X que contiene todos los colores distintos presentes en A, también
considerados vectores 3-D. El siguiente paso consiste en calcular las memorias min -WXX y
max -MXX usando respectivamente las ecs. (3.16) y (3.17), a partir del conjunto X . Para
el caso de imágenes a color las memorias matriciales calculadas son de tamaño 3 × 3, es
decir, W = (w1 , w2 , w3 ) y M = (m1 , m2 , m3 ). Como se mencionó en el capítulo anterior, de
acuerdo a la forma en que se construyen las memorias reticulares sus vectores columna no
necesariamente pertenecen al espacio de color de la imagen, por lo que se necesita realizar el
escalamiento expresado en la ec. (3.19). Las columnas escaladas de cada una de las matrices
W y M deben satisfacer la propiedad de independencia afín, la cual se puede vericar de
manera sencilla en base al Teorema 3.5; en particular, para vericar la independencia afín
de los vectores de W o M ninguna columna debe ser igual o un múltiplo de las dos restantes.
El siguiente paso en el proceso de segmentación consiste en utilizar los conjuntos
W = {w1 , w2 , w3 } y M = {m1 , m2 , m3 } para determinar diversos tetraedros que encierren
subconjuntos de X . Recuérdese que en el espacio de tres dimensiones un simplex corresponderá
a un tetraedro. De esta manera, si los vectores pixel de una imagen a color están encerrados
por algún tetraedro, cuya base esté formada por sus colores más saturados, entonces es posible
hacer una estimación de las fracciones en las cuales éstos aparecen en cualquier otro pixel de
4.4. EJEMPLOS DE SEGMENTACIÓN
la imagen. Un modelo que se puede utilizar para este análisis es el modelo de mezclado lineal
con restricciones en el cual cada vector de color se representa como una combinación lineal
de los colores más saturados en distintas proporciones; en efecto, a partir de las ecs. (3.9) y
(3.10) para i = 1, 2, 3 y haciendo r = 0 se tiene
x = Sa = a1 s1 + a2 s2 + a3 s3 , sujeto a (4.11)
a1 , a2 , a3 ≥ 0,
a1 + a2 + a3 = 1,
donde x es un vector pixel de la imagen, S = (s1 , s2 , s3 ) es una matriz cuadrada de 3 × 3 cuyas

columnas son los colores más saturados, y a es el vector de 3 × 1 que contiene las fracciones
de colores saturados presentes en x. Es importante mencionar que el conjunto de colores más
saturados de una imagen puede ser igual al conjunto de colores primarios (rojo, verde, azul)
o al conjunto de colores complementarios (magenta, cian, amarillo).
La geometría de W y M permite determinar los vértices de un tetraedro que encierra
a los pixeles en la imagen a partir de sus columnas escaladas; dichos vértices corresponden
a los colores más saturados de la imagen. Por lo tanto, el paso siguiente en el procedimiento
consiste en resolver la ecuación (4.11) haciendo S = W o S = M para determinar el vector
a para cada x ∈ X , proceso conocido como separación lineal. Una vez que la ec.(4.11) se ha
resuelto para cada pixel de color x, los valores de los vectores a son desplegados como una
imagen de fracciones de color saturados para s1 , s2 , s3 . El paso nal consiste en realizar una
umbralización entre 0 y 1 para obtener una segmentación de la imagen de color.
4.4. Ejemplos de segmentación
En las siguientes líneas se presenta un ejemplo que ilustra el funcionamiento del método
de segmentación propuesto, también conocido como método W M . Posteriormente se presen-
tan los resultados de segmentación obtenidos para un conjunto de imágenes en color RGB de
dominio público, así como un conjunto de imágenes representadas en otros espacios de color.
Ejemplo 4.1 En la parte superior izquierda de la gura 4.4 se presenta una imagen RGB de
tamaño 256 × 256 que corresponde a los colores primarios en el modelo aditivo de color. De
acuerdo con el procedimiento descrito, el conjunto X se ha generado con todos los diferentes
colores presentes en la imagen. El número de vectores en la imagen es de 65,536 y el conjunto
X = {x1 , . . . , x8 }. Utilizando X como el conjunto de entrada se han calculado las MAARs, así
como los vectores cota máxima y mínima usados para obtener las matrices escaladas W y M ,
los cuales están dados por
       
255 0 0 255 0 255 255 0
       
W =
 0 255 0   
 , u  255  ; M =   
 255 0 255  , v =  0  .
0 0 255 255 255 255 0 0
Figura 4.4: Primera la, izquierda a derecha: imagen en color RGB utilizada en el Ejemplo 4.1, imágenes en
tonos de gris de las fracciones de color determinadas a partir de las columnas de W. Segunda la: fracciones
de color determinadas a partir de las columnas de M. La correspondencia entre el nivel de gris asignado y el
valor numérico es el siguiente: 1 = blanco, 0.5 = gris medio, 0.33 = gris oscuro y 0 = negro.
Para determinar el vector de fracciones de color a para cada pixel en la imagen, un

simple análisis algebráico permite invertir la ecuación (4.11) haciendo primero S = W y luego
S = M . Así, es posible obtener una solución analítica para los vectores que conforman la
imagen; en efecto,
   
1 1 1 −1 1 1
−1   −1 1  
W = 1  1 1 1  ; M =  1 −1 1 
255   510  .
1 1 1 1 1 −1
−1
En el caso de W = I/(255), siendo I la matriz identidad, se tiene que ai = xi /255
satisface la desigualdad 0 ≤ ai ≤ 1 para todo i = 1, 2, 3 dado que los vectores {x1 , . . . x8 } se en-
∑ ∑
cuentran en el intervalo [0,255]. La aditividad completa se satisface si 3i=1 ai = 3i=1 xi /255 =
1, por lo que los valores de los pixeles de colores residen en el plano x1 + x2 + x3 = 255 lo
cual sólo ocurre en los puntos (255,0,0), (0,255,0) y (0,0,255). Haciendo g = x1 + x2 + x3 se
puede especicar un criterio que permita determinar las fracciones de color y que satisfaga
la condición anterior; es decir, ai = xi /g si g ̸= 0, de otra forma ai = 0. De manera similar,
−1 ∑
para M se tiene que ai = j̸=i (xj − xi )/510 para i = 1, 2, 3. Sin embargo, puesto que xξi
con ξ = {1, . . . , 8} está en el intervalo [0,255] entonces ai ∈ {−0,5, 0, 0,5, 1} lo que implica
que la positividad no se satisface para todo i. Además, la aditividad completa se satisface si
∑3 ∑
i=1 ( j̸=i xj − xi )/510 = 1 indicando que los valores de los pixeles de colores están en el
plano x1 + x2 + x3 = 510, lo cual sucede en los puntos (0,255,255), (255,0,255) y (255,255,0).

Por lo tanto, haciendo g = x1 + x2 + x3 las fracciones de color que se obtienen con la memoria
∑
M están dadas por ai = ( j̸=i xj − xi )/g si g ̸= 0, de otra forma si g = 0, entonces ai = 0.
Por último para el caso ai = −1 es necesario hacer ai = 0 y entonces aj será igual a aj /2 para
j ̸= i.
Los resultados del procedimiento antes descrito se han desplegado en la gura 4.4. En
la primera la se presentan las fracciones de color obtenidas con W que corresponden a la
segmentación de las porciones rojo, verde y azul de la gura; por su parte en la segunda la
se presentan las fracciones obtenidas con M que corresponden a las porciones cian, magenta
y amarillo, respectivamente. Cada imagen segmentada ha sido escalada linealmente al rango
[0,255] para su visualización.
Ejemplo 4.2 En la parte superior de la gura 4.5 se presentan tres imágenes RGB de tamaño
256 × 256 pixeles que se han utlizado para demostrar la funcionalidad del método propuesto.
La Tabla 4.1 presenta información de las caracterísiticas propias de cada imagen.
Tabla 4.1: Información de las imágenes en color RGB utilizadas en el Ejemplo 4.2
Imagen Pixeles (mq) Colores (κ) Matrices

Mandril 65,536 63,106 W α, M α
Flores 65,536 40,805 W β, M β
Mariposa 65,536 53,298 W γ, Mγ
Las entradas numéricas de las versiones escaladas de las MAARs calculadas a partir de las
imágenes ejemplares están dadas explícitamente por:
   
255 129 72 0 200 255
   
Wα = 
 55 255 156  ; M α =  126
 0 165 
,
0 90 255 183 99 0
   
255 224 167 0 48 160
   
Wβ = 
 207 255 145  
 ; M β =  31 0 126 ,
95 129 255 88 110 0
   
255 249 243 16 165 194
   
Wγ = 
 90 255 166  
 ; M γ =  22 0 137 .
61 118 247 20 81 0
Para las imágenes anteriores se han utilizado independientemente W ℓ y M ℓ como la

matriz S , con ℓ = α, β, γ y se ha utilizado el algoritmo numérico del NNLS para estimar
las fracciones de color en los vectores de cada imagen. Además, las memorias matriciales
calculadas son de rango completo y, por lo tanto, las soluciones determinadas por el proceso
de separación lineal son únicas. Obsérvese que los vectores v y u (subrayados en las matrices
anteriores) corresponden respectivamente, a un color negro y un color cercano al blanco; es
posible entonces reemplazar alguna columna de W o M con uno de estos puntos extremos
para obtener una segmentación de las regiones brillantes u oscuras.
Figura 4.5: Fila superior: imágenes de color ejemplares; segunda a cuarta las: imágenes en tonos de gris
representando las fracciones de los colores saturados seleccionados a partir de W y M.
Por otra parte, los vectores de fracciones de color satisfacen las desigualdades 0 ≤ a ≤ 1,
por lo que es posible mapear linealmente el subintervalo denido por [0, µ] ⊆ [0, 1] al rango
dinámico [0,255], donde µ = ∨kξ=1 aξj . La gura 4.5 presenta los resultados de segmentación
obtenidos para las guras ejemplares a partir de las columnas de W y M . En estas guras
los resultados se han desplegado en todos de gris donde los grises brillantes indican fracciones
de color cercanas a 1, mientras que los grises oscuros indican fracciones de color cercanas a 0.
La parte izquierda de la gura 4.6 presenta una gráca 3-D de la distribución de los vectores
de la imagen del mandril. En las partes central y derecha se muestran cuatro tetraedros
que encierran distintos subconjuntos de X y que se obtienen al formar respectivamente los
conjuntos W ∪ {v} y W ∪ {u} (centro) o M ∪ {v} y M ∪ {u} (derecha).
Por último, si se require segmentar el color original de la imagen en cuestión, entonces
puede aplicarse un valor de umbral τ ∈ (0.3, 1) a la imagen de fracciones de color para
4.5. COMPARACIÓN DE RESULTADOS
Tabla 4.2: Datos de la segmentación de colores en las imágenes ejemplares

Imagen Vectores (Umbral)
Mandril w1α (0.78), m1α (0.92), m3α (0.67)
Flores m2β (0.62), w1β (0.51), w2β (0.30)
Mariposa m3γ (0.62), m2γ (0.52), uγ (0.34)
Figura 4.6: Izquierda: distribución en el espacio de los diferentes vectores de color en la imagen del mandril de
la g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1 , w2 , w3 } y M = {m1 , m2 , m3 }
que encierran diferentes subconjuntos de X.
binarizarla y después hacer un enmascaramiento de la imagen de color original con la imagen

binarizada; la gura 4.7 muestra los resultados del proceso de enmascaramiento para separar
los distintos colores presentes en las imágenes ejemplares. La Tabla 4.2 despliega los vectores
columna (pixeles de color saturados) seleccionados a partir de ℓ = α, β, γ junto con los valores
de umbral utilizados para realizar la segmentación de los colores de la imagen. Los resultados
de segmentación discutidos, así como una comparación con el método de distancias han sido
reportados en [22].
4.5. Comparación de resultados
Parte fundamental en el desarrollo de una nueva técnica de segmentación consiste

en evaluar los resultados respecto a otras técnicas reportadas en la literatura; lo anterior
Figura 4.7: Fila superior: imágenes de color ejemplares; segunda a cuarta las: imágenes de colores segmen-
tados para las guras ejemplares (resultado de umbralización y enmascaramiento).
permitirá conocer el desempeño del método y determinar el tipo de imágenes en el que éste
puede ser utilizado. Además, algunas técnicas de segmentación presentan mejores resultados
en un determinado espacio de color, por tal motivo es necesario conocer si existen mejoras
en los resultados cuando se realizan transformaciones de la imagen original a otros espacios.
En esta sección se presentan los resultados de evaluar el desempeño del método basado en
W y M utilizando imágenes en color RGB y su transformación a los tres espacios de color
introducidos en las secciones anteriores. Más adelante se realiza una comparación cuantitativa
de estos resultados de segmentación en relación a los obtenidos con dos técnicas conocidas: la
técnica por agrupamiento basada en la distancia de Mahalanobis y el algoritmo de cuencas.
En la primera la de la gura 4.8 se presentan la imagen RGB de los pimientos y su
transformación a los espacios I1I2I3, HSI y L*a*b* que se han desplegado como imágenes en fal-
so color RGB. En la segunda la se presentan las imágenes conformadas por las segmentaciones
de los pimientos rojos y verdes y las porciones de luz reejada para los respectivos espacios
de color. Para formar cada una de las imágenes compuestas se ha realizado el procedimiento
siguiente. Primero, se han calculado W e independientemente M en base a la imagen en el
correspondiente espacio de color y para cada vector columna se han determinado las fracciones
de color por medio de la estimación NNLS. Después, se han seleccionado los mapas que pre-
sentan los mejores resultados en la distribución del color, a partir del conjunto {W ∪ M }. A
los mapas seleccionados se les ha asignado un determinado tono de gris y se han combinado
para formar una imagen compuesta. La tabla 4.3 presenta los vectores correspondientes y um-
brales utilizados para producir dichas imágenes. Al observar detenidamente estos resultados se
puede concluir que la técnica propuesta presenta una mejor segmentación cuando se utilizan
los espacios I1I2I3 y RGB.
Tabla 4.3: Datos de segmentación utilizados para los diferentes espacios de color
Espacio de color Vector(umbral)

RGB w1 (0.45), w2 (0.36), m1 (1.56)
I1I2I3 m3 (0.39), w3 (0.38), w1 (0.34)
HSI w1 (0.54), m1 (0.16), w3 (0.51)
L*a*b* w2 (0.29), m2 (0.53), w1 (0.81)
La primera la de la gura 4.9, columnas 1 y 2, presenta los resultados de segmentación

producidos con el método W M en los espacios RGB e I1I2I3, respectivamente. En las columnas
3 y 4 de la misma la se presentan los resultados obtenidos por medio de la distancia de
Mahalanobis y el algoritmo de cuencas. En la última columna se presenta la versión en tonos
de gris NTSC de la imagen de color original, que ha sido cuantizada a 16 niveles de gris.
Asimismo, en la segunda la de la gura se han presentado las imágenes de bordes resultado
de aplicar ltros de Sobel a cada una de las imágenes de la primera la. Es importante destacar
que la imagen de bordes producida para la versión en tonos de gris de la imagen original será
utilizada como referencia en el proceso de comparación.
Las imágenes de bordes producidas a partir de las segmentaciones antes descritas nos
Figura 4.8: Primera la: imagen de color en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente; segunda
la: imágenes conformadas por las segmentaciones de los pimientos rojos y verdes y las porciones de luz reejada
producidas por W y M para cada espacio de color.
permiten delimitar las regiones segmentadas por cada uno de los algoritmos. Estas regiones
pueden ser comparadas respecto de la imagen de bordes de la versión NTSC tomando en
cuenta los siguientes criterios: perímetro y área de las regiones, razón señal a ruido, coeciente
de correlación, entre otros [3]. Para la comparación que se presenta a continuación hemos
elegido como métricas el coeciente de correlación, φ, y la razón señal a ruido, SNR, los cuales
se denen en lo siguiente.
Denición 4.3 Sean X e Y dos imágenes con mq = k elementos, sus vectores medios se
denotan respectivamente por zx y zy ; se dene el coeciente de correlación φ como el índice
que mide la relación lineal entre estas dos variables, el cual está expresado como sigue
∑k
CXY (xi − zx )(yi − zy )
φ= √ = √∑ i=1 ∑k , (4.12)
σX σY
i=1 (xi − zx ) · i=1 (yi − zy )
k 2 2
donde CXY es la matriz de covarianza de X, Y y σX , σY son respectivamente las desviaciones

estándar de las distribuciones [7]. Los valores de φ están en el intervalo [-1,1], cuando φ = 1
existe una correlación positiva perfecta entre las dos imágenes; si φ = 0 no hay correlación y
si φ = −1 existe una correlación negativa total lo que implica una relación inversa entre las
dos imágenes.
Figura 4.9: Primera la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,
con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas e imagen de los
pimientos cuantizada a 16 niveles de gris; segunda la: imágenes de bordes producidos por ltros de Sobel
para las imágenes de la primera la.
Denición 4.4 Sean X una imagen de referencia y Y una imagen modicada, la razón señal
a ruido (signal to noise ratio, SNR) se dene como la razón entre la varianza de la imagen
original σX
2
y la varianza de la diferencia de imágenes, matemáticamente,
( 2)
σX
SNR = 10 log10 . (4.13)
σd2
donde σX
2
representa la varianza de la imagen original y σd2 es la varianza de la diferencia de
las imágenes original y modicada [11].
Los resultados de comparar las imágenes de bordes de la gura 4.9 respecto de la imagen
de referencia (imagen de bordes de la versión NTSC) se presentan en la tabla 4.4. Se puede
notar que los mejores resultados de segmentación se han producido con el método basado en
W y M en el espacio de color I1I2I3 cuyos valores de correlación y SNR están por encima de
los otros métodos.
Finalmente, para el caso de imágenes de tres canales en el que el modelo MLR se
transforma en la ec. (4.11), dado que x ∈ R3 y p = 3, una solución alternativa para la
determinación de las abundancias de los colores saturados se puede realizar por medio de la
Tabla 4.4: Comparación del desempeño de los algoritmos de segmentación.
Método de segmentación φ SNR

W M en RGB 0.707 14.179
W M en I1I2I3 0.717 14.931
W M en HSI 0.708 14.124
W M en L*a*b* 0.675 14.006
Distancia de Mahalanobis 0.632 12.917
Algoritmo de cuencas 0.594 9.814
inversión de matriz generalizada que refuerce la aditividad y además umbralice todos aquellos
valores negativos [24]. De esta forma, cualquier aq = 1 − ag − ah con q = 1, 2, 3 y q ̸= g < h ̸= q
puede ser seleccionado para reducir el tamaño de la matriz S y el vector a. Por tanto, para
determinar las fracciones de colores saturados se debe resolver para cada pixel de color el
sistema xq = Sq aq , donde aq = (ag , ah )T , Sq = W q o Sq = M q . Las la i-ésimas y las entradas
respectivas para i = 1, . . . , 3 están dadas por
Sq = (sig − siq , sih − siq ) ; xq = (xi − siq ). (4.14)
Cualquier valor negativo que resulte de esta inversión debe ser umbralizado al valor de cero
para satisfacer la condición de positividad. La solución expresada en la ec. (4.14), con q = 1,
ha sido empleada para realizar la determinación de las fracciones de colores saturados para el
conjunto de imágenes naturales de dominio público que se presentan en la gura 4.10. En cada
la, la imagen original en color RGB se despliega a la izquierda y de izquierda a derecha se
presentan las imágenes compuestas producidas por la segmentación del método W M en los
espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente. Por ejemplo, la imagen en tonos de gris
correspondiente al oso en el espacio I1I2I3 fue generada mediante la composición de los mapas
de fracciones obtenidos por w2 y m2 después de la umbralización en τ =0.387 y τ =0.326,
respectivamente. En base a estos resultados se puede notar que el algoritmo de segmentación
basado en W y M presenta mejores resultados en el espacio de color I1I2I3.
Figura 4.10: Primera columna: imágenes en color RGB; segunda a quinta columnas: imágenes conformadas
por las segmentaciones producidas por W y M en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente.
Las principales regiones de interès se han cuantizado.
4.6. CONCLUSIONES
4.6. Conclusiones
En este capítulo se ha presentado un método de segmentación para imágenes en color

basado en las memorias autoasociativas reticualres W y M . Los vectores columna de ambas
memorias denen los pixeles de color más saturados en una imagen en color. En base al modelo
MLR, estos pixeles saturados permiten determinar las fracciones de color en cualquier otro pixel
de la imagen. Diversos ejemplos han ilustrado la aplicación de este método en imágenes RGB,
así como a imágenes transformadas a los espacios de color I1I2I3, HSI y L*a*b*. Los resultados
de comparar el método W y M con otras técnicas de segmentación proporcionan detalles en
la efectividad de los resultados obtenidos. En efecto, el método aquí presentado puede ser
clasicada como una técnica de agrupamiento de pixeles no supervisada.
Bibliografía
[1] Beucher S., The watershed transform applied to image segmentation, Scanning Mi-
croscopy International, Vol. 6, pp. 299314, 1992.
[2] Celenk M., Uijt de Haag M., Optimal thresholding for color images, SPIE Proc.: Non-
linear Image Processing IX, Vol. 3304, San Jose, CA, pp. 250259, 1998.
[3] Chalana V., Kim Y., A methodology for evaluation of boundary detection algorithms on
medical images, IEEE Trans. on Medical Imaging, Vol. 16, No. 5, pp. 642652, 1997.
[4] Cheng H.D., Jain X.H., Sun Y., Wang J., Color image segmentation: advances and
prospects, Pattern Recognition, Vol. 34, No. 12, pp. 22592281, 2001.
[5] Crespo J., Schafer R.W., The at zone approach and color images. In: Mathematical
morphology and its applications to image processing, J. Serra and P. Soille eds., Dordrecht,
The Netherlands: Kluwer Academic, pp. 8592, 1994.
[6] Géraud T., Strub P-Y., Darbon J., Color image segmentation based on automatic mor-
phological clustering, IEEE Proc.: Inter. Conf. on Image Processing, Vol. 3, Thessaloniki,
Greece, pp. 7073, 2001.
[7] Gonzalez R.C., Woods R.E., Digital Image Processing, 3rd edition, Pearson Education,
2008.
[8] Koschan A., Abidi M., Digital color image processing, Hoboken, NJ: John Wiley & Sons,
chap. 7, pp. 149174, 2008
92
BIBLIOGRAFÍA
[9] Liu J., Yang Y.H., Multiresolution color image segmentation, IEEE Trans. on Pattern
Analysis and Machine Intelligence, Vol. 16, No. 7, pp. 689700, 1994.
[10] Lucchese L., Mitra S.K., Color image segmentation: A-state-of-the-art-survey, Proc.
Indian Nat. Sci. Acad. (INSA-A), Vol. 67, No. 2, pp. 207221, 2001.
[11] MacDonald L.W., Ronnier-Luo M., Colour Image Science: exploiting digital media, Eng-
land: John Wiley & Sons, pp. 378380, 2002.
[12] Meyer F. and Beucher S., Morphological segmentation, Journal of Visual Communi-
cation and Image Representation, Vol. 1, No. 1, pp. 2146, 1990.
[13] Meyer F., Color image segmentation, IEEE Proc.: 4th Inter. Conf. on Image Processing
and its Applications, pp. 303306, 1992.
[14] Palus H., Color image segmentation: selected techniques. In: Color image processing:
methods and applications, R. Lukac, K.N. Plataniotis eds., Boca Raton, FL: CRC Press,
chap. 5, pp. 103128, 2006.
[15] Panjwani D.K., Healey G., Unsupervised segmentation of textured colour images using
Markov random eld models, Proc. CVPR'93, New York, USA, pp. 776777, 1993.
[16] Park S.H., Yun I.D., Lee S.U., Color image segmentation based on 3-D clustering: mor-
phological approach, Pattern Recognition, Vol. 31, No. 8, pp. 10611076, 1998.
[17] Plataniotis K.N., Venetsanopoulos A.N., Color image processing and applications, Berlin,
Germany: Springer, chap. 6, pp. 237273, 2000.
[18] Poynton C.A., A technical introduction to digital video, NJ: John Wiley & Sons, 1996.
[19] Shafarenko L., Petrou H., Kittler J., Histogram-based segmentation in a perceptually
uniform color space, IEEE Trans. on image processing, Vol. 7, No. 9, pp. 13541358,
1998.
[20] Skarbek W., Koschan A., Colour image segmentation: a survey, Technical Report 94-32,
Technical University of Berlin, pp. 181, 1994.
BIBLIOGRAFÍA
[21] Sowmya B., Sheelanari B., Color image segmentation using soft computing techniques,
Int. Journal of Soft Computing Applications, Vol. 4, pp. 6980, 2009.
[22] Urcid G. and Valdiviezo-N J.C., Color image segmentation based on lattice autoassocia-
tive memories, IASTED Proc.: 13th Articial Intelligence and Soft Computing, Vol. 683,
Palma de Mallorca, Spain, pp. 166173, 2009.
[23] Urcid G., Valdiviezo-N J.C., Ritter G.X., Lattice associative memories for segmenting
color images in dierent color spaces, LNCS Proc.: Hybrid Articial Intelligence Systems,
Springer, Vol. 6077/2010, pp. 359366, 2010.
[24] Urcid G., Valdiviezo-N J.C., Ritter G.X., Lattice algebra approach to color image seg-
mentation, Journal of Mathematical Imaging and Vision, doi 10.1007/s10851-011-0302-2,
2011.
Capítulo 5
Análisis de Imágenes Multiespectrales
En este capítulo se realiza el análisis de un conjunto de imágenes multiespectrales usando

el método W M que se introdujo en el capítulo anterior. En primer lugar se explicará el
proceso para el registro de una escena multiespectral en el laboratorio. Después se describirá
la aplicación del método mencionado para el análisis de datos multiespectrales. Finalmente
se presenta una aplicación en la recuperación de la escritura original en el palimpsesto de
Arquímedes. El capitulo se concluye con una comparación de resultados entre el método que
aquí se presenta y dos métricas conocidas.
5.1. Imágenes multiespectrales de documentos antiguos
En años recientes el análisis de palimpsestos y otros documentos antiguos ha tenido

gran interés debido a la cantidad de información que es posible obtener mediante el registro
de imágenes en distintas porciones del espectro electromagnético. Muchos de los textos an-
tiguos que aún se conservan han sufrido daños severos durante el transcurso de varios siglos,
impidiendo que el escrito pueda ser interpretado correctamente. Investigaciones recientes se
han orientado al análisis y recuperación del contenido original aún presente en ellos mediante
técnicas de imagen. El fundamento físico de las técnicas de imagen está basado en el hecho
de que la reectancia de los materiales utilizados para la elaboración del documento varía
con la longitud de onda. Un estudio importante acerca de las propiedades ópticas de películas
95
5.1. IMÁGENES MULTIESPECTRALES DE DOCUMENTOS ANTIGUOS
delgadas de pinturas fue realizado por Van Asperen de Boer quien descubrió que, alrededor
de 2 µm, se puede lograr máxima penetración en la mayoría de las pinturas [17]. Sin embargo,
a longitudes de onda cercanas a los 2 µm, materiales comunes como la tinta de hierro-hiel y
la sepia se vuelven invisibles [5]. Lo anterior sugiere que el registro de imágenes espectrales en
la porción infrarroja puede ser utilizada para visualizar dibujos y textos originales sobre los
cuales se superpusieron nuevas guras.
Los instrumentos multiespectrales, que fueron utilizados primeramente para registrar
imágenes de la superce terrestre, han sido empleados en la actualidad para el análisis, con-
servación y digitalización de objetos de arte y documentos con valor histórico. La reectancia
espectral derivada en base a este registro múltiple permite identicar y clasicar los elementos
presentes en la escena. De esta manera, el uso de instrumentos multiespectrales en conjunto
con las técnicas digitales de análisis de imagen han permitido el rescate de textos antiguos
y la preservación de una parte del patrimonio cultural. Uno de los primeros trabajos en el
que se utilizó un instrumento multiespectral para analizar la pintura denominada Santísima
Trinidad Predella se presenta en [2]. Las imágenes registradas en las porciones visible e infrar-
rojo cercano fueron procesadas con el objetivo de identicar los materiales y mejorar las partes
oscuras de la pintura. Más adelante, se realizó la caracterización de las tinturas orgánicas y
minerales en una pintura del siglo XVI atribuída a la escuela de Pieter Brueguel el Elder [11].
Las imágenes captadas fueron analizadas utilizando la técnica de agrupamiento denominada
medias-c difusas. Por otro lado, el registro de imágenes multiespectrales ha dado lugar a nove-
dosas aplicaciones en el estudio de pinturas en murales. En particular, Ware et al analizaron
pigmentos mayas con coloración similar pero diferente composición química provenientes de la
caverna Naj Tunich en Guatemala [18]. Con el análisis de los datos utilizando técnicas de agru-
pamiento se logró diferenciar entre las pinturas originales y aquellas que fueron posteriormente
sobrepuestas.
Existen aplicaciones más especializadas en las que se requiere recuperar los textos
e imágenes originales en documentos históricos. En este contexto, el uso de instrumentos
multiespectrales fue primeramente empleado para visualizar e interpretar la escritura en las
partes dañadas de los Rollos del Mar Muerto [3, 9]. Además, en el caso de los denominados
5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA
palimpsestos, que son libros escritos en un periodo histórico determinado y cuyo texto original
fue borrado para sobre escribir en ellos un texto religioso, se ha podido rescatar exitosamente
gran parte del texto original. Uno de los estudios más importantes ha sido impulsado por el
proyecto Arquímedes [1, 8]. Aunque el registro multiespectral de los folios que conforman el
documento en las porciones ultravioleta, visible e infrarroja, en combinación con técnicas de
análisis de imagen han ayudado en el rescate de gran parte de los tratados del matemático
griego, existen partes del texto que no han podido ser rescatadas debido a la presencia de
moho [8].
Nuevas aplicaciones en el contexto de análisis multiespectral de palimpsestos han si-
do desarrolladas para el proyecto europeo denominado Renascimento Virtuale [15]. De esta
manera, diferentes instrumentos multiespectrales se han utilizado para interpretar escritos que
hasta entonces habían sido imposibles de leer. Aunque las técnicas de análisis multiespectral
han demostrado un gran potencial para este propósito, existen problemas relacionados con el
análisis de los datos que no han podido ser resueltos. Uno de estos problemas surge cuando los
tipos de escritura presentan curvas espectrales similares, lo que hace difícil su diferenciación.
En efecto, diversos algoritmos como el análisis de componentes principales o técnicas basadas
en agrupamiento, tales como medias-K o medias-C difusas, siguen siendo evaluadas con el
propósito de lograr una mejor diferenciación y mejoramiento de los textos originales.
5.2. Registro multiespectral de una escena
Existen diversas técnicas que pueden ser utilizadas para registrar una escena multi-
espectral en el laboratorio, las cuales se pueden clasicar principalmente en dos clases: (1)
técnicas que usan ltros, (2) técnicas que utilizan distintas fuentes de luz. En el primer ca-
so, el registro está basado en el uso de ltros de banda angosta para muestrear la escena en
bandas espectrales a lo largo del espectro electromagnético. De esta manera, el proceso para
la adquisición del conjunto de imágenes es el siguiente. Una fuente de luz de amplio espec-
tro, que puede ser una lámpara de tungsteno, ilumina la muestra; la energía que es reejada
por la muestra se hace pasar a través de un ltro de banda angosta (ltro variable o ltro
CCD
Fuente
de luz
filtros
Figura 5.1: Registro multiespectral de un documento antiguo usando un arreglo de ltros.
interferométrico), colocado en la entrada de un detector, que puede ser una cámara CCD, el
cual registra la imagen. Este procedimiento se repite para cada uno de los ltros que permiten
muestrear el intervalo de longitudes de onda de interés. Por otra parte, en el segundo caso la
idea fundamental consiste en el uso de diversas fuentes de luz espectralmente angostas para
capturar imágenes de la misma escena en distintas bandas espectrales. De esta forma, los ele-
mentos que conforman el arreglo experimental son: una fuente de luz variable o un conjunto
de fuentes espectralmente angostas para iluminar la muestra y un elemento detector, tal como
una cámara CCD. En la gura 5.1 se muestra el arreglo utilizado para registrar la imagen
multiespectral de un documento antiguo usando un arreglo de ltros.
En efecto, con cualquiera de las dos técnicas la idea es submuestrear el espectro de
longitudes de onda de interés (visible o infrarrojo cercano) utilizando elementos ópticos o
fuentes de luz que limiten el registro de las imágenes en determinadas bandas relativamente
angostas. Una vez que se ha realizado el registro multiespectral de la escena es necesario
modelar los factores que intervienen en la adquisición con el propósito de derivar la reectancia
espectral de los materiales que la conforman. En las siguientes líneas se hará mención de
algunas de estas técnicas.
5.2.1. Técnicas de estimación de la reectancia espectral

Para un sistema de captura de imágenes multiespectrales que consta de una cámara
CCD monocromática, un conjunto m de ltros ópticos y una fuente de luz de banda ancha, la
respuesta de la cámara ci que se obtiene con el i-ésimo ltro (para i = 1, . . . , m), asumiendo
iluminación de luz colimada a lo largo de la imagen, está dada por,
∫ λmáx
ci = o(λ)r(λ)dλ + ni , (5.1)
λmı́n
donde o(λ) = fi (λ)E(λ) representa el producto de la sensibilidad espectral de la cámara para

el i-ésimo ltro fi (λ) por la distribución espectral de la fuente de iluminación E(λ), r(λ)
es la reectancia espectral del objeto y ni es el ruido adherido en la i-ésima imagen [12].
Una solución a esta ecuación se puede conseguir utilizando técnicas de estimación discretas;
para ello, es necesario tomar K muestras de oi (λ) y r(λ) que permitan discretizar la integral
continua y expresarla en forma vectorial de la siguiente manera
ci = oTi r + ni , (5.2)
donde oi y r son vectores de dimensión K × 1, respectivamente, y oTi = fiT E , es el producto

de fiT , el vector transpuesto de la sensibilidad espectral del i-ésimo ltro por E , la matriz
diagonal de la distribución espectral de la iluminación. Además, la respuesta de la cámara ci
se puede representar como un vector de m × 1, tal que
c = Or + n, (5.3)
donde oTi ocupa la i-ésima la de la matriz O. Por tanto, una primera estimación r̂ de la
reectancia espectral puede obtenerse a partir de la inversa generalizada asumiendo la ausencia
de ruido; ésto es,
r̂ = O+ c = OT (OOT )−1 c. (5.4)
La inversa generalizada proporciona un error cuadrático medio mínimo, sin embargo, dicho
cálculo puede conducir a estimaciones oscilatorias. Una alternativa para evitar este problema
consiste en imponer algunas condiciones de suavizamiento sobre la solución. El uso de una
matriz de suavizamiento permite obtener una estimación suavizada, la cual está dada por [12],
r̂ = M −1 OT (OM −1 OT )−1 c; (5.5)
La matriz de suavizamiento M se dene como:

 
1 −2 1 0 0 0 ... 0
 
 −2 −4 0 ... 0 
 5 1 0 
 
 1 −4 6 −4 0 
 1 0 
M = . (5.6)
 0 1 −4 6 −4 1 0 
 
 .. .. .. 
 . . . 
 
0 ... ... ... 0 1 −2 1
Una tercera alternativa consiste en aplicar métodos de estimación de Wiener en los

que se considera a r como un vector muestra que resulta de un proceso alteatorio con media
conocida y matriz de covarianza Cr [12]. De esta forma, la estimación de Wiener está denida
por,
r̂ = Cr OT (OCr OT )−1 c, (5.7)
Una aproximación utilizada para Cr en la que ésta es modelada como una matriz
de covarianza resultado de un proceso de Markov de primer orden está denida, para i, j =
1, . . . , K , como 


j−i
⇔ i<j
 ρ
(Cr )ij = 1 ⇔ i=j , (5.8)


 i−j
ρ ⇔ i>j
donde 0 ≤ ρ ≤ 1 es el factor de correlación del elemento adyacente.
5.2.2. El Palimpsesto de Arquímedes

El manuscrito original de Arquímedes es un texto escrito sobre cuero de animal que fue
creado en el siglo X para copiar siete de los tratados del cientico y matemático griego. Cada
hoja del manuscrito medía aproximadamente 20 cm de ancho por 30 cm de largo. En el siglo
XII el texto fue lavado, cada página fue cortada por la mitad y sobre ellas se reescribió un

libro cristiano de resos al que se le denominó el Euchologion. Durante la edad media reciclar
libros de esta manera era una práctica común debido a lo costoso que resultaba el tratamiento
de la piel de cordero para hacer nuevos pergaminos. Las hojas individuales del nuevo libro
miden aproximadamente 15 cm de ancho por 20 cm de largo y el texto religioso está escrito de
manera perpendicular a los textos originales borrados. La tinta utilizada para escribir el libro
de resos y la mayoría de los textos originales fue tinta hecha de hierro y hiel. En el Euchologion
la tinta es de color café oscura y los caracteres se leen muy bien en la mayoría de las páginas,
mientras que, en los textos borrados, las manchas de tinta remanentes son generalmente de
color más rojo y la visibilidad de los textos va desde evidente hasta virtualmente invisible.
El libro de resos fue utilizado por cientos de años en los servicios cristianos en el
Monasterio de San Saba, localizado en el desierto de Judea. En 1800, el libro fue colocado
en la biblioteca del Metochion del Santo Sepulcro en Constantinopla, donde su presencia
fue notado en 1844 por Constantin Von Tischendorf. Después de una larga trayectoria, en
octubre de 1998 el manuscrito fue comprado por un coleccionista anónimo, quien lo depositó
en el Museo de Arte Walters, en Baltimore, Maryland y desde entonces ha nanciado un
programa intensivo para la restauración, conservación y el análisis del documento. De esta
forma, diversas técnicas y sensores han sido utilizados para la digitalización del documento,
incluyendo imágenes obtenidas mediante iluminación con rayos UV y rayos X [10].
El registro multiespectral del documento se realizó por medio de iluminación prove-
niente de arreglos LEDs, a diferentes longitudes de onda; para la captura de las imágenes del
documento se utilizó un sensor de color Sinar 54H, que registra valores RGB en cada pixel
por medio de traslaciones pizoeléctricas del sensor. Con el uso de este arreglo once imágenes
fueron registradas con bandas espectrales centradas en las longitudes de onda que se indican
en la Tabla 5.1. Una vez que los valores de radiancia captados por el sensor se transformaron
en reectancia, tomando en cuenta la respuesta de la cámara y la distribución espectral de las
fuentes de iluminación, el análisis de las imágenes permite diferenciar los pigmentos presentes
en la manuscrito en base a su reectancia espectral.

5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS
Tabla 5.1: Imágenes multiespectrales registradas para el documento de Arquímedes.
Bandas 1 2 3 4 5 6 7 8 9 10 11
λ0 (nm) 365 445 470 505 530 570 617 625 700 735 870
5.3. Métodos autónomos de análisis
En diversas aplicaciones se requieren técnicas autónomas que permitan clasicar los elemen-
tos que conforman una imagen. En el caso de imágenes multiespectrales técnicas particulares
se han aplicado para este propósito, algunas de la cuales están basadas en criterios como:
transformaciones para reducir la redundancia de información, agrupamiento de pixeles con in-
formación espectral similar y técnicas basadas en geometría convexa. En esta sección se hace
mención de tres métodos importantes de análisis que se pueden utilizar para la separación de
los textos presentes en el manuscrito de Arquímedes.
5.3.1. Análisis de componentes principales

La transformación de componentes principales (principal component analysis, PCA),
ha sido ampliamente utilizada para reducir la redundancia de información en un conjunto de
datos multiespectrales. Esta técnica permite encontrar combinaciones lineales ortogonales de
un conjunto de características (bandas espectrales) que maximizan la variación existente dentro
de ellas; dichas variaciones se despliegan en un nuevo conjunto de imágenes denominadas
componentes. El tratamiento matemático del análisis de componentes principales se presenta
a continuación.
Dada una imagen con k vectores en Rn , el vector medio z y la matriz de covarianza
C se calculan mediante las expresiones introducidas en la ec. (4.1). La matriz C de tamaño
n × n es real y simétrica. Si los elementos xi y xj no están correlacionados, su covarianza es
cero y, por lo tanto, cij = cji = 0. Además, sean ei y λi con i = 1, . . . , n, respectivamente,
los eigenvectores y eigenvalores correspondientes de C, ordenados en orden descendente tal
que λj ≥ λj+1 para j = 1, . . . , n − 1. De esta manera, sea A una matriz cuyas las estén
formadas por los eigenvectores de C, ordenados decrecientemente de acuerdo al valor de sus

correspondientes eigenvalores. Por lo tanto, siendo A una matriz de transformación que se

utiliza para mapear los vectores x a vectores correspondientes y, se dene la transformada
Hotelling de acuerdo a la siguiente expresión:
y = A(x − z). (5.9)
Es importante mencionar que en esta transformación los ejes del nuevo sistema coordenado
apuntan en la dirección de máxima varianza. Por otra parte, al calcular la matriz de covarianza
de y, los elementos fuera de la diagonal son cero, lo cual signica que sus elementos no
poseen correlación. Finalmente, para el caso de las imágenes de componentes principales, una
característica importante es que una porción alta del contraste está contenida en las primeras
dos imágenes, decreciendo rápidamente a partir de la segunda componente.
5.3.2. Agrupación con medias-K

El algoritmo de medias-K (K -means ) es utilizado para identicar grupos de los puntos
de datos en un espacio n-dimensional. Dado un conjunto de datos {x1 , . . . , xQ } que consiste
en Q observaciones de una variable aleatoria X ∈ Rn , el propósito es particionar el conjunto
de datos en algún número K de grupos. En particular, un grupo consiste en un conjunto de
datos cuyas distancias entre puntos son pequeñas comparadas con las distancias con puntos
fuera del grupo. Los vectores −
→
ς ξ , con ξ = 1, . . . , K , representan los centros de dichos grupos.
De esta forma, el objetivo del algoritmo es determinar el conjunto de vectores −
→
ς ξ , así como
asignar los datos a alguno de los grupos tal que la suma del cuadrado de las distancias de cada
punto a su vector −→ς ξ más cercano sea un mínimo.
Formalmente, para cada punto xq , con q = 1, . . . Q, un conjunto de variables indicadoras
binarias dq,ξ ∈ {0, 1} describe a cual de los K grupos el punto xq es asignado, tal que si este
punto se asigna al grupo ξ , entonces dq,ξ = 1 y dq,j = 0 para j ̸= ξ . Se dene entonces la
siguiente función objetivo, tal que
∑
Q
∑
K
J= dq,ξ ∥ xq − −
→
ς ξ ∥2 , (5.10)
q=1 ξ=1

la cual representa la suma de los cuadrados de las distancias de cada punto a su vector asignado
−
→ς ξ . Dado que esta función tiene por objetivo encontrar valores de d y −q,ξ
→ς ξ que minimicen
a J , el algoritmo realiza un proceso iterativo en el que cada iteración involucra dos procesos
de optimización. Primero se escogen valores iniciales para − →ς ξ . Entonces se minimiza J con
respecto a dq,ξ , manteniendo a −
→
ς ξ jo. En la segunda etapa se minimiza J con respecto a
−
→ς ξ , manteniendo a d jo. Estos dos pasos se repiten hasta que el algoritmo converge [4]. En
q,ξ
efecto, con el procedimiento descrito todos los puntos se clasican en alguno de los K grupos.
5.3.3. El método W y M aplicado al caso multiespectral

En el caso de imágenes multiespectrales, el método basado en W y M se puede utilizar
para determinar el conjunto de puntos extremos de la imagen, que a su vez representan a los
pixeles espectrales más puros. En base al modelo MLR, enunciado en la ec. (3.9), la información
registrada en cada pixel de una imagen multiespectral puede considerarse como la reectancia
mezclada de los diversos materiales que conforman la escena. Es decir, muchos de los pixeles
de la escena habrán registrado un espectro combinado y algunos otros contendrán el espectro
de un único material. En particular, para el caso del palimpsesto de Arquímedes, la mezcla
espectral estará conformada por los espectros que pertenecen a los dos tipos de pigmentos
utilizados para los dos escritos y el cuero del manuscrito. Por tanto, la representación de
mezclas espectrales permitirá estimar la presencia de alguno de los pigmentos en cada pixel
de la imagen.
De acuerdo con la discusión presentada en el Capítulo 3, después de calular las memo-
rias escaladas W y M es necesario vericar que sus columnas cumplen con la propiedad de
independientes afín. De esta manera, la extensión de este método para el caso multiespectral
consiste en el uso de cualquiera de los dos criterios para derivar subconjuntos de W y M que
sean independientes afín. En el Criterio I la idea fundamental consiste en determinar los vec-
tores que cumplen con independencia reticular fuerte ya que se ha establecido que ésta implica
independencia afín. De acuerdo a lo descrito en el Teorema 3.3, dado que W es max-dominante
y M es min-dominante en la diagonal, para la búsqueda de vectores IRF es suciente evaluar
únicamente la propiedad de independencia reticular. En efecto, la demostración de este teo-

5.4. DETERMINACIÓN DE PIGMENTOS
rema provee un método para comprobar la propiedad de independencia reticular y con ello
derivar un subconjunto de vectores independientes afín.
El Criterio II está basado en los Teoremas 3.4 y 3.5, en los que se establece que, para
obtener un conjunto independiente afín, ningun vector columna de W e independientemente M
debe ser igual o un múltiplo de alguno de los demás vectores. De esta forma, el procedimiento
en este caso consiste en eliminar cualquier vector columna que sea un múltiplo de los restantes.
Una vez que se han determinado subconjuntos de W y M se pueden utilizar ambos
conjuntos o determinadas columnas de ellos como la matriz S en el MLR. Por último, de
manera análoga al caso de imágenes en color, se debe estimar la proporción de cada uno de
los materiales constituyentes que forman las columnas de S , en cada pixel de la imagen. Para
ello, es posible utilizar el algoritmo de estimación por mínimos cuadrados no-negativa (NNLS),
la técnica de multiplicadores de Lagrange o la técnica híbrida presentada en la ec. (4.14).
5.4. Determinación de pigmentos
El análisis multiespectral de documentos antiguos se ha realizado por medio de los

tres métodos descritos anteriormente, aplicados al conjunto multiespectral perteneciente al
palimpsesto de Arquímedes. El objetivo que se pretende lograr con cada una de estas técnicas
es separar los diferentes pigmentos presentes. En esta sección se presentan las imágenes de
segmentación que se obtienen en cada caso y que incluyen los tipos de escritura y el cuero que
fue utilizado para la elaboración del documento.
5.4.1. Implementación numérica

Los métodos de análisis se han aplicado utilizando una subimagen de tamaño 270 × 360
pixeles de las once bandas multiespectrales que corresponde a la página inferior izquierda del
folio 014v-019r en el palimpsesto. Los datos de este conjunto multiespectral corresponden
a valores de reectancia, por lo que cualquiera de los métodos se pueden aplicar de forma
directa. Para el análisis se forma primeramente la matrix X con todos los pixeles espectrales
que contiene la imagen; así, X = {x1 , . . . , xk } ∈ R11 , con k = 270 × 360 vectores.

Componentes principales
Al emplear el análisis de componentes principales, a partir del conjunto X se calcu-
laron el vector z y la matriz de covarianza C, respectivamente. El cálculo de los eigenvalores y
eigenvectores de C se utilizó para formar la matriz A cuyas las contienen a los eigenvectores
ordenados en forma decreciente de su correspondiente eigenvalor. Además, las once compo-
nentes de la imagen se calcularon por medio de la trasformación expresada en la ecuacion
(5.9). La Tabla 5.2 muestra los eigenvalores ordenados en forma decreciente. De acuerdo a
la discusión presentada en la sección anterior, en esta transformación es posible representar
las características más importantes de la imagen utilizando las componentes con los mayores
eigenvalores. Por tanto, las dos primeras componentes principales de la imagen, denotadas por
C1 y C2, se han utilizado para formar una imagen en falso color, tal que C1, C2, C1 han sido
empleadas respectivamente, como los canales R,G y B de la nueva imagen. La parte izquierda
de la gura 5.2 presenta la imagen en color verdadero de la porción del manuscrito empleada
para las simulaciones, mientras que la parte derecha despliega la imagen RGB que resulta de
la combinación de C1 y C2.
Tabla 5.2: Eigenvalores λi con i = 1, . . . , 11 calculados para el análisis de componentes principales.
λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9 λ10 λ11
284.3 215 67.9 59.17 16.23 10.88 9 7.29 6.49 4.69 3.33
Medias-K .
La implementación numérica del algoritmo de acumulación por medias K en Matlab
fue utilizado para separar las tres clases presentes en el conjunto de datos X . Para ello, los
parámetros que se pueden especicar como entrada en el algoritmo son: el número de clases, el
tipo de distancia a utilizar, el número de veces que se desea repetir el agrupamiento y el método
utilizado para elegir las posiciones de los centroides iniciales. En base a los resultados obtenidos
con componentes principales, el número de clases se estableció igual a 3. Además, después de
realizar distintas iteraciones con diferentes parámetros para determinar el mejor desempeño
del algoritmo los parámetros restantes se denieron como sigue. La distancia Euclidiana se

Figura 5.2: Izquierda: imagen en color verdadero de la porción del palimpsesto utilizada para los experimen-
tos. Derecha: imagen en falso color realizada mediante la composición de las componentes C1 y C2 obtenidas
mediante PCA.
denió como métrica entre las clases, el número de veces que se repitió el agrupamiento fue
igual a 5 y los centroides iniciales se eligieron de acuerdo a una selección aleatoria a partir
del conjunto X . La Tabla 5.3 despliega los valores de los centroides −
→
ς 1, −
→
ς 2, −
→
ς 3 determinados
con el algoritmo. En la parte inferior izquierda de la gura 5.5 se muestra la clasicación de
los tipos de escritura y el fondo realizados por el agrupamiento de medias-K .
Tabla 5.3: Centroides determinados por medias-K para separar las tres clases en el palimpsesto.
−
→
ς1 116.4 56.5 74.5 92.2 94.9 81.4 98.3 94.4 77.4 73.6 118.9
−
→
ς2 82.4 41.3 54.2 68.6 71.7 65.5 88.5 83.6 69.9 68.1 114.8
−
→
ς3 48.6 25.6 32.9 41.4 43.6 40.9 59.5 56.9 52.2 54.5 107.8
Método W y M.
El cálculo de las matrices WXX y MXX se realizó a partir del conjunto X y los vectores
u y v fueron utilizados para calcular las versiones escaladas W y M , respectivamente. Después
de comprobar la independencia afín de las columnas de ambas memorias, cada matriz está

conformada por 11 columnas, por lo que el máximo número de puntos extremos que se pueden
determinar a partir de W ∪M ∪{v∪u} es igual a 11+11+2 = 24. Es importante mencionar que,
aunque las columnas que conforman a W ∪ M corresponden a valores extremos que encierran
al conjunto X , existe una correlación entre columnas adyacentes de cada matriz escalada. De
ahí que sea necesario aplicar una medida que permita discriminar entre aquellas columnas
que no presenten correlación, mismas que serán utilizadas como columnas de la matriz S en
el modelo MLR. En esta aplicación se utilizó el ángulo espectral entre vectores (spectral angle
mapper, SAM) como métrica para seleccionar un subconjunto de éstos, el cual calcula el ángulo
θ entre un vector espectral x y un espectro de referencia t y está denida por [14],
x·t
θ = cos−1 . (5.11)
∥x∥∥t∥
A partir de los 24 vectores extremos, 3 columnas no correlacionadas fueron seleccionadas

en base a los valores más altos de θ calculados para todo el conjunto de vectores; de esta
manera, las columnas seleccionadas fueron w11 , m1 , m11 . La gura 5.3 muestra las curvas de
dichos vectores espectrales. Finalmente, los vectores espectrales se utilizaron como columnas
de la matriz S en la ec. (3.9). La solución obtenida por medio del método numérico de NNLS
permitió determinar los coecientes de abundancias para cada punto extremo en cada pixel
de la imagen. Además, dichos coecientes fueron escalados en el rango dinámico [0,255] para
su visualización como mapas de abundancia. La gura 5.4 muestra los mapas de abundancia
de los tipos de escritura y el fondo del manuscrito determinados a partir de W y M .
5.4.2. Comparación de resultados

Los resultados de segmentación obtenidos con cada uno de los métodos anteriores se
resumen en la gura 5.5. En la primera la, de izquierda a derecha, se presentan la subimagen
del manuscrito desplegada en color verdadero, así como la composición en falso color obtenida
con el método PCA. La segunda la despliega los resultados del agrupamiento realizado por
medias-K (izquierda) y la combinación de dos mapas de abundancia, que corresponden a los
tipos de escritura, determinados por el método W y M (derecha). En base a este panel es
posible realizar una comparación visual de los resultados. Así, al tratar de interpretar el texto

Figura 5.3: Curvas espectrales de los puntos extremos determinados a partir de W y M. La correspondencia
de estos puntos es: pigmento 1 = w11 , pigmento 2 = m1 y cuero = m11 .
escrito en forma horizontal, el cual corresponde al texto original que data del siglo X, las tres
técnicas permiten resaltar o extraer gran parte de información. Por ejemplo, la composición
realizada en base a PCA ayuda a contrastar los dos textos presentes en el palimpsesto, lo
que facilita su interpretación. En el caso de medias-K , aunque se logran separar las tres
clases, existen diversos cortes en el texto original así como muchos pixeles mal clasicados
en los que el algoritmo ha señalado la presencia del pigmento 1. Por otra parte, dado que
con el método basado en W y M se han calculado las abundancias fraccionales para cada
pigmento en los pixeles de la imagen, la separación de los dos textos y el cuero se ha logrado
en buena proporción, lo cual permite una mejor extracción e interpretación del texto original.
Una ventaja adicional del método propuesto es que los textos se pueden visualizar de forma
separada. Por otra parte, en muchas aplicaciones es deseable realizar una cuanticación de
los resultados obtenidos en cada caso. Sin embargo, para este caso de estudio en el que no
se cuenta con una imagen de referencia con la que se puedan comparar dichos resultados, la
comparación está limitada a una interpretación visual.

5.5. CONCLUSIONES
Figura 5.4: Imágenes de las abundancias de los materiales constituyentes del palimpsesto determinados a
partir de W y M. Izquierda: texto escrito en el siglo XII (pigmento 2); centro: texto escrito en el siglo X
(pigmento 1); derecha: cuero del manuscrito.
5.5. Conclusiones
En este capítulo se ha discutido la aplicación del método W y M para la segmentación de

textos en imágenes multiespectrales de documentos antiguos. En primer lugar se ha descrito el
proceso para el registro de imágenes multiespectrales, así como algunos métodos para estimar
la reectancia espectral de la escena. Además, se han discutido los criterios para la aplicación de
W y M al caso multiespectral y se han presentado los fundamentos matemáticos de dos técnicas
adicionales que se pueden emplear para el análisis de los textos del palimpsesto de Arquímedes.
Los resultados obtenidos con el método W y M , así como aquellos determinados por PCA y
medias-K han permitido extraer gran parte del texto original presente en el documento. En
particular, las primeras componentes de PCA pueden ser utilizadas para contrastar los textos
del documento, mientras que el agrupamiento realizado por medias-K permite clasicar los
pixeles que pertenecen a un determinado tipo de escritura. Aunque los resultados con ambos
métodos son buenos, los que se han obtenido con W y M logran una mejor separación de los
pigmentos y con ello una mayor porción del texto original ha sido extraída. De esta manera,
con los resultados obtenidos se concluye que es posible emplear el análisis de mezclado lineal
para representar las mezclas espectrales en cada pixel de la imagen.

5.5. CONCLUSIONES
Figura 5.5: Resultados de segmentación de los pigmentos presentes en el palimpsesto de Arquímedes. Primera
la, de izquierda a derecha: subimagen del manuscrito desplegada en color verdadero, composición en falso
color utilizando PCA. Segunda la, izquierda a derecha: resultados del agrupamiento por medias-K , mapas de
abundancia que corresponden a los dos tipos de escritura determinados por el método W M.

Bibliografía
[1] Archimedes Palimpsest, The Archimedes Palimpsest Project, www.archimedespalimpsest.net,

2008.
[2] Baronti S., Casini A., Lotti F., Porcinai S., Multispectral imaging systems for the mapping of
pigments in works of art by use of principal component analysis, Applied Optics, Vol. 37, No. 8,
pp. 12991309, 1998.
[3] Bearman G.H., Spiro S.E., Archaeological applications of advanced imaging techniques, The
Biblical Archaeologist, Vol. 59, No. 1, pp. 5666, 1996.
[4] Bishop C.M., Pattern Recognition and Machine Learning, Springer, pp. 424425, 2006.
[5] Burmester A., Bayerer F., Towards improved infrared reectograms, Studies in Conservation,
Vol. 38, No. 3, pp. 145154, 1993.
[6] Casini A., Lotti F., Picollo M., Stefani L., Buzzegoli E., Image spectroscopy mapping technique
for non-invasive analysis of paintings, Studies in Conservation Vol. 44, No. 1, pp. 3948, 1999.
[7] Conde J., Haneishi H., Yamaguchi M., Ohyama N., Baez J., Spectral reectance estimation of
ancient mexican condices, multispectral images approach, Revista Mexicana de Física, Vol. 50,
No. 5, pp. 484489, 2004.
[8] Easton R.L., Knox K.T., Christens-Barry W.A., Multispectral imaging of the Archimedes
Palimpsest, Proc. 32nd AIPR, pp. 111118, 2003.
[9] Easton R.L., Knox K.T., Digital restoration of erased and damaged manuscripts, Proc. 39th
Annual Convention of the Association of Jewish Libraries, Brooklyn, NY, June 20-23, 2004.
112
BIBLIOGRAFÍA
[10] Easton, R.L., Innite possibilities: Ten year of study of the Archimedes Palimpsest, Proc. of
the American Philosophical Society, Vol.154, No. 1, pp. 5076, 2010.
[11] Manseld J.R., Sowa M.G., Majzels C., Collins C., Cloutis E., Mantsch H.H., Near infrared
spectroscopic reectance imaging: supervised vs. unsupervised analysis using an art conservation
application, Vibrational Spectroscopy, Vol. 19, pp. 3345, 1999.
[12] Pratt W.K., Mancill C.E., Spectral estimation techniques for the spectral calibration of a color
image scanner, Applied Optics, Vol. 15, No. 1, pp. 7375, 1976.
[13] Park S.K., Huck F.O., Estimation of spectral reectance curves from multispectral image data,
Applied Optics, Vol. 16, No. 12, pp. 31073114, 1977.
[14] Smith R.B., Introduction to hyperspectral images, Microimages Inc. Tutorial, Lincoln, NE.
(2001).
[15] Rinascimento Virtuale, www.bml.firenze.sb.it/rinascimentovirtuale, January 2006.
[16] Valdiviezo-Navarro J.C. and Urcid G., Multispectral images segmentation of ancient documents
with lattice memories, OSA Proc.: Digital Image Processing and Analysis, Tucson, AZ, June
2010.
[17] Van Asperen de Boer J.R.J., Reectrography of paintings using an infra-red vidicon television
system, Studies in Conservation, Vol. 14, pp. 96118, 1969.
[18] Ware G.A., Chabries D.M., Christiansen R.W., Brady J.E., Martin C.E., Multispectral Analysis
of Ancient Maya Pigments: Implications for the Naj Tunich Corpus, IEEE Proc.: IGARSS, Vol
6, pp. 24892491, 2000.

Capítulo 6
Procesado de Imágenes Hiperespectrales
En este capítulo se presenta el análisis de puntos extremos utilizando las memorias reticulares
para el caso de dos imágenes hiperespectrales remotamente registradas. El capítulo se inicia con
una breve descripción de los fundamentos físicos involucrados en el registro de estas imágenes,
sus características partículares, así como los métodos utilizados para derivar la reectancia
espectral. Más adelante se presentan los espectros de los puntos extremos determinados con
W y M , los cuales se comparan con los obtenidos por el análisis de componentes de vértices.
Para concluir el capítulo se muestran los mapas de la distribución de los recursos naturales
calculados a partir de los puntos extremos determinados con cada método.
6.1. Registro hiperespectral de una escena
El desarrollo de tecnologías de formación de imágenes más sosticadas en combinación

con espectrómetros de alta resolución ha dado lugar a una nueva perspectiva para el sensado
remoto, en la que es posible registrar, simultáneamente, la información espacial y espectral
de la energía reejada por la supercie de la Tierra. Estos instrumentos, conocidos como es-
pectrómetros de imagen, forman la imagen de la radiancia solar reejada o emitida por los
materiales de la supercie, en cientos de bandas cuasi-contiguas usualmente en la porción solar
de reexión del espectro (de 0.35 a 2.5 µm). En aplicaciones de percepción remota la región
que comprende de 0.35 a 1.0 µm se conoce como visible/infrarrojo cercano, (visible and near
114
6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA
infrared, VNIR) y la región que comprende de 1.0 a 2.5 µm se conoce como infrarrojo de longi-
tud de onda corta (short wavelength infrared, SWIR). Por lo tanto, los datos hiperespectrales
resultantes están conformados en un cubo de imágenes con dos dimensiones espaciales y una
espectral. La información contenida en un pixel único de la imagen hiperespectral puede ser
usada para comparar e identicar cualquier objeto en base a sus características espectrales,
en una localización especíca de la zona de interés.
6.1.1. Fundamentos físicos

Existen procesos importantes de interacción entre materia y energía que constituyen
la base física de la información que es capturada por los espectrómetros. La energía electro-
magnética procedente del sol puede ser modicada en su dirección, intensidad o polarización
cuando toca la supercie terrestre. Estos cambios de energía dependen de la constitución físi-
ca y química de los materiales que conforman la supercie, los cuales pueden ser clasicados
como: transmisión, reexión, absorción y emisiòn de radiación1 . Más aún, los procesos de
interacción entre materia y energía permiten identicar los materiales que conforman la su-
percie terrestre a partir de determinadas bandas de absorción o emisión presentes en los datos
hiperespectrales registrados por un sensor.
Para aplicaciones en percepción remota los espectrómetros de imagen son colocados
sobre plataformas aéreas, principalmente en satélites o aviones [4]. Por tanto, las partes fun-
damentales que conforman a estos instrumentos son las siguientes. (1) Óptica para colectar luz,
(2) un sistema mecánico para barrer el campo de visión instantáneo (IFOV) del espectrómetro
sobre una escena y (3) un arreglo de espectrómetros que subdividen la porción del espectro de
interés. Además, el proceso de adquisición de la imagen se realiza de acuerdo a lo siguiente. Un
espejo de barrido acoplado al sistema mecánico, así como el movimiento de la plataforma se
encargan de colectar la energía reejada por la supercie. Para el proceso de barrido de cada
línea de la escena se pueden utilizar diferentes sistemas. Si la óptica forma la imagen de un
punto único sobre la supercie, tal que el sistema barre una línea larga que es perpendicular
al movimiento de la plataforma, el sistema se conoce como escobilla giratoria (whiskbroom
1 Los fenómenos de interacción materia y energía fueron descritos con detalle en el Capítulo 2

Sistema "whiskbroom" Sistema "pushbroom"
IR
espejo rotatorio
Rojo
Verde
Azul
Figura 6.1: Dos tipos de sistemas de barrido usados para capturar una escena hiperespectral; el
número de bandas espectrales está determinado por los detectores que cubren intervalos de longitudes
de onda (λ) especícos.
system ). Por otro lado, si la óptica forma la imagen de una rendija larga sin necesitar de un
sistema mecánico de barrido más que el movimiento de la plataforma para formar una imagen,
el sistema se conoce como escobilla de empuje (pushbroom system ). Ambos sistemas se ilus-
tran el la gura 6.1. Existe otro sistema que utiliza un arreglo bidimensional de fotodetectores
y un arreglo lineal de ltros para registrar de manera simultánea las bandas de la imagen [4].
Después de que la energía se ha colectado, la radiación incidente es entonces dirigida a un
conjunto de espectrómetros que dividen la luz en múltiples bandas estrechas de energía por
medio de un elemento dispersivo, que puede ser una rejilla o un prisma. Finalmente la energía
que sale del elemento dispersivo es capturada por medio de fotodetectores cuya sensibilidad
responde a intervalos de longitudes de onda especícos, lo que da lugar a cientos de bandas
espectrales.
6.1.2. Resolución espacial y espectral

En los espectrómetros de imagen existen dos características básicas que denen el
grado de resolución del sistema: la resolución espacial y espectral. La resolución espacial es
una medida del mínimo detalle sobre la supercie que puede ser captado por un sensor remoto
dado. La resolución espacial depende de las características propias del sensor y de la altura de

vuelo de la plataforma aérea. En particular, para un espectrómetro de imagen la resolución

espacial está denida por el tamaño de los pixeles del CCD en la dirección y y la amplicación
del sistema microscópico. Sin embargo, en la dirección x, la resolución depende del ancho de la
rendija del espectrómetro y de la amplicación del sistema [3]. Sean ∆x y ∆y las dimensiones
de los pixeles del CCD, respectivamente, y M la amplicación del sistema. El ancho de la
rendija del espectrómetro, denotado por ws , siempre será mayor a ∆x. Entonces, la resolución
espacial en la dirección y es 2∆y/M , mientras que en la dirección x es 2ws /M . Más aún, una
denición de resolución comúnmente utilizada es aquella que relaciona el tamaño del pixel y
la altitud de vuelo; es decir, esta resolución se reere al área física sobre la supercie terrestre
ocupada por un pixel único. Claramente, la resolución espacial incrementa conforme la altitud
de la plataforma aérea decrementa.
Por otra parte, la resolución espectral se reere al número y ancho de las bandas
espectrales que un sensor puede registrar. La resolución espectral depende de las componentes
del espectrómetro, lo cual incluye al ancho de la rendija, la dispersión de la rejilla o prisma
y el tamaño del pixel del dispositivo. Por ejemplo, para un pixel CCD de 10 µm2 de área, la
dispersión en operación normal es aproximadamente de 40 nm por mm o, equivalentemente,
0.4 nm por pixel.
6.1.3. Técnicas de estimación de la reectancia

En términos radiométricos, la energía que llega a la apertura de entrada de un sensor
es la cantidad conocida como radiancia. Dado que la reectancia espectral es una cantidad
que está relacionada con las propiedades de los materiales, resulta necesario estimar dicha re-
ectancia a partir de la información de radiancia contenida en los datos hiperespectrales. Para
este propósito, el nivel de energía solar de fondo debe ser removido y los efectos de absorción
y esparcimiento atmosféricos deben ser compensados. Existen tres técnicas principales que
pueden ser usadas para derivar la reectancia espectral de los materiales, las cuales pueden
ser: (1) técnicas basadas en imagen, (2) métodos empíricos, (3) aproximación basada en mod-
elos. Una técnica basada en imágenes utiliza sólo los datos captados por el instrumento, con el
requisito de que las imágenes incluyan regiones de reectancia relativamente uniformes. Así,

cualquier absorción presente en la reectancia medida sobre estas regiones estará relacionada
con las efectos antes mencionados y, por lo tanto, tales efectos pueden ser compensados para
la imagen completa. De esta manera, al dividir cada espectro de la imagen por el espectro de
campo plano, la escena se convierte a reectancia relativa.
Por otro lado, los métodos empíricos emplean tanto los datos sensados remotamente,
como mediciones de campo de la reectancia, r(λ), para resolver una ecuación lineal que la
relaciona con la radiancia del sensor, tal que,
L(λ) = br(λ) + c , (6.1)
donde L(λ) representa la radiancia capturada por el sensor y que varía con la longitud de
onda λ, y b, c representan, respectivamente, términos multiplicativo y aditivo para ajustar la
radiancia del sensor.
Las aproximaciones basadas en modelos buscan representar matemáticamente todos los
factores involucrados en la radiancia adquirida en cada pixel, incluyendo las perturbaciones
atmosféricas. Para este propósito, se utiliza el espectro de irradiancia solar simulado, entonces
el método estima la radiancia solar en el día y la hora de la adquisición de la imagen y los
efectos de esparcimiento y absorción de la atmósfera. Por tanto, la radiancia solar que llega a
la apertura del sensor Ls , en función de la longitud de onda λ puede ser modelado como
1
Ls (λ) = (Er(λ) + Mt )τθ + Lp , (6.2)
π
donde E es la irradiancia sobre la supercie terrestre, r(λ) es la reectancia de la supercie,

Mt es la excitancia radiante espectral a temperatura t, τθ es la transmitancia de la atmósfera a
un ángulo zenith θ y Lp es la radiancia espectral de trayectoria de la atmósfera [2]. El resolver
la ec. (6.2) permite obtener resultados exactos en la estimación ya que dicha ecuación incluye
todos los factores que contribuyen en el proceso de adquisición de la imagen. De manera
adicional, las aproximaciones basadas en modelos son empleadas para estimar las propiedades
atmosféricas directamente de los datos hiperespectrales.

6.1.4. Instrumentos hiperespectrales

Uno de los primeros instrumentos hiperespectrales colocado en una base aérea para
aplicaciones de observación terrestre es el espectrómetro de imagen AVIRIS (Airborne, Visible
and Infrared Imaging Spectrometer ). El instrumento fue desarrollado en el Laboratorio de

Propulsión de Aviones de la NASA y está compuesto por un sistema de barrido de tipo escobilla
giratoria y cuatro espectrómetros de rejillas (A, B, C y D) que dividen la región de longitudes
de onda de 0.4 a 2.45 µm en cuatro segmentos espectrales: 0.41-0.7 µm, 0.68-1.27 µm, 1.25-
1.86 µm y 1.84-2.45 µm. De esta forma, la na resolución espectral del instrumento (alrededor
de 10 nm) permite registrar 224 bandas espectrales, por medio de un arreglo lineal de 224
sensores de silicio e indio-antimonio. Cuando el sensor es colocado a bordo del avión ER-2,
el cual vuela a una altura de 20 km sobre el nivel terrestre, la resolución espacial del sensor
está alrededor de 400 m2 , con un FOV de 30◦ y un IFOV de 1.0 mrad. Sin embargo, cuando
el instrumento es colocado sobre un avión que vuela a una altura de 4 km sobre el nivel del
mar, la resolución espacial del sensor está alrededor de 16 m2 .
Por otra parte, el sensor CHRIS es un espectrómetro de imagen europeo que se encuentra
operando actualmente. El instrumento tiene una resolución espacial de 17 m y registra 62
bandas. Los datos capturados por el sensor permiten una variedad de aplicaciones, tales como
el monitoreo de zonas costeras y de la supercie terrestre. Otros espectrómetros de imagen que
están en uso actualmente son: el instrumento conocido como HYDICE (Hyperspectral Digital
Imagery Collection Experiment ) y los espectrómetros de imagen comerciales desarrollados por

la compañía SpecTir [12].
Además de los sensores hiperespectrales mencionados, tres misiones están planeadas
para los próximos cinco años. La Agencia Espacial Italiana ASI planea lanzar en 2012 un
instrumento de media resolución, conocido como Prisma. El dispositivo combinará un sensor
hiperespectral con una cámara pancromática de mediana resolución, capaz de registrar 235
bandas espectrales en las porciones VNIR y SWIR. El Centro Aeroespacial Alemán (DLR)
planea lanzar el satélite hiperespectral denominado EnMAP en 2014; el sensor está diseñado
para registrar imágenes de la supercie terrestre en 200 bandas angostas a color. Por otra parte,
en 2015 la agencia espacial NASA planea poner en funcionamiento el instrumento infrarrojo

6.2. DETERMINACIÓN DE PUNTOS EXTREMOS
conocido como HyspIRI. La misión incluye dos instrumentos colocados en un satélite en órbita
terrestre baja. El primero, un espectrómetro de imagen, registrará imágenes a una resolución
de 10 nm en las porciones visible a infrarrojo de onda corta. El segundo instrumento es un
sensor multiespectral que cubrirá las porciones infrarrojo medio y térmico (3 a 12 µm). Ambos
instrumentos tendrán una resolución espacial de 60 m y serán capaces de colectar 210 bandas
espectrales [1].
6.2. Determinación de puntos extremos
6.2.1. Análisis de componentes de vértices

Este método considera que los datos hiperespectrales se encuentran mezclados lineal-
mente. Así, su objetivo es determinar el conjunto de puntos extremos, que serán utilizados
para el proceso de separación espectral, a partir de los vértices de un simplex que encierra
los vectores espectrales. El algoritmo asume la presencia de pixeles puros y proyecta iterativa-
mente los datos sobre una dirección ortogonal al subespacio ocupado por los miembros nales
ya determinados. Los nuevos miembros nales corresponden a los extremos de la proyección.
Especícamente, la técnica considera que, en ausencia de ruido, los vectores espectrales res-
iden en un cono convexo Cp que está contenido en un subespacio Ep , con p igual al número
de puntos extremos presentes. Por tanto, el algoritmo comienza por identicar Ep mediante la
descomposición de valores singulares y entonces proyecta los puntos en Cp sobre un simplex Sp
por medio de una transformación. Este simplex está contenido en un conjunto an de dimen-
sión p − 1. Una ventaja de este algoritmo es que su complejidad computacional es un orden
de magnitud menor al de N-FINDR, con la dicultad de que el número de puntos extremos es
un parámetro de entrada [9].
6.2.2. El método W y M aplicado al caso hiperespectral

El método basado en las MAARs puede ser aplicado al caso de imágenes hiperespectrales
de acuerdo al procedimiento discutido en el Capítulo anterior. Una vez calculadas W y M es

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
necesario vericar que sus vectores columna satisfacen la propiedad de independencia afín.
Más aún, a diferencia de los casos de aplicación en imágenes en color y multiespectrales, para
imágenes hiperespectrales en las que n es de alto orden, los vectores columna de W presentan
un pico hacia arriba, mientras que los vectores de M presentan un pico hacia abajo. Este
efecto de picos se debe al escalamiento aditivo previamente realizado puesto que wii = ui
y mii = vi , respectivamente. Resulta necesario entonces realizar un procedimiento simple de
suavización considerando uno o dos de los vectores espectrales más cercanos a wii o mii , el
cual está dado, para cualquier i ∈ {1, . . . , n}, por


 z1,2 ⇔ i = 1,

zii = 1
(z + zi+1,i ) ⇔ 1 < i < n, (6.3)


2 i−1,i

zn−1,n ⇔ i = n,
donde z puede ser igual a w o m. Una vez que se ha realizado este proceso de suavización, un
subconjunto de W ∪ M puede ser utilizado como puntos extremos en el modelo de mezclado
lineal.
6.3. Ejemplos de aplicación de sensado remoto
La funcionalidad de los métodos de identicación de puntos extremos puede ilustrarse

utilizando conjuntos de datos hiperespectrales reales. El objetivo de los ejemplos siguientes
es proporcionar detalles sucientes en el uso de la técnica basada en W XX y M XX , la cual
ha demostrado ser efectiva para el análisis de datos multiespectrales. Como un complemento
a estos resultados se presentarán los puntos extremos determinados por el algoritmo VCA,
mismos que serán comparados con los obtenidos con el primer método. Al nal de la sección
se presentan los mapas de abundancias generados a partir de la estimación de las proporciones
de cada punto extremo en cada escena hiperespectral.
Las siguientes imágenes fueron tomadas de la base de datos de la compañía SpecTir
[12]. La información que se tiene acerca del proceso de adquisición de las imágenes indica que
fueron registradas por un espectrómetro de imagen en las porciones VNIR y SWIR, cubriendo

el intervalo de longitudes de onda de 0.395 a 2.45 µm. Cada escena tiene una reolución espec-
tral de 5 nm, con un total de 360 bandas espectrales. De esta manera, un cubo hiperespectral
está conformado por 600 líneas × 320 pixeles × 360 bandas (alrededor de 132 Mbytes). Dada
la alta resolución espectral, una práctica común para evitar información redundante consiste
en reducir la dimensionalidad espectral de los datos mediante una técnica determinada; por
ejemplo, PCA, la transformación de fracciones de mínimo ruido o una reducción de bandas
adyacentes altamente correlacionadas [6, 10, 11], las cuales son necesarias para disminuir el
costo computacional. En los cubos de datos usados para esta simulación, el número de bandas
espectrales fue reducido a 90 por medio de una selección de bandas a subintervalos de 20 nm,
que en conjunto cubren la misma porción del espectro. Esta reducción espectral permite acel-
erar los tiempos de cómputo sin ocasionar cambios signicativos en la tarea de identicación.
Ejemplo 1. Costa del Golfo de México

Este cubo hiperespectral fue registrado sobre el Refugio Nacional de vida salvaje de
Suwanee, el cual se localiza en la costa norte del Golfo que pertenece a Estados Unidos. El
refugio alberga uno de los ecosistemas más grandes del río Delta, en el que habitan numerosas
especies de vida salvaje. Los datos registrados cubren pantanos, así como múltiples reservas de
vida salvaje durante el periodo de mayo a junio del 2010. Las imágenes capturaron el estado
de la vegetación en ese momento y pueden ser utilizadas para localizar la presencia o ausencia
de hidrocarburos en la supercie de la vegetación. Además, debido a que los datos fueron
adquiridos antes del derrame de petroleo ocurrido en 2010, éstos pueden ser comparados con
imágenes más recientes para ayudar en la recuperación de los áreas afectadas. La gura 6.2
muestra dos imágenes compuestas de la escena hiperespectral de la costa del Golfo. La parte
izquierda de la gura fue formada por la combinación de las bandas 54 (rojo, λ = 693 nm),
34 (verde, λ = 584 nm) y 14 (azul, λ = 469.5 nm), dando la apariencia de imagen de color
verdadero; la parte derecha fue formada con las bandas 81 (rojo, λ = 851 nm), 217 (verde,
λ = 1631 nm) y 54 (azul, λ = 693 nm), cuya combinación de bandas en el infrarrojo resalta
las áreas de vegetación en colores verde, naranja y café.
Para el proceso de determinación de los puntos extremos se siguió un proceso similar
al discutido para el caso multiespectral. Primero se formó el conjunto X = {x1 , . . . , xk } ∈ Rn ,

Figura 6.2: Imágenes a color de la escena hiperespectral registrada sobre la costa del Golfo de México.
Izquierda: imagen formada por la combinación de las bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha:
combinación de bandas 81 (rojo), 217 (verde) y 54 (azul).
donde k = 600 × 320 = 192000 y n = 90, compuesto con todos los vectores espectrales que
conforman la escena. A partir de la matriz X se calcularon las memorias WXX y MXX . Asimis-
mo, por medio de los vectores v y u, las columnas de ambas memorias fueron escaladas para
obtener W y M . Para comprobar la independencia afín de los vectores se vericó que ninguna
columna de W y M fueran iguales. En este ejemplo, cada matriz escalada está conformada
por 90 columnas independientes afín y, por lo tanto, cada una posee 90 candidatos a puntos
extremos. De manera adicional, antes de seleccionar un subconjunto de puntos extremos se
realizó el proceso de suavizamiento de los picos que aparecen en la diagonal principal de ambas
memorias, por medio de la ecuación (6.3).
Es importante destacar que el método basado en W y M siempre proporciona un
número de candidatos a puntos extremos que es igual o ligeramente menor que la dimen-
sionalidad espectral. En la práctica, sin embargo, las columnas contiguas están altamente

correlacionadas siendo necesario utilizar algunas técnicas para seleccionar un conjunto reduci-
do [11]. En estos ejemplos se ha utilizado una técnica simple basada en el hecho de que las
√ √
memorias forman ⌊ n + 1⌋ subconjuntos, cada uno con ⌊ n + 1⌋ vectores columna tanto para
W como para M . De esta manera, un representante de cada grupo es seleccionado como punto
extremo. Aunque esta técnica provee un número razonable de puntos extremos, en situaciones
prácticas donde un pequño número de materiales conforman la escena hiperespectral, es nece-
sario realizar una selección nal al considerar sólo aquellos espectros que están completamente
decorrelacionados. Por lo tanto en este ejemplo de aplicación, de los 20 candidatos a puntos
extremos determinados a partir de W ∪ M , una selección nal de puntos extremos no correla-
cionados proporcionó un conjunto de 5 vectores espectrales que forman las columnas de S ; así,
S = (w2 , w24 , w43 , w54 , w79 ).
Por otra parte, el algoritmo VCA se aplicó al mismo conjunto de datos hiperespec-
trales. De acuerdo a la implementación, el algoritmo requiere como parámetro de entrada el
número de puntos extremos a determinarse; la salida del algoritmo incluye los espectros de
los puntos extremos obtenidos, así como las posiciones de los pixeles en la imagen de donde
éstos fueron extraídos. Iteraciones repetidas con el mismo número de puntos extremos pro-
duce casi el mismo conjunto de salida, con la diferencia en el orden en el que sus espectros
aparecen. Después de probar diferentes valores de entrada, tales como 5, 7, 9, 10, se eligió
utilizar el número de puntos extremos determinados con W y M como entrada para VCA.
De ahí que el conjunto S de puntos extremos identicados con VCA está conformado por
S = (x27876 , x90661 , x97850 , x84588 , x191634 ). La gura 6.3 despliega los espectros de tres puntos
extremos determinados mediante la selección de columnas de W ∪ M , cuyas curvas espectrales
corresponden a recursos naturales en la escena de la costa del Golfo. De manera similar, la
gura 6.4 muestra los espectros de tres puntos extremos obtenidos con el algoritmo VCA. En
ambos casos la distribución espectral de los valores de reectancia se normalizó del rango
[0,6000] al intervalo unitario [0,1]. En ambas guras se puede observar una similitud entre
curvas espectrales dibujadas con el mismo color.
Ejemplo 2. Belstville
En el siguiente ejemplo se utilizó un cubo hiperespectral registrado sobre el área de

Reflectancia normalizada
Longitud de onda
Figura 6.3: Espectros de tres puntos extremos determinados con W y M en el cubo hiperespectral del Golfo
de México. Los valores de columna seleccionados a partir de W ∪M son: w2 , w24 , w54 .
Belstville, que se localiza al norte del condado de Prince George en Maryland, Estados Unidos.
El área registrada por el sensor incluye muestras de agricultura y vegetación. De forma similar
a la imagen anterior, el cubo de datos empleado para este experimento es de tamaño 600 ×
320 × 90, abarcando el mismo intervalo de longitudes de onda. La parte izquierda de la gura
6.5 despliega una imagen a color compuesta por la combinación de bandas 54 (rojo, λ = 693
nm), 34 (verde, λ = 584 nm) y 14 (azul, λ = 469.5 nm), simulando una imagen de color
verdadero; la parte derecha de la gura fue formada con las bandas 81 (rojo, λ = 851 nm), 54
(verde, λ = 693 nm) y 34 (azul, λ = 584 nm) que permite resaltar las áreas de vegetación en
tonos rojos.
La determinación de los puntos extremos en base a W y M se realizó de manera similar
al procedimiento descrito en el ejemplo previo. El conjunto de todos los vectores espectrales
de la imagen está formado por X = {x1 , . . . , xk }, con k = 600 × 320 = 192000 y n = 90. A
partir de X se calcularon las memorias WXX , MXX = −WXX
T
, así como las matrices escaladas
W y M . Una vez que la condición de independencia afín es vericada, las memorias escaladas
son de tamaño 90 × 90. Además los efectos de picos que aparecen en la diagonal principal de
ambas memorias fueron removidos por medio de la ec. (6.3). A partir del conjunto W ∪ M se

Longitud de onda
Figura 6.4: Espectros de tres puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral del
Golfo de México. Los vectores columna sj para j = 1, . . . , 5 indican las columnas correspondientes de S.
realizó una selección de 20 candidatos a puntos extremos. La elección de los vectores columna
espectralmente diferentes permitió formar el conjunto nal de puntos extremos, cuyos vectores
denen las columnas de S , tal que S = {w24 , w37 , w47 , w64 , m46 , m57 , m62 }; dicho conjunto
será empleado para estimar las abundancias fraccionales de cada punto extremo.
Por otra parte, la búsqueda de puntos extremos con el algoritmo VCA se realizó estable-
ciendo el valor de 7 como parámetro de entrada. Los espectros resultantes de este procedimiento
fueron usados para formar la matriz S = (s1 , . . . , s7 ), cuyos vectores columna asociados son
(x191845 , x191419 , x9630 , x111446 , x114301 , x191724 , x65969 ). La gura 6.6 muestra cuatro de los pun-
tos extremos nales obtenidos con la selección realizada a partir de W ∪ M . La gura 6.7
despliega cuatro de los puntos extremos determinados por VCA y que son similares a aquellos
calculados con las memorias. La similitud entre curvas espectrales se puede identicar para
curvas dibujadas con el mismo color.

6.4. SEPARACIÓN ESPECTRAL Y COMPARACIÓN DE RESULTADOS
Figura 6.5: Imágenes a color de la escena hiperespectral de Beltsville. Izquierda: imagen formada por la
combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81 (rojo), 54 (verde)
y 34 (azul).
6.4. Separación espectral y comparación de resultados
Aunque las curvas en ambos conjuntos parecen ser similares, algún criterio debe ser
aplicado para cuanticar estas similitudes. Aqui se han calculado los coecientes de correlación
(φ) entre los vectores determinados por las MAAMs y aquellos producidos por VCA, en cada
uno de los ejemplos. La Tabla 6.1 muestra los coecientes de correlación calculados para las
curvas espectrales desplegadas en las guras 6.3, 6.4 y 6.6, 6.7, respectivamente.
El proceso de separación espectral puede efectuarse mediante la inversión de la ec.
(3.9), sujeta a las restricciones de aditividad completa y no negatividad de los coecientes de
abundancia. Esta inversión se expresa en la ec. (3.11), la cual es un sistema sobre determinado
de ecuaciones lineales, tal que n > p. Para los ejemplos aquí presentados, ambas matrices W y
M son de rango completo, así sus vectores columna son linealmente independientes. Además,

6.4. SEPARACIÓN ESPECTRAL Y COMPARACIÓN DE RESULTADOS
Longitud de onda
Figura 6.6: Espectros de cuatro puntos extremos determinados con W y M en el cubo hiperespectral de
Beltsville. Los vectores columna seleccionados a partir de W ∪M son: w 24

, w 37
, w47 , w64 .
los conjuntos de miembros nales determinados tanto con las MAAMs como con VCA son
linealmente independientes, cuya matriz pseudoinversa es única. Para los ejemplos presentados,
donde n > p con n = 90 y p = 7 o p = 5, se ha utilizado la estimación de mínimos cuadrados
no negativa NNLS que resuelve el problema de minimizar la norma Euclidiana ∥Sa − x∥2 ,
sujeta a la condición a > 0 [7].
La gura 6.8 despliega los mapas de abundancia en color de los puntos extremos de-
terminados con los dos métodos aquí discutidos. En estas imágenes las áreas más brillantes
representan máxima distribución del punto extremo correspondiente. La parte izquierda de la
misma gura muestra la distribución de cuatro recursos naturales que fueron determinados
con W y M en el cubo hiperespectral de la costa del Golfo. La parte derecha despliega la dis-
tribución de tres recursos naturales que fueron determinados por el algoritmo VCA. En ambos
casos se presentan sólo los mapas de abundancia que proveen información útil ya que algunos
otros mapas presentan información redundante o áreas predominantemente oscuras, los cuales
no fueron incluidos. Aunque la región es particularmente caracterizada por la presencia de
pantanos, no fue posible identicar los recursos naturales en base a un conjunto de espectros
de referencia pues no se cuenta con dichos espectros.

6.5. CONCLUSIONES
Tabla 6.1: Coecientes de correlación (φ) para espectros similares obtenidos con el método W M y algoritmo
VCA para las imágenes hiperespectrales del Golfo de México y Beltsville.
Golfo de México Beltsville

VCA & W M φ VCA & W M φ
s2 y w24 0.980 s1 y w37 0.965
s3 y w54 0.974 s2 y w24 0.944
s4 y w2 0.641 s3 y w64 0.912
− − s4 y w47 0.939
La gura 6.9 despliega los mapas de abundancia en color de los puntos extremos deter-
minados en base a W y M (izquierda) y con VCA (derecha), a partir del cubo hiperespectral de
Belstville. Aunque el conjunto S está conformado por siete puntos extremos, en ambos casos
se han incluido los mapas de abundancia que mejor se asemejan a la distribución de vegetación
que se puede interpretar en la gura 6.5. En este ejemplo es evidente que la identicación de
los tipos de vegetación, producida por cada uno de los métodos, presenta resultados similares
para las segmentaciones mostradas en colores amarillo y magenta. Sin embargo, los resultados
presentan diferencias importantes en las segmentaciones verde y azul. Estas diferencias son
causadas principalmente por el procedimiento de búsqueda de puntos extremos que emplea
cada uno de los métodos. Más aún, el hecho de que las curvas espectrales de los tipos de
vegetación sean similares, presentando variaciones únicamente en ciertas bandas de absorción,
contribuye con las discrepancias en los resultados de segmentación.
6.5. Conclusiones
El uso de espectrómetros de imagen de alta resolución para observaciones de la supercie

de la Tierra ha dado lugar a múltiples aplicaciones orientadas a la identicación, clasicación
y monitoreo de recursos naturales a partir de datos remotamente sensados. En este capítulo
se han descrito los fundamentos físicos detrás de la adquisición y calibración de las imágenes
hiperespectrales y que constituyen la base de instrumentos como AVIRIS, HYDICE, entre otros.

6.5. CONCLUSIONES
Longitud de onda
Figura 6.7: Espectros de cuatro puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral
de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes de la matriz S.
Gran parte de los métodos que han sido propuestos para la identicación de puntos extremos
están basados en la geometría de conjuntos convexos; el fundamento matemático de dichos
métodos es modelar las mezclas espectrales adquiridas en los pixeles como una combinación
lineal de materiales constituyentes de la escena. Además, el método basado en MAAMs se
ha empleado para la identicación de recursos naturales en imágenes hiperespectrales. Los
resultados obtenidos en la identicación de puntos extremos se han comparado con aquellos
presentados con el algoritmo VCA. Los mapas de abundancias de los materiales calculados
para cada método permiten conocer la distribución de un determinado material a lo largo de
la escena. En efecto, dichos mapas presentan resultados similares con algunas discrepancias
en la distribución de determinados recursos naturales. De esta manera, se puede decir que el
método W y M es una técnica autónoma con resultados adecuados que pueden ser utilizados
para la clasicación de materiales en imágenes hiperespectrales.

6.5. CONCLUSIONES
Figura 6.8: Mapas de abundancia en color de los recursos naturales determinados con la identicación
autónoma de puntos extremos en el cubo hiperspectral del Golfo de México. Izquierda: abundancias de cuatro
puntos extremos determinados con W y M , cuya distribución de colores corresponde a amarillo = w2 , magenta
= w24 , verde = w43 , azul = w54 . Derecha: abundancias de tres puntos extremos determinados con VCA cuya
distribución de colores es amarillo = s4 , magenta = s2 , verde = s3 . Áreas más brillantes representan mayor
concentración del recurso natural.

6.5. CONCLUSIONES
Figura 6.9: Mapas de abundancia en color de los tipos de vegetación obtenidos con la identicación autónoma
de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundancias de cuatro puntos extremos
determinados con WM cuya distribución de colores corresponde a magenta = w24 , amarillo = w67 , azul =
m46 , verde = m62 . Derecha: abundancias de cuatro puntos extremos determinados con VCA, cuya distribución
de colores es magenta = s2 , amarillo = s3 , azul = s5 , verde = s7 . Áreas más brillantes representan mayor
concentración del recurso natural.

Bibliografía
[1] European Space Agency, website: www.esa.int, 2010.
[2] Farrand W.H., Hyperspectral remote sensing of land and the atmosphere. In: Encyclopedia of
Modern Optics, Robert D. Guenther ed., Vol. 1, pp. 395403, Elsevier, Academic Press, 2005.
[3] Huebshman M.L., Schultz R.A., Garner H.R., Hyperspectral imaging. In: Encyclopedia of
Modern Optics, Robert D. Guenther ed., Vol. 1, pp. 134143, Elsevier, Academic Press, 2005.
[4] Jensen J.R., Remote Sensing of the Environment: an Earth Resource Perspective, 2nd edition,
Pearson Prentice Hall, 2007.
[5] Keshava N., Mustard J.F., Spectral unmixing, IEEE Signal Processing Magazine, Vol. 19, No.
1, pp. 4457, 2002.
[6] Keshava N., A survey of spectral unmixing algorithms, Lincoln Laboratory Journal, Vol. 14,
No. 1, pp. 5578, 2003.
[7] Lawson C.L., Hanson R.J., Solving least squares problems, chap. 23, Prentice-Hall, Englewood
Clis NJ, 1974.
[8] More K.A., Spectrometers, In: Encyclopedia of Modern Optics, Robert D. Guenther ed., Vol.
[9] Nascimento J.M.P., Bioucas-Dias J.M., Vertex component analysis: a fast algorithm to unmix
hyperspectral data, IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 4, pp. 898
910, 2005.
133
BIBLIOGRAFÍA
[10] Ritter G.X., Urcid G., Schmalz M.S., Autonomous single-pass endmember approximation using
lattice auto-associative memories, Neurocomputing, Vol. 72, No. 10-12, pp. 21012110, June
2009.
[11] Ritter G.X., Urcid G., Lattice algebra approach to endmember determination in hyperspectral
imagery. In: Advances in Imaging and Electron Physics, Peter W. Hawkes ed., Vol. 160, pp.
113169, Elsevier Inc, Academic Press, 2010.
[12] SpecTir. SpecTir: end to end hyperspectral solutions, website: www.spectir.com, 2009.
[13] Urcid G., Valdiviezo-N. J.C., Ritter G.X., Endmember search techniques based on lattice
auto-associative memories: a case on vegetation discrimination, SPIE Proc.: Image and Signal
Processing for Remote Sensing, Vol. 7477, Berlín, Germany, pp. 74771D:112, 2009.
[14] Valdiviezo J.C., Urcid G., Convex set approaches for material quantication in hyperspectral
imagery. In: Earth Observation, Rustam B. Rustamov and Saida E. Salahova eds., In Press.

Capítulo 7
Conclusiones
7.1. Conclusiones generales
El desarrollo de los espectrómetros de imagen ha dado lugar a una gran diversidad de

aplicaciones en la identiación, clasicación, cuanticación y monitoreo de los materiales que
conforman una escena en base a sus espectros de reectancia. Este trabajo de investigación ha
sido motivado por la necesidad de desarrollar métodos matemáticos ecientes que permitan
un mejor análisis de las imágenes registradas por dichos instrumentos. En el método aquí
desarrollado se asume que cada pixel de una imagen espectral particular está conformado por
una combinación lineal de los espectros de los materiales que conforman la escena, en propor-
ciones determinadas. Esta representación es en realidad un conjunto convexo, cuyos vértices
representan los pixeles espectrales más puros y que además están asociados a los materiales
constituyentes. Así, para determinar las mezclas en cada pixel es necesario determinar primero
los vértices o puntos extremos; para este efecto se han utilizado las transformaciones reticu-
lares W XX y M XX cuya aplicación a imágenes en color, multiespectrales e hiperespectrales ha
presentado resultados satisfactorios.
En el Capítulo 1 de esta investigación se ha introducido la problemática a resolver y
se han presentado tanto las motivaciones como los objetivos que se buscaron a lo largo de
este trabajo. Más adelante, en el Capítulo 2 se describieron los procesos fundamentales de
la interacción materia y energía, los cuales constituyen la base física de la espectroscopía y
135
7.1. CONCLUSIONES GENERALES
se denieron los conceptos de reectancia y absortancia que son útiles para comprender los
capítulos subsecuentes. Además, se presentaron espectros de energía reejada registrados para
diversos tipos de vegetación utilizando un espectrómetro de línea de la compañia BWTek. El
registro de espectros en el laboratorio ha sido fundamental en este trabajo ya que ha permitido
tener una idea más clara de los factores que están involucrados en el proceso de registro de
espectros y de los fenómenos que originan cambios en las curvas espectrales. Al tratar de
simular los mecanismos que originan las mezclas espectrales se ha determinado que es posible
representar dichas mezclas usando un modelo de mezclado lineal.
En el Capítulo 3 se enunció la base matemática del método desarrollado en esta in-
vestigación. En particular, las operaciones del álgebra reticular minimax fueron denidas y se
presentó un breve tratamiento de conjuntos convexos y su relación con el análisis de mezclado
lineal. Más aún, al denir las memorias autoasociativas reticulares WXX y MXX se enunció
también su relación con la geometría de conjuntos convexos. Así, las columnas escaladas de
ambas memorias permiten determinar los puntos extremos que envuelven a los datos. De ahí
que el conjunto W ∪ M ∪ {u ∪ v} dene un politopo con 2(n + 1) vértices, donde n es la
dimensión del espacio dado. Un subconjunto de puntos extremos derivados a partir de este
politopo puede ser usado para cuanticar las mezclas en cada pixel de una imagen dada.
En el Capítulo 4 se ha introducido una novedosa técnica de segmentación para imágenes
en color, la cual está basada en la determinación de puntos extremos usando las memorias
autoasociativas reticulares. Los puntos extremos determinados a partir de imágenes en tres
canales corresponden a los pixeles de color saturados en la imagen, los cuales son utilizados en
el modelo de mezclado lineal para representar las mezclas de color en cada pixel. El cálculo de
los coecientes fraccionales de cada color saturado en los pixeles de la imagen permite realizar
una segmentación global de los colores que la conforman. El método basado en W y M se
ha aplicado a imágenes transformadas a otros espacios de color, con lo que se han logrado
mejoras en los resultados de segmentación cuando se utiliza el espacio I1I2I3. Al comparar esta
técnica con métodos de segmentación conocidos, tales como la distancia de Mahalanobis y el
algoritmo de cuencas, los resultados de segmentación son superiores a los que presentan dichas
técnicas. En efecto, el método propuesto puede ser considerado como una técnica autónoma

7.1. CONCLUSIONES GENERALES
para la segmentación de imágenes en tres canales.

En el Capítulo 5 se han presentado los resultados del uso de las memorias reticulares
para determinar los espectros de los pigmentos presentes en el palimpsesto de Arquímedes. Al
aplicar el método propuesto para el caso de imágenes multiespectrales es fundamental compro-
bar que los vectores de W , e independientemente M , satisfacen la propiedad de independencia
afín. Con esta condición se busca evitar que algún punto extremo sea una combinación lineal
de los anteriores. Además, dado que el número de puntos extremos determinados es mucho
mayor al número de materiales que conforman una escena resulta necesario realizar un pro-
ceso de selección de aquellos vectores que sean menos correlacionados. El ángulo espectral o
el coeciente de correlación calculados a partir de los espectros de los puntos extremos son
métricas que proporcionan resultados adecuados para dicha selección. El subconjunto de vec-
tores seleccionado es empleado entonces para calcular las abundancias fraccionales en cada
pixel de la imagen. La aplicación de esta técnica al conjunto de imágenes multiespectrales
del palimpsesto ha permitido calcular mapas de las abundancias de los dos pigmentos y del
cuero que conforman el manuscrito; con la determinación de la distribución de los pigmentos
se ha logrado recuperar satisfactoriamente gran parte del texto original del manuscrito. De
esta manera, el método aquí desarrollado se puede utilizar para el análisis de pigmentos en
documentos antiguos.
Por otra parte, en el Capítulo 6 se ha discutido el caso de imágenes hiperespectrales; las
memorias reticulares se han empleado para determinar los espectros de los materiales consti-
tuyentes de la escena, sin la necesidad de recurrir a espectros medidos directamente en la zona.
Lo anterior representa un logro importante ya que no se necesita tener conocimiento a priori
de los recursos naturales que se encuentran en el área bajo estudio. Por tanto, los espectros
de los puntos extremos obtenidos mediante las memorias reticulares fueron empleados para el
cálculo de las abundancias de cada recurso natural. Los resultados de segmentación obtenidos
para las dos imágenes ejemplares permiten conocer la presencia de los recursos naturales exis-
tentes. En efecto, en base a los resultados obtenidos en cada uno de los casos aquí discutidos se
ha demostrado que es posible aplicar las memorias autoasociativas reticulares para el análisis
y segmentación de imágenes multicanal.

7.2. APORTACIONES DE ESTA INVESTIGACIÓN
7.2. Aportaciones de esta investigación
La realización de este trabajo de investigación proporciona detalles signicativos en

el uso y el potencial de las memorias reticulares para el análisis de imágenes en color, multi-
espectrales e hiperespectrales. En el primer caso se ha desarrollado un método de segmentación
eciente que permite conocer las distribuciones de color a lo largo de la imagen. Además para
este caso de tres dimensiones, el cálculo de las fracciones de color saturado se ha realizado
por medio de una matriz generalizada que permite resolver el sistema de ecuaciones y además
satisfacer las restricciones de aditividad completa y positividad, impuestas en el modelo. Por
lo tanto, esta técnica de segmentación es rápida y puede ser aplicada en cualquier espacio
de color con resultados satisfactorios. Es importante mencionar que este método, así como
los resultados de segmentación de imágenes en color han sido reportados en los siguientes
manuscritos:
G. Urcid, J.C. Valdiviezo-N, G.X. Ritter, Lattice algebra approach to color image seg-
mentation, Journal of Mathematical Imaging and Vision, doi 10.1007/s10851-011-0302-
2, June 2011.
Gonzalo Urcid, Juan Carlos Valdiviezo-N, Gerhard X. Ritter, Lattice associative memo-
ries for segmenting color images in dierent color spaces, LNCS Proc.: Hybrid Articial
Intelligence Systems, Springer, Vol. 6077/2010, pp. 359366, 2010.
G. Urcid and J.C. Valdiviezo-Navarro, Color image segmentation based on lattice au-
toassociative memories, IASTED Proc.: 13th Articial Intelligence and Soft Computing,
Vol. 683, Palma de Mallorca, Spain, pp. 166173, 2009.
La aplicación del método W y M para el análisis de imágenes multiespectrales de

documentos antiguos provee resultados importantes pues se ha logrado recuperar gran parte
del texto original del palimpsesto de Arquímedes. En efecto, esta técnica presenta un gran
potencial para el análisis de pigmentos y trabajos de arte. Además de este tratamiento, se
han discutido aspectos fundamentales en el proceso de estimación de la reectancia para
imágenes multiespectrales, así como los aspectos físicos que intervienen en dicha estimación

para imágenes hiperespectrales. Los resultados de la separación de textos en el palimpsesto de

Arquímedes han sido publicados en el manuscrito:
Juan C. Valdiviezo-Navarro and Gonzalo Urcid, Multispectral images segmentation of

ancient documents with lattice memories, OSA Proc.: Digital Image Processing and
Analysis, Tucson, AZ, June 2010.
Una aportación adicional de esta investigación es que el cálculo de W y M facilita la

determinación autónoma de los recursos naturales que conforman una escena remotamente
sensada. Para ello sólo se necesita seleccionar un conjunto reducido de los puntos extremos
determinados con ambas memorias y separar las mezclas en cada pixel de la imagen hipere-
spectral. Los resultados en la determinación de recursos naturales en imágenes hiperespectrales
han sido reportados en los siguientes manuscritos:
J.C. Valdiviezo, G. Urcid, Convex set approaches for material quantication in hyper-
spectral imagery. In: Earth Observation, Rustam B. Rustamov and Saida E. Salahova
editors, In Press.
Gonzalo Urcid, Juan Carlos Valdiviezo-N. and Gerhard X. Ritter, Endmember search
techniques based on lattice auto-associative memories: a case on vegetation discrimina-
tion, SPIE Proc.: Image and Signal Processing for Remote Sensing, Vol. 7477, Berlín,
Germany, 74771D:112, 2009.
Además de las aportaciones del trabajo de investigación, en la segunda mitad del tercer
año de doctorado se realizó una estancia de investigación en el Instituto de Óptica Daza de
Valdés, en Madrid España. Durante la estancia se trabajó en temas relacionados con el análisis
y mejoramiento de imágenes de Óptica Biomédica. Uno de los resultados de esta estancia ha
sido la publicación del siguiente manuscrito:
R. Redondo, M.G. Bueno, J.C. Valdiviezo, R. Nava, G. Cristóbal, M. García, O. Déniz, B.

Escalante-Ramirez, Evaluation of autofocus measures for microscopic images of biop-
sy and cytology, SPIE Proc.: 22nd Congress of the ICO, Vol. 8011, pp. 801194:19,
November 2011.

7.2.1. Dirección del trabajo futuro

Uno de los resultados más satisfactorios que se lograron con el desarrollo de este trabajo
fue la recuperación del texto borrado a partir de las imágenes multiespectrales del palimpsesto
de Arquímedes. De esta manera, una aplicación inmediata de esta técnica es en el contexto del
análisis y restauración de documentos antiguos. Estas aplicaciones son de gran importancia ya
que el uso de técnicas ópticas y digitales pueden ayudar a la preservación y rescate de muchos
de estos documentos. Por tal motivo, la dirección del trabajo futuro está orientada a la restau-
ración del color digital en imágenes multiespectrales de códices mexicanos. Dichos códices son
parte del patrimonio artístico y cultural de nuestro país por lo que es importante aplicar las
técnicas desarrolladas para su preservación. Por otra parte, el desarrollo de algoritmos que
permitan remover los huecos e identicar la presencia de pigmentos en las partes dañadas de
los códices resulta necesario para realizar la restauración de estos documentos.

Valdiviezo Na JC

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Valdiviezo Na JC

Uploaded by

Copyright:

Available Formats

Análisis Espectral de Imágenes

Multicanal basado en Transformaciones

Juan Carlos Valdiviezo Navarro

Instituto Nacional de Astrofísica, Óptica

Dr. Gonzalo J. Urcid Serrano, INAOE

El autor otorga al INAOE el permiso para

reproducir y distribuir copias en su totalidad o

en partes de esta tesis.

El uso de espectrómetros de imagen, los cuales registran simultáneamente la información es-

El desarrollo de este trabajo de investigación ha sido motivado por la necesidad de

Juan Carlos Valdiviezo Navarro,

Al Ser Supremo quien me ha acompañado en cada instante de mi vida y quien me

A mis hermanos: Rocío, Gloria Estefanía y Luis Enrique, mi inspiración y mis

A mis abuelitos: Estela, María de la Luz y Antero porque su sabio caminar me ha

porque con su cariño las distancias se han vuelto relativas.

 El aprendizaje es el inicio de la riqueza, es el inicio de la salud, es el inicio de la

espiritualidad. Investigando y aprendiendo es donde todos los procesos milagrosos

2.3. Registro espectral de materiales . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4. Segmentación de Imágenes a Color 70

J. C. Valdiviezo INAOE vii

5. Análisis de Imágenes Multiespectrales 95

6. Procesado de Imágenes Hiperespectrales 114

J. C. Valdiviezo INAOE viii

7.2.1. Dirección del trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . 140

2.1. Espectro electromagnético en orden creciente de longitud de onda. . . . . . . . 18

2.20. Espectro de energía reejada registrado a partir de la cáscara de un jitomate rojo. . . . . . 40

3.1. Ejemplos de simplex para k = 1, . . . , 4 . . . . . . . . . . . . . . . . . . . . . . 56

4.1. Representación del espacio de color RGB. . . . . . . . . . . . . . . . . . . . . . . . . 75

escala de grises, mientras que a* y b* denen la saturación y el color. . . . . . . . . . . . 77

la: fracciones de color determinadas a partir de las columnas de M . La correspondencia entre

= gris oscuro y 0 = negro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

representando las fracciones de los colores saturados seleccionados a partir de W y M. . . . 83

de la g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1 , w2 , w3 } y

M = {m1 , m2 , m3 } que encierran diferentes subconjuntos de X. . . . . . . . . . . . . . 84

mentados para las guras ejemplares (resultado de umbralización y enmascaramiento). . . . 85

4.9. Primera la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,

con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas

producidos por ltros de Sobel para las imágenes de la primera la. . . . . . . . . . . . . 88

respectivamente. Las principales regiones de interès se han cuantizado. . . . . . . . . . . 90

5.1. Registro multiespectral de un documento antiguo usando un arreglo de ltros. . . . . . . 98

C1 y C2 obtenidas mediante PCA. . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

en el siglo X (pigmento 1); derecha: cuero del manuscrito. . . . . . . . . . . . . . . . . 110

critura determinados por el método W M. . . . . . . . . . . . . . . . . . . . . . . . 111

valos de longitudes de onda (λ) especícos. . . . . . . . . . . . . . . . . . . . . . . 116

Derecha: combinación de bandas 81 (rojo), 217 (verde) y 54 (azul). . . . . . . . . . . . . 123

J. C. Valdiviezo INAOE xii

combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81

(rojo), 54 (verde) y 34 (azul). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes

dancias de cuatro puntos extremos determinados con W y M, cuya distribución de colores

= s4 , magenta = s2 , verde = s3 . Áreas más brillantes representan mayor concentración del

recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

autónoma de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundan-

amarillo = s3 , azul = s5 , verde = s7 . Áreas más brillantes representan mayor concentración

del recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

El creciente surgimiento de dispositivos que realizan el registro de imágenes en distintos

1.2. Planteamiento del problema

restricciones (MLR), en el cual se considera que el espectro de reectancia medido en un pixel

1.3. Ob jetivo General

1.3.1. Objetivos particulares

2. Determinar los puntos extremos para el análisis de imágenes multiespectrales, en par-

3. Adquirir un conjunto de espectros en el laboratorio utilizando un espectrómetro de línea

para vericar el modelo MLR.

El aprendizaje es el inicio de la riqueza, es el inicio de la salud, es el inicio de la

2.20. Espectro de energía reejada registrado a partir de la cáscara de un jitomate rojo. . . . . . 40

escala de grises, mientras que a* y b* denen la saturación y el color. . . . . . . . . . . . 77

la: fracciones de color determinadas a partir de las columnas de M . La correspondencia entre

de la g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1 , w2 , w3 } y

mentados para las guras ejemplares (resultado de umbralización y enmascaramiento). . . . 85

4.9. Primera la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,

producidos por ltros de Sobel para las imágenes de la primera la. . . . . . . . . . . . . 88

5.1. Registro multiespectral de un documento antiguo usando un arreglo de ltros. . . . . . . 98

valos de longitudes de onda (λ) especícos. . . . . . . . . . . . . . . . . . . . . . . 116

restricciones (MLR), en el cual se considera que el espectro de reectancia medido en un pixel

para vericar el modelo MLR.

El problema de hallar el volumen mínimo fue modicado a un problema de minimizar el volu-

[1] Archimedes Palimpsest, The Archimedes Palimpsest Project, www.archimedespalimpsest.net,

[2] Aviris JPL., AVIRIS home page, www.aviris.jpl.nasa.gov, 1997.

10, pp. 28042819, 2006.

Palimpsest, Proc. 32nd AIPR, pp. 111118, 2003.

IEEE Proc.: ICIP, Vol. 7803, pp. 549552, 2003.

No. 9, pp. 20252041, 2002.

6, pp. 24892491, 2000.

in hyperspectral data, SPIE Proc.: Imaging Spectrometry V, pp. 266275, 1999.

2.1.4. Reectancia, absortancia y transmitancia

En efecto, tomando en cuenta las cantidades radiométricas antes denidas, se puede

Figura 2.2: Espectro de absorción de la clorola a y b.

El instrumento utilizado para medir la energía reejada o emitida por un material en

El límite de resolución depende de la difracción debido al ancho del haz nito o a la

Respecto a la punta de prueba de bra óptica, su estructura bifurcada permite conectar

Filtro λ0 especicada λ0 determinada Error |Error relativo|

Además de caracterizar la respuesta del conjunto de ltros interferométricos se deter-

Una vez vericada la calibración del instrumento se realizó, a manera de ejemplo, el

Figura 2.19: Espectro de energía reejada para una hoja de bugambilia.

Figura 2.21: Espectro de energía reejada para la cáscara de una mandarina.

una función cuyos coecientes aproximan la forma del espectro mezclado.