Logo Studenta

Analisis-comparativo-de-algoritmos-para-el-control-de-la-LOS-de-un-sensor-sobre-una-plataforma-movil

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO 
 PROGRAMA DE MAESTRÍA Y DOCTORADO EN 
 INGENIERÍA 
 
 FACULTAD DE INGENIERÍA 
 ANÁLISIS COMPARATIVO DE ALGORITMOS 
 PARA EL CONTROL DE LA LOS DE UN SENSOR 
 SOBRE UNA PLATAFORMA MÓVIL 
T E S I S 
 QUE PARA OPTAR POR EL GRADO DE: 
 MAESTRO EN INGENIERÍA 
 ÁREA: ELÉCTRICA – CAMPO: CONTROL 
 P R E S E N T A : 
 SERGIO ATAYDE DEL MORAL 
 TUTOR: 
 DR. YU TANG XU 
 2007 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
JURADO ASIGNADO: 
Presidente: Dr. Gerardo René Espinosa Pérez 
Secretario: Dr. Luis Agustín Álvarez Icaza Longoría 
Vocal: Dr. Yu Tang Xu 
1er. Suplente: Dr. Héctor Pérez Benítez 
2do. Suplente: Dr. Marco Arteaga Pérez 
Lugar donde se realizó la tesis:
México, D.F., Ciudad Universitaria 
TUTOR DE TESIS: 
Dr. Yu Tang Xu 
_________________________________ 
FIRMA 
AGRADECIMIENTOS
Agradezco a mi asesor el Doctor Yu Tang Xu por dirigir este trabajo de tesis. 
Agradezco a los sinodales por el tiempo que dedicaron a revisar y comentar este trabajo de tesis. 
Agradezco al Colegio de Control de la DEPFI por sus enseñanzas durante el curso de las asignaturas 
de la maestría en control. 
Agradezco al Consejo Nacional de Ciencia y Tecnología, CONACYT, por su apoyo económico al 
concederme una beca de maestría, a través del programa de Formación de Científicos y Tecnólogos. 
Agradezco a la Secretaría de Marina por el apoyo y las facilidades prestadas para la realización de 
este trabajo, en particular al Capitán de Corbeta y Maestro en Ingeniería Alberto Fuentes Maya y al 
Almirante Laureano Suárez Allen 
 Sergio Atayde Del Moral 
 2007 
Análisis comparativo de algoritmos
para el control de la LOS de un
sensor sobre una plataforma móvil
Sergio Atayde Del Moral
2007
Índice general
1. Introducción 9
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1. Orientación de la LOS . . . . . . . . . . . . . . . . . . 11
1.2.2. Estabilización de la LOS . . . . . . . . . . . . . . . . . 11
1.3. Definición geométrica de la tarea de control . . . . . . . . . . 12
1.4. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5. Ubicación de este trabajo de tesis . . . . . . . . . . . . . . . . 14
1.6. Contribución . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Modelo del sistema 16
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2. Configuración cinemática . . . . . . . . . . . . . . . . . . . . . 16
2.3. Marcos de referencia: Convención
Denavit-Hartenberg . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4. Relaciones cinemáticas de la plataforma . . . . . . . . . . . . 19
2.5. Sistemas Lagrangianos . . . . . . . . . . . . . . . . . . . . . . 21
2.5.1. Modelado mediante métodos energéticos:
Ecuaciónes Euler-Lagrange [3] . . . . . . . . . . . . . 21
2.5.2. Desarrollo de las ecuaciones Euler-Lagrange para ma-
nipuladores mecánicos de n grados de libertad . . . . . 23
2.6. Desarrollo del modelo . . . . . . . . . . . . . . . . . . . . . . . 26
2.7. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . 29
2.7.1. Fenómeno de fricción [8] . . . . . . . . . . . . . . . . . 29
2.7.2. Modelo de fricción LuGre [7] . . . . . . . . . . . . . . 30
3. Algoritmos de Control: Comparación cualitativa 32
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1
3.2. Control de Orientación . . . . . . . . . . . . . . . . . . . . . . 33
3.3. Control de Estabilización . . . . . . . . . . . . . . . . . . . . . 34
3.3.1. Estabilización de balanceo: Grado de libertad “virtual”
en balanceo . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4. Métodos de control para manipuladores . . . . . . . . . . . . . 36
3.4.1. PD+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4.2. Control Adaptable . . . . . . . . . . . . . . . . . . . . 38
3.4.3. Control Robusto . . . . . . . . . . . . . . . . . . . . . 40
3.4.4. Modos deslizantes . . . . . . . . . . . . . . . . . . . . . 43
3.4.5. Compensación de fricción: observador . . . . . . . . . . 49
3.5. Comparación cualitativa entre algoritmos . . . . . . . . . . . . 51
4. Simulación: Comparación cuantitativa 53
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2. Señal caracteŕıstica de la mar . . . . . . . . . . . . . . . . . . 54
4.3. Sensores de giro y su disposición f́ısica: aproximación directa
e indirecta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4. Señal de referencia: aproximación directa . . . . . . . . . . . . 57
4.5. Suavización de señales de simulación . . . . . . . . . . . . . . 58
4.6. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.7. Comparación Cualitativa . . . . . . . . . . . . . . . . . . . . . 73
5. Conclusiones 80
5.1. Conclusiones, aportación y trabajo futuro . . . . . . . . . . . 80
A. Códigos y Diagramas para las simulaciones en Simulink 82
B. Grado de libertad virtual en eje de balanceo 89
C. Suavización de señales 93
2
Índice de figuras
1.1. Rotaciones de una embarcación . . . . . . . . . . . . . . . . . 10
1.2. Tareas de control: orientación y estabilización . . . . . . . . . 12
1.3. Disposición de ejes para formar la señal de referencia . . . . . 13
2.1. Plataforma de dos Grados de Libertad . . . . . . . . . . . . . 17
2.2. Representación general de plataforma 2GDF . . . . . . . . . 18
2.3. Disposición de ejes para la plataforma 2DOF . . . . . . . . . 20
2.4. Cuerpos simples para representar a la plataforma de dos gra-
dos de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5. Cerdas microscópicas entre dos superficies en contacto . . . . 30
3.1. Esquema de control. Las lecturas del sensor de giro alimentan
las correcciones mecánicas en cabeceo y guiñada y la correción
en balanceo de la imagen. . . . . . . . . . . . . . . . . . . . . 36
3.2. Diagrama a bloques del sistema con fricción y observador de
fricción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1. Señal caracteŕıstica de las rotaciones en una embarcación a la
mar. El eje horizontal tiene escala en segundos y el vertigal en
grados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2. Señales caracteŕısticas de un par de movimientos del buque
hacia adelante . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3. Disposición de ejes para formar la señal de referencia . . . . . 58
4.4. Señales de velocidad y aceleración caculadas con diferenciación
numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5. Señales de velocidad y aceleración caculadas con diferenciación
numérica y suavizadas . . . . . . . . . . . . . . . . . . . . . . 60
4.6. Señal de referencia para guiñada (a) y cabeceo (b) . . . . . . . 62
3
4.7. Señales de error para simulaciones de las leyes decontrol de la
Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas-
suavizadas-. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.8. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas
-suavizadas-. (detalle). . . . . . . . . . . . . . . . . . . . . . . 64
4.9. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo (2.7), con señales de referencia
filtradas-suavizadas-. . . . . . . . . . . . . . . . . . . . . . . . 65
4.10. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo 2.6, con señales de referencia no
filtradas (contrástese con la Figura 4.9) . . . . . . . . . . . . 67
4.11. Señales de fricción t́ıpica inyectada . . . . . . . . . . . . . . . 68
4.12. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo 2.6 con referencias filtradas y fricción
no compensada . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.13. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción
no compensada (detalle) . . . . . . . . . . . . . . . . . . . . . 70
4.14. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y
fricción no compensada . . . . . . . . . . . . . . . . . . . . . 71
4.15. Señales de error para simulaciones de las leyes de control de
la Tabla 4.1 en el modelo (2.7) con fricción compensada . . . 72
4.16. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción
compensada (detalle) . . . . . . . . . . . . . . . . . . . . . . 73
4.17. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y
fricción compensada . . . . . . . . . . . . . . . . . . . . . . . 74
4.18. Señales de fricción “real” y observada con detalle de conver-
gencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.19. Enerǵıa de la señal de error . . . . . . . . . . . . . . . . . . . 76
4.20. Enerǵıa de la señal de control . . . . . . . . . . . . . . . . . . 77
A.1. Modelo de simulación en Simulink . . . . . . . . . . . . . . . 83
4
B.1. Ejes de referencia convencionales para el manejo de imágenes
digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
B.2. Ejes de referencia propuestos . . . . . . . . . . . . . . . . . . 90
B.3. Rotación de n grados, algoritmo con pixeles ciegos . . . . . . 91
B.4. Rotación de n grados, algoritmo sin puntos ciegos . . . . . . . 92
C.1. Señal escalonada (ĺınea sólida) y su contraparte “suavizada”(ĺınea
discontinua) . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5
Índice de cuadros
2.1. Tabla de parámetros D-H . . . . . . . . . . . . . . . . . . . . 20
2.2. Tabla de Momentos de Inercia . . . . . . . . . . . . . . . . . 27
4.1. Tabla de leyes de control . . . . . . . . . . . . . . . . . . . . 61
4.2. Tabla de resultados: Tanto en las calificaciones de los incisos
como en el renglón de Índice Final, una cifra menor representa
un mejor desempeño . . . . . . . . . . . . . . . . . . . . . . . 78
4.3. Tabla de ponderación de incisos de comparación . . . . . . . 79
4.4. Ejemplo del cálculo del Índice Final para el control PD+ . . . 79
A.1. código de control (1) . . . . . . . . . . . . . . . . . . . . . . . 85
A.2. código de control (2) . . . . . . . . . . . . . . . . . . . . . . . 86
A.3. Modelo de aceleración . . . . . . . . . . . . . . . . . . . . . . 87
A.4. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . 87
A.5. Observador de fricción . . . . . . . . . . . . . . . . . . . . . . 88
6
Prefacio
Organización de la tesis
En esta tesis se analiza comparativamente el desempeño de varios algo-
ritmos de control aplicados a la estabilización y orientación de la ĺınea de
vista de un sensor montado en una plataforma movil en un ambiente con
perturbaciones. Siendo más espećıficos, el sensor de interés es una cámara
de video montada en una embarcación1, por tanto las perturbaciones son las
propias del medio marino, principalmente el oleaje.
La tesis se organiza de la siguiente manera:
El Caṕıtulo 1 es una introducción en la que se presenta la motivación de
este trabajo de tesis, revisándose el contexto en el que es deseable lograr la
orientación y estabilización de dispositivos mediante el empleo de platafor-
mas moviles. Una vez descrita la problemática se establecen los objetivos
de control. Se mencionan aśı mismo, trabajos en los que se han desarrollado
varias aproximaciones a la tarea de manipulación de plataformas. Por último,
se ubica este trabajo de tesis y se resaltan las contribuciones del mismo.
En el Caṕıtulo 2 se desarrolla un modelo del sistema plataforma móvil.
Primero se propone una configuración cinemática para la plataforma y a
continuación se emplea la convención Denavit-Hartenberg para establecer
marcos de referencia y obtener las matrices de transformación asociadas.
Después se hace una breve revisión del modelado mediante métodos energé-
ticos (indicador variacional, variables de flujo y esfuerzo) y de las ecuaciones
Euler-Lagrange. En la sección final del caṕıtulo, se llega a una expresión
1La naturaleza espećıfica del sensor y el medio en el que opera resulta de relevancia en
el desarrollo de este trabajo
7
parametrizada puntual para el modelo de la plataforma.
En el Caṕıtulo 3 se revisan varios de los métodos de control de manipuladores
mecánicos, haciendo énfasis en los de tipo robusto, incluyéndose el análisis
de estabilidad y convergencia en lazo cerrado para los casos nominales. En
uno de los incisos de simulación se prueba el desempeño de los controladores
ante la presencia de fricción, por lo que en este caṕıtulo se revisa brevemente
el modelo LuGre, aśı como un observador de fricción. El caṕıtulo finaliza con
una comparación cualitativa entre los algoritmos de control presentados.
El caṕıtulo 4 está dedicado a simulaciones del control de la plataforma u-
sando los algoritmos revisados en el Caṕıtulo 3, aśı como a la comparación
cuantitativa del desempeño de las diferentes leyes de control presentadas.
Primero se presentan señales de giro t́ıpicas (reales) para varios estados de
la mar. Dicho tipo de señal es el que se alimenta como perturbación al sis-
tema controlado en lazo cerrado. Despúes se enuncian las caracteŕısticas de
las aproximaciones directa e indirecta para la medición de rotaciones y tasas
de giro. Por último se presenta el análisis comparativo de los distintos con-
troles, el cual incluye un conjunto de gráficas y tablas en las que se resume y
analiza el desempeño de los controles con base en parámetros como, tiempo
de asentamiento, enerǵıa de las señales de error y de control, magnitud del
error residual, suposiciones a priori etc2.
En el Caṕıtulo 5, se presentan las conclusiones de este trabajo de tesis, se
resalta lo que se considera como aportaciones y se esboza el trabajo a futuro.
2En su momento en los casos que no se pueda obviar, se definen los parametros de
comparación
8
Caṕıtulo 1
Introducción
1.1. Motivación
Varios son los veh́ıculos aéreos, terrestres y marinos que transportan
equipo de sensado el cual entra en operación mientras dichos veh́ıculos se
mueven y está, por ende, sujeto a movimientos aleatorios debidos a las irre-
gularidades de la v́ıa, sea ésta un terreno pedregoso, un mar con oleaje o un
cielo turbulento. Frecuentemente para cumplir su fin espećıfico de manera
óptima, los sensores montados en los veh́ıculos deben conservar en la me-
dida de lo posible cierta orientación, aún cuando perturbaciones del medio
tiendan a “desorientarlos”. Por ejemplo, en el caso de sistemas de comuni-
cación se busca que las antenasreceptoras/transmisoras apunten hacia la
fuente/destino de la señal a fin de recibir/enviar ı́ntegramente la información
de interés. En tales casos, el equipo de sensado se monta sobre una platafor-
ma móvil que lo estabiliza respecto a los movimientos del veh́ıculo en uno
o más de sus ejes, con base en información de rotación proporcionada por
sensores de giro adosados a la plataforma y/o al sensor.
En particular, en esta tesis se revisará el caso en que el veh́ıculo de interés
es una embarcación y el sensor es una cámara de video montada
en una plataforma móvil actuada. El objetivo primordial del control es
conservar cierta ĺınea de visión o LOS 1. Por lo tanto, cuando la embar-
cación sufre rotaciónes respecto a sus ejes, Figura 1.1, se busca que el control
1Por las siglas en inglés de Line Of Sight, la abreviacion LOS se usa a lo largo de la
tesis
9
adquiera y/o mantenga la orientación de la LOS respecto al blanco u objeti-
vo de interés, al generar en la plataforma los movimientos que logren la LOS
comandada y contrarresten las perturbaciones que sufre la embarcación.
Figura 1.1: Rotaciones de una embarcación
1.2. Objetivo
Es necesario establecer claramente el objetivo de control para determinar
qué eventos y/o perturbaciones generan una reacción del esquema de control,
y aquellas que no lo hacen por no contravenir el objetivo establecido. Aśı mis-
mo, al haber delimitado el objetivo se puede elegir un tipo de configuración
mecánica para la plataforma, cuya cinemática permita cumplir el objetivo
10
planteado dentro de una buena relación complejidad-desempeño.
La tarea de interés se puede resumir de la siguiente manera: la ĺınea de
vista del sensor en cuestión, cámara, debe apuntar en dirección del blanco
u objetivo de interés , el cual puede estar fijo o en movimiento. Aunado
a lo anterior, la embarcación en que se encuentra el sensor está expuesta
a movimientos continuos debidos al medio marino. Esto es, se tiene en el
caso más general una LOS variable en un medio con perturbaciones. De es-
ta forma, el objetivo de dirigir la LOS del sensor hacia un blanco puede
definirse en dos subtareas: tarea de orientación o seguimiento y tarea de es-
tabilización o rechazo de perturbaciones. Las perturbaciones y movimientos
de orientación/seguimiento considerados serán de tipo rotacional, en conse-
cuencia las tareas de orientación y estabilización se satisfacen con grados de
libertad rotacionales.
1.2.1. Orientación de la LOS
La tarea de orientación de la LOS de un sensor mediante el uso de una
plataforma móvil, consiste en dirigir el vector caracteŕıstico de la LOS 2 hacia
el objetivo de interés a través de la manipulación de los grados de libertad de
la plataforma. En general puede identificarse lo anterior como una tarea de
seguimiento, en la que se busca llevar el estado de operación de un sistema
a lo largo de cierta trayectoria y/o hacia cierta referencia constante.
En el caso particular en que el sensor es una cámara, la tarea de adquirir y
preservar cierta LOS puede traducirse, por ejemplo, en mantener centrado
y en foco un objetivo en movimiento relativo respecto a la embarcación que
transporta al sensor. Aśı, con un objeto en movimiento y un sensor con el
que se le quiere apuntar, se tiene en general una tarea de seguimiento.
1.2.2. Estabilización de la LOS
El vector caracteŕıstico de la LOS de un sensor sobre una plataforma en
una embarcación marina se encuentra expuesto a multiples fuentes de pertur-
bación, siendo la principal la acción de las olas. Otras fuentes de perturbación
2La ĺınea de vista de un sensor tiene asociado un vector caracteŕıstico o vector de
dirección, el cual es unitario, deslizante y está dirigido sobre la ĺınea recta no obstruida
que une al sensor y su objetivo.
11
pueden deberse a torcas inducidas por corrientes de viento. También las vi-
braciones y movimientos lineales de la embarcación pueden generar torcas de
perturbación debido a desbalances de masa por la disposición geométrica de
los componentes de la plataforma. Recordando que en este trabajo de tesis se
consideran sólo perturbaciones de orden rotacional, las perturbaciones trasla-
cionales se toman en cuenta sólo en la medida que impacten la orientación
de la LOS respecto al blanco de interés.
La Figura 1.2 resume las tareas de control descritas en esta sección. Se puede
hacer la siguiente analoǵıa: las perturbaciones marinas impactan la cola del
vector que define a la LOS en tanto que el movimiento relativo del blanco
del sensor afecta la punta del vector de la LOS.
Figura 1.2: Tareas de control: orientación y estabilización
1.3. Definición geométrica de la tarea de con-
trol
Con ayuda de la Figura 1.3 se pueden definir geométricamente las ta-
reas de orientación y estabilización. La figura representa una vista aérea
del conjunto buque-plataforma-sensor. Considérese por simplicidad sólo el
12
movimiento en el eje de guiñada. Los vectores LOSdes y LOSact definen,
respectivamente, la orientación deseada del sensor y la orientación actual
referidas a un sistema de ejes inercial (ejes ĺınea gruesa discontinua) respecto
al cual se tienen mediciones de giro de posición/velocidad angular. El vector
LOSdes es en general variable, pues cambia conforme al movimiento relati-
vo entre el buque y el objetivo de interés. El vector LOSact por su parte,
está expuesto a las perturbaciones de la mar.
Se tiene además, otro marco de referencia (ejes ĺınea delgada discontinua)
respecto al cual se establece, mediante un codificador de posición, el estado
en guiñada qact del eje mecánico de la plataforma mov́ıl que orienta al sensor.
La tarea de control consiste en combinar la LOSdes con la información de
los sensores de giro LOSact y posición qact a fin de generar una referencia qdes
que, como entrada a un esquema de control, permita que el vector LOSact
siga a la referencia LOSdes (orientación) a la vez que se rechazan las pertur-
baciones de la mar (estabilización).
Figura 1.3: Disposición de ejes para formar la señal de referencia
13
1.4. Estado del arte
La tarea de estabilización y orientación de una plataforma ha sido abor-
dada en varios trabajos con el empleo de un manipulador Stewart, [11] y [12].
Esta aproximación a la tarea de estabilización es buena para el control de vi-
braciones, es decir, para casos en que las desviaciones del punto de operación
son relativamente pequeñas. Este tipo de plataforma puede corregir en seis
grados de libertad, es decir en tres grados de posición y tres de orientación.
Sin embargo, la amplidud de sus movimientos es limitada y la complejidad
de control es elevada.
Shtessel en [13] y [14] trata el problema de estabilización de una platafor-
ma inercial de tres ejes mediante técnicas de modos deslizantes y desacoplamien-
to.
Peter et al en [6] trataron el tema de la estabilización de una plataforma
de dos grados de libertad, haciendo una comparación de desempeño entre la
aproximacion de mediciones de giro directamente sobre la LOS, y mediciones
indirectas en la base de la plataforma, caso en el cual han de reconstruirse
las perturbaciones sobre la LOS a partir de las perturbaciones medidas en
la base. La conclusión es que el desempeño de la aproximación directa es
superior.
1.5. Ubicación de este trabajo de tesis
En este trabajo de tesis se aplica la metodoloǵıa de control como trasfondo
y sustento académico de una tarea de interés práctico. El objetivo principal
de ı́ndole teórico-académico se aborda v́ıa la comparación de algoritmos de
control de tipo adaptable y robusto para el control de orientación y estabi-
lización de la Ĺınea de Vista de un sensor.
Las tareas de estabilización y orientación de la LOS se desarrollan tomando
en cuenta las condiciones que presenta el medio marino, aśı como restricciones
y limitaciones que es necesario imponer a fin de poder presumir la “imple-
mentabilidad” de los esquemasde control revisados. Tales restricciones son
por ejemplo: viabilidad f́ısica-mecánica del esquema de control -simplicidad
14
de implementación-; accesibilidad de señales de referencia y estado; magnitud
de la señal de control dentro de un rango razonable; robustez del esquema
ante perturbaciones, dinámicas no modeladas, variaciones del sistema, etc.
La comparación de los distintos algoritmos presentados se hace mediante
la evaluación de parámetros ponderados. Se presume que los resultados de
este trabajo permitirán llevar a cabo una implementación práctica óptima.
1.6. Contribución
Este trabajo a sido apoyado por el INIDETAM (Instituto de Investigación
y Desarrollo Tecnológico de la Armada de México) de la Secretaŕıa de Ma-
rina, uno de cuyos objetivos es realizar y fomentar la investigación en áreas
de interés naval a fin de aumentar el nivel de independencia tecnológica de
la institución.
Este trabajo sirve de base teórico-académica para la implementación de es-
quemas de control de orientación y estabilización de sistemas de vigilancia
de desarrollo nacional en buques de la Secretaria de Marina, coadyudando
eventualmente a reducir la dependencia tecnológica, con las ventajas que ello
implica: menores costos de implementación, mantenimiento y actualiación;
aumento del cuerpo de conocimientos con base en el cual se pueden realizar
otros proyectos de investigación afines, etc.
15
Caṕıtulo 2
Modelo del sistema
2.1. Introducción
El paso inicial hacia la consecución de un buen esquema de control para
un sistema, es la obtención de un módelo matemático que capture las ca-
racteŕısticas dinámicas de la planta y con base en la cual puedan realizarse
tareas de análisis y śıntesis que conduzcan al controlador adecuado.
Es dif́ıcil que un modelo represente a plenitud la dinámica de su contraparte
real. Un buen modelo representará las caracteŕısticas más significativas del
sistema, en tanto que las incertidumbres por dinámicas no modeladas, per-
turbaciones, variación de parámetros, etc., pueden considerarse en el diseño
del controlador.
Para la obtención de modelos matemáticos de sistemas mecánicos (como el
de interés) existen metodoloǵıas ampliamente desarrolladas y bien documen-
tadas. Son de especial interés los métodos de modelado energético, los cuales
permiten llegar a modelos para sistemas de mediana y alta complejidad sin la
necesidad de establecer de manera expĺıcita las restricciones de interconexión
entre los distintos elementos del sistema.
2.2. Configuración cinemática
El tipo de plataforma propuesto para el objetivo, es el que se muestra en
la Figura 2.1.
16
Figura 2.1: Plataforma de dos Grados de Libertad
La Figura 2.2 es una representación general del tipo de plataforma de
dos Grados de Libertad (2GDL), en la que se describen algunos elementos
básicos del arreglo: la plataforma consta de dos articulaciones de revolución,
en el eje de guiñada -o yaw - y en el eje de elevación -o pitch-. La caracteŕıstica
principal de este tipo de plataforma es la de que los ejes de sus articulaciones
de revolución se intersectan en un punto en común.
Como puede apreciarse el tipo de plataforma mostrada no tiene la capaci-
dad de realizar movimientos alrededor del eje de balanceo. Cuando el sensor
de interés que va montado en la plataforma es, por ejemplo, un telémetro
laser, las correcciones en balanceo no son necesarias pues la señal envia-
da/recibida por el sensor es un haz. No obstante cuando el sensor de interés
es, como en el caso de este trabajo, una cámara de video, las perturbaciones
en balanceo resultan en imágenes sesgadas. No obstante, como se verá en el
Caṕıtulo 3, se propone una estabilización “virtual” en el eje de balanceo.
17
Figura 2.2: Representación general de plataforma 2GDF
La configuración de la plataforma permite delimitar los alcances del con-
trol: las acciones de control de orientación y estabilización se efectuarán sólo
con rotaciones en dos ejes. Lo anterior simplifica el análisis cinemático, al no
existir movimientos de traslación.
La cinemática directa de este tipo de plataforma es simple, pues se puede de-
terminar la orientación del sensor de forma inmediata al conocer la posición
angular de los ejes, lo cual en las implementaciones se realiza fácilmente con
codificadores de posición.
2.3. Marcos de referencia: Convención
Denavit-Hartenberg
La primera tarea hacia el desarrollo de un modelo es establecer los sis-
temas coordenados para representar la posición y orientación de los varios
cuerpos (considerados ŕıgidos) que conforman la plataforma. Para ello se
18
empleará la representación Denavit-Hartenberg (D-H ), la cual permite es-
tablecer de manera sistemática los marcos de referencia en cada articulación
y facilita posteriormente la obtención de parametros con los cuales se forman
las matrices de transformación entre los sistemas referenciales.
A continuación se enuncian 6 primeros pasos hacia la obtención de la cinemá-
tica directa del manipulador, los cuales se relacionan con el establecimento
de los marcos de referencia:
Representación D-H [2]:
1. Localizar y etiquetar los ejes de las articulaciones z0, ...zn−1, donde n
representa el número de articulaciones. El eje zi, se alinea con el eje de
movimiento de la articulación i+1,
2. Establecer un marco de referencia base x0y0z0. Poner el origen en
cualquier posición sobre el eje z0. Los ejes x0 y y0 respectivos se es-
tablecen de forma tal que se forme un sistema dextrogiro. Los pasos 3
al 5 se repiten para i=1,...n-1.
3. Localizar el origen Oi en el punto en el que la normal común zi y
zi−1 interseca a zi. Si zi y zi−1 son paralelos, se ubica Oi en la i -ésima
articulación.
4. Establecer xi a lo largo de la normal común entre zi y zi−1 tal que
cruce Oi, o, si zi−1 y zi se intersecan, en la dirección normal al plano
que forman zi − zi−1.
5. Establecer yi tal que complete un marco de referencia derecho.
6. Establecer el marco referencial del efector final onxnynzn, asumiendo la
n-ésima articulación de revolución,
Tras aplicar los pasos enunciados anteriormente, los marcos de referencia se
establecen de acuerdo a la Figura 2.3:
2.4. Relaciones cinemáticas de la plataforma
Una vez establecidos los marcos de referencia, han de obtenerse las rela-
ciones de transformación entre los sistemas coordenados, para poder referir
19
Figura 2.3: Disposición de ejes para la plataforma 2DOF
posiciones y velocidades de un sistema a otro. Ello es sencillo una vez apli-
cada la convención D-H, al formar una tabla de parámetros ai, di, αi, θi de la
siguiente manera [2]:
1. ai es la distancia medida a lo largo del eje xi desde el origen Oi, hasta
la intersección del eje zi−1 con el eje xi (distancia más corta entre zi−1
y zi) con signo contrario al sentido del eje xi.
2. di es la distancia a lo largo del origen zi−1 desde Oi−1 hasta la intersec-
ción de zi−1 con xi (respetando el signo del eje zi−1).
3. αi es el ángulo entre zi−1 y zi, medido alrededor de xi.
4. θi es el ángulo entre xi−1 y xi medida alrededor de xi, siendo variable
para las articulaciones de revolución.
La Tabla 2.1 resume los parámetros para la configuración propuesta:
Articulación ai αi di θi
1 0 -90 0 θ1(t)
2 0 0 0 θ2(t)
Cuadro 2.1: Tabla de parámetros D-H
20
Una vez formada la tabla, la matriz de transformación del sistema i al i-1,
Ai−1i , está dada por el producto de 4 transformaciones básicas, dos rotaciones
y dos traslaciones:
Ai−1i = Rotz,θiTrasz,diTrasx,aiRotx,αi
Ai−1i =
⎡
⎢⎢⎣
Cθi −Sθi 0 0
Sθi Cθi 0 0
0 0 1 0
0 0 0 1
⎤
⎥⎥⎦
⎡
⎢⎢⎣
1 0 0 0
0 1 0 0
0 0 1 di
0 0 0 1
⎤
⎥⎥⎦
⎡
⎢⎢⎣
1 0 0 ai
0 1 0 0
0 0 1 0
0 0 0 1
⎤
⎥⎥⎦
⎡
⎢⎢⎣
1 0 0 0
0 Cαi −Sαi 0
0 Sαi Cαi 0
0 0 0 1
⎤
⎥⎥⎦
donde Cθi y Sθi denotan respectivamente coseno y seno de θi.
Las matrices de transformación homogéneas son por tanto:
A01 =
⎡
⎣Cθ1 0 −Sθ1Sθ1 0 Cθ1
0 −1 0
⎤
⎦
A12 =
⎡
⎣Cθ2 −Sθ2 0Sθ2 Cθ20
0 0 1
⎤
⎦
La matriz de transformación del sistema es:
T 02 =
⎡
⎣Cθ1Cθ2 −Cθ1Sθ2 Sθ1Sθ1Cθ2 −Sθ1Sθ2 Cθ1
−Sθ2 −Cθ2 0
⎤
⎦
2.5. Sistemas Lagrangianos
2.5.1. Modelado mediante métodos energéticos:
Ecuaciónes Euler-Lagrange [3]
La formulación de un modelo matemático para un sistema de ı́ndole
mecánico puede realizarse de manera sistemática considerando al sistema
como un dispositivo manejador de enerǵıa y utilizando los denominados
Métodos Variacionales, en los cuales, los intercambios energéticos del sis-
21
tema se asocian con una función de cambio de enerǵıa total del sistema,
Indicador Variacional, la cual se conserva balanceada a cero en tanto la con-
ducta dinámica del sistema sea “correcta”. Por “conducta correcta”ha de
entenderse que las variaciones de las variables de almacenamiento de esfuer-
zo y flujo no transgreden las restricciones de interconexión del sistema, es
decir, tales variaciones permisibles no violan las restricciones de compatibi-
lidad ni las de continuidad1
En términos llanos, lo anterior es un refinamiento del concepto básico de
que la enerǵıa de entrada a un sistema es igual a la que se almacena (por
ejemplo en forma cinética o potencial) y a la que se disipa.
Un indicador variacional δV que se balancea a cero para cualquier transi-
ción permisible de un sistema con m coordenadas generalizadas de almace-
namiento de esfuerzo(q1, ..., qm) y l coordenadas generalizadas variacionales
(δq1, ..., δql) es:
δV =
∫ t1
t0
[
δU∗ − δT −∑lj=1 ( ∂J∂q̇j − τj) δqj] dt = 0
donde:
U∗: Co-enerǵıa total almacenada en elementos almacenadores de flujo en
función de las coordenadas generalizadas de esfuerzo.
T : Enerǵıa total almacenada en elementos almacenadores de esfuerzo en fun-
ción de las coordenadas generalizadas de almacenamiento de esfuerzo.
J : Co-contenido total en los disipadores del sistema.
Un resultado de uso inmediato del análisis variacional, es el conjunto de
ecuaciones Euler-Lagrange, las cuales deben de satisfacerse en tanto el in-
dicador variacional δV se conserve nulo para cualquier transición dinámica
1Restricción de Compatibilidad : La suma de esfuerzos para el lazo cerrado formado por
n puertos de enerǵıa debe ser cero.
Restricción de Continuidad : La suma de flujos en la terminal común de n puertos de
enerǵıa debe ser cero [3].
22
permisible del sistema:
d
dt
[
∂L
∂q̇i
]
− ∂L
∂qi
+
∂J
∂q̇i
= τi para i=1,...,l
donde, el lagrangiano L está dado por:
L = U∗(q̇1, ..., ˙qm) − T (q1, ..., qm)
2.5.2. Desarrollo de las ecuaciones Euler-Lagrange para
manipuladores mecánicos de n grados de liber-
tad
Se puede establecer la correspondencia entre los elementos generales de la
subsección anterior, y los elementos particulares de los sistemas mecánicos.
En el ámbito de los sistemas mecánicos, puede identificarse a las velocidades
(lineales o angulares) como las variables de esfuerzo y a los desplazamien-
tos (lineales o angulares) como las variables de almacenamiento de esfuerzo.
Aśı mismo, las fuerzas y torcas se corresponden con las variables de flujo,
y las variables de almacenamiento asociadas son los momentos (lineales o
angulares).
Dadas las correspondencias anteriores, puede establecerse a la función de
co-enerǵıa U∗(q̇1, ..., ˙qm) como la función de co-enerǵıa cinética2 respecto a
las velocidades del sistema, y a la función T (q1, ..., qm) como la enerǵıa po-
tencial en función de los desplazamientos.
Para manipuladores ŕıgidos de n grados de libertad pueden aplicarse directa-
mente la formulación Euler-Lagrange. Sólo se requiere encontrar la función
de enerǵıa cinética ( co-enerǵıa ) y la de energia potencial.
El modelo dinámico general del manipulador al que se llega desarrollando
2Para un objeto de masa constante, de acuerdo a la segunda ley de Newton, se establece
una relación lineal entre el momento y la velocidad del objeto, por lo cual la co-enerǵıa
cinética (área bajo la curva momento vs. velocidad) es igual a la enerǵıa cinética (área
bajo la curva velocidad vs.momento).
23
el conjunto de ecuaciones Euler-Lagrange es no lineal, y está dado por la
siguiente expresión [2] :
H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ (2.1)
siendo H(q)nxn la matriz de inercia tal que:
hij =
n∑
k=max(i,j)
Tr(UkiJkU
T
kj) (2.2)
donde, el término Jk representan la pseudo matriz de inercia del cuerpo k
respecto al sistema de referencia xkykzk:
Jk =
⎡
⎣−Ixx+Iyy+Izz2 Ixy IxzIxy Ixx−Iyy+Izz2 Iyz
Ixz Iyz
Ixx+Iyy−Izz
2
⎤
⎦ (2.3)
Además:
Uij =
∂T0i
∂qj
donde:
T
0
j = A
0
i A
1
2...A
i−1
i i=1,...,n
siendo Aij la matriz de transformación del sistema j al i.
En el caso de que la matriz Aij represente una transformación ortogonal,
se tiene:
Uij =
{
T
0
j−iQjT
j−i
j j ≤ i
0 j > i
24
donde, si qj representa una variable de almacenamiento de esfuerzo angu-
lar:
Qj =
⎡
⎣0 −1 01 0 0
0 0 0
⎤
⎦.
En cuanto a los elementos de la matriz C(q, q̇) que representa términos cen-
trifugos y de Coriolis, se tiene:
Cij =
n∑
k=1
Ckjiq̇k (2.4)
i,j=1,..,n
con:
Ckji =
1
2
(
∂hij
∂qk
+
∂hik
∂qj
− ∂hkj
∂qi
)
(2.5)
Para g(q) que representa el vector de términos gravitacionales, se tiene la
siguiente expresión:
g(q) =
∂P
∂q
(2.6)
siendo P la función para la enerǵıa Potencial del sistema.
La Ecuación (2.1) y las matrices de inercia H(q) y de Coriolis C(q, q̇), tienen
importantes propiedades:
Acotamiento y positividad de H(q)nxn:
mI ≤ H(q) ≤ HT (q) ≤ mI, ∀q ∈ Rn, con 0 ≤ m ≤ m
Antisimetŕıa de la matriz ˙H(q) − 2C(q, q̇):
sT [ ˙H(q) − 2C(q, q̇)]s = 0, ∀s ∈ Rn
Parametrización lineal. La Ecuación (2.1) puede representarse como:
25
H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ = Ψ(q, q̇, q̇, q̈)ϕ
siendo ϕ un vector de parámetros de dimensión nϕ
2.6. Desarrollo del modelo
En esta sección se desarrolla un modelo del sistema a partir de una
geometŕıa simplificada de la plataforma.
Para fines de modelado y simulación, se propone una representación simpli-
ficada de la plataforma, como lo muestra la Figura 2.4. Además se definen:
q=[ q1 q2 ]
T donde q1 = θ1 y q2 = θ2.
La plataforma mostrada se compone de dos cuerpos principales, un cilin-
dro y una especie de horquilla formada a su vez por tres paralelepipedos.
Figura 2.4: Cuerpos simples para representar a la plataforma de dos grados
de libertad
El momento de inercia del cuerpo k=1,2 se establece respecto al sistema
de referencia xk−1yk−1zk−1. De tablas de momentos inerciales y utilizando el
teorema de ejes paralelos ( ver la disposición de ejes en la Figura 2.3), la
Tabla 2.2 resume los momentos de inercia de los cuerpos representados en la
26
Figura 2.4 3.
Cuerpo Ixx Iyy Izz
1a m1a12 (b
2 + l21) + m1a(
l2
2 +
b
2 )
2 m1a
12 (a
2 + b2) + m1a( l22 +
b
2 )
2 m1a
12 (l
2
1 + a
2) + m1a( l12 )
2
1b m1b12 (b
2 + l22) + m1b(l1 − b2 )2 m1b12 (a2 + l22) m1b12 (b2 + a2) + m1b(l1 − b2 )2
1c m1a12 (b
2 + l21) + m1a(
l2
2 +
b
2 )
2 m1a
12 (a
2 + b2) + m1a( l22 +
b
2 )
2 m1a
12 (l
2
1 + a
2) + m1a( l12 )
2
2 12m2r
2 m2
12 (3r
2 + h2) m212 (3r
2 + h2)
Cuadro 2.2: Tabla de Momentos de Inercia
En la Ecuación (2.3):
J1 = diag
⎛
⎝ m1b24 (2a2) + m1a12 (3l21 + 2a2)m1b
24
(2b2 + 6(2l1 − b)2) + m1a12 (5l21)
m1b
24
(2l22) +
m1a
12
(−3l21 + 2b2 + 6(l2 + b)2)
⎞
⎠ = diag
⎛
⎝J1xJ1y
J1z
⎞
⎠
J2 = diag
⎛
⎝ 112m2h21
4
m2r
2
1
4
m2r
2
⎞
⎠ = diag
⎛
⎝J2xJ2y
J2z
⎞
⎠
Se tiene que:
U11 =
∂A01
∂θ1
=
⎡
⎣−Sθ1 0 −Cθ1Cθ1 0 −Sθ1
0 0 0
⎤
⎦
U12 =
∂A01
∂θ2
= 0
U21 =
∂A02
∂θ1
=
⎡
⎣−Sθ1Cθ2 Sθ1Sθ2 −Cθ1−Cθ1Cθ2 −Cθ1Sθ2 −Sθ1
0 0 0
⎤
⎦
U22 =
∂A02
∂θ2
=
⎡
⎣−Cθ1Sθ2 −Cθ1Cθ2 0−Sθ1Sθ2 −Sθ1Cθ2 0
−Cθ2 Sθ2 0
⎤
⎦
en la Ecuación (2.2), desarrollando y simplificando:
h11 = J1x + J1z + J2y + J2z + (J2x − J2y)C2θ2
3Se asume para fines de modelado, que los cuerpos son simétricos y homogéneos, tales
que los productos de inercia Ixy, Iyz, ... son cero
27
h12 = 0
h21 = 0
h12 = J2x + J2y
En cuanto a los términos centŕıfugos y de Coriolis, se tiene de la Ecuación
(2.5):
C211 = (J2x − J2y)Cθ2Sθ2= C121 = −C112
todos los demás términos son cero. En la Ecuación (2.4):
C11 = (J2x − J2y)Cθ2Sθ2 θ̇2
C12 = (J2x − J2y)Cθ2Sθ2 θ̇1=-C21
C22 = 0
Para el vector de términos gravitacionales (2.6), dada la disposición geométri-
ca simétrica de la plataforma y la suposición de homogeneidad de los cuerpos
que la componen, se tiene que:
g(q) = ∂P
∂q
= 0
Por último se considera al término de disipación Dq como cero. Resumiendo
los resultados anteriores en la Ecuación (2.1), el modelo del sistema es:
[
α + βC2θ2 0
0 γ
] [
θ̈1
θ̈2
]
+
[
γCθ2Sθ2 θ̇2 γCθ2Sθ2 θ̇1
−γCθ2Sθ2 θ̇1 0
] [
θ̇1
θ̇2
]
=
[
τ1
τ2
]
(2.7)
con:
28
α = J1x + J1z + J+ + 2y + J2z
β = J2x − J2y
γ = J2x + J2y
2.7. Modelo de fricción
En el caṕıtulo de simulaciones se presenta un inciso en el que se prueba el
desempeño de los distintos algoritmos ante la presencia de fricción. En esta
sección se presentan generalidades de la fricción y el modelo particular de
fricción que se utilizó, el modelo LuGre [7].
2.7.1. Fenómeno de fricción [8]
La fricción ocurre siempre que cuerpos en contacto experimentan un
movimiento relativo. Este movimiento puede ser lineal o rotacional, pero
en ambos casos la fricción se comporta básicamente de la misma forma.
La fricción es la fuerza de reacción tangencial entre dos superficies en contac-
to. F́ısicamente estas fuerzas de reacción son el resultado de toda una variedad
de mecanismos y fenómenos que dependen de la geometŕıa y topoloǵıa del
contacto, propiedades de porosidad y dureza de las superficies en contacto,
existencia de sustancias entre las superficies, etc. Involucrados tantos factores
en el fenómeno de friccion es de esperarse que sea altamente no lineal. En
un sistema mecánico cuyo control se desea lograr, la fricción puede llevar a
errores en estado estable, ciclos ĺımite y bajo desempeño en general.
Existe una gran cantidad de modelos de fricción que vaŕıan tanto en comple-
jidad como en su capacidad de replicar los fenómenos de fricción observados
experimentalmente. Independientemente de la complejidad del modelo de
fricción, se puede observar como factor común en todos ellos dos compo-
nentes: una de fricción viscosa y otra de fricción Coulomb. Ambas producen
una fuerza que se opone al movimiento, siendo la primera proporcional a
la magnitud y signo de la velocidad, en tanto que la última depende sólo
del signo de la velocidad. Las componentes de fricción anteriores no presen-
tan ningún efecto de memoria, dicho de otra forma son mapeos estáticos,
29
y por ende fallan en capturar importantes efectos dinámicos observados en
presencia de fuerzas de fricción.
2.7.2. Modelo de fricción LuGre [7]
El modelo de fricción considerado en este apartado es el modelo LuGre,
el cual captura la mayoŕıa de los efectos de la fricción observados experi-
mentalmente, entre los que se encuentran el efecto Stribeck, histéresis (Fric-
tional Lag), efecto “stick-slip”, desplazamiento de predeslizamiento, fuerza
de rompimiento variable, “stiction”, y por supuesto fricción viscosa y de
Coulomb.
El modelo LuGre se relaciona con una interpretación de la fricción basa-
da en cerdas. La fricción se modela como la deflexión promedio de cerdas
microscópicas que actúan como resortes, Figura 2.5. Cuando una fuerza tan-
gencial es aplicada, las cerdas sufren una deflexión elástica. Si la deflexión es
suficientemente grande las cerdas empiezan a deslizarse. La deflexión prome-
dio de las cerdas para un movimiento en estado estable queda determinado
por la velocidad. La deflección promedio queda denotada por z y se modela
por:
Figura 2.5: Cerdas microscópicas entre dos superficies en contacto
dz
dt
= v − |v|
g(v)
z (2.8)
30
siendo v la velocidad relativa entre las dos superficies. El primer término
indica que la deflexión es proporcional a la integral de la velocidad relativa.
El segundo término indica que la deflexión z tiende a un valor zss en estado
estable, cuando v es constante:
zss =
v
|v|g(z) = g(v)sgn(v)
La función g es positiva, dependiendo de factores tales como propiedades
de los materiales, lubricación, temperatura, etc. T́ıpicamente g(v) decrece
monótonamente a partir de g(0) conforme v se incrementa. El modelo queda
completo con la expreción de la fuerza de fricción:
FL = σ0z + σ1
dz
dt
+ σ2v (2.9)
El parámetro σ0 representa la rigidez de las cerdas, σ1 es un coheficiente
de amortiguamiento y σ2 es un parámetro de fricción viscosa. Para la función
g(v) existe una parametrización que captura el efectro Stribeck, tal que:
σ0g(v) = Fc + (Fs − Fc)e−(v/vs)2
Fc es el nivel de fricción Coulomb, Fs el nivel de fricción estática y vs la ve-
locidad Stribeck. Aśı, con está parámetrización de g(v) el modelo de fricción
LuGre está caracterizado por 6 parámetros: σ0, σ1, σ2, Fc, Fs y vs.
El modelo de fricción anterior se introduce en un par de incisos de simulación
del Caṕıtulo 4 a fin de evaluar el desempeño de los algoritmos de control ante
la presencia de una dinámica no modelada. En uno de los incisos se introduce
la fricción sin compensarla, mientras que en el otro se inyecta la fricción a la
vez que se compensa con un observador de fricción [7]. En ambos casos, la
fuerza de fricción queda fuera del análisis de estabilidad de los algoritmos de
control.
31
Caṕıtulo 3
Algoritmos de Control:
Comparación cualitativa
3.1. Introducción
En este caṕıtulo se revisan y comparan algoritmos de interés para cumplir
la tarea de control propuesta. Las leyes de control asociadas presentan dis-
tintos grados de complejidad lo que es de por śı un punto de comparación.
También queda de manifiesto que el nivel de simplicidad del algoritmo co-
rresponde de manera inversa al peso de las suposiciones en que se basa. Las
consideraciones anteriores permiten por tanto, formular ya una comparación
cualitativa entre los algoritmos presentados, restando para el caṕıtulo de
simulación la comparación cuantitativa del desempeño de los distintos algo-
ritmos.
En las secciones 3.2 y 3.3 de este caṕıtulo se pormenorizan los objetivos
de control. En particular en la sección de Control de estabilización, dada la
naturaleza del sensor cuya LOS se desea estabilizar, se propone un eje virtu-
al para auxiliar la tarea de rechazo de perturbaciones. Al final de estas dos
secciones se presenta un diagrama del sistema de control, en el que resalta el
hecho de que los objetivos de control de orientación y estabilización pueden
tratarse como uno solo. El resto del caṕıtulo presenta seis algoritmos de con-
trol con sus respectivas expresiones y análisis de estabilidad en lazo cerrado.
32
Los algoritmos revisados se eligieron tomando en consideración su even-
tual implementación. Los algoritmos presentados manejan en mayor o menor
medida consideraciones de ı́ndole práctico: incertidumbres paramétricas, varia-
ciones lentas del sistema, perturbaciones, dinámicas no modeladas, etc. Aśı mis-
mo las leyes de control son expresiones cuya complejidad no es elevada, ni
requieren un extenso conocimiento a priori.
Al final del caṕıtulo se presenta un observador de fricción y una sección
en que se hace una comparación cualitativa entre los controladores.
3.2. Control de Orientación
Como se adelantó en el caṕıtulo introductorio, el objetivo de orientación
se identifica con el de seguimiento, entendiéndose por seguimiento el llevar
y/o conservar a la plataforma móvil en un punto de operación tal que la
LOS del sensor que soporta (cámara) permanezca dirigido hacia el blanco.
En resumen, se desea que la LOS siga una referencia, por lo general variable
en el tiempo.
Los comandos de orientación que definen la trayectoria deseada para la
LOS de un sensor, siendo éste una cámara, pueden asociarse a varias fuentes:
Generación autónoma de trayectoria de seguimiento: Si el fin
ulterior de la cámara es la vigilancia autónoma y el “enganche”1 y
seguimiento de blancos, los comandos de orientaciónde la LOS de-
seada provendrán del procesamiento digital de las mismas imágenes
capturadas por la cámara. Un algoritmo de procesamiento de imágenes
puede extraer coordenadas de orientación del objeto de interés “en-
ganchado”, generalmente en movimiento, y generar las coordenadas de
orientación correspondientes a fin de mantener la LOS dirigida hacia
dicho objeto. 2
1Término coloquial que en procesamiento de imágenes se refiere a la adquisición de
un blanco en una imagen. El procesamiento extrae caracteŕısticas significativas de la ima-
gen, lo cual permite identificar patrones para, por ejemplo, aislar objetos, asociarles un
centroide, vector de posición, vector de velocidad, etc.
2En este trabajo de tesis no se abordan detalles del procesamiento de imágenes para
33
Generación semi-autónoma de trayectoria de seguimiento: Para
fines de vigilancia o tareas de búsqueda, la LOS de una cámara comúnmente
deberá seguir un patrón predeterminado que replique cierta trayectoria
de barrido.
Generación manual de trayectoria de seguimiento: Un opera-
dor humano puede generar mediante alguna interfaz (joystick, pantalla
táctil, etc.) los comandos de orientación de la LOS de una cámara
3.3. Control de Estabilización
Los movimientos irregulares en las embarcaciones a la mar son el resul-
tado de una gran cantidad de factores: tipo de mar que se navega (nivel del
oleaje); velocidad de la embarcación; dirección y sentido de movimiento; pe-
so y tamaño de la embarcacion, distribución de la carga, etc. Como puede
verse se trata de un sistema muy complejo en el que lo más conveniente es
centrarse en el efecto final sobre el sistema de interés, que en el caso de este
trabajo son las perturbaciones rotacionales que sufre la LOS de referencia de
una cámara sobre una plataforma móvil.
Como en el caso de la orientación, pueden reconocerse varias fuentes que
dirigen la tarea de estabilización
Acelerómetros lineales: Una de las técnicas para conocer los movimien-
tos lineales y rotacionales que sufre un cuerpo es adosándole sensores
de aceleración lineal. Al disponer varios de estos sensores en ejes de
movimiento ortogonales, y conociendo la disposicion relativa entre e-
llos, se puede, con base en las mediciones lineales y operaciones de
integración y geometŕıa, conocer desplazamientos lineales y angulares.
Sensores de tasa de giro: Este tipo de sensor mide velocidades de
giro de un objeto alrededor de ejes de movimiento perpendiculares.
La integración de estas señales permite conocer los desplazamientos
angulares.
obtener una LOS deseada, se da por hecho que se tiene una señal que comanda la
orientación de la plataforma. Las únicas referencias que se hacen al procesamiento de
imágenes (en la subsección 3.3.1) quedan circunscritas a la tarea de estabilización.
34
Giros de estado sólido: Una giro de estado sólido suele componerse a
su vez de acelerómetros lineales, sensores de tasa de giro e incluso sen-
sores de campo magnético, para integrar su información y proporcionar
lecturas de posición angular, absoluta o relativa.
Tan importante como el tipo de fuente que genera la información de despla-
zamientos angulares, es el lugar en que se ubica. En el próximo caṕıtulo se
hacen consideraciones sobre la ubicación de los sensores para una tarea de
estabilización. También se indicará a detalle como se miden los ángulos y se
establecen las referencias respectivas.
3.3.1. Estabilización de balanceo: Grado de libertad
“virtual” en balanceo
Hasta ahora se ha considerado que el sistema propuesto opera con dos
articulaciones de revolución. Como se mencionó antes, dos grados de libertad
rotacionales son suficientes para mantener dirigido un haz hacia un objetivo
de interés. Pero tratándose el sensor de una cámara, las rotaciones alrededor
de su eje de balanceo no pueden pasarse por alto, pues detrimentan la imagen
observada. Con el fin de estabilizar perturbaciones de la imagen en el eje de
balanceo se propone un tercer grado de libertad en el eje de balanceo, sólo
que “virtual” y que opera a nivel de procesamiento de imagen.
A continuación se presentan las tareas propuestas para la implementación
del grado de libertad virtual ya mencionado3:
1. Algoritmo para rotar la imagen n grados.
2. Conexión del algoritmo de rotación de imagen con el sensor de posición
angular que mide el estado del eje de balanceo, a fin de efectuar el giro
proporcional que estabilice la imagen.
3. Filtro suavizador y predictor para las lecturas del sensor de posición
angular, que por un lado ofrezca valores “suaves” del estado del eje de
3Se pueden consultar algunos otros detalles en el apéndice “Grado de libertad virtual
en eje de balanceo”
35
balanceo (lo que se traduce en rotaciones “suaves” de la imagen) y que
por otro lado estime el próximo estado del eje de balanceo permitiendo
un desempeño predictivo del sistema.
El esquema de control propuesto es el que se ilustra en la Figura 3.1. En
el puede verse como las tareas de orientación y estabilización se resuelven
en una especie de “seguimiento diferencial”, como se sugeŕıa ya en la Figura
1.2 del Caṕıtulo 1. El esquema representa el caso general en que se considera
la fricción y su compensación aśı como la estabilización de imagen (que no
obstante, no son temas capitales de este trabajo).
Figura 3.1: Esquema de control. Las lecturas del sensor de giro alimentan las
correcciones mecánicas en cabeceo y guiñada y la correción en balanceo de
la imagen.
3.4. Métodos de control para manipuladores
No existe un método general en el diseño de controladores para sistemas
no lineales. Lo que se suele hacer por tanto, es usar técnicas complementarias
de análisis y śıntesis: en base al análisis del modelo del sistema por alguno o
varios de los métodos disponibles (análisis de Lyapunov, método de función
36
descriptiva, análisis del plano de fase, etc.) se puede sintetizar un controlador
cuyo buen desempeño en la práctica pueda presumirse en base al análisis
previo y las simulaciones computacionales realizadas.
3.4.1. PD+
El primer tipo de control revisado, con una expresión bastante sencilla es
el PD+. El control PD+ compensa las no linealidades modeladas del mani-
pulador de interés a la vez que incorpora términos que garantizan la conver-
genćıa (asintótica como se verá adelante) del error a cero en condiciones nom-
inales. El PD+ puede también tener un buen desempeño en condiciones de
perturbación o incertidumbre paramétrica pero a costa de valores de ganan-
cia relativamente altos.
Sea la ley de control PD+ [2]:
τ = H(q)q̈d + C(q, q̇)q̇d + Dq̇d + g(q) − Kv ˙̃q − Kpq̃ (3.1)
con D ≥ 0, Kv, Kp > 0 diagonales, y definiéndose q̃ = q − qd, siendo qd
el estado deseado y q el estado actual. Se pueden analizar las propiedades de
esta ley de control emplendo teoŕıa de Lyapunov. Sea (3.1) en la Ecuación
(2.1):
H(q)¨̃q + C(q, q̇) ˙̃q + (Kv + D) ˙̃q + Kpq̃ = 0 (3.2)
Si se usa como candidata a función de Lyapunov la función:
V (q̃, ˙̃q) = 1
2
˙̃qT H(q) ˙̃q + 1
2
q̃T Kpq̃
derivando V :
V̇ = 1
2
˙̃qT ˙H(q) ˙̃q + ˙̃qT H(q)¨̃q + 1
2
q̃T Kpq̃
sustituyendo H(q)¨̃q de (3.2), agrupando términos y por la propiedad de an-
tisimetŕıa de ˙H(q) − 2C(q, q̇) = 0, se tiene:
37
V (q̃, ˙̃q) = − ˙̃qT (Kv + D) ˙̃q
que es una función negativa semi-definida. Empleando el teorema de La Salle
de conjuntos invariantes al conjunto de puntos:
{(q̃, ˙̃q) | ˙̃q = 0}
en (3.2):
Kpq̃ = 0
que se cumple sólo para q̃ = 0 pues por definición Kp es positiva defini-
da. Se tiene pues un resultado de estabilidad asintótica para el sistema en
lazo cerrado (3.2).
3.4.2. Control Adaptable
La aproximación adaptable al problema de control permite lidiar con
incertidumbres de orden paramétrico en el modelo del sistema, o bien con
sistemas variantes (lentamente) en el tiempo. Aśı pues, la incertidumbre de
los sistemas atacables con el control adaptable se atribuye al conocimienyo
imprecisode los parámetros del modelo, y no a su estructura en śı. El control
adaptable como método de control único en una aplicación real no es muy
usado, pues no tiene un buen desempeño ante perturbaciones, dinámicas
no modeladas o parámetros que vaŕıan rápidamente (este último fenómeno
puede deberse a su vez a un modelado inadecuado), y por tanto suele em-
plearse en complemento con un método de control robusto.
Sea el sistema (2.1) representado mediante una parametrización lineal de
la forma:
τ = Ψ(q, q̇, q̇v, q̈v)ϕ̂0 = Ψa (3.3)
siendo Ψ una matriz conocida y ϕ̂0 un vector de parámetros nominales
[1]. A Ψ se le denonina matriz regresora o simplemente regresor.
El control adaptable propone una ley de variación para el vector de pará-
metros nominales ϕ̂0 tal que cada iteración de control ajusta dicho vector
38
de forma que el error de seguimiento disminuye, e incluso, si las condiciones
son adecuadas 4, el vector nominal puede converger al vector de parámetros
reales ϕ.
Sea la ley de control adaptable [1] :
τ = Ψ(q, q̇, q̇v, q̈v)ϕ̂0 − KvS (3.4)
con la ley de adaptación:
˙̂ϕ0 = −Γ−1ΨT (q, q̇, q̇v, q̈v)S
donde:
Kv = D + K, K > 0 diagonal; Λ, Γ > 0 diagonales; S = q̇ − q̇v = ˙̃q + Λq̃, y
q̇v = q̇d − Λq̃; qd y q̃ como se definieron en 3.4.1.
La ley de control se puede reescribir como:
τ = Ψϕ̂0 − KvS + Ψϕ − Ψϕ = Ψϕ − KvS + Ψϕ̃; con ϕ̃ � ϕ̂0 − ϕ.
En lazo cerrado en la Ecuación del sistema (2.1):
H(q)(q̈ − q̈v) + C(q, q̇)(q̇ − q̇v) + D(q̇ − q̇v) + KvS = Ψϕ̃
por la definición de S :
H(q)Ṡ + C(q, q̇)S + (Kv + D)S = Ψϕ̃ (3.5)
Si se propone como candidata a función Lyapunov:
V = 1
2
ST H(q)S + 1
2
ϕ̃T Γϕ̃
4La condición de convergencia paramétrica para control adaptable de sistemas no
lineales y lineales se conoce como excitación persistente y en general implica que la
señal de referecia contenga suficiente “riqueza” frecuencial para estimular la dinámica de
adaptación. Para sistemas lineales en general se requieren m/2 frecuencias para la conver-
gencia de m parámetros desconocidos. Para sistemas no lineales con parametrización lineal
la regla aplica sobre la matriz regresora, tal que
∫ T
0 Ψ
T Ψdt > αI para un determinado
tiempo T y α > 0
39
que derivando:
V̇ = 1
2
ST ˙H(q)S + ST H(q)Ṡ + ϕ̃T Γ ˙̃ϕ
sustituyendo H(q)Ṡ de 3.5 y dado que ˙̃ϕ = ˙̂ϕ0 = −Γ−1ΨT S, se tiene:
V̇ = −ST (D + Kv)S ≤ 0
Se puede alcanzar un resultado de estabilidad si S → 0, cuando t → ∞.
El lema de Barbalat permite obtener este resultado. Dado que V tiene un
ĺımite inferior y V̇ ≤ 0, entonces V (t) ≤ V (0) y S y ϕ̃ están acotados (aśı co-
mo los términos asociados q, q̇, q̈, qd, q̃, ˙̃q). Puesto que V̈ = −2ST (D +Kv)Ṡ
está acotada (Ṡ está en función de términos acotados) entonces V̇ → 0 con
t → ∞ ⇒ S → 0 cuando t → ∞.
3.4.3. Control Robusto
La implementación de la ley de control ( 3.1) requiere que el modelo
dinámico y los parámetros asociados se conozcan de manera precisa y además
que el conjunto de ecuaciones de movimiento se pueda calcular en tiempo re-
al. En la práctica, tales requerimientos son dif́ıciles de satisfacer. Para los
sistemas f́ısicos siempre existirá incertidumbre respecto a los valores de los
parámetros que lo describen. Por su parte la ley de control (3.4) representa
un avance permitiendo incertidumbre paramétrica, pero con la premisa de
la certeza del modelo dinámico. Prácticamente siempre habrá cancelaciones
inexactas de las no linealidades del sistema debido a las incertidumbres, el
redondeo computacional, etc. El siguiente paso natural hacia una expresión
de control es una ley que tolere la incertidumbre paramétrica y de modelado.
Con relación a la parametrización lineal ( 3.3), cuando se puede hacer una
aseveración del valor ρ tal que ‖ϕ̂0 − ϕ‖ ≤ ρ, siendo ϕ el valor real del vector
de parámetros, entonces puede aplicarse una ley de control que compensa la
incertidumbre del vector nominal ϕ̂0, tal que :
τ = Ψa − KvS + ΨaU (3.6)
donde:
40
U =
{
-ρ Ψ
T
a S
‖ΨTa S‖
∥∥ΨTa S∥∥ > �
-ρΨTa S/� Ψ
T
a S ≤ �
con:
Kv = D + K, K > 0 diagonal, y Ψa como en (( 3.3)) [2].
Procediendo como en la sección anterior, sumando y restando a la expresión
(3.6) el valor real ϕ, en lazo cerrado en la Ecuación (2.1) y de la definición
de S :
H(q)Ṡ + C(q, q̇)S + KvS = Ψa(ϕ̃ + U) (3.7)
con ϕ̃ = ϕ̂0 − ϕ
Proponiendo como candidata a función Lyapunov:
V = 1
2
ST H(q)S + qT ΛKvq̃
Derivando V, sustituyendo H(q)Ṡ de (3.7), y por Ḣ − 2C = 0, se tiene:
V̇ = STΨaϕ̃ + S
T ΨaU + 2q̃
T ΛKv ˙̃q − ST KvS
de la definición de S, desarrollando:
ST KvS = ˙̃q
TKv ˙̃q + q̃
T ΛKvΛq̃ + 2 ˙̃q
T KvΛq̃
Si se definen x = [q̃; ˙̃q]T y Q =
[
ΛKvΛ 0
0 Kv
]
, se tiene:
V̇ = STΨa(ϕ̃ + U) − xT Qx
CASO A:
∥∥ΨTa S∥∥ > �
V̇ = STΨAϕ̃ − ρST ΨA‖ΨTa S‖ S
T ΨA − xT Qx ≤
∥∥ΨTa S∥∥ ‖ϕ̃‖ − ρ ∥∥ΨTa S∥∥− xT Qx
41
pero por definición ‖ϕ̃‖ ≤ ρ
V̇ ≤ 0
CASO B:
∥∥ΨTa S∥∥ ≤ �
V̇ = STΨAϕ̃ − ρ�
∥∥ΨTa S∥∥2≤ ∥∥ΨTa S∥∥ ρ − ρ� ∥∥ΨTa S∥∥2
el lado derecho de la desigualdad representa una ecuación en
∥∥ΨTa S∥∥ con
un valor máximo en el intervalo [0, �] de �ρ
4
en
∥∥ΨTa S∥∥ = �2 , por tanto:
V̇ ≤ −xT Qx + �ρ
4
Para matrices positivas definidas como Q existen los eigenvalores λmin(Q), λmax(Q)
tales que:
λmin(Q) ‖x‖2 ≤ xT Qx ≤ λmax(Q) ‖x‖2
por tanto
V̇ ≤ −λmin(Q) ‖x‖2 + �ρ4
aśı mismo para toda función cuadrática como V ∃λ1, λ2 > 0 tales que:
λ1 ‖x‖2 ≤ V ≤ λ2 ‖x‖2
si, V̇ < 0 ⇒ V (t) ≤ V (t0), por tanto
‖x‖ ≤
√
λ2
λ1
‖x(t0)‖
para que V̇ < 0 es necesario que:
‖x‖ > 1
2
√
�ρ
λmin(Q)
(I)
aśı que, cuando V̇ > 0, ‖x‖ crece hasta que (I) se vuelve a satisfacer y
V̇ < 0, y ‖x‖ está acotado por:
42
‖x‖ < 1
2
√
λ1
λ2
√
�ρ
λmin(Q)
y se tiene un resultado de estabilidad práctica.
3.4.4. Modos deslizantes
El control por modos deslizantes es un tipo de control de los denominados
de estructura variable. Un controlador robusto fuerza a los estados, combina-
dos en una variable deslizante, a alcanzar una superficie o modo deslizante, en
la que la dinámica se reduce. La dinámica se conserva en el modo deslizante,
sobre el cual se persigue la convergencia a cero del error de seguimiento. Los
modos deslizantes convencionales (lineales) son un control relevado basado
en la función signo, lo que resulta en controladores de alta ganancia y con un
efecto indeseable conocido como troceo o chattering, que es la conmutación
excesivamente rápida de la señal de control. Ante la poca practicidad de los
Modos Deslizantes Lineales, se han desarrollado otras formas como los Mo-
dos Deslizantes Terminales, tipo de control basado en una función “suave”
(en vez de la función discontinua signo) que resulta en un esfuerzo de control
reducido en el transitorio y atenuación del chattering. Se revisan a continua-
ción dos de estos algoritmos.
MODOS DESLIZANTES TERMINALES I: MDT1 [15]
Pártase nuevamente de la parametrización lineal del sistema, con vector de
parámetros nominales ϕ̂0 tal que ‖ϕ̂0 − ϕ‖ ≤ ρ . Sea la ley de control :
τ = Ψ(q, q̇, q̇r, q̈r)(ϕ̂0 + w) − Ksr (3.8)
con :
q̇r = q̇d − Λq̃p
q̈r = q̈d − pΛdia[q̃1p−1...q̃np−1] ˙̃q
q̃p � [q̃1p...q̃np]T
sr � [sr1...srn]T
43
s = ˙̃q + Λq̃p
1
2
< p ≤ 1, 0 < r ≤ 1; K, Λ > 0, diagonales
w =
{
-ρ Ψ
T s
‖ΨT s‖
∥∥ΨT s∥∥ > 0
0
∥∥ΨT s∥∥ = 0
De (3.8) en lazo cerrado en (2.1):
H(q)ṡ + C(q, q̇)s + Ksr = Ψ(q, q̇, q̇r, q̈r)(ϕ̃ + w)
Proponiendo como candidata a función Lyapunov:
V = 1
2
sT H(q)s
derivando V y por Ḣ − 2C = 0, se tiene:
V̇ = −sT Ksr + sT Ψ(ϕ̃0 + w) (3.9)
Para el término sT Ksr se tiene:
sT Ksr =
∑n
i=1 kis
r+1
i ≥ α
{∑n
i=1
1
2
m̄s2i
}η ≥ αV η
con η � (1 + r)/2, α � kmin
{
2
m̄
}η
, con kmin � mini {ki}
cuando
∥∥ΨT s∥∥ = 0 el término sT Ψ(ϕ0 + w) es cero , y de las definiciones de
w y ρ cuando
∥∥ΨT s∥∥ > 0, se tiene:
sT Ψ(ϕ̃0 + w) = s
T Ψ
(
ϕ̃ − ρ ΨT s‖ΨT s‖
)
≤ ∥∥sT Ψ∥∥ (‖ϕ̃‖ − ρ) ≤ 0
en resumen, conjuntando los resultados para los dos términos de (3.9):
V̇ (t) ≤ −αV η, ∀t ≥ 0 (3.10)
Un lema de desigualdades diferenciales establece que, siendo V(t) una
función positivadefinida cuya derivada satisface (3.10), ∀t0 ≥ 0, V (t0) ≥ 0
con α > 0, 0 < η < 1, entonces, V (t) = 0, ∀t ≥ t1 con t1 = t0 + V 1−η(t0)α(1−η) .
44
Dado lo anterior, el algoritmo de control conduce a señales uniformemente
acotadas y a un error de seguimiento q̃(t) = 0 para t ≥ tT con tT < ∞
MODOS DESLIZANTES TERMINALES II: MDT2 [15]
Respecto al control anterior [15], en cuyo algoritmo aparece el término ρ,
tal que ‖ϕ̂0 − ϕ‖ ≤ ρ, y un término w cuyo valor depende de la magnitud∥∥ΨT s∥∥, se propone una variación del control en la cual se estime ρ y la ex-
presión de w conste de un sólo término. Lo anterior implica, por un lado, que
no sea necesario el conocimiento a prioi de ρ, y por otro lado, que la ley de
control adquiera una expresión más sencilla. Sea pues:
˙̂ρ = −σρ̂ + γ ‖Ψ
T s‖
‖ΨT s‖+�
y
w = −ρ̂ ΨT s‖ΨT s‖+�
con �, σ, γ > 0, conservándose todos los demás términos como en el con-
trol anterior.
De (3.8) en lazo cerrado en (2.1) con las nuevas expresiones de w y ρ, y
de la definición de s, se tiene la siguiente dinámica para el error:
H(q)ṡ + C(q, q̇)s + Ksr = Ψ(q, q̇, q̇r, q̈r)(ϕ̃ + w)
Sea la candidata a función Lyapunov:
V = 1
2
sT H(q)s + 1
2γ
ρ̃2, con ρ̃ � ρ̂ − ρ
de donde la derivada de V sobre las trayectorias de la dinámica del error, es:
V̇ = sT H(q)ṡ + 1
2
sT ˙H(q)s + 1
γ
ρ̃ ˙̃ρ
45
V̇ = sT [−C(q, q̇) − Ksr + Ψ(ϕ̃ + w)] + 1
γ
ρ̃ ˙̂ρ + 1
2
sT ˙H(q)s
V̇ = −sT Ksr + sT Ψ(ϕ̃ + w) + 1
γ
ρ̃ ˙̂ρ
o de la definición de w y ρ̂
V̇ = −sT Ksr︸ ︷︷ ︸
−κ
+ sTΨ
(
ϕ̃ − ρ Ψ
T s
‖ΨT s‖ + �
)
︸ ︷︷ ︸
λ
−ρ̃
∥∥ΨT s∥∥2
‖ΨT s‖ + � +
1
γ
ρ̃ ˙̃ρ︸ ︷︷ ︸
µ
Del inciso anterior para κ:
κ ≥ αV η
además para λ:
λ ≤ ∥∥ΨT s∥∥(‖ϕ̃‖ − ρ ‖ΨT s‖‖ΨT s‖+�
)
si
∥∥ΨT s∥∥ ≤ � :
λ ≤ �
2
ρ
si
∥∥ΨT s∥∥ >> � :
λ ≤ 0.
Para µ, dado que ˙̂ρ = ˙̃ρ, y de la definición de ρ̃:
µ = ρ̃
γ
(
˙̃ρ − γ ‖Ψ
T s‖
‖ΨT s‖+�
)
µ = σ
γ
ρ̂ρ̃
µ = −σ
γ
ρ̂2 + σ
γ
ρ
46
Conjuntando los resultados se puede establecer que:
V̇ ≤ −αV η − σ
γ
ρ̂2 + K
siendo K = σ
γ
ρ + �
2
ρ una constante positiva que depende del parámetro
constante desconocido ρ, pero también de los parámetros controlables γ, �
y σ. En cualquier caso, cuando V̇ > 0, V aumenta hasta que nuevamente
V̇ < 0 y se tiene un resultado de estabilidad práctica.
MODOS DESLIZANTES TERMINALES III: NMDT [16]
Otra forma de Modos Deslizantes Terminales que ofrece un desempeño rápi-
do y de alta precisión, es la presentada a continuación. Sea la representación
del sistema en la forma:
H(q)q̈ + C(q, q̇)q̇ + g(q) = τ + τd + F (q, q̇, q̈) (3.11)
representando τ el control, τd un vector de perturbación externa acotada
y F (q, q̇, q̈) incertidumbre concentrada del sistema. Sea pues, la siguiente ley
de control:
τ = τ0 + τ1 (3.12)
donde:
τ0 = H(q)q̈d + C(q, q̇)q̇ + g(q)
τ1 = −H(q)(k1s − k2sig(s)ρ)
siendo el modo deslizante:
47
s = q̃ + βsig( ˙̃qγ) = 0
con:
k1 = diag(k11, ..., k1n), k2 = diag(k21, ..., k2n), k1i > 0, k2i > 0, β = diag(β1, ..., βn),
βi > 0, 0 < γi < 1, 0 < ρ = ρi = ... = ρn < 1.
definiéndose sig(x)γ como: sig(x)γ = [|x1|γ1 sign(x1)...sig(x)γ |xn|γn sign(xn)].
Para analizar las propiedades de estabilidad de la ley de control (3.12), se
presenta el Lema 1 y una forma extendida de Lyapunov para estabilidad en
tiempo finito para modos deslizantes términales [16]:
Lema 1: Supóngase que a1, a2, ..., an y 0 < p < 2 son todos números posi-
tivos, entonces se cumple la siguiente desigualdad:
a21 + a
2
2 + ... + a
2
n ≤ (ap1 + ap2 + ... + apn)2
Forma extendida de Lyapunov para MDT:
V̇ (x) + αV (x) + βV γ(x) ≤ 0, 0 < γ < 1
.
Sea la candidata a función Lyapunov:
V = ‖s‖
2
2
Derivando V, sustituyendo (3.12) y utilizando el Lema 1, se tiene:
V̇ = sT βγdiag(
∣∣ ˙̃q∣∣γ−1)H(q)−1(τ1 + F + τd) (3.13)
Para F=0 y τd = 0 (3.13) se puede expresar como:
V̇ = −sTk1s − sTk2sig(s)p
con k1 = βγdiag(
∣∣˜̇qγ−1∣∣)k1 ∈ Rnxn y k2 = βγdiag(∣∣˜̇qγ−1∣∣)k2 ∈ Rnxn son
48
matrices diagonales positivas definidas si cualquier ˙̃qi 
= 0. Del Lema 2, se
tiene:
V̇ ≤ −2k1V − 2(p+1)/2k2V (p+1)/2
donde k1 = minik1i > 0 y k2 = minik2i > 0 son los mı́nimos eigenval-
ores de k1 y k2 respectivamente y 1/2 < (p+1)/2 < 1. De acuerdo al criterio
de estabilidad en tiempo finito, el modo deslizante terminal se alcanzará en
tiempo finito y posteriormente el error de seguimiento q̃ convergirá a cero
también en tiempo finito.
II: Para F 
= 0 y τd 
= 0 la trayectoria del sistema converge a la vecindad
del TSM s=0 tal que:
‖s‖ ≤ ∆ = min∆1, ∆2,
∆1 =
‖M−10 (q)‖(b0+b1‖q‖+b2‖q̇‖2)
k1
, ∆2 =
(‖M−10 (q)‖(b0+b1‖q‖+b2‖q̇‖2)
k2
)1/p
,
donde ‖F (q, q̇, q̈)‖ ≤ b0 + b1 ‖q‖ + b2 ‖q̇‖2 y τd ≤ d
El error de seguimiento q̃i y ˙̃q convergen a las regiones:
|q̃i| ≤ ∆q̃ = 2∆,
∣∣ ˙̃qi∣∣ ≤ ∆ ˙̃q = (∆βi)1/γi en tiempo finito5.
3.4.5. Compensación de fricción: observador
El término de fricción FL se puede integrar al modelo (2.1) como un
término aditivo
H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ − FL (3.14)
Un esquema de control que compense el fenómeno de fricción debe incluir
un estimador que prediga su valor. Este estimador ha de basarse en un mo-
delo de fricción, en el caso considerado, el modelo LuGre, el cual como ya se
5La demostración de las propiedades enunciadas resulta extensa y no se consigna en
este trabajo. Puede consultarse en [16]
49
vió depende de seis parámetros, es dinámico y tiene un estado no medible z.
Si se asume que se conocen los parámetros σ0, σ1, σ2 y g(v) de (2.8) y (2.9)
se puede usar un observador no lineal de fricción, tal que:
dẑ
dt
= v − |v|
g(v)
ẑ − ke
F̂L = σ0ẑ + σ1
dẑ
dt
+ σ2v
donde e = x − xd es el error de posición y xd es la posición deseada que se
asume 2 veces diferenciable.
El diagrama a bloques de la Figura 3.2 describe al sistema con la adición de
la fuerza de fricción y el observador correspondiente:
Figura 3.2: Diagrama a bloques del sistema con fricción y observador de
fricción
Como se mencionó en la sección 2.7.2, no se presenta en este trabajo
prueba formal de estabilidad del sistema de control ante la presencia de
fricción ni tras la inclusión del observador de fricción. Este trabajo se limita
a incorporar la fricción como una dinámica no modelada, en su oportunidad
simplemente compensada con la ayuda del observador ya presentado6.
6En [7] se demuestra que cuando los parámetros de fricción se conocen, el error del
50
3.5. Comparación cualitativa entre algoritmos
PD+
Presenta la estructura más simple, con un término que compensa no line-
alidades. La convergencia asintótica se asegura para el caso nominal y sólo
una alta ganancia asegura un desempeño adecuado para casos no nominales.
Es el control con más exigencias a priori y restricciones.
Control Adaptable
Permite lidiar con incertidumbre paramétrica, pero parte de la premisa de
estructura conocida. Se sabe que su respuesta ante perturbaciones o dinámi-
cas no modeladas no es muy buena. Los parámetros convergen en condición
de exitación persistente, pero en caso de exitación no persistente o dinámicas
no modeladas puede ocurrir un problema de deriva: el error de seguimiento
puede mentenerse pequeño en tanto los parámetros divergen de los reales
hasta un punto tal en que el sistema se vuelve inestable. Respecto al control
PD+, aumenta el número de expresiones y por los problemas conocidos de
deriva resulta un tipo de control que no se autosustenta en términos prácticos.
Control Robusto
Este control es un paso adelante respecto al controlador adaptable. Igual
que en el control adaptable se parte del supuesto que el vector de parámetros
nominales difiere del real, pero en vez de implementar una ley de adaptación
para el vector de parámeros nominales, se compensa la ley de control con un
término que depende de la magnitud del error entre los parámetros nominales
y los reales. Esta aproximación solventa el problema de deriva de parámetros,
evitando que el sistema escape y se desestabilice. A fin de cuentas se alcanza
un resultado de estabilidad práctica al estar los estadosultimadamente aco-
tados en función de parámetros manipulables. Este resultado de estabilidad
es menos fuerte que el del caso adaptable, pero más robusto ante dinámi-
cas no modeladas y perturbaciones. Se advierte en el controlador robusto un
compromiso entre la cota final del vector de estados y la ganacia del control,
al ser estas dos magnitudes inversamente proporcionales.
observador de fricción converge asintóticamente a cero
51
Control por Modos Deslizantes
MDT1
El control MDT1 al igual que el control robusto, compensa la incertidum-
bre en el vector de parámetros, pero el término de compensación w es un
término de magnitud constante que se aplica sólo cuando existe error de
seguimiento. A diferencia de los controladores previos que presentan en la
ley de control un término proporcional al error de seguimiento y a la tasa de
error de seguimiento, esta ley de control presenta una función exponencial
fraccionaria de dichas magnitudes. Esto tiene como efecto un control suave
y con magnitudes menores a los casos anteriores (en la etapa transitoria),
pero que usualmente requiere tiempos de respuesta mayores. La expresión
de control resulta la más sencilla entre los controladores deslizantes revisa-
dos, además de alcanzar un fuerte resultado de estabilidad, como lo es el de
señales uniformenmente acotadas y convergencia del error de seguimiento a
cero en tiempo finito.
MDT2
Partiendo de MDT1, la ley MDT2 propone una simplificación a la expresión
de control para el término w, aśı como un esquema adaptable para establecer
el valor del término ρ. El esquema MDT2 representa una mejora respecto a
MDT1 en los rubros de simplicidad del algoritmo y cantidad de información
a priori (al no tener que conocerse de antemano el valor de ρ). Sin embargo
para MDT2 se establece un resultado de estabilidad menos fuerte que para
MDT1: estabilidad práctica.
NMDT
La expresión de control resulta la más compleja de las revisadas, pero aśı mis-
mo la más completa al incluir términos que compensan expĺıcitamente las
perturbaciones y dinámicas no modeladas. Los resultados de estabilidad
obtenidos son fuertes: de convergencia del error a cero en tiempo finito para
casos nominales y de estabilidad práctica para el caso con perturbación.
52
Caṕıtulo 4
Simulación: Comparación
cuantitativa
4.1. Introducción
En este caṕıtulo se realizan simulaciones del sistema para las leyes de
control revisadas en el caṕıtulo anterior con lo que se pueden comparar cuan-
titativamente los distintos algoritmos. En la sección 4.2 se presentan señales
reales caracteŕısticas del movimiento del tipo de buque de interés, las cuales
se usan para alimentar las simulaciones.
En la sección 4.3 se hacen consideraciones respecto a la aproximaciónes di-
recta e indirecta al realizar la disposición de los sensores que miden el giro
alrededor de los ejes de interés, haciendo alusión a los resultados de [6].
Aśı mismo se ejemplifica como se realizan las mediciones angulares en el es-
quema de control propuesto.
En la sección 4.5 se presenta una estrategia que permite disminuir signi-
ficativamente la amplitud de las transiciones abruptas de la señal de control,
al suavizar las derivadas de las señales de referencia.
En la sección 4.6 se resume en una tabla los algoritmos de control revisa-
dos y se presentan las gráficas resultantes de las simulaciones de control del
sistema representado por la Ecuación (2.7) para varias condiciones.
53
En la sección final se realiza la comparación cualitativa del desempeño de
los controladres. Se presenta una tabla de parámetros ponderados en base a
los cuales se califica el desempeño de los algoritmos.
4.2. Señal caracteŕıstica de la mar
Como se adelantó en la sección 3.3 el movimiento que se experimenta
sobre un barco depende de factores muy diversos, como por ejemplo, la ve-
locidad de navegación (que para las embarcaciones de interés es de 0 a 20
nudos1), el sentido de movimiento, el estado de la mar, incluso la disposición
de la carga al interior del buque.
En general se pueden identificar 4 tipos de movimiento importantes del
buque, a saber: el movimiento hacia adelante, el movimiento hacia atrás, el
movimiento de cambio de rumbo y el estado en el que el buque debe conser-
var su posición respecto al fondo del mar, en lenguaje marinero se denomina
“estar al pairo”.
Las gráficas de la Figura 4.1 presentan un conjunto de señales caracteŕısticas
de los movimiento de rotación que experimenta un buque a la mar y permiten
tener una idea de las perturbaciones a que se ve sometido un sensor abordo
de una embarcación.
Las señales que se presentan fueron obtenidas de giros de estado sólido
en un buque de la marina de México. Cabe resaltar que la frecuencia de
muestreo es de entre 9 y 10 Hz por limitaciones de las giros usadas. Ello indica
que de acuerdo al teorema de Nyquist2 tal frecuencia de muestreo captura
fenómenos en frecuencias dentro del rango de 0 a 5 hertz. Se tiene reportado
que para las embarcaciones de interés, existe una componente de vibración
persistente alrededor de 15 Hz, la cual se atribuye al conjunto estructura-
sistema de máquinas del buque. No obstante, esta frecuencia resulta muy
alta comparada con la dinámica del mar y su componente de enerǵıa es
1Un nudo, knt equivale a 0.515 m/s
2La frecuecia de muestreo debe ser al menos el doble del ancho de banda de la señal
de entrada, si el criterio no es satisfecho existirán frecuencias cuyo muestreo coincide con
el de otra(s)-el denominado aliasing-
54
Figura 4.1: Señal caracteŕıstica de las rotaciones en una embarcación a la
mar. El eje horizontal tiene escala en segundos y el vertigal en grados
soslayable comparada con la enerǵıa de las frecuencias por abajo de 5 Hz.
La Figura 4.2 muestra un par de movimientos de buque hacia adelante, los
espectros permiten ver el rango de frecuencia en que ocurre el fenómeno de
perturbación.
Las datos de las señales reales de giro se usan en las simulaciones com-
putacionales que se presentan en la seccion final.
4.3. Sensores de giro y su disposición f́ısica:
aproximación directa e indirecta
La disposición del sensor de giro en una aplicación de estabilzación puede
tener un impacto significativo en el desempeño del sistema. En este sentido,
existen dos aproximaciones al problema de sensado de giro, la directa y la
indirecta.
55
Figura 4.2: Señales caracteŕısticas de un par de movimientos del buque hacia
adelante
La aproximación directa, consiste en establecer los sensores de giro di-
rectamente sobre la ĺınea de vista.
En la aproximación indirecta, se establecen los sensores en la base de
la plataforma. Por ende si la tarea es estabilizar la LOS, deben aplicarse las
transformaciones necesarias para obtener la perturbación equivalente alrede-
dor del eje de referencia de la LOS. La relación entre la perturbación real
alrededor de la LOS y aquella medida en la base de la plataforma depen-
derá de la geometŕıa de la plataforma, su rigidez estructural, la precisión de
los sensores de posición (tacómetro y o codificador de posición), juegos entre
los mecanismos de transmisión de movimiento, etc.
En resumen, puede establecerse lo siguiente respecto a la dispocición de los
56
sensores de giro en una aplicación de estabilización:
Aproximación directa
• El sensor o sensores se montan directamente sobre la LOS.
• La corrección de la perturbación es directa
• Dependiendo del tamaño del sensor, puede impactar el tamaño de
la base y limitar rangos de movimiento.
• El método directo ofrece ventajas para aplicaciones de precisión
pues las perturbaciones se miden directamente sobre ĺınea de vista.
Aproximación indirecta
• El sensor o sensores se montan en la base de la plataforma.
• No se miden las perturbaciones alrededor de la LOS.
• La perturbación alrededor de la LOS se obtiene mediante trans-
formaciones.
• Las ventajas de esta configuración son de tipo

Otros materiales