Analisis-comparativo-de-algoritmos-para-el-control-de-la-LOS-de-un-sensor-sobre-una-plataforma-movil

Ciencias Sociales

•
Humanas / Sociais

Contenido de Estudio
30.9.2022
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Ciencias Sociales

81.962 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO 
 PROGRAMA DE MAESTRÍA Y DOCTORADO EN 
 INGENIERÍA 
 
 FACULTAD DE INGENIERÍA 
 ANÁLISIS COMPARATIVO DE ALGORITMOS 
 PARA EL CONTROL DE LA LOS DE UN SENSOR 
 SOBRE UNA PLATAFORMA MÓVIL 
T E S I S 
 QUE PARA OPTAR POR EL GRADO DE: 
 MAESTRO EN INGENIERÍA 
 ÁREA: ELÉCTRICA – CAMPO: CONTROL 
 P R E S E N T A : 
 SERGIO ATAYDE DEL MORAL 
 TUTOR: 
 DR. YU TANG XU 
 2007 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
JURADO ASIGNADO: 
Presidente: Dr. Gerardo René Espinosa Pérez 
Secretario: Dr. Luis Agustín Álvarez Icaza Longoría 
Vocal: Dr. Yu Tang Xu 
1er. Suplente: Dr. Héctor Pérez Benítez 
2do. Suplente: Dr. Marco Arteaga Pérez 
Lugar donde se realizó la tesis:
México, D.F., Ciudad Universitaria 
TUTOR DE TESIS: 
Dr. Yu Tang Xu 
_________________________________ 
FIRMA 
AGRADECIMIENTOS
Agradezco a mi asesor el Doctor Yu Tang Xu por dirigir este trabajo de tesis. 
Agradezco a los sinodales por el tiempo que dedicaron a revisar y comentar este trabajo de tesis. 
Agradezco al Colegio de Control de la DEPFI por sus enseñanzas durante el curso de las asignaturas 
de la maestría en control. 
Agradezco al Consejo Nacional de Ciencia y Tecnología, CONACYT, por su apoyo económico al 
concederme una beca de maestría, a través del programa de Formación de Científicos y Tecnólogos. 
Agradezco a la Secretaría de Marina por el apoyo y las facilidades prestadas para la realización de 
este trabajo, en particular al Capitán de Corbeta y Maestro en Ingeniería Alberto Fuentes Maya y al 
Almirante Laureano Suárez Allen 
 Sergio Atayde Del Moral 
 2007 
Análisis comparativo de algoritmos
para el control de la LOS de un
sensor sobre una plataforma móvil
Sergio Atayde Del Moral
2007
Índice general
1. Introducción 9
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1. Orientación de la LOS . . . . . . . . . . . . . . . . . . 11
1.2.2. Estabilización de la LOS . . . . . . . . . . . . . . . . . 11
1.3. Definición geométrica de la tarea de control . . . . . . . . . . 12
1.4. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5. Ubicación de este trabajo de tesis . . . . . . . . . . . . . . . . 14
1.6. Contribución . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Modelo del sistema 16
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2. Configuración cinemática . . . . . . . . . . . . . . . . . . . . . 16
2.3. Marcos de referencia: Convención
Denavit-Hartenberg . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4. Relaciones cinemáticas de la plataforma . . . . . . . . . . . . 19
2.5. Sistemas Lagrangianos . . . . . . . . . . . . . . . . . . . . . . 21
2.5.1. Modelado mediante métodos energéticos:
Ecuaciónes Euler-Lagrange [3] . . . . . . . . . . . . . 21
2.5.2. Desarrollo de las ecuaciones Euler-Lagrange para ma-
nipuladores mecánicos de n grados de libertad . . . . . 23
2.6. Desarrollo del modelo . . . . . . . . . . . . . . . . . . . . . . . 26
2.7. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . 29
2.7.1. Fenómeno de fricción [8] . . . . . . . . . . . . . . . . . 29
2.7.2. Modelo de fricción LuGre [7] . . . . . . . . . . . . . . 30
3. Algoritmos de Control: Comparación cualitativa 32
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1
3.2. Control de Orientación . . . . . . . . . . . . . . . . . . . . . . 33
3.3. Control de Estabilización . . . . . . . . . . . . . . . . . . . . . 34
3.3.1. Estabilización de balanceo: Grado de libertad “virtual”
en balanceo . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4. Métodos de control para manipuladores . . . . . . . . . . . . . 36
3.4.1. PD+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4.2. Control Adaptable . . . . . . . . . . . . . . . . . . . . 38
3.4.3. Control Robusto . . . . . . . . . . . . . . . . . . . . . 40
3.4.4. Modos deslizantes . . . . . . . . . . . . . . . . . . . . . 43
3.4.5. Compensación de fricción: observador . . . . . . . . . . 49
3.5. Comparación cualitativa entre algoritmos . . . . . . . . . . . . 51
4. Simulación: Comparación cuantitativa 53
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2. Señal caracteŕıstica de la mar . . . . . . . . . . . . . . . . . . 54
4.3. Sensores de giro y su disposición f́ısica: aproximación directa
e indirecta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4. Señal de referencia: aproximación directa . . . . . . . . . . . . 57
4.5. Suavización de señales de simulación . . . . . . . . . . . . . . 58
4.6. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.7. Comparación Cualitativa . . . . . . . . . . . . . . . . . . . . . 73
5. Conclusiones 80
5.1. Conclusiones, aportación y trabajo futuro . . . . . . . . . . . 80
A. Códigos y Diagramas para las simulaciones en Simulink 82
B. Grado de libertad virtual en eje de balanceo 89
C. Suavización de señales 93
2
Índice de figuras
1.1. Rotaciones de una embarcación . . . . . . . . . . . . . . . . . 10
1.2. Tareas de control: orientación y estabilización . . . . . . . . . 12
1.3. Disposición de ejes para formar la señal de referencia . . . . . 13
2.1. Plataforma de dos Grados de Libertad . . . . . . . . . . . . . 17
2.2. Representación general de plataforma 2GDF . . . . . . . . . 18
2.3. Disposición de ejes para la plataforma 2DOF . . . . . . . . . 20
2.4. Cuerpos simples para representar a la plataforma de dos gra-
dos de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5. Cerdas microscópicas entre dos superficies en contacto . . . . 30
3.1. Esquema de control. Las lecturas del sensor de giro alimentan
las correcciones mecánicas en cabeceo y guiñada y la correción
en balanceo de la imagen. . . . . . . . . . . . . . . . . . . . . 36
3.2. Diagrama a bloques del sistema con fricción y observador de
fricción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1. Señal caracteŕıstica de las rotaciones en una embarcación a la
mar. El eje horizontal tiene escala en segundos y el vertigal en
grados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2. Señales caracteŕısticas de un par de movimientos del buque
hacia adelante . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3. Disposición de ejes para formar la señal de referencia . . . . . 58
4.4. Señales de velocidad y aceleración caculadas con diferenciación
numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5. Señales de velocidad y aceleración caculadas con diferenciación
numérica y suavizadas . . . . . . . . . . . . . . . . . . . . . . 60
4.6. Señal de referencia para guiñada (a) y cabeceo (b) . . . . . . . 62
3
4.7. Señales de error para simulaciones de las leyes decontrol de la
Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas-
suavizadas-. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.8. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas
-suavizadas-. (detalle). . . . . . . . . . . . . . . . . . . . . . . 64
4.9. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo (2.7), con señales de referencia
filtradas-suavizadas-. . . . . . . . . . . . . . . . . . . . . . . . 65
4.10. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo 2.6, con señales de referencia no
filtradas (contrástese con la Figura 4.9) . . . . . . . . . . . . 67
4.11. Señales de fricción t́ıpica inyectada . . . . . . . . . . . . . . . 68
4.12. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo 2.6 con referencias filtradas y fricción
no compensada . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.13. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción
no compensada (detalle) . . . . . . . . . . . . . . . . . . . . . 70
4.14. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y
fricción no compensada . . . . . . . . . . . . . . . . . . . . . 71
4.15. Señales de error para simulaciones de las leyes de control de
la Tabla 4.1 en el modelo (2.7) con fricción compensada . . . 72
4.16. Señales de error para simulaciones de las leyes de control de la
Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción
compensada (detalle) . . . . . . . . . . . . . . . . . . . . . . 73
4.17. Señales de control para simulaciones de las leyes de control
de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y
fricción compensada . . . . . . . . . . . . . . . . . . . . . . . 74
4.18. Señales de fricción “real” y observada con detalle de conver-
gencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.19. Enerǵıa de la señal de error . . . . . . . . . . . . . . . . . . . 76
4.20. Enerǵıa de la señal de control . . . . . . . . . . . . . . . . . . 77
A.1. Modelo de simulación en Simulink . . . . . . . . . . . . . . . 83
4
B.1. Ejes de referencia convencionales para el manejo de imágenes
digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
B.2. Ejes de referencia propuestos . . . . . . . . . . . . . . . . . . 90
B.3. Rotación de n grados, algoritmo con pixeles ciegos . . . . . . 91
B.4. Rotación de n grados, algoritmo sin puntos ciegos . . . . . . . 92
C.1. Señal escalonada (ĺınea sólida) y su contraparte “suavizada”(ĺınea
discontinua) . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5
Índice de cuadros
2.1. Tabla de parámetros D-H . . . . . . . . . . . . . . . . . . . . 20
2.2. Tabla de Momentos de Inercia . . . . . . . . . . . . . . . . . 27
4.1. Tabla de leyes de control . . . . . . . . . . . . . . . . . . . . 61
4.2. Tabla de resultados: Tanto en las calificaciones de los incisos
como en el renglón de Índice Final, una cifra menor representa
un mejor desempeño . . . . . . . . . . . . . . . . . . . . . . . 78
4.3. Tabla de ponderación de incisos de comparación . . . . . . . 79
4.4. Ejemplo del cálculo del Índice Final para el control PD+ . . . 79
A.1. código de control (1) . . . . . . . . . . . . . . . . . . . . . . . 85
A.2. código de control (2) . . . . . . . . . . . . . . . . . . . . . . . 86
A.3. Modelo de aceleración . . . . . . . . . . . . . . . . . . . . . . 87
A.4. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . 87
A.5. Observador de fricción . . . . . . . . . . . . . . . . . . . . . . 88
6
Prefacio
Organización de la tesis
En esta tesis se analiza comparativamente el desempeño de varios algo-
ritmos de control aplicados a la estabilización y orientación de la ĺınea de
vista de un sensor montado en una plataforma movil en un ambiente con
perturbaciones. Siendo más espećıficos, el sensor de interés es una cámara
de video montada en una embarcación1, por tanto las perturbaciones son las
propias del medio marino, principalmente el oleaje.
La tesis se organiza de la siguiente manera:
El Caṕıtulo 1 es una introducción en la que se presenta la motivación de
este trabajo de tesis, revisándose el contexto en el que es deseable lograr la
orientación y estabilización de dispositivos mediante el empleo de platafor-
mas moviles. Una vez descrita la problemática se establecen los objetivos
de control. Se mencionan aśı mismo, trabajos en los que se han desarrollado
varias aproximaciones a la tarea de manipulación de plataformas. Por último,
se ubica este trabajo de tesis y se resaltan las contribuciones del mismo.
En el Caṕıtulo 2 se desarrolla un modelo del sistema plataforma móvil.
Primero se propone una configuración cinemática para la plataforma y a
continuación se emplea la convención Denavit-Hartenberg para establecer
marcos de referencia y obtener las matrices de transformación asociadas.
Después se hace una breve revisión del modelado mediante métodos energé-
ticos (indicador variacional, variables de flujo y esfuerzo) y de las ecuaciones
Euler-Lagrange. En la sección final del caṕıtulo, se llega a una expresión
1La naturaleza espećıfica del sensor y el medio en el que opera resulta de relevancia en
el desarrollo de este trabajo
7
parametrizada puntual para el modelo de la plataforma.
En el Caṕıtulo 3 se revisan varios de los métodos de control de manipuladores
mecánicos, haciendo énfasis en los de tipo robusto, incluyéndose el análisis
de estabilidad y convergencia en lazo cerrado para los casos nominales. En
uno de los incisos de simulación se prueba el desempeño de los controladores
ante la presencia de fricción, por lo que en este caṕıtulo se revisa brevemente
el modelo LuGre, aśı como un observador de fricción. El caṕıtulo finaliza con
una comparación cualitativa entre los algoritmos de control presentados.
El caṕıtulo 4 está dedicado a simulaciones del control de la plataforma u-
sando los algoritmos revisados en el Caṕıtulo 3, aśı como a la comparación
cuantitativa del desempeño de las diferentes leyes de control presentadas.
Primero se presentan señales de giro t́ıpicas (reales) para varios estados de
la mar. Dicho tipo de señal es el que se alimenta como perturbación al sis-
tema controlado en lazo cerrado. Despúes se enuncian las caracteŕısticas de
las aproximaciones directa e indirecta para la medición de rotaciones y tasas
de giro. Por último se presenta el análisis comparativo de los distintos con-
troles, el cual incluye un conjunto de gráficas y tablas en las que se resume y
analiza el desempeño de los controles con base en parámetros como, tiempo
de asentamiento, enerǵıa de las señales de error y de control, magnitud del
error residual, suposiciones a priori etc2.
En el Caṕıtulo 5, se presentan las conclusiones de este trabajo de tesis, se
resalta lo que se considera como aportaciones y se esboza el trabajo a futuro.
2En su momento en los casos que no se pueda obviar, se definen los parametros de
comparación
8
Caṕıtulo 1
Introducción
1.1. Motivación
Varios son los veh́ıculos aéreos, terrestres y marinos que transportan
equipo de sensado el cual entra en operación mientras dichos veh́ıculos se
mueven y está, por ende, sujeto a movimientos aleatorios debidos a las irre-
gularidades de la v́ıa, sea ésta un terreno pedregoso, un mar con oleaje o un
cielo turbulento. Frecuentemente para cumplir su fin espećıfico de manera
óptima, los sensores montados en los veh́ıculos deben conservar en la me-
dida de lo posible cierta orientación, aún cuando perturbaciones del medio
tiendan a “desorientarlos”. Por ejemplo, en el caso de sistemas de comuni-
cación se busca que las antenasreceptoras/transmisoras apunten hacia la
fuente/destino de la señal a fin de recibir/enviar ı́ntegramente la información
de interés. En tales casos, el equipo de sensado se monta sobre una platafor-
ma móvil que lo estabiliza respecto a los movimientos del veh́ıculo en uno
o más de sus ejes, con base en información de rotación proporcionada por
sensores de giro adosados a la plataforma y/o al sensor.
En particular, en esta tesis se revisará el caso en que el veh́ıculo de interés
es una embarcación y el sensor es una cámara de video montada
en una plataforma móvil actuada. El objetivo primordial del control es
conservar cierta ĺınea de visión o LOS 1. Por lo tanto, cuando la embar-
cación sufre rotaciónes respecto a sus ejes, Figura 1.1, se busca que el control
1Por las siglas en inglés de Line Of Sight, la abreviacion LOS se usa a lo largo de la
tesis
9
adquiera y/o mantenga la orientación de la LOS respecto al blanco u objeti-
vo de interés, al generar en la plataforma los movimientos que logren la LOS
comandada y contrarresten las perturbaciones que sufre la embarcación.
Figura 1.1: Rotaciones de una embarcación
1.2. Objetivo
Es necesario establecer claramente el objetivo de control para determinar
qué eventos y/o perturbaciones generan una reacción del esquema de control,
y aquellas que no lo hacen por no contravenir el objetivo establecido. Aśı mis-
mo, al haber delimitado el objetivo se puede elegir un tipo de configuración
mecánica para la plataforma, cuya cinemática permita cumplir el objetivo
10
planteado dentro de una buena relación complejidad-desempeño.
La tarea de interés se puede resumir de la siguiente manera: la ĺınea de
vista del sensor en cuestión, cámara, debe apuntar en dirección del blanco
u objetivo de interés , el cual puede estar fijo o en movimiento. Aunado
a lo anterior, la embarcación en que se encuentra el sensor está expuesta
a movimientos continuos debidos al medio marino. Esto es, se tiene en el
caso más general una LOS variable en un medio con perturbaciones. De es-
ta forma, el objetivo de dirigir la LOS del sensor hacia un blanco puede
definirse en dos subtareas: tarea de orientación o seguimiento y tarea de es-
tabilización o rechazo de perturbaciones. Las perturbaciones y movimientos
de orientación/seguimiento considerados serán de tipo rotacional, en conse-
cuencia las tareas de orientación y estabilización se satisfacen con grados de
libertad rotacionales.
1.2.1. Orientación de la LOS
La tarea de orientación de la LOS de un sensor mediante el uso de una
plataforma móvil, consiste en dirigir el vector caracteŕıstico de la LOS 2 hacia
el objetivo de interés a través de la manipulación de los grados de libertad de
la plataforma. En general puede identificarse lo anterior como una tarea de
seguimiento, en la que se busca llevar el estado de operación de un sistema
a lo largo de cierta trayectoria y/o hacia cierta referencia constante.
En el caso particular en que el sensor es una cámara, la tarea de adquirir y
preservar cierta LOS puede traducirse, por ejemplo, en mantener centrado
y en foco un objetivo en movimiento relativo respecto a la embarcación que
transporta al sensor. Aśı, con un objeto en movimiento y un sensor con el
que se le quiere apuntar, se tiene en general una tarea de seguimiento.
1.2.2. Estabilización de la LOS
El vector caracteŕıstico de la LOS de un sensor sobre una plataforma en
una embarcación marina se encuentra expuesto a multiples fuentes de pertur-
bación, siendo la principal la acción de las olas. Otras fuentes de perturbación
2La ĺınea de vista de un sensor tiene asociado un vector caracteŕıstico o vector de
dirección, el cual es unitario, deslizante y está dirigido sobre la ĺınea recta no obstruida
que une al sensor y su objetivo.
11
pueden deberse a torcas inducidas por corrientes de viento. También las vi-
braciones y movimientos lineales de la embarcación pueden generar torcas de
perturbación debido a desbalances de masa por la disposición geométrica de
los componentes de la plataforma. Recordando que en este trabajo de tesis se
consideran sólo perturbaciones de orden rotacional, las perturbaciones trasla-
cionales se toman en cuenta sólo en la medida que impacten la orientación
de la LOS respecto al blanco de interés.
La Figura 1.2 resume las tareas de control descritas en esta sección. Se puede
hacer la siguiente analoǵıa: las perturbaciones marinas impactan la cola del
vector que define a la LOS en tanto que el movimiento relativo del blanco
del sensor afecta la punta del vector de la LOS.
Figura 1.2: Tareas de control: orientación y estabilización
1.3. Definición geométrica de la tarea de con-
trol
Con ayuda de la Figura 1.3 se pueden definir geométricamente las ta-
reas de orientación y estabilización. La figura representa una vista aérea
del conjunto buque-plataforma-sensor. Considérese por simplicidad sólo el
12
movimiento en el eje de guiñada. Los vectores LOSdes y LOSact definen,
respectivamente, la orientación deseada del sensor y la orientación actual
referidas a un sistema de ejes inercial (ejes ĺınea gruesa discontinua) respecto
al cual se tienen mediciones de giro de posición/velocidad angular. El vector
LOSdes es en general variable, pues cambia conforme al movimiento relati-
vo entre el buque y el objetivo de interés. El vector LOSact por su parte,
está expuesto a las perturbaciones de la mar.
Se tiene además, otro marco de referencia (ejes ĺınea delgada discontinua)
respecto al cual se establece, mediante un codificador de posición, el estado
en guiñada qact del eje mecánico de la plataforma mov́ıl que orienta al sensor.
La tarea de control consiste en combinar la LOSdes con la información de
los sensores de giro LOSact y posición qact a fin de generar una referencia qdes
que, como entrada a un esquema de control, permita que el vector LOSact
siga a la referencia LOSdes (orientación) a la vez que se rechazan las pertur-
baciones de la mar (estabilización).
Figura 1.3: Disposición de ejes para formar la señal de referencia
13
1.4. Estado del arte
La tarea de estabilización y orientación de una plataforma ha sido abor-
dada en varios trabajos con el empleo de un manipulador Stewart, [11] y [12].
Esta aproximación a la tarea de estabilización es buena para el control de vi-
braciones, es decir, para casos en que las desviaciones del punto de operación
son relativamente pequeñas. Este tipo de plataforma puede corregir en seis
grados de libertad, es decir en tres grados de posición y tres de orientación.
Sin embargo, la amplidud de sus movimientos es limitada y la complejidad
de control es elevada.
Shtessel en [13] y [14] trata el problema de estabilización de una platafor-
ma inercial de tres ejes mediante técnicas de modos deslizantes y desacoplamien-
to.
Peter et al en [6] trataron el tema de la estabilización de una plataforma
de dos grados de libertad, haciendo una comparación de desempeño entre la
aproximacion de mediciones de giro directamente sobre la LOS, y mediciones
indirectas en la base de la plataforma, caso en el cual han de reconstruirse
las perturbaciones sobre la LOS a partir de las perturbaciones medidas en
la base. La conclusión es que el desempeño de la aproximación directa es
superior.
1.5. Ubicación de este trabajo de tesis
En este trabajo de tesis se aplica la metodoloǵıa de control como trasfondo
y sustento académico de una tarea de interés práctico. El objetivo principal
de ı́ndole teórico-académico se aborda v́ıa la comparación de algoritmos de
control de tipo adaptable y robusto para el control de orientación y estabi-
lización de la Ĺınea de Vista de un sensor.
Las tareas de estabilización y orientación de la LOS se desarrollan tomando
en cuenta las condiciones que presenta el medio marino, aśı como restricciones
y limitaciones que es necesario imponer a fin de poder presumir la “imple-
mentabilidad” de los esquemasde control revisados. Tales restricciones son
por ejemplo: viabilidad f́ısica-mecánica del esquema de control -simplicidad
14
de implementación-; accesibilidad de señales de referencia y estado; magnitud
de la señal de control dentro de un rango razonable; robustez del esquema
ante perturbaciones, dinámicas no modeladas, variaciones del sistema, etc.
La comparación de los distintos algoritmos presentados se hace mediante
la evaluación de parámetros ponderados. Se presume que los resultados de
este trabajo permitirán llevar a cabo una implementación práctica óptima.
1.6. Contribución
Este trabajo a sido apoyado por el INIDETAM (Instituto de Investigación
y Desarrollo Tecnológico de la Armada de México) de la Secretaŕıa de Ma-
rina, uno de cuyos objetivos es realizar y fomentar la investigación en áreas
de interés naval a fin de aumentar el nivel de independencia tecnológica de
la institución.
Este trabajo sirve de base teórico-académica para la implementación de es-
quemas de control de orientación y estabilización de sistemas de vigilancia
de desarrollo nacional en buques de la Secretaria de Marina, coadyudando
eventualmente a reducir la dependencia tecnológica, con las ventajas que ello
implica: menores costos de implementación, mantenimiento y actualiación;
aumento del cuerpo de conocimientos con base en el cual se pueden realizar
otros proyectos de investigación afines, etc.
15
Caṕıtulo 2
Modelo del sistema
2.1. Introducción
El paso inicial hacia la consecución de un buen esquema de control para
un sistema, es la obtención de un módelo matemático que capture las ca-
racteŕısticas dinámicas de la planta y con base en la cual puedan realizarse
tareas de análisis y śıntesis que conduzcan al controlador adecuado.
Es dif́ıcil que un modelo represente a plenitud la dinámica de su contraparte
real. Un buen modelo representará las caracteŕısticas más significativas del
sistema, en tanto que las incertidumbres por dinámicas no modeladas, per-
turbaciones, variación de parámetros, etc., pueden considerarse en el diseño
del controlador.
Para la obtención de modelos matemáticos de sistemas mecánicos (como el
de interés) existen metodoloǵıas ampliamente desarrolladas y bien documen-
tadas. Son de especial interés los métodos de modelado energético, los cuales
permiten llegar a modelos para sistemas de mediana y alta complejidad sin la
necesidad de establecer de manera expĺıcita las restricciones de interconexión
entre los distintos elementos del sistema.
2.2. Configuración cinemática
El tipo de plataforma propuesto para el objetivo, es el que se muestra en
la Figura 2.1.
16
Figura 2.1: Plataforma de dos Grados de Libertad
La Figura 2.2 es una representación general del tipo de plataforma de
dos Grados de Libertad (2GDL), en la que se describen algunos elementos
básicos del arreglo: la plataforma consta de dos articulaciones de revolución,
en el eje de guiñada -o yaw - y en el eje de elevación -o pitch-. La caracteŕıstica
principal de este tipo de plataforma es la de que los ejes de sus articulaciones
de revolución se intersectan en un punto en común.
Como puede apreciarse el tipo de plataforma mostrada no tiene la capaci-
dad de realizar movimientos alrededor del eje de balanceo. Cuando el sensor
de interés que va montado en la plataforma es, por ejemplo, un telémetro
laser, las correcciones en balanceo no son necesarias pues la señal envia-
da/recibida por el sensor es un haz. No obstante cuando el sensor de interés
es, como en el caso de este trabajo, una cámara de video, las perturbaciones
en balanceo resultan en imágenes sesgadas. No obstante, como se verá en el
Caṕıtulo 3, se propone una estabilización “virtual” en el eje de balanceo.
17
Figura 2.2: Representación general de plataforma 2GDF
La configuración de la plataforma permite delimitar los alcances del con-
trol: las acciones de control de orientación y estabilización se efectuarán sólo
con rotaciones en dos ejes. Lo anterior simplifica el análisis cinemático, al no
existir movimientos de traslación.
La cinemática directa de este tipo de plataforma es simple, pues se puede de-
terminar la orientación del sensor de forma inmediata al conocer la posición
angular de los ejes, lo cual en las implementaciones se realiza fácilmente con
codificadores de posición.
2.3. Marcos de referencia: Convención
Denavit-Hartenberg
La primera tarea hacia el desarrollo de un modelo es establecer los sis-
temas coordenados para representar la posición y orientación de los varios
cuerpos (considerados ŕıgidos) que conforman la plataforma. Para ello se
18
empleará la representación Denavit-Hartenberg (D-H ), la cual permite es-
tablecer de manera sistemática los marcos de referencia en cada articulación
y facilita posteriormente la obtención de parametros con los cuales se forman
las matrices de transformación entre los sistemas referenciales.
A continuación se enuncian 6 primeros pasos hacia la obtención de la cinemá-
tica directa del manipulador, los cuales se relacionan con el establecimento
de los marcos de referencia:
Representación D-H [2]:
1. Localizar y etiquetar los ejes de las articulaciones z0, ...zn−1, donde n
representa el número de articulaciones. El eje zi, se alinea con el eje de
movimiento de la articulación i+1,
2. Establecer un marco de referencia base x0y0z0. Poner el origen en
cualquier posición sobre el eje z0. Los ejes x0 y y0 respectivos se es-
tablecen de forma tal que se forme un sistema dextrogiro. Los pasos 3
al 5 se repiten para i=1,...n-1.
3. Localizar el origen Oi en el punto en el que la normal común zi y
zi−1 interseca a zi. Si zi y zi−1 son paralelos, se ubica Oi en la i -ésima
articulación.
4. Establecer xi a lo largo de la normal común entre zi y zi−1 tal que
cruce Oi, o, si zi−1 y zi se intersecan, en la dirección normal al plano
que forman zi − zi−1.
5. Establecer yi tal que complete un marco de referencia derecho.
6. Establecer el marco referencial del efector final onxnynzn, asumiendo la
n-ésima articulación de revolución,
Tras aplicar los pasos enunciados anteriormente, los marcos de referencia se
establecen de acuerdo a la Figura 2.3:
2.4. Relaciones cinemáticas de la plataforma
Una vez establecidos los marcos de referencia, han de obtenerse las rela-
ciones de transformación entre los sistemas coordenados, para poder referir
19
Figura 2.3: Disposición de ejes para la plataforma 2DOF
posiciones y velocidades de un sistema a otro. Ello es sencillo una vez apli-
cada la convención D-H, al formar una tabla de parámetros ai, di, αi, θi de la
siguiente manera [2]:
1. ai es la distancia medida a lo largo del eje xi desde el origen Oi, hasta
la intersección del eje zi−1 con el eje xi (distancia más corta entre zi−1
y zi) con signo contrario al sentido del eje xi.
2. di es la distancia a lo largo del origen zi−1 desde Oi−1 hasta la intersec-
ción de zi−1 con xi (respetando el signo del eje zi−1).
3. αi es el ángulo entre zi−1 y zi, medido alrededor de xi.
4. θi es el ángulo entre xi−1 y xi medida alrededor de xi, siendo variable
para las articulaciones de revolución.
La Tabla 2.1 resume los parámetros para la configuración propuesta:
Articulación ai αi di θi
1 0 -90 0 θ1(t)
2 0 0 0 θ2(t)
Cuadro 2.1: Tabla de parámetros D-H
20
Una vez formada la tabla, la matriz de transformación del sistema i al i-1,
Ai−1i , está dada por el producto de 4 transformaciones básicas, dos rotaciones
y dos traslaciones:
Ai−1i = Rotz,θiTrasz,diTrasx,aiRotx,αi
Ai−1i =
⎡
⎢⎢⎣
Cθi −Sθi 0 0
Sθi Cθi 0 0
0 0 1 0
0 0 0 1
⎤
⎥⎥⎦
⎡
⎢⎢⎣
1 0 0 0
0 1 0 0
0 0 1 di
0 0 0 1
⎤
⎥⎥⎦
⎡
⎢⎢⎣
1 0 0 ai
0 1 0 0
0 0 1 0
0 0 0 1
⎤
⎥⎥⎦
⎡
⎢⎢⎣
1 0 0 0
0 Cαi −Sαi 0
0 Sαi Cαi 0
0 0 0 1
⎤
⎥⎥⎦
donde Cθi y Sθi denotan respectivamente coseno y seno de θi.
Las matrices de transformación homogéneas son por tanto:
A01 =
⎡
⎣Cθ1 0 −Sθ1Sθ1 0 Cθ1
0 −1 0
⎤
⎦
A12 =
⎡
⎣Cθ2 −Sθ2 0Sθ2 Cθ20
0 0 1
⎤
⎦
La matriz de transformación del sistema es:
T 02 =
⎡
⎣Cθ1Cθ2 −Cθ1Sθ2 Sθ1Sθ1Cθ2 −Sθ1Sθ2 Cθ1
−Sθ2 −Cθ2 0
⎤
⎦
2.5. Sistemas Lagrangianos
2.5.1. Modelado mediante métodos energéticos:
Ecuaciónes Euler-Lagrange [3]
La formulación de un modelo matemático para un sistema de ı́ndole
mecánico puede realizarse de manera sistemática considerando al sistema
como un dispositivo manejador de enerǵıa y utilizando los denominados
Métodos Variacionales, en los cuales, los intercambios energéticos del sis-
21
tema se asocian con una función de cambio de enerǵıa total del sistema,
Indicador Variacional, la cual se conserva balanceada a cero en tanto la con-
ducta dinámica del sistema sea “correcta”. Por “conducta correcta”ha de
entenderse que las variaciones de las variables de almacenamiento de esfuer-
zo y flujo no transgreden las restricciones de interconexión del sistema, es
decir, tales variaciones permisibles no violan las restricciones de compatibi-
lidad ni las de continuidad1
En términos llanos, lo anterior es un refinamiento del concepto básico de
que la enerǵıa de entrada a un sistema es igual a la que se almacena (por
ejemplo en forma cinética o potencial) y a la que se disipa.
Un indicador variacional δV que se balancea a cero para cualquier transi-
ción permisible de un sistema con m coordenadas generalizadas de almace-
namiento de esfuerzo(q1, ..., qm) y l coordenadas generalizadas variacionales
(δq1, ..., δql) es:
δV =
∫ t1
t0
[
δU∗ − δT −∑lj=1 ( ∂J∂q̇j − τj) δqj] dt = 0
donde:
U∗: Co-enerǵıa total almacenada en elementos almacenadores de flujo en
función de las coordenadas generalizadas de esfuerzo.
T : Enerǵıa total almacenada en elementos almacenadores de esfuerzo en fun-
ción de las coordenadas generalizadas de almacenamiento de esfuerzo.
J : Co-contenido total en los disipadores del sistema.
Un resultado de uso inmediato del análisis variacional, es el conjunto de
ecuaciones Euler-Lagrange, las cuales deben de satisfacerse en tanto el in-
dicador variacional δV se conserve nulo para cualquier transición dinámica
1Restricción de Compatibilidad : La suma de esfuerzos para el lazo cerrado formado por
n puertos de enerǵıa debe ser cero.
Restricción de Continuidad : La suma de flujos en la terminal común de n puertos de
enerǵıa debe ser cero [3].
22
permisible del sistema:
d
dt
[
∂L
∂q̇i
]
− ∂L
∂qi
+
∂J
∂q̇i
= τi para i=1,...,l
donde, el lagrangiano L está dado por:
L = U∗(q̇1, ..., ˙qm) − T (q1, ..., qm)
2.5.2. Desarrollo de las ecuaciones Euler-Lagrange para
manipuladores mecánicos de n grados de liber-
tad
Se puede establecer la correspondencia entre los elementos generales de la
subsección anterior, y los elementos particulares de los sistemas mecánicos.
En el ámbito de los sistemas mecánicos, puede identificarse a las velocidades
(lineales o angulares) como las variables de esfuerzo y a los desplazamien-
tos (lineales o angulares) como las variables de almacenamiento de esfuerzo.
Aśı mismo, las fuerzas y torcas se corresponden con las variables de flujo,
y las variables de almacenamiento asociadas son los momentos (lineales o
angulares).
Dadas las correspondencias anteriores, puede establecerse a la función de
co-enerǵıa U∗(q̇1, ..., ˙qm) como la función de co-enerǵıa cinética2 respecto a
las velocidades del sistema, y a la función T (q1, ..., qm) como la enerǵıa po-
tencial en función de los desplazamientos.
Para manipuladores ŕıgidos de n grados de libertad pueden aplicarse directa-
mente la formulación Euler-Lagrange. Sólo se requiere encontrar la función
de enerǵıa cinética ( co-enerǵıa ) y la de energia potencial.
El modelo dinámico general del manipulador al que se llega desarrollando
2Para un objeto de masa constante, de acuerdo a la segunda ley de Newton, se establece
una relación lineal entre el momento y la velocidad del objeto, por lo cual la co-enerǵıa
cinética (área bajo la curva momento vs. velocidad) es igual a la enerǵıa cinética (área
bajo la curva velocidad vs.momento).
23
el conjunto de ecuaciones Euler-Lagrange es no lineal, y está dado por la
siguiente expresión [2] :
H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ (2.1)
siendo H(q)nxn la matriz de inercia tal que:
hij =
n∑
k=max(i,j)
Tr(UkiJkU
T
kj) (2.2)
donde, el término Jk representan la pseudo matriz de inercia del cuerpo k
respecto al sistema de referencia xkykzk:
Jk =
⎡
⎣−Ixx+Iyy+Izz2 Ixy IxzIxy Ixx−Iyy+Izz2 Iyz
Ixz Iyz
Ixx+Iyy−Izz
2
⎤
⎦ (2.3)
Además:
Uij =
∂T0i
∂qj
donde:
T
0
j = A
0
i A
1
2...A
i−1
i i=1,...,n
siendo Aij la matriz de transformación del sistema j al i.
En el caso de que la matriz Aij represente una transformación ortogonal,
se tiene:
Uij =
{
T
0
j−iQjT
j−i
j j ≤ i
0 j > i
24
donde, si qj representa una variable de almacenamiento de esfuerzo angu-
lar:
Qj =
⎡
⎣0 −1 01 0 0
0 0 0
⎤
⎦.
En cuanto a los elementos de la matriz C(q, q̇) que representa términos cen-
trifugos y de Coriolis, se tiene:
Cij =
n∑
k=1
Ckjiq̇k (2.4)
i,j=1,..,n
con:
Ckji =
1
2
(
∂hij
∂qk
+
∂hik
∂qj
− ∂hkj
∂qi
)
(2.5)
Para g(q) que representa el vector de términos gravitacionales, se tiene la
siguiente expresión:
g(q) =
∂P
∂q
(2.6)
siendo P la función para la enerǵıa Potencial del sistema.
La Ecuación (2.1) y las matrices de inercia H(q) y de Coriolis C(q, q̇), tienen
importantes propiedades:
Acotamiento y positividad de H(q)nxn:
mI ≤ H(q) ≤ HT (q) ≤ mI, ∀q ∈ Rn, con 0 ≤ m ≤ m
Antisimetŕıa de la matriz ˙H(q) − 2C(q, q̇):
sT [ ˙H(q) − 2C(q, q̇)]s = 0, ∀s ∈ Rn
Parametrización lineal. La Ecuación (2.1) puede representarse como:
25
H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ = Ψ(q, q̇, q̇, q̈)ϕ
siendo ϕ un vector de parámetros de dimensión nϕ
2.6. Desarrollo del modelo
En esta sección se desarrolla un modelo del sistema a partir de una
geometŕıa simplificada de la plataforma.
Para fines de modelado y simulación, se propone una representación simpli-
ficada de la plataforma, como lo muestra la Figura 2.4. Además se definen:
q=[ q1 q2 ]
T donde q1 = θ1 y q2 = θ2.
La plataforma mostrada se compone de dos cuerpos principales, un cilin-
dro y una especie de horquilla formada a su vez por tres paralelepipedos.
Figura 2.4: Cuerpos simples para representar a la plataforma de dos grados
de libertad
El momento de inercia del cuerpo k=1,2 se establece respecto al sistema
de referencia xk−1yk−1zk−1. De tablas de momentos inerciales y utilizando el
teorema de ejes paralelos ( ver la disposición de ejes en la Figura 2.3), la
Tabla 2.2 resume los momentos de inercia de los cuerpos representados en la
26
Figura 2.4 3.
Cuerpo Ixx Iyy Izz
1a m1a12 (b
2 + l21) + m1a(
l2
2 +
b
2 )
2 m1a
12 (a
2 + b2) + m1a( l22 +
b
2 )
2 m1a
12 (l
2
1 + a
2) + m1a( l12 )
2
1b m1b12 (b
2 + l22) + m1b(l1 − b2 )2 m1b12 (a2 + l22) m1b12 (b2 + a2) + m1b(l1 − b2 )2
1c m1a12 (b
2 + l21) + m1a(
l2
2 +
b
2 )
2 m1a
12 (a
2 + b2) + m1a( l22 +
b
2 )
2 m1a
12 (l
2
1 + a
2) + m1a( l12 )
2
2 12m2r
2 m2
12 (3r
2 + h2) m212 (3r
2 + h2)
Cuadro 2.2: Tabla de Momentos de Inercia
En la Ecuación (2.3):
J1 = diag
⎛
⎝ m1b24 (2a2) + m1a12 (3l21 + 2a2)m1b
24
(2b2 + 6(2l1 − b)2) + m1a12 (5l21)
m1b
24
(2l22) +
m1a
12
(−3l21 + 2b2 + 6(l2 + b)2)
⎞
⎠ = diag
⎛
⎝J1xJ1y
J1z
⎞
⎠
J2 = diag
⎛
⎝ 112m2h21
4
m2r
2
1
4
m2r
2
⎞
⎠ = diag
⎛
⎝J2xJ2y
J2z
⎞
⎠
Se tiene que:
U11 =
∂A01
∂θ1
=
⎡
⎣−Sθ1 0 −Cθ1Cθ1 0 −Sθ1
0 0 0
⎤
⎦
U12 =
∂A01
∂θ2
= 0
U21 =
∂A02
∂θ1
=
⎡
⎣−Sθ1Cθ2 Sθ1Sθ2 −Cθ1−Cθ1Cθ2 −Cθ1Sθ2 −Sθ1
0 0 0
⎤
⎦
U22 =
∂A02
∂θ2
=
⎡
⎣−Cθ1Sθ2 −Cθ1Cθ2 0−Sθ1Sθ2 −Sθ1Cθ2 0
−Cθ2 Sθ2 0
⎤
⎦
en la Ecuación (2.2), desarrollando y simplificando:
h11 = J1x + J1z + J2y + J2z + (J2x − J2y)C2θ2
3Se asume para fines de modelado, que los cuerpos son simétricos y homogéneos, tales
que los productos de inercia Ixy, Iyz, ... son cero
27
h12 = 0
h21 = 0
h12 = J2x + J2y
En cuanto a los términos centŕıfugos y de Coriolis, se tiene de la Ecuación
(2.5):
C211 = (J2x − J2y)Cθ2Sθ2= C121 = −C112
todos los demás términos son cero. En la Ecuación (2.4):
C11 = (J2x − J2y)Cθ2Sθ2 θ̇2
C12 = (J2x − J2y)Cθ2Sθ2 θ̇1=-C21
C22 = 0
Para el vector de términos gravitacionales (2.6), dada la disposición geométri-
ca simétrica de la plataforma y la suposición de homogeneidad de los cuerpos
que la componen, se tiene que:
g(q) = ∂P
∂q
= 0
Por último se considera al término de disipación Dq como cero. Resumiendo
los resultados anteriores en la Ecuación (2.1), el modelo del sistema es:
[
α + βC2θ2 0
0 γ
] [
θ̈1
θ̈2
]
+
[
γCθ2Sθ2 θ̇2 γCθ2Sθ2 θ̇1
−γCθ2Sθ2 θ̇1 0
] [
θ̇1
θ̇2
]
=
[
τ1
τ2
]
(2.7)
con:
28
α = J1x + J1z + J+ + 2y + J2z
β = J2x − J2y
γ = J2x + J2y
2.7. Modelo de fricción
En el caṕıtulo de simulaciones se presenta un inciso en el que se prueba el
desempeño de los distintos algoritmos ante la presencia de fricción. En esta
sección se presentan generalidades de la fricción y el modelo particular de
fricción que se utilizó, el modelo LuGre [7].
2.7.1. Fenómeno de fricción [8]
La fricción ocurre siempre que cuerpos en contacto experimentan un
movimiento relativo. Este movimiento puede ser lineal o rotacional, pero
en ambos casos la fricción se comporta básicamente de la misma forma.
La fricción es la fuerza de reacción tangencial entre dos superficies en contac-
to. F́ısicamente estas fuerzas de reacción son el resultado de toda una variedad
de mecanismos y fenómenos que dependen de la geometŕıa y topoloǵıa del
contacto, propiedades de porosidad y dureza de las superficies en contacto,
existencia de sustancias entre las superficies, etc. Involucrados tantos factores
en el fenómeno de friccion es de esperarse que sea altamente no lineal. En
un sistema mecánico cuyo control se desea lograr, la fricción puede llevar a
errores en estado estable, ciclos ĺımite y bajo desempeño en general.
Existe una gran cantidad de modelos de fricción que vaŕıan tanto en comple-
jidad como en su capacidad de replicar los fenómenos de fricción observados
experimentalmente. Independientemente de la complejidad del modelo de
fricción, se puede observar como factor común en todos ellos dos compo-
nentes: una de fricción viscosa y otra de fricción Coulomb. Ambas producen
una fuerza que se opone al movimiento, siendo la primera proporcional a
la magnitud y signo de la velocidad, en tanto que la última depende sólo
del signo de la velocidad. Las componentes de fricción anteriores no presen-
tan ningún efecto de memoria, dicho de otra forma son mapeos estáticos,
29
y por ende fallan en capturar importantes efectos dinámicos observados en
presencia de fuerzas de fricción.
2.7.2. Modelo de fricción LuGre [7]
El modelo de fricción considerado en este apartado es el modelo LuGre,
el cual captura la mayoŕıa de los efectos de la fricción observados experi-
mentalmente, entre los que se encuentran el efecto Stribeck, histéresis (Fric-
tional Lag), efecto “stick-slip”, desplazamiento de predeslizamiento, fuerza
de rompimiento variable, “stiction”, y por supuesto fricción viscosa y de
Coulomb.
El modelo LuGre se relaciona con una interpretación de la fricción basa-
da en cerdas. La fricción se modela como la deflexión promedio de cerdas
microscópicas que actúan como resortes, Figura 2.5. Cuando una fuerza tan-
gencial es aplicada, las cerdas sufren una deflexión elástica. Si la deflexión es
suficientemente grande las cerdas empiezan a deslizarse. La deflexión prome-
dio de las cerdas para un movimiento en estado estable queda determinado
por la velocidad. La deflección promedio queda denotada por z y se modela
por:
Figura 2.5: Cerdas microscópicas entre dos superficies en contacto
dz
dt
= v − |v|
g(v)
z (2.8)
30
siendo v la velocidad relativa entre las dos superficies. El primer término
indica que la deflexión es proporcional a la integral de la velocidad relativa.
El segundo término indica que la deflexión z tiende a un valor zss en estado
estable, cuando v es constante:
zss =
v
|v|g(z) = g(v)sgn(v)
La función g es positiva, dependiendo de factores tales como propiedades
de los materiales, lubricación, temperatura, etc. T́ıpicamente g(v) decrece
monótonamente a partir de g(0) conforme v se incrementa. El modelo queda
completo con la expreción de la fuerza de fricción:
FL = σ0z + σ1
dz
dt
+ σ2v (2.9)
El parámetro σ0 representa la rigidez de las cerdas, σ1 es un coheficiente
de amortiguamiento y σ2 es un parámetro de fricción viscosa. Para la función
g(v) existe una parametrización que captura el efectro Stribeck, tal que:
σ0g(v) = Fc + (Fs − Fc)e−(v/vs)2
Fc es el nivel de fricción Coulomb, Fs el nivel de fricción estática y vs la ve-
locidad Stribeck. Aśı, con está parámetrización de g(v) el modelo de fricción
LuGre está caracterizado por 6 parámetros: σ0, σ1, σ2, Fc, Fs y vs.
El modelo de fricción anterior se introduce en un par de incisos de simulación
del Caṕıtulo 4 a fin de evaluar el desempeño de los algoritmos de control ante
la presencia de una dinámica no modelada. En uno de los incisos se introduce
la fricción sin compensarla, mientras que en el otro se inyecta la fricción a la
vez que se compensa con un observador de fricción [7]. En ambos casos, la
fuerza de fricción queda fuera del análisis de estabilidad de los algoritmos de
control.
31
Caṕıtulo 3
Algoritmos de Control:
Comparación cualitativa
3.1. Introducción
En este caṕıtulo se revisan y comparan algoritmos de interés para cumplir
la tarea de control propuesta. Las leyes de control asociadas presentan dis-
tintos grados de complejidad lo que es de por śı un punto de comparación.
También queda de manifiesto que el nivel de simplicidad del algoritmo co-
rresponde de manera inversa al peso de las suposiciones en que se basa. Las
consideraciones anteriores permiten por tanto, formular ya una comparación
cualitativa entre los algoritmos presentados, restando para el caṕıtulo de
simulación la comparación cuantitativa del desempeño de los distintos algo-
ritmos.
En las secciones 3.2 y 3.3 de este caṕıtulo se pormenorizan los objetivos
de control. En particular en la sección de Control de estabilización, dada la
naturaleza del sensor cuya LOS se desea estabilizar, se propone un eje virtu-
al para auxiliar la tarea de rechazo de perturbaciones. Al final de estas dos
secciones se presenta un diagrama del sistema de control, en el que resalta el
hecho de que los objetivos de control de orientación y estabilización pueden
tratarse como uno solo. El resto del caṕıtulo presenta seis algoritmos de con-
trol con sus respectivas expresiones y análisis de estabilidad en lazo cerrado.
32
Los algoritmos revisados se eligieron tomando en consideración su even-
tual implementación. Los algoritmos presentados manejan en mayor o menor
medida consideraciones de ı́ndole práctico: incertidumbres paramétricas, varia-
ciones lentas del sistema, perturbaciones, dinámicas no modeladas, etc. Aśı mis-
mo las leyes de control son expresiones cuya complejidad no es elevada, ni
requieren un extenso conocimiento a priori.
Al final del caṕıtulo se presenta un observador de fricción y una sección
en que se hace una comparación cualitativa entre los controladores.
3.2. Control de Orientación
Como se adelantó en el caṕıtulo introductorio, el objetivo de orientación
se identifica con el de seguimiento, entendiéndose por seguimiento el llevar
y/o conservar a la plataforma móvil en un punto de operación tal que la
LOS del sensor que soporta (cámara) permanezca dirigido hacia el blanco.
En resumen, se desea que la LOS siga una referencia, por lo general variable
en el tiempo.
Los comandos de orientación que definen la trayectoria deseada para la
LOS de un sensor, siendo éste una cámara, pueden asociarse a varias fuentes:
Generación autónoma de trayectoria de seguimiento: Si el fin
ulterior de la cámara es la vigilancia autónoma y el “enganche”1 y
seguimiento de blancos, los comandos de orientaciónde la LOS de-
seada provendrán del procesamiento digital de las mismas imágenes
capturadas por la cámara. Un algoritmo de procesamiento de imágenes
puede extraer coordenadas de orientación del objeto de interés “en-
ganchado”, generalmente en movimiento, y generar las coordenadas de
orientación correspondientes a fin de mantener la LOS dirigida hacia
dicho objeto. 2
1Término coloquial que en procesamiento de imágenes se refiere a la adquisición de
un blanco en una imagen. El procesamiento extrae caracteŕısticas significativas de la ima-
gen, lo cual permite identificar patrones para, por ejemplo, aislar objetos, asociarles un
centroide, vector de posición, vector de velocidad, etc.
2En este trabajo de tesis no se abordan detalles del procesamiento de imágenes para
33
Generación semi-autónoma de trayectoria de seguimiento: Para
fines de vigilancia o tareas de búsqueda, la LOS de una cámara comúnmente
deberá seguir un patrón predeterminado que replique cierta trayectoria
de barrido.
Generación manual de trayectoria de seguimiento: Un opera-
dor humano puede generar mediante alguna interfaz (joystick, pantalla
táctil, etc.) los comandos de orientación de la LOS de una cámara
3.3. Control de Estabilización
Los movimientos irregulares en las embarcaciones a la mar son el resul-
tado de una gran cantidad de factores: tipo de mar que se navega (nivel del
oleaje); velocidad de la embarcación; dirección y sentido de movimiento; pe-
so y tamaño de la embarcacion, distribución de la carga, etc. Como puede
verse se trata de un sistema muy complejo en el que lo más conveniente es
centrarse en el efecto final sobre el sistema de interés, que en el caso de este
trabajo son las perturbaciones rotacionales que sufre la LOS de referencia de
una cámara sobre una plataforma móvil.
Como en el caso de la orientación, pueden reconocerse varias fuentes que
dirigen la tarea de estabilización
Acelerómetros lineales: Una de las técnicas para conocer los movimien-
tos lineales y rotacionales que sufre un cuerpo es adosándole sensores
de aceleración lineal. Al disponer varios de estos sensores en ejes de
movimiento ortogonales, y conociendo la disposicion relativa entre e-
llos, se puede, con base en las mediciones lineales y operaciones de
integración y geometŕıa, conocer desplazamientos lineales y angulares.
Sensores de tasa de giro: Este tipo de sensor mide velocidades de
giro de un objeto alrededor de ejes de movimiento perpendiculares.
La integración de estas señales permite conocer los desplazamientos
angulares.
obtener una LOS deseada, se da por hecho que se tiene una señal que comanda la
orientación de la plataforma. Las únicas referencias que se hacen al procesamiento de
imágenes (en la subsección 3.3.1) quedan circunscritas a la tarea de estabilización.
34
Giros de estado sólido: Una giro de estado sólido suele componerse a
su vez de acelerómetros lineales, sensores de tasa de giro e incluso sen-
sores de campo magnético, para integrar su información y proporcionar
lecturas de posición angular, absoluta o relativa.
Tan importante como el tipo de fuente que genera la información de despla-
zamientos angulares, es el lugar en que se ubica. En el próximo caṕıtulo se
hacen consideraciones sobre la ubicación de los sensores para una tarea de
estabilización. También se indicará a detalle como se miden los ángulos y se
establecen las referencias respectivas.
3.3.1. Estabilización de balanceo: Grado de libertad
“virtual” en balanceo
Hasta ahora se ha considerado que el sistema propuesto opera con dos
articulaciones de revolución. Como se mencionó antes, dos grados de libertad
rotacionales son suficientes para mantener dirigido un haz hacia un objetivo
de interés. Pero tratándose el sensor de una cámara, las rotaciones alrededor
de su eje de balanceo no pueden pasarse por alto, pues detrimentan la imagen
observada. Con el fin de estabilizar perturbaciones de la imagen en el eje de
balanceo se propone un tercer grado de libertad en el eje de balanceo, sólo
que “virtual” y que opera a nivel de procesamiento de imagen.
A continuación se presentan las tareas propuestas para la implementación
del grado de libertad virtual ya mencionado3:
1. Algoritmo para rotar la imagen n grados.
2. Conexión del algoritmo de rotación de imagen con el sensor de posición
angular que mide el estado del eje de balanceo, a fin de efectuar el giro
proporcional que estabilice la imagen.
3. Filtro suavizador y predictor para las lecturas del sensor de posición
angular, que por un lado ofrezca valores “suaves” del estado del eje de
3Se pueden consultar algunos otros detalles en el apéndice “Grado de libertad virtual
en eje de balanceo”
35
balanceo (lo que se traduce en rotaciones “suaves” de la imagen) y que
por otro lado estime el próximo estado del eje de balanceo permitiendo
un desempeño predictivo del sistema.
El esquema de control propuesto es el que se ilustra en la Figura 3.1. En
el puede verse como las tareas de orientación y estabilización se resuelven
en una especie de “seguimiento diferencial”, como se sugeŕıa ya en la Figura
1.2 del Caṕıtulo 1. El esquema representa el caso general en que se considera
la fricción y su compensación aśı como la estabilización de imagen (que no
obstante, no son temas capitales de este trabajo).
Figura 3.1: Esquema de control. Las lecturas del sensor de giro alimentan las
correcciones mecánicas en cabeceo y guiñada y la correción en balanceo de
la imagen.
3.4. Métodos de control para manipuladores
No existe un método general en el diseño de controladores para sistemas
no lineales. Lo que se suele hacer por tanto, es usar técnicas complementarias
de análisis y śıntesis: en base al análisis del modelo del sistema por alguno o
varios de los métodos disponibles (análisis de Lyapunov, método de función
36
descriptiva, análisis del plano de fase, etc.) se puede sintetizar un controlador
cuyo buen desempeño en la práctica pueda presumirse en base al análisis
previo y las simulaciones computacionales realizadas.
3.4.1. PD+
El primer tipo de control revisado, con una expresión bastante sencilla es
el PD+. El control PD+ compensa las no linealidades modeladas del mani-
pulador de interés a la vez que incorpora términos que garantizan la conver-
genćıa (asintótica como se verá adelante) del error a cero en condiciones nom-
inales. El PD+ puede también tener un buen desempeño en condiciones de
perturbación o incertidumbre paramétrica pero a costa de valores de ganan-
cia relativamente altos.
Sea la ley de control PD+ [2]:
τ = H(q)q̈d + C(q, q̇)q̇d + Dq̇d + g(q) − Kv ˙̃q − Kpq̃ (3.1)
con D ≥ 0, Kv, Kp > 0 diagonales, y definiéndose q̃ = q − qd, siendo qd
el estado deseado y q el estado actual. Se pueden analizar las propiedades de
esta ley de control emplendo teoŕıa de Lyapunov. Sea (3.1) en la Ecuación
(2.1):
H(q)¨̃q + C(q, q̇) ˙̃q + (Kv + D) ˙̃q + Kpq̃ = 0 (3.2)
Si se usa como candidata a función de Lyapunov la función:
V (q̃, ˙̃q) = 1
2
˙̃qT H(q) ˙̃q + 1
2
q̃T Kpq̃
derivando V :
V̇ = 1
2
˙̃qT ˙H(q) ˙̃q + ˙̃qT H(q)¨̃q + 1
2
q̃T Kpq̃
sustituyendo H(q)¨̃q de (3.2), agrupando términos y por la propiedad de an-
tisimetŕıa de ˙H(q) − 2C(q, q̇) = 0, se tiene:
37
V (q̃, ˙̃q) = − ˙̃qT (Kv + D) ˙̃q
que es una función negativa semi-definida. Empleando el teorema de La Salle
de conjuntos invariantes al conjunto de puntos:
{(q̃, ˙̃q) | ˙̃q = 0}
en (3.2):
Kpq̃ = 0
que se cumple sólo para q̃ = 0 pues por definición Kp es positiva defini-
da. Se tiene pues un resultado de estabilidad asintótica para el sistema en
lazo cerrado (3.2).
3.4.2. Control Adaptable
La aproximación adaptable al problema de control permite lidiar con
incertidumbres de orden paramétrico en el modelo del sistema, o bien con
sistemas variantes (lentamente) en el tiempo. Aśı pues, la incertidumbre de
los sistemas atacables con el control adaptable se atribuye al conocimienyo
imprecisode los parámetros del modelo, y no a su estructura en śı. El control
adaptable como método de control único en una aplicación real no es muy
usado, pues no tiene un buen desempeño ante perturbaciones, dinámicas
no modeladas o parámetros que vaŕıan rápidamente (este último fenómeno
puede deberse a su vez a un modelado inadecuado), y por tanto suele em-
plearse en complemento con un método de control robusto.
Sea el sistema (2.1) representado mediante una parametrización lineal de
la forma:
τ = Ψ(q, q̇, q̇v, q̈v)ϕ̂0 = Ψa (3.3)
siendo Ψ una matriz conocida y ϕ̂0 un vector de parámetros nominales
[1]. A Ψ se le denonina matriz regresora o simplemente regresor.
El control adaptable propone una ley de variación para el vector de pará-
metros nominales ϕ̂0 tal que cada iteración de control ajusta dicho vector
38
de forma que el error de seguimiento disminuye, e incluso, si las condiciones
son adecuadas 4, el vector nominal puede converger al vector de parámetros
reales ϕ.
Sea la ley de control adaptable [1] :
τ = Ψ(q, q̇, q̇v, q̈v)ϕ̂0 − KvS (3.4)
con la ley de adaptación:
˙̂ϕ0 = −Γ−1ΨT (q, q̇, q̇v, q̈v)S
donde:
Kv = D + K, K > 0 diagonal; Λ, Γ > 0 diagonales; S = q̇ − q̇v = ˙̃q + Λq̃, y
q̇v = q̇d − Λq̃; qd y q̃ como se definieron en 3.4.1.
La ley de control se puede reescribir como:
τ = Ψϕ̂0 − KvS + Ψϕ − Ψϕ = Ψϕ − KvS + Ψϕ̃; con ϕ̃ � ϕ̂0 − ϕ.
En lazo cerrado en la Ecuación del sistema (2.1):
H(q)(q̈ − q̈v) + C(q, q̇)(q̇ − q̇v) + D(q̇ − q̇v) + KvS = Ψϕ̃
por la definición de S :
H(q)Ṡ + C(q, q̇)S + (Kv + D)S = Ψϕ̃ (3.5)
Si se propone como candidata a función Lyapunov:
V = 1
2
ST H(q)S + 1
2
ϕ̃T Γϕ̃
4La condición de convergencia paramétrica para control adaptable de sistemas no
lineales y lineales se conoce como excitación persistente y en general implica que la
señal de referecia contenga suficiente “riqueza” frecuencial para estimular la dinámica de
adaptación. Para sistemas lineales en general se requieren m/2 frecuencias para la conver-
gencia de m parámetros desconocidos. Para sistemas no lineales con parametrización lineal
la regla aplica sobre la matriz regresora, tal que
∫ T
0 Ψ
T Ψdt > αI para un determinado
tiempo T y α > 0
39
que derivando:
V̇ = 1
2
ST ˙H(q)S + ST H(q)Ṡ + ϕ̃T Γ ˙̃ϕ
sustituyendo H(q)Ṡ de 3.5 y dado que ˙̃ϕ = ˙̂ϕ0 = −Γ−1ΨT S, se tiene:
V̇ = −ST (D + Kv)S ≤ 0
Se puede alcanzar un resultado de estabilidad si S → 0, cuando t → ∞.
El lema de Barbalat permite obtener este resultado. Dado que V tiene un
ĺımite inferior y V̇ ≤ 0, entonces V (t) ≤ V (0) y S y ϕ̃ están acotados (aśı co-
mo los términos asociados q, q̇, q̈, qd, q̃, ˙̃q). Puesto que V̈ = −2ST (D +Kv)Ṡ
está acotada (Ṡ está en función de términos acotados) entonces V̇ → 0 con
t → ∞ ⇒ S → 0 cuando t → ∞.
3.4.3. Control Robusto
La implementación de la ley de control ( 3.1) requiere que el modelo
dinámico y los parámetros asociados se conozcan de manera precisa y además
que el conjunto de ecuaciones de movimiento se pueda calcular en tiempo re-
al. En la práctica, tales requerimientos son dif́ıciles de satisfacer. Para los
sistemas f́ısicos siempre existirá incertidumbre respecto a los valores de los
parámetros que lo describen. Por su parte la ley de control (3.4) representa
un avance permitiendo incertidumbre paramétrica, pero con la premisa de
la certeza del modelo dinámico. Prácticamente siempre habrá cancelaciones
inexactas de las no linealidades del sistema debido a las incertidumbres, el
redondeo computacional, etc. El siguiente paso natural hacia una expresión
de control es una ley que tolere la incertidumbre paramétrica y de modelado.
Con relación a la parametrización lineal ( 3.3), cuando se puede hacer una
aseveración del valor ρ tal que ‖ϕ̂0 − ϕ‖ ≤ ρ, siendo ϕ el valor real del vector
de parámetros, entonces puede aplicarse una ley de control que compensa la
incertidumbre del vector nominal ϕ̂0, tal que :
τ = Ψa − KvS + ΨaU (3.6)
donde:
40
U =
{
-ρ Ψ
T
a S
‖ΨTa S‖
∥∥ΨTa S∥∥ > �
-ρΨTa S/� Ψ
T
a S ≤ �
con:
Kv = D + K, K > 0 diagonal, y Ψa como en (( 3.3)) [2].
Procediendo como en la sección anterior, sumando y restando a la expresión
(3.6) el valor real ϕ, en lazo cerrado en la Ecuación (2.1) y de la definición
de S :
H(q)Ṡ + C(q, q̇)S + KvS = Ψa(ϕ̃ + U) (3.7)
con ϕ̃ = ϕ̂0 − ϕ
Proponiendo como candidata a función Lyapunov:
V = 1
2
ST H(q)S + qT ΛKvq̃
Derivando V, sustituyendo H(q)Ṡ de (3.7), y por Ḣ − 2C = 0, se tiene:
V̇ = STΨaϕ̃ + S
T ΨaU + 2q̃
T ΛKv ˙̃q − ST KvS
de la definición de S, desarrollando:
ST KvS = ˙̃q
TKv ˙̃q + q̃
T ΛKvΛq̃ + 2 ˙̃q
T KvΛq̃
Si se definen x = [q̃; ˙̃q]T y Q =
[
ΛKvΛ 0
0 Kv
]
, se tiene:
V̇ = STΨa(ϕ̃ + U) − xT Qx
CASO A:
∥∥ΨTa S∥∥ > �
V̇ = STΨAϕ̃ − ρST ΨA‖ΨTa S‖ S
T ΨA − xT Qx ≤
∥∥ΨTa S∥∥ ‖ϕ̃‖ − ρ ∥∥ΨTa S∥∥− xT Qx
41
pero por definición ‖ϕ̃‖ ≤ ρ
V̇ ≤ 0
CASO B:
∥∥ΨTa S∥∥ ≤ �
V̇ = STΨAϕ̃ − ρ�
∥∥ΨTa S∥∥2≤ ∥∥ΨTa S∥∥ ρ − ρ� ∥∥ΨTa S∥∥2
el lado derecho de la desigualdad representa una ecuación en
∥∥ΨTa S∥∥ con
un valor máximo en el intervalo [0, �] de �ρ
4
en
∥∥ΨTa S∥∥ = �2 , por tanto:
V̇ ≤ −xT Qx + �ρ
4
Para matrices positivas definidas como Q existen los eigenvalores λmin(Q), λmax(Q)
tales que:
λmin(Q) ‖x‖2 ≤ xT Qx ≤ λmax(Q) ‖x‖2
por tanto
V̇ ≤ −λmin(Q) ‖x‖2 + �ρ4
aśı mismo para toda función cuadrática como V ∃λ1, λ2 > 0 tales que:
λ1 ‖x‖2 ≤ V ≤ λ2 ‖x‖2
si, V̇ < 0 ⇒ V (t) ≤ V (t0), por tanto
‖x‖ ≤
√
λ2
λ1
‖x(t0)‖
para que V̇ < 0 es necesario que:
‖x‖ > 1
2
√
�ρ
λmin(Q)
(I)
aśı que, cuando V̇ > 0, ‖x‖ crece hasta que (I) se vuelve a satisfacer y
V̇ < 0, y ‖x‖ está acotado por:
42
‖x‖ < 1
2
√
λ1
λ2
√
�ρ
λmin(Q)
y se tiene un resultado de estabilidad práctica.
3.4.4. Modos deslizantes
El control por modos deslizantes es un tipo de control de los denominados
de estructura variable. Un controlador robusto fuerza a los estados, combina-
dos en una variable deslizante, a alcanzar una superficie o modo deslizante, en
la que la dinámica se reduce. La dinámica se conserva en el modo deslizante,
sobre el cual se persigue la convergencia a cero del error de seguimiento. Los
modos deslizantes convencionales (lineales) son un control relevado basado
en la función signo, lo que resulta en controladores de alta ganancia y con un
efecto indeseable conocido como troceo o chattering, que es la conmutación
excesivamente rápida de la señal de control. Ante la poca practicidad de los
Modos Deslizantes Lineales, se han desarrollado otras formas como los Mo-
dos Deslizantes Terminales, tipo de control basado en una función “suave”
(en vez de la función discontinua signo) que resulta en un esfuerzo de control
reducido en el transitorio y atenuación del chattering. Se revisan a continua-
ción dos de estos algoritmos.
MODOS DESLIZANTES TERMINALES I: MDT1 [15]
Pártase nuevamente de la parametrización lineal del sistema, con vector de
parámetros nominales ϕ̂0 tal que ‖ϕ̂0 − ϕ‖ ≤ ρ . Sea la ley de control :
τ = Ψ(q, q̇, q̇r, q̈r)(ϕ̂0 + w) − Ksr (3.8)
con :
q̇r = q̇d − Λq̃p
q̈r = q̈d − pΛdia[q̃1p−1...q̃np−1] ˙̃q
q̃p � [q̃1p...q̃np]T
sr � [sr1...srn]T
43
s = ˙̃q + Λq̃p
1
2
< p ≤ 1, 0 < r ≤ 1; K, Λ > 0, diagonales
w =
{
-ρ Ψ
T s
‖ΨT s‖
∥∥ΨT s∥∥ > 0
0
∥∥ΨT s∥∥ = 0
De (3.8) en lazo cerrado en (2.1):
H(q)ṡ + C(q, q̇)s + Ksr = Ψ(q, q̇, q̇r, q̈r)(ϕ̃ + w)
Proponiendo como candidata a función Lyapunov:
V = 1
2
sT H(q)s
derivando V y por Ḣ − 2C = 0, se tiene:
V̇ = −sT Ksr + sT Ψ(ϕ̃0 + w) (3.9)
Para el término sT Ksr se tiene:
sT Ksr =
∑n
i=1 kis
r+1
i ≥ α
{∑n
i=1
1
2
m̄s2i
}η ≥ αV η
con η � (1 + r)/2, α � kmin
{
2
m̄
}η
, con kmin � mini {ki}
cuando
∥∥ΨT s∥∥ = 0 el término sT Ψ(ϕ0 + w) es cero , y de las definiciones de
w y ρ cuando
∥∥ΨT s∥∥ > 0, se tiene:
sT Ψ(ϕ̃0 + w) = s
T Ψ
(
ϕ̃ − ρ ΨT s‖ΨT s‖
)
≤ ∥∥sT Ψ∥∥ (‖ϕ̃‖ − ρ) ≤ 0
en resumen, conjuntando los resultados para los dos términos de (3.9):
V̇ (t) ≤ −αV η, ∀t ≥ 0 (3.10)
Un lema de desigualdades diferenciales establece que, siendo V(t) una
función positivadefinida cuya derivada satisface (3.10), ∀t0 ≥ 0, V (t0) ≥ 0
con α > 0, 0 < η < 1, entonces, V (t) = 0, ∀t ≥ t1 con t1 = t0 + V 1−η(t0)α(1−η) .
44
Dado lo anterior, el algoritmo de control conduce a señales uniformemente
acotadas y a un error de seguimiento q̃(t) = 0 para t ≥ tT con tT < ∞
MODOS DESLIZANTES TERMINALES II: MDT2 [15]
Respecto al control anterior [15], en cuyo algoritmo aparece el término ρ,
tal que ‖ϕ̂0 − ϕ‖ ≤ ρ, y un término w cuyo valor depende de la magnitud∥∥ΨT s∥∥, se propone una variación del control en la cual se estime ρ y la ex-
presión de w conste de un sólo término. Lo anterior implica, por un lado, que
no sea necesario el conocimiento a prioi de ρ, y por otro lado, que la ley de
control adquiera una expresión más sencilla. Sea pues:
˙̂ρ = −σρ̂ + γ ‖Ψ
T s‖
‖ΨT s‖+�
y
w = −ρ̂ ΨT s‖ΨT s‖+�
con �, σ, γ > 0, conservándose todos los demás términos como en el con-
trol anterior.
De (3.8) en lazo cerrado en (2.1) con las nuevas expresiones de w y ρ, y
de la definición de s, se tiene la siguiente dinámica para el error:
H(q)ṡ + C(q, q̇)s + Ksr = Ψ(q, q̇, q̇r, q̈r)(ϕ̃ + w)
Sea la candidata a función Lyapunov:
V = 1
2
sT H(q)s + 1
2γ
ρ̃2, con ρ̃ � ρ̂ − ρ
de donde la derivada de V sobre las trayectorias de la dinámica del error, es:
V̇ = sT H(q)ṡ + 1
2
sT ˙H(q)s + 1
γ
ρ̃ ˙̃ρ
45
V̇ = sT [−C(q, q̇) − Ksr + Ψ(ϕ̃ + w)] + 1
γ
ρ̃ ˙̂ρ + 1
2
sT ˙H(q)s
V̇ = −sT Ksr + sT Ψ(ϕ̃ + w) + 1
γ
ρ̃ ˙̂ρ
o de la definición de w y ρ̂
V̇ = −sT Ksr︸ ︷︷ ︸
−κ
+ sTΨ
(
ϕ̃ − ρ Ψ
T s
‖ΨT s‖ + �
)
︸ ︷︷ ︸
λ
−ρ̃
∥∥ΨT s∥∥2
‖ΨT s‖ + � +
1
γ
ρ̃ ˙̃ρ︸ ︷︷ ︸
µ
Del inciso anterior para κ:
κ ≥ αV η
además para λ:
λ ≤ ∥∥ΨT s∥∥(‖ϕ̃‖ − ρ ‖ΨT s‖‖ΨT s‖+�
)
si
∥∥ΨT s∥∥ ≤ � :
λ ≤ �
2
ρ
si
∥∥ΨT s∥∥ >> � :
λ ≤ 0.
Para µ, dado que ˙̂ρ = ˙̃ρ, y de la definición de ρ̃:
µ = ρ̃
γ
(
˙̃ρ − γ ‖Ψ
T s‖
‖ΨT s‖+�
)
µ = σ
γ
ρ̂ρ̃
µ = −σ
γ
ρ̂2 + σ
γ
ρ
46
Conjuntando los resultados se puede establecer que:
V̇ ≤ −αV η − σ
γ
ρ̂2 + K
siendo K = σ
γ
ρ + �
2
ρ una constante positiva que depende del parámetro
constante desconocido ρ, pero también de los parámetros controlables γ, �
y σ. En cualquier caso, cuando V̇ > 0, V aumenta hasta que nuevamente
V̇ < 0 y se tiene un resultado de estabilidad práctica.
MODOS DESLIZANTES TERMINALES III: NMDT [16]
Otra forma de Modos Deslizantes Terminales que ofrece un desempeño rápi-
do y de alta precisión, es la presentada a continuación. Sea la representación
del sistema en la forma:
H(q)q̈ + C(q, q̇)q̇ + g(q) = τ + τd + F (q, q̇, q̈) (3.11)
representando τ el control, τd un vector de perturbación externa acotada
y F (q, q̇, q̈) incertidumbre concentrada del sistema. Sea pues, la siguiente ley
de control:
τ = τ0 + τ1 (3.12)
donde:
τ0 = H(q)q̈d + C(q, q̇)q̇ + g(q)
τ1 = −H(q)(k1s − k2sig(s)ρ)
siendo el modo deslizante:
47
s = q̃ + βsig( ˙̃qγ) = 0
con:
k1 = diag(k11, ..., k1n), k2 = diag(k21, ..., k2n), k1i > 0, k2i > 0, β = diag(β1, ..., βn),
βi > 0, 0 < γi < 1, 0 < ρ = ρi = ... = ρn < 1.
definiéndose sig(x)γ como: sig(x)γ = [|x1|γ1 sign(x1)...sig(x)γ |xn|γn sign(xn)].
Para analizar las propiedades de estabilidad de la ley de control (3.12), se
presenta el Lema 1 y una forma extendida de Lyapunov para estabilidad en
tiempo finito para modos deslizantes términales [16]:
Lema 1: Supóngase que a1, a2, ..., an y 0 < p < 2 son todos números posi-
tivos, entonces se cumple la siguiente desigualdad:
a21 + a
2
2 + ... + a
2
n ≤ (ap1 + ap2 + ... + apn)2
Forma extendida de Lyapunov para MDT:
V̇ (x) + αV (x) + βV γ(x) ≤ 0, 0 < γ < 1
.
Sea la candidata a función Lyapunov:
V = ‖s‖
2
2
Derivando V, sustituyendo (3.12) y utilizando el Lema 1, se tiene:
V̇ = sT βγdiag(
∣∣ ˙̃q∣∣γ−1)H(q)−1(τ1 + F + τd) (3.13)
Para F=0 y τd = 0 (3.13) se puede expresar como:
V̇ = −sTk1s − sTk2sig(s)p
con k1 = βγdiag(
∣∣˜̇qγ−1∣∣)k1 ∈ Rnxn y k2 = βγdiag(∣∣˜̇qγ−1∣∣)k2 ∈ Rnxn son
48
matrices diagonales positivas definidas si cualquier ˙̃qi 
= 0. Del Lema 2, se
tiene:
V̇ ≤ −2k1V − 2(p+1)/2k2V (p+1)/2
donde k1 = minik1i > 0 y k2 = minik2i > 0 son los mı́nimos eigenval-
ores de k1 y k2 respectivamente y 1/2 < (p+1)/2 < 1. De acuerdo al criterio
de estabilidad en tiempo finito, el modo deslizante terminal se alcanzará en
tiempo finito y posteriormente el error de seguimiento q̃ convergirá a cero
también en tiempo finito.
II: Para F 
= 0 y τd 
= 0 la trayectoria del sistema converge a la vecindad
del TSM s=0 tal que:
‖s‖ ≤ ∆ = min∆1, ∆2,
∆1 =
‖M−10 (q)‖(b0+b1‖q‖+b2‖q̇‖2)
k1
, ∆2 =
(‖M−10 (q)‖(b0+b1‖q‖+b2‖q̇‖2)
k2
)1/p
,
donde ‖F (q, q̇, q̈)‖ ≤ b0 + b1 ‖q‖ + b2 ‖q̇‖2 y τd ≤ d
El error de seguimiento q̃i y ˙̃q convergen a las regiones:
|q̃i| ≤ ∆q̃ = 2∆,
∣∣ ˙̃qi∣∣ ≤ ∆ ˙̃q = (∆βi)1/γi en tiempo finito5.
3.4.5. Compensación de fricción: observador
El término de fricción FL se puede integrar al modelo (2.1) como un
término aditivo
H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ − FL (3.14)
Un esquema de control que compense el fenómeno de fricción debe incluir
un estimador que prediga su valor. Este estimador ha de basarse en un mo-
delo de fricción, en el caso considerado, el modelo LuGre, el cual como ya se
5La demostración de las propiedades enunciadas resulta extensa y no se consigna en
este trabajo. Puede consultarse en [16]
49
vió depende de seis parámetros, es dinámico y tiene un estado no medible z.
Si se asume que se conocen los parámetros σ0, σ1, σ2 y g(v) de (2.8) y (2.9)
se puede usar un observador no lineal de fricción, tal que:
dẑ
dt
= v − |v|
g(v)
ẑ − ke
F̂L = σ0ẑ + σ1
dẑ
dt
+ σ2v
donde e = x − xd es el error de posición y xd es la posición deseada que se
asume 2 veces diferenciable.
El diagrama a bloques de la Figura 3.2 describe al sistema con la adición de
la fuerza de fricción y el observador correspondiente:
Figura 3.2: Diagrama a bloques del sistema con fricción y observador de
fricción
Como se mencionó en la sección 2.7.2, no se presenta en este trabajo
prueba formal de estabilidad del sistema de control ante la presencia de
fricción ni tras la inclusión del observador de fricción. Este trabajo se limita
a incorporar la fricción como una dinámica no modelada, en su oportunidad
simplemente compensada con la ayuda del observador ya presentado6.
6En [7] se demuestra que cuando los parámetros de fricción se conocen, el error del
50
3.5. Comparación cualitativa entre algoritmos
PD+
Presenta la estructura más simple, con un término que compensa no line-
alidades. La convergencia asintótica se asegura para el caso nominal y sólo
una alta ganancia asegura un desempeño adecuado para casos no nominales.
Es el control con más exigencias a priori y restricciones.
Control Adaptable
Permite lidiar con incertidumbre paramétrica, pero parte de la premisa de
estructura conocida. Se sabe que su respuesta ante perturbaciones o dinámi-
cas no modeladas no es muy buena. Los parámetros convergen en condición
de exitación persistente, pero en caso de exitación no persistente o dinámicas
no modeladas puede ocurrir un problema de deriva: el error de seguimiento
puede mentenerse pequeño en tanto los parámetros divergen de los reales
hasta un punto tal en que el sistema se vuelve inestable. Respecto al control
PD+, aumenta el número de expresiones y por los problemas conocidos de
deriva resulta un tipo de control que no se autosustenta en términos prácticos.
Control Robusto
Este control es un paso adelante respecto al controlador adaptable. Igual
que en el control adaptable se parte del supuesto que el vector de parámetros
nominales difiere del real, pero en vez de implementar una ley de adaptación
para el vector de parámeros nominales, se compensa la ley de control con un
término que depende de la magnitud del error entre los parámetros nominales
y los reales. Esta aproximación solventa el problema de deriva de parámetros,
evitando que el sistema escape y se desestabilice. A fin de cuentas se alcanza
un resultado de estabilidad práctica al estar los estadosultimadamente aco-
tados en función de parámetros manipulables. Este resultado de estabilidad
es menos fuerte que el del caso adaptable, pero más robusto ante dinámi-
cas no modeladas y perturbaciones. Se advierte en el controlador robusto un
compromiso entre la cota final del vector de estados y la ganacia del control,
al ser estas dos magnitudes inversamente proporcionales.
observador de fricción converge asintóticamente a cero
51
Control por Modos Deslizantes
MDT1
El control MDT1 al igual que el control robusto, compensa la incertidum-
bre en el vector de parámetros, pero el término de compensación w es un
término de magnitud constante que se aplica sólo cuando existe error de
seguimiento. A diferencia de los controladores previos que presentan en la
ley de control un término proporcional al error de seguimiento y a la tasa de
error de seguimiento, esta ley de control presenta una función exponencial
fraccionaria de dichas magnitudes. Esto tiene como efecto un control suave
y con magnitudes menores a los casos anteriores (en la etapa transitoria),
pero que usualmente requiere tiempos de respuesta mayores. La expresión
de control resulta la más sencilla entre los controladores deslizantes revisa-
dos, además de alcanzar un fuerte resultado de estabilidad, como lo es el de
señales uniformenmente acotadas y convergencia del error de seguimiento a
cero en tiempo finito.
MDT2
Partiendo de MDT1, la ley MDT2 propone una simplificación a la expresión
de control para el término w, aśı como un esquema adaptable para establecer
el valor del término ρ. El esquema MDT2 representa una mejora respecto a
MDT1 en los rubros de simplicidad del algoritmo y cantidad de información
a priori (al no tener que conocerse de antemano el valor de ρ). Sin embargo
para MDT2 se establece un resultado de estabilidad menos fuerte que para
MDT1: estabilidad práctica.
NMDT
La expresión de control resulta la más compleja de las revisadas, pero aśı mis-
mo la más completa al incluir términos que compensan expĺıcitamente las
perturbaciones y dinámicas no modeladas. Los resultados de estabilidad
obtenidos son fuertes: de convergencia del error a cero en tiempo finito para
casos nominales y de estabilidad práctica para el caso con perturbación.
52
Caṕıtulo 4
Simulación: Comparación
cuantitativa
4.1. Introducción
En este caṕıtulo se realizan simulaciones del sistema para las leyes de
control revisadas en el caṕıtulo anterior con lo que se pueden comparar cuan-
titativamente los distintos algoritmos. En la sección 4.2 se presentan señales
reales caracteŕısticas del movimiento del tipo de buque de interés, las cuales
se usan para alimentar las simulaciones.
En la sección 4.3 se hacen consideraciones respecto a la aproximaciónes di-
recta e indirecta al realizar la disposición de los sensores que miden el giro
alrededor de los ejes de interés, haciendo alusión a los resultados de [6].
Aśı mismo se ejemplifica como se realizan las mediciones angulares en el es-
quema de control propuesto.
En la sección 4.5 se presenta una estrategia que permite disminuir signi-
ficativamente la amplitud de las transiciones abruptas de la señal de control,
al suavizar las derivadas de las señales de referencia.
En la sección 4.6 se resume en una tabla los algoritmos de control revisa-
dos y se presentan las gráficas resultantes de las simulaciones de control del
sistema representado por la Ecuación (2.7) para varias condiciones.
53
En la sección final se realiza la comparación cualitativa del desempeño de
los controladres. Se presenta una tabla de parámetros ponderados en base a
los cuales se califica el desempeño de los algoritmos.
4.2. Señal caracteŕıstica de la mar
Como se adelantó en la sección 3.3 el movimiento que se experimenta
sobre un barco depende de factores muy diversos, como por ejemplo, la ve-
locidad de navegación (que para las embarcaciones de interés es de 0 a 20
nudos1), el sentido de movimiento, el estado de la mar, incluso la disposición
de la carga al interior del buque.
En general se pueden identificar 4 tipos de movimiento importantes del
buque, a saber: el movimiento hacia adelante, el movimiento hacia atrás, el
movimiento de cambio de rumbo y el estado en el que el buque debe conser-
var su posición respecto al fondo del mar, en lenguaje marinero se denomina
“estar al pairo”.
Las gráficas de la Figura 4.1 presentan un conjunto de señales caracteŕısticas
de los movimiento de rotación que experimenta un buque a la mar y permiten
tener una idea de las perturbaciones a que se ve sometido un sensor abordo
de una embarcación.
Las señales que se presentan fueron obtenidas de giros de estado sólido
en un buque de la marina de México. Cabe resaltar que la frecuencia de
muestreo es de entre 9 y 10 Hz por limitaciones de las giros usadas. Ello indica
que de acuerdo al teorema de Nyquist2 tal frecuencia de muestreo captura
fenómenos en frecuencias dentro del rango de 0 a 5 hertz. Se tiene reportado
que para las embarcaciones de interés, existe una componente de vibración
persistente alrededor de 15 Hz, la cual se atribuye al conjunto estructura-
sistema de máquinas del buque. No obstante, esta frecuencia resulta muy
alta comparada con la dinámica del mar y su componente de enerǵıa es
1Un nudo, knt equivale a 0.515 m/s
2La frecuecia de muestreo debe ser al menos el doble del ancho de banda de la señal
de entrada, si el criterio no es satisfecho existirán frecuencias cuyo muestreo coincide con
el de otra(s)-el denominado aliasing-
54
Figura 4.1: Señal caracteŕıstica de las rotaciones en una embarcación a la
mar. El eje horizontal tiene escala en segundos y el vertigal en grados
soslayable comparada con la enerǵıa de las frecuencias por abajo de 5 Hz.
La Figura 4.2 muestra un par de movimientos de buque hacia adelante, los
espectros permiten ver el rango de frecuencia en que ocurre el fenómeno de
perturbación.
Las datos de las señales reales de giro se usan en las simulaciones com-
putacionales que se presentan en la seccion final.
4.3. Sensores de giro y su disposición f́ısica:
aproximación directa e indirecta
La disposición del sensor de giro en una aplicación de estabilzación puede
tener un impacto significativo en el desempeño del sistema. En este sentido,
existen dos aproximaciones al problema de sensado de giro, la directa y la
indirecta.
55
Figura 4.2: Señales caracteŕısticas de un par de movimientos del buque hacia
adelante
La aproximación directa, consiste en establecer los sensores de giro di-
rectamente sobre la ĺınea de vista.
En la aproximación indirecta, se establecen los sensores en la base de
la plataforma. Por ende si la tarea es estabilizar la LOS, deben aplicarse las
transformaciones necesarias para obtener la perturbación equivalente alrede-
dor del eje de referencia de la LOS. La relación entre la perturbación real
alrededor de la LOS y aquella medida en la base de la plataforma depen-
derá de la geometŕıa de la plataforma, su rigidez estructural, la precisión de
los sensores de posición (tacómetro y o codificador de posición), juegos entre
los mecanismos de transmisión de movimiento, etc.
En resumen, puede establecerse lo siguiente respecto a la dispocición de los
56
sensores de giro en una aplicación de estabilización:
Aproximación directa
• El sensor o sensores se montan directamente sobre la LOS.
• La corrección de la perturbación es directa
• Dependiendo del tamaño del sensor, puede impactar el tamaño de
la base y limitar rangos de movimiento.
• El método directo ofrece ventajas para aplicaciones de precisión
pues las perturbaciones se miden directamente sobre ĺınea de vista.
Aproximación indirecta
• El sensor o sensores se montan en la base de la plataforma.
• No se miden las perturbaciones alrededor de la LOS.
• La perturbación alrededor de la LOS se obtiene mediante trans-
formaciones.
• Las ventajas de esta configuración son de tipo
Preguntas relacionadas

¿Cuál es la definición del análisis numérico? a) El análisis numérico es una rama de las matemáticas que se enfoca en el desarrollo, análisis e i...

Preguntas Generales
El análisis fenomenológico experimental posibilita una investigación empírica en la que el punto de partida son fenómenos, y no elementos sensorial...

Preguntas Generales
fijas de un ambiente laboral, la nueva generación de oficinas con sus dispositivos electrónicos conforma una generación que apoya el trabajo móvil ...

Preguntas Generales
Analisis-comparativo-de-algoritmos-para-el-control-de-la-LOS-de-un-sensor-sobre-una-plataforma-movil

Ciencias Sociales

Humanas / Sociais

Ciencias Sociales

Otros materiales

Preguntas relacionadas

¿Cuál es la definición del análisis numérico? a) El análisis numérico es una rama de las matemáticas que se enfoca en el desarrollo, análisis e i...

El análisis fenomenológico experimental posibilita una investigación empírica en la que el punto de partida son fenómenos, y no elementos sensorial...

fijas de un ambiente laboral, la nueva generación de oficinas con sus dispositivos electrónicos conforma una generación que apoya el trabajo móvil ...

Otros materiales