Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO PROGRAMA DE MAESTRÍA Y DOCTORADO EN INGENIERÍA FACULTAD DE INGENIERÍA ANÁLISIS COMPARATIVO DE ALGORITMOS PARA EL CONTROL DE LA LOS DE UN SENSOR SOBRE UNA PLATAFORMA MÓVIL T E S I S QUE PARA OPTAR POR EL GRADO DE: MAESTRO EN INGENIERÍA ÁREA: ELÉCTRICA – CAMPO: CONTROL P R E S E N T A : SERGIO ATAYDE DEL MORAL TUTOR: DR. YU TANG XU 2007 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. JURADO ASIGNADO: Presidente: Dr. Gerardo René Espinosa Pérez Secretario: Dr. Luis Agustín Álvarez Icaza Longoría Vocal: Dr. Yu Tang Xu 1er. Suplente: Dr. Héctor Pérez Benítez 2do. Suplente: Dr. Marco Arteaga Pérez Lugar donde se realizó la tesis: México, D.F., Ciudad Universitaria TUTOR DE TESIS: Dr. Yu Tang Xu _________________________________ FIRMA AGRADECIMIENTOS Agradezco a mi asesor el Doctor Yu Tang Xu por dirigir este trabajo de tesis. Agradezco a los sinodales por el tiempo que dedicaron a revisar y comentar este trabajo de tesis. Agradezco al Colegio de Control de la DEPFI por sus enseñanzas durante el curso de las asignaturas de la maestría en control. Agradezco al Consejo Nacional de Ciencia y Tecnología, CONACYT, por su apoyo económico al concederme una beca de maestría, a través del programa de Formación de Científicos y Tecnólogos. Agradezco a la Secretaría de Marina por el apoyo y las facilidades prestadas para la realización de este trabajo, en particular al Capitán de Corbeta y Maestro en Ingeniería Alberto Fuentes Maya y al Almirante Laureano Suárez Allen Sergio Atayde Del Moral 2007 Análisis comparativo de algoritmos para el control de la LOS de un sensor sobre una plataforma móvil Sergio Atayde Del Moral 2007 Índice general 1. Introducción 9 1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2.1. Orientación de la LOS . . . . . . . . . . . . . . . . . . 11 1.2.2. Estabilización de la LOS . . . . . . . . . . . . . . . . . 11 1.3. Definición geométrica de la tarea de control . . . . . . . . . . 12 1.4. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.5. Ubicación de este trabajo de tesis . . . . . . . . . . . . . . . . 14 1.6. Contribución . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2. Modelo del sistema 16 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2. Configuración cinemática . . . . . . . . . . . . . . . . . . . . . 16 2.3. Marcos de referencia: Convención Denavit-Hartenberg . . . . . . . . . . . . . . . . . . . . . . . . 18 2.4. Relaciones cinemáticas de la plataforma . . . . . . . . . . . . 19 2.5. Sistemas Lagrangianos . . . . . . . . . . . . . . . . . . . . . . 21 2.5.1. Modelado mediante métodos energéticos: Ecuaciónes Euler-Lagrange [3] . . . . . . . . . . . . . 21 2.5.2. Desarrollo de las ecuaciones Euler-Lagrange para ma- nipuladores mecánicos de n grados de libertad . . . . . 23 2.6. Desarrollo del modelo . . . . . . . . . . . . . . . . . . . . . . . 26 2.7. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . 29 2.7.1. Fenómeno de fricción [8] . . . . . . . . . . . . . . . . . 29 2.7.2. Modelo de fricción LuGre [7] . . . . . . . . . . . . . . 30 3. Algoritmos de Control: Comparación cualitativa 32 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 1 3.2. Control de Orientación . . . . . . . . . . . . . . . . . . . . . . 33 3.3. Control de Estabilización . . . . . . . . . . . . . . . . . . . . . 34 3.3.1. Estabilización de balanceo: Grado de libertad “virtual” en balanceo . . . . . . . . . . . . . . . . . . . . . . . . 35 3.4. Métodos de control para manipuladores . . . . . . . . . . . . . 36 3.4.1. PD+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.4.2. Control Adaptable . . . . . . . . . . . . . . . . . . . . 38 3.4.3. Control Robusto . . . . . . . . . . . . . . . . . . . . . 40 3.4.4. Modos deslizantes . . . . . . . . . . . . . . . . . . . . . 43 3.4.5. Compensación de fricción: observador . . . . . . . . . . 49 3.5. Comparación cualitativa entre algoritmos . . . . . . . . . . . . 51 4. Simulación: Comparación cuantitativa 53 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.2. Señal caracteŕıstica de la mar . . . . . . . . . . . . . . . . . . 54 4.3. Sensores de giro y su disposición f́ısica: aproximación directa e indirecta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.4. Señal de referencia: aproximación directa . . . . . . . . . . . . 57 4.5. Suavización de señales de simulación . . . . . . . . . . . . . . 58 4.6. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.7. Comparación Cualitativa . . . . . . . . . . . . . . . . . . . . . 73 5. Conclusiones 80 5.1. Conclusiones, aportación y trabajo futuro . . . . . . . . . . . 80 A. Códigos y Diagramas para las simulaciones en Simulink 82 B. Grado de libertad virtual en eje de balanceo 89 C. Suavización de señales 93 2 Índice de figuras 1.1. Rotaciones de una embarcación . . . . . . . . . . . . . . . . . 10 1.2. Tareas de control: orientación y estabilización . . . . . . . . . 12 1.3. Disposición de ejes para formar la señal de referencia . . . . . 13 2.1. Plataforma de dos Grados de Libertad . . . . . . . . . . . . . 17 2.2. Representación general de plataforma 2GDF . . . . . . . . . 18 2.3. Disposición de ejes para la plataforma 2DOF . . . . . . . . . 20 2.4. Cuerpos simples para representar a la plataforma de dos gra- dos de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.5. Cerdas microscópicas entre dos superficies en contacto . . . . 30 3.1. Esquema de control. Las lecturas del sensor de giro alimentan las correcciones mecánicas en cabeceo y guiñada y la correción en balanceo de la imagen. . . . . . . . . . . . . . . . . . . . . 36 3.2. Diagrama a bloques del sistema con fricción y observador de fricción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 4.1. Señal caracteŕıstica de las rotaciones en una embarcación a la mar. El eje horizontal tiene escala en segundos y el vertigal en grados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.2. Señales caracteŕısticas de un par de movimientos del buque hacia adelante . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.3. Disposición de ejes para formar la señal de referencia . . . . . 58 4.4. Señales de velocidad y aceleración caculadas con diferenciación numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.5. Señales de velocidad y aceleración caculadas con diferenciación numérica y suavizadas . . . . . . . . . . . . . . . . . . . . . . 60 4.6. Señal de referencia para guiñada (a) y cabeceo (b) . . . . . . . 62 3 4.7. Señales de error para simulaciones de las leyes decontrol de la Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas- suavizadas-. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.8. Señales de error para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas -suavizadas-. (detalle). . . . . . . . . . . . . . . . . . . . . . . 64 4.9. Señales de control para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7), con señales de referencia filtradas-suavizadas-. . . . . . . . . . . . . . . . . . . . . . . . 65 4.10. Señales de control para simulaciones de las leyes de control de la Tabla 4.1 en el modelo 2.6, con señales de referencia no filtradas (contrástese con la Figura 4.9) . . . . . . . . . . . . 67 4.11. Señales de fricción t́ıpica inyectada . . . . . . . . . . . . . . . 68 4.12. Señales de error para simulaciones de las leyes de control de la Tabla 4.1 en el modelo 2.6 con referencias filtradas y fricción no compensada . . . . . . . . . . . . . . . . . . . . . . . . . . 69 4.13. Señales de error para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción no compensada (detalle) . . . . . . . . . . . . . . . . . . . . . 70 4.14. Señales de control para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción no compensada . . . . . . . . . . . . . . . . . . . . . 71 4.15. Señales de error para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7) con fricción compensada . . . 72 4.16. Señales de error para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción compensada (detalle) . . . . . . . . . . . . . . . . . . . . . . 73 4.17. Señales de control para simulaciones de las leyes de control de la Tabla 4.1 en el modelo (2.7) con referencias filtradas y fricción compensada . . . . . . . . . . . . . . . . . . . . . . . 74 4.18. Señales de fricción “real” y observada con detalle de conver- gencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4.19. Enerǵıa de la señal de error . . . . . . . . . . . . . . . . . . . 76 4.20. Enerǵıa de la señal de control . . . . . . . . . . . . . . . . . . 77 A.1. Modelo de simulación en Simulink . . . . . . . . . . . . . . . 83 4 B.1. Ejes de referencia convencionales para el manejo de imágenes digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 B.2. Ejes de referencia propuestos . . . . . . . . . . . . . . . . . . 90 B.3. Rotación de n grados, algoritmo con pixeles ciegos . . . . . . 91 B.4. Rotación de n grados, algoritmo sin puntos ciegos . . . . . . . 92 C.1. Señal escalonada (ĺınea sólida) y su contraparte “suavizada”(ĺınea discontinua) . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5 Índice de cuadros 2.1. Tabla de parámetros D-H . . . . . . . . . . . . . . . . . . . . 20 2.2. Tabla de Momentos de Inercia . . . . . . . . . . . . . . . . . 27 4.1. Tabla de leyes de control . . . . . . . . . . . . . . . . . . . . 61 4.2. Tabla de resultados: Tanto en las calificaciones de los incisos como en el renglón de Índice Final, una cifra menor representa un mejor desempeño . . . . . . . . . . . . . . . . . . . . . . . 78 4.3. Tabla de ponderación de incisos de comparación . . . . . . . 79 4.4. Ejemplo del cálculo del Índice Final para el control PD+ . . . 79 A.1. código de control (1) . . . . . . . . . . . . . . . . . . . . . . . 85 A.2. código de control (2) . . . . . . . . . . . . . . . . . . . . . . . 86 A.3. Modelo de aceleración . . . . . . . . . . . . . . . . . . . . . . 87 A.4. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . 87 A.5. Observador de fricción . . . . . . . . . . . . . . . . . . . . . . 88 6 Prefacio Organización de la tesis En esta tesis se analiza comparativamente el desempeño de varios algo- ritmos de control aplicados a la estabilización y orientación de la ĺınea de vista de un sensor montado en una plataforma movil en un ambiente con perturbaciones. Siendo más espećıficos, el sensor de interés es una cámara de video montada en una embarcación1, por tanto las perturbaciones son las propias del medio marino, principalmente el oleaje. La tesis se organiza de la siguiente manera: El Caṕıtulo 1 es una introducción en la que se presenta la motivación de este trabajo de tesis, revisándose el contexto en el que es deseable lograr la orientación y estabilización de dispositivos mediante el empleo de platafor- mas moviles. Una vez descrita la problemática se establecen los objetivos de control. Se mencionan aśı mismo, trabajos en los que se han desarrollado varias aproximaciones a la tarea de manipulación de plataformas. Por último, se ubica este trabajo de tesis y se resaltan las contribuciones del mismo. En el Caṕıtulo 2 se desarrolla un modelo del sistema plataforma móvil. Primero se propone una configuración cinemática para la plataforma y a continuación se emplea la convención Denavit-Hartenberg para establecer marcos de referencia y obtener las matrices de transformación asociadas. Después se hace una breve revisión del modelado mediante métodos energé- ticos (indicador variacional, variables de flujo y esfuerzo) y de las ecuaciones Euler-Lagrange. En la sección final del caṕıtulo, se llega a una expresión 1La naturaleza espećıfica del sensor y el medio en el que opera resulta de relevancia en el desarrollo de este trabajo 7 parametrizada puntual para el modelo de la plataforma. En el Caṕıtulo 3 se revisan varios de los métodos de control de manipuladores mecánicos, haciendo énfasis en los de tipo robusto, incluyéndose el análisis de estabilidad y convergencia en lazo cerrado para los casos nominales. En uno de los incisos de simulación se prueba el desempeño de los controladores ante la presencia de fricción, por lo que en este caṕıtulo se revisa brevemente el modelo LuGre, aśı como un observador de fricción. El caṕıtulo finaliza con una comparación cualitativa entre los algoritmos de control presentados. El caṕıtulo 4 está dedicado a simulaciones del control de la plataforma u- sando los algoritmos revisados en el Caṕıtulo 3, aśı como a la comparación cuantitativa del desempeño de las diferentes leyes de control presentadas. Primero se presentan señales de giro t́ıpicas (reales) para varios estados de la mar. Dicho tipo de señal es el que se alimenta como perturbación al sis- tema controlado en lazo cerrado. Despúes se enuncian las caracteŕısticas de las aproximaciones directa e indirecta para la medición de rotaciones y tasas de giro. Por último se presenta el análisis comparativo de los distintos con- troles, el cual incluye un conjunto de gráficas y tablas en las que se resume y analiza el desempeño de los controles con base en parámetros como, tiempo de asentamiento, enerǵıa de las señales de error y de control, magnitud del error residual, suposiciones a priori etc2. En el Caṕıtulo 5, se presentan las conclusiones de este trabajo de tesis, se resalta lo que se considera como aportaciones y se esboza el trabajo a futuro. 2En su momento en los casos que no se pueda obviar, se definen los parametros de comparación 8 Caṕıtulo 1 Introducción 1.1. Motivación Varios son los veh́ıculos aéreos, terrestres y marinos que transportan equipo de sensado el cual entra en operación mientras dichos veh́ıculos se mueven y está, por ende, sujeto a movimientos aleatorios debidos a las irre- gularidades de la v́ıa, sea ésta un terreno pedregoso, un mar con oleaje o un cielo turbulento. Frecuentemente para cumplir su fin espećıfico de manera óptima, los sensores montados en los veh́ıculos deben conservar en la me- dida de lo posible cierta orientación, aún cuando perturbaciones del medio tiendan a “desorientarlos”. Por ejemplo, en el caso de sistemas de comuni- cación se busca que las antenasreceptoras/transmisoras apunten hacia la fuente/destino de la señal a fin de recibir/enviar ı́ntegramente la información de interés. En tales casos, el equipo de sensado se monta sobre una platafor- ma móvil que lo estabiliza respecto a los movimientos del veh́ıculo en uno o más de sus ejes, con base en información de rotación proporcionada por sensores de giro adosados a la plataforma y/o al sensor. En particular, en esta tesis se revisará el caso en que el veh́ıculo de interés es una embarcación y el sensor es una cámara de video montada en una plataforma móvil actuada. El objetivo primordial del control es conservar cierta ĺınea de visión o LOS 1. Por lo tanto, cuando la embar- cación sufre rotaciónes respecto a sus ejes, Figura 1.1, se busca que el control 1Por las siglas en inglés de Line Of Sight, la abreviacion LOS se usa a lo largo de la tesis 9 adquiera y/o mantenga la orientación de la LOS respecto al blanco u objeti- vo de interés, al generar en la plataforma los movimientos que logren la LOS comandada y contrarresten las perturbaciones que sufre la embarcación. Figura 1.1: Rotaciones de una embarcación 1.2. Objetivo Es necesario establecer claramente el objetivo de control para determinar qué eventos y/o perturbaciones generan una reacción del esquema de control, y aquellas que no lo hacen por no contravenir el objetivo establecido. Aśı mis- mo, al haber delimitado el objetivo se puede elegir un tipo de configuración mecánica para la plataforma, cuya cinemática permita cumplir el objetivo 10 planteado dentro de una buena relación complejidad-desempeño. La tarea de interés se puede resumir de la siguiente manera: la ĺınea de vista del sensor en cuestión, cámara, debe apuntar en dirección del blanco u objetivo de interés , el cual puede estar fijo o en movimiento. Aunado a lo anterior, la embarcación en que se encuentra el sensor está expuesta a movimientos continuos debidos al medio marino. Esto es, se tiene en el caso más general una LOS variable en un medio con perturbaciones. De es- ta forma, el objetivo de dirigir la LOS del sensor hacia un blanco puede definirse en dos subtareas: tarea de orientación o seguimiento y tarea de es- tabilización o rechazo de perturbaciones. Las perturbaciones y movimientos de orientación/seguimiento considerados serán de tipo rotacional, en conse- cuencia las tareas de orientación y estabilización se satisfacen con grados de libertad rotacionales. 1.2.1. Orientación de la LOS La tarea de orientación de la LOS de un sensor mediante el uso de una plataforma móvil, consiste en dirigir el vector caracteŕıstico de la LOS 2 hacia el objetivo de interés a través de la manipulación de los grados de libertad de la plataforma. En general puede identificarse lo anterior como una tarea de seguimiento, en la que se busca llevar el estado de operación de un sistema a lo largo de cierta trayectoria y/o hacia cierta referencia constante. En el caso particular en que el sensor es una cámara, la tarea de adquirir y preservar cierta LOS puede traducirse, por ejemplo, en mantener centrado y en foco un objetivo en movimiento relativo respecto a la embarcación que transporta al sensor. Aśı, con un objeto en movimiento y un sensor con el que se le quiere apuntar, se tiene en general una tarea de seguimiento. 1.2.2. Estabilización de la LOS El vector caracteŕıstico de la LOS de un sensor sobre una plataforma en una embarcación marina se encuentra expuesto a multiples fuentes de pertur- bación, siendo la principal la acción de las olas. Otras fuentes de perturbación 2La ĺınea de vista de un sensor tiene asociado un vector caracteŕıstico o vector de dirección, el cual es unitario, deslizante y está dirigido sobre la ĺınea recta no obstruida que une al sensor y su objetivo. 11 pueden deberse a torcas inducidas por corrientes de viento. También las vi- braciones y movimientos lineales de la embarcación pueden generar torcas de perturbación debido a desbalances de masa por la disposición geométrica de los componentes de la plataforma. Recordando que en este trabajo de tesis se consideran sólo perturbaciones de orden rotacional, las perturbaciones trasla- cionales se toman en cuenta sólo en la medida que impacten la orientación de la LOS respecto al blanco de interés. La Figura 1.2 resume las tareas de control descritas en esta sección. Se puede hacer la siguiente analoǵıa: las perturbaciones marinas impactan la cola del vector que define a la LOS en tanto que el movimiento relativo del blanco del sensor afecta la punta del vector de la LOS. Figura 1.2: Tareas de control: orientación y estabilización 1.3. Definición geométrica de la tarea de con- trol Con ayuda de la Figura 1.3 se pueden definir geométricamente las ta- reas de orientación y estabilización. La figura representa una vista aérea del conjunto buque-plataforma-sensor. Considérese por simplicidad sólo el 12 movimiento en el eje de guiñada. Los vectores LOSdes y LOSact definen, respectivamente, la orientación deseada del sensor y la orientación actual referidas a un sistema de ejes inercial (ejes ĺınea gruesa discontinua) respecto al cual se tienen mediciones de giro de posición/velocidad angular. El vector LOSdes es en general variable, pues cambia conforme al movimiento relati- vo entre el buque y el objetivo de interés. El vector LOSact por su parte, está expuesto a las perturbaciones de la mar. Se tiene además, otro marco de referencia (ejes ĺınea delgada discontinua) respecto al cual se establece, mediante un codificador de posición, el estado en guiñada qact del eje mecánico de la plataforma mov́ıl que orienta al sensor. La tarea de control consiste en combinar la LOSdes con la información de los sensores de giro LOSact y posición qact a fin de generar una referencia qdes que, como entrada a un esquema de control, permita que el vector LOSact siga a la referencia LOSdes (orientación) a la vez que se rechazan las pertur- baciones de la mar (estabilización). Figura 1.3: Disposición de ejes para formar la señal de referencia 13 1.4. Estado del arte La tarea de estabilización y orientación de una plataforma ha sido abor- dada en varios trabajos con el empleo de un manipulador Stewart, [11] y [12]. Esta aproximación a la tarea de estabilización es buena para el control de vi- braciones, es decir, para casos en que las desviaciones del punto de operación son relativamente pequeñas. Este tipo de plataforma puede corregir en seis grados de libertad, es decir en tres grados de posición y tres de orientación. Sin embargo, la amplidud de sus movimientos es limitada y la complejidad de control es elevada. Shtessel en [13] y [14] trata el problema de estabilización de una platafor- ma inercial de tres ejes mediante técnicas de modos deslizantes y desacoplamien- to. Peter et al en [6] trataron el tema de la estabilización de una plataforma de dos grados de libertad, haciendo una comparación de desempeño entre la aproximacion de mediciones de giro directamente sobre la LOS, y mediciones indirectas en la base de la plataforma, caso en el cual han de reconstruirse las perturbaciones sobre la LOS a partir de las perturbaciones medidas en la base. La conclusión es que el desempeño de la aproximación directa es superior. 1.5. Ubicación de este trabajo de tesis En este trabajo de tesis se aplica la metodoloǵıa de control como trasfondo y sustento académico de una tarea de interés práctico. El objetivo principal de ı́ndole teórico-académico se aborda v́ıa la comparación de algoritmos de control de tipo adaptable y robusto para el control de orientación y estabi- lización de la Ĺınea de Vista de un sensor. Las tareas de estabilización y orientación de la LOS se desarrollan tomando en cuenta las condiciones que presenta el medio marino, aśı como restricciones y limitaciones que es necesario imponer a fin de poder presumir la “imple- mentabilidad” de los esquemasde control revisados. Tales restricciones son por ejemplo: viabilidad f́ısica-mecánica del esquema de control -simplicidad 14 de implementación-; accesibilidad de señales de referencia y estado; magnitud de la señal de control dentro de un rango razonable; robustez del esquema ante perturbaciones, dinámicas no modeladas, variaciones del sistema, etc. La comparación de los distintos algoritmos presentados se hace mediante la evaluación de parámetros ponderados. Se presume que los resultados de este trabajo permitirán llevar a cabo una implementación práctica óptima. 1.6. Contribución Este trabajo a sido apoyado por el INIDETAM (Instituto de Investigación y Desarrollo Tecnológico de la Armada de México) de la Secretaŕıa de Ma- rina, uno de cuyos objetivos es realizar y fomentar la investigación en áreas de interés naval a fin de aumentar el nivel de independencia tecnológica de la institución. Este trabajo sirve de base teórico-académica para la implementación de es- quemas de control de orientación y estabilización de sistemas de vigilancia de desarrollo nacional en buques de la Secretaria de Marina, coadyudando eventualmente a reducir la dependencia tecnológica, con las ventajas que ello implica: menores costos de implementación, mantenimiento y actualiación; aumento del cuerpo de conocimientos con base en el cual se pueden realizar otros proyectos de investigación afines, etc. 15 Caṕıtulo 2 Modelo del sistema 2.1. Introducción El paso inicial hacia la consecución de un buen esquema de control para un sistema, es la obtención de un módelo matemático que capture las ca- racteŕısticas dinámicas de la planta y con base en la cual puedan realizarse tareas de análisis y śıntesis que conduzcan al controlador adecuado. Es dif́ıcil que un modelo represente a plenitud la dinámica de su contraparte real. Un buen modelo representará las caracteŕısticas más significativas del sistema, en tanto que las incertidumbres por dinámicas no modeladas, per- turbaciones, variación de parámetros, etc., pueden considerarse en el diseño del controlador. Para la obtención de modelos matemáticos de sistemas mecánicos (como el de interés) existen metodoloǵıas ampliamente desarrolladas y bien documen- tadas. Son de especial interés los métodos de modelado energético, los cuales permiten llegar a modelos para sistemas de mediana y alta complejidad sin la necesidad de establecer de manera expĺıcita las restricciones de interconexión entre los distintos elementos del sistema. 2.2. Configuración cinemática El tipo de plataforma propuesto para el objetivo, es el que se muestra en la Figura 2.1. 16 Figura 2.1: Plataforma de dos Grados de Libertad La Figura 2.2 es una representación general del tipo de plataforma de dos Grados de Libertad (2GDL), en la que se describen algunos elementos básicos del arreglo: la plataforma consta de dos articulaciones de revolución, en el eje de guiñada -o yaw - y en el eje de elevación -o pitch-. La caracteŕıstica principal de este tipo de plataforma es la de que los ejes de sus articulaciones de revolución se intersectan en un punto en común. Como puede apreciarse el tipo de plataforma mostrada no tiene la capaci- dad de realizar movimientos alrededor del eje de balanceo. Cuando el sensor de interés que va montado en la plataforma es, por ejemplo, un telémetro laser, las correcciones en balanceo no son necesarias pues la señal envia- da/recibida por el sensor es un haz. No obstante cuando el sensor de interés es, como en el caso de este trabajo, una cámara de video, las perturbaciones en balanceo resultan en imágenes sesgadas. No obstante, como se verá en el Caṕıtulo 3, se propone una estabilización “virtual” en el eje de balanceo. 17 Figura 2.2: Representación general de plataforma 2GDF La configuración de la plataforma permite delimitar los alcances del con- trol: las acciones de control de orientación y estabilización se efectuarán sólo con rotaciones en dos ejes. Lo anterior simplifica el análisis cinemático, al no existir movimientos de traslación. La cinemática directa de este tipo de plataforma es simple, pues se puede de- terminar la orientación del sensor de forma inmediata al conocer la posición angular de los ejes, lo cual en las implementaciones se realiza fácilmente con codificadores de posición. 2.3. Marcos de referencia: Convención Denavit-Hartenberg La primera tarea hacia el desarrollo de un modelo es establecer los sis- temas coordenados para representar la posición y orientación de los varios cuerpos (considerados ŕıgidos) que conforman la plataforma. Para ello se 18 empleará la representación Denavit-Hartenberg (D-H ), la cual permite es- tablecer de manera sistemática los marcos de referencia en cada articulación y facilita posteriormente la obtención de parametros con los cuales se forman las matrices de transformación entre los sistemas referenciales. A continuación se enuncian 6 primeros pasos hacia la obtención de la cinemá- tica directa del manipulador, los cuales se relacionan con el establecimento de los marcos de referencia: Representación D-H [2]: 1. Localizar y etiquetar los ejes de las articulaciones z0, ...zn−1, donde n representa el número de articulaciones. El eje zi, se alinea con el eje de movimiento de la articulación i+1, 2. Establecer un marco de referencia base x0y0z0. Poner el origen en cualquier posición sobre el eje z0. Los ejes x0 y y0 respectivos se es- tablecen de forma tal que se forme un sistema dextrogiro. Los pasos 3 al 5 se repiten para i=1,...n-1. 3. Localizar el origen Oi en el punto en el que la normal común zi y zi−1 interseca a zi. Si zi y zi−1 son paralelos, se ubica Oi en la i -ésima articulación. 4. Establecer xi a lo largo de la normal común entre zi y zi−1 tal que cruce Oi, o, si zi−1 y zi se intersecan, en la dirección normal al plano que forman zi − zi−1. 5. Establecer yi tal que complete un marco de referencia derecho. 6. Establecer el marco referencial del efector final onxnynzn, asumiendo la n-ésima articulación de revolución, Tras aplicar los pasos enunciados anteriormente, los marcos de referencia se establecen de acuerdo a la Figura 2.3: 2.4. Relaciones cinemáticas de la plataforma Una vez establecidos los marcos de referencia, han de obtenerse las rela- ciones de transformación entre los sistemas coordenados, para poder referir 19 Figura 2.3: Disposición de ejes para la plataforma 2DOF posiciones y velocidades de un sistema a otro. Ello es sencillo una vez apli- cada la convención D-H, al formar una tabla de parámetros ai, di, αi, θi de la siguiente manera [2]: 1. ai es la distancia medida a lo largo del eje xi desde el origen Oi, hasta la intersección del eje zi−1 con el eje xi (distancia más corta entre zi−1 y zi) con signo contrario al sentido del eje xi. 2. di es la distancia a lo largo del origen zi−1 desde Oi−1 hasta la intersec- ción de zi−1 con xi (respetando el signo del eje zi−1). 3. αi es el ángulo entre zi−1 y zi, medido alrededor de xi. 4. θi es el ángulo entre xi−1 y xi medida alrededor de xi, siendo variable para las articulaciones de revolución. La Tabla 2.1 resume los parámetros para la configuración propuesta: Articulación ai αi di θi 1 0 -90 0 θ1(t) 2 0 0 0 θ2(t) Cuadro 2.1: Tabla de parámetros D-H 20 Una vez formada la tabla, la matriz de transformación del sistema i al i-1, Ai−1i , está dada por el producto de 4 transformaciones básicas, dos rotaciones y dos traslaciones: Ai−1i = Rotz,θiTrasz,diTrasx,aiRotx,αi Ai−1i = ⎡ ⎢⎢⎣ Cθi −Sθi 0 0 Sθi Cθi 0 0 0 0 1 0 0 0 0 1 ⎤ ⎥⎥⎦ ⎡ ⎢⎢⎣ 1 0 0 0 0 1 0 0 0 0 1 di 0 0 0 1 ⎤ ⎥⎥⎦ ⎡ ⎢⎢⎣ 1 0 0 ai 0 1 0 0 0 0 1 0 0 0 0 1 ⎤ ⎥⎥⎦ ⎡ ⎢⎢⎣ 1 0 0 0 0 Cαi −Sαi 0 0 Sαi Cαi 0 0 0 0 1 ⎤ ⎥⎥⎦ donde Cθi y Sθi denotan respectivamente coseno y seno de θi. Las matrices de transformación homogéneas son por tanto: A01 = ⎡ ⎣Cθ1 0 −Sθ1Sθ1 0 Cθ1 0 −1 0 ⎤ ⎦ A12 = ⎡ ⎣Cθ2 −Sθ2 0Sθ2 Cθ20 0 0 1 ⎤ ⎦ La matriz de transformación del sistema es: T 02 = ⎡ ⎣Cθ1Cθ2 −Cθ1Sθ2 Sθ1Sθ1Cθ2 −Sθ1Sθ2 Cθ1 −Sθ2 −Cθ2 0 ⎤ ⎦ 2.5. Sistemas Lagrangianos 2.5.1. Modelado mediante métodos energéticos: Ecuaciónes Euler-Lagrange [3] La formulación de un modelo matemático para un sistema de ı́ndole mecánico puede realizarse de manera sistemática considerando al sistema como un dispositivo manejador de enerǵıa y utilizando los denominados Métodos Variacionales, en los cuales, los intercambios energéticos del sis- 21 tema se asocian con una función de cambio de enerǵıa total del sistema, Indicador Variacional, la cual se conserva balanceada a cero en tanto la con- ducta dinámica del sistema sea “correcta”. Por “conducta correcta”ha de entenderse que las variaciones de las variables de almacenamiento de esfuer- zo y flujo no transgreden las restricciones de interconexión del sistema, es decir, tales variaciones permisibles no violan las restricciones de compatibi- lidad ni las de continuidad1 En términos llanos, lo anterior es un refinamiento del concepto básico de que la enerǵıa de entrada a un sistema es igual a la que se almacena (por ejemplo en forma cinética o potencial) y a la que se disipa. Un indicador variacional δV que se balancea a cero para cualquier transi- ción permisible de un sistema con m coordenadas generalizadas de almace- namiento de esfuerzo(q1, ..., qm) y l coordenadas generalizadas variacionales (δq1, ..., δql) es: δV = ∫ t1 t0 [ δU∗ − δT −∑lj=1 ( ∂J∂q̇j − τj) δqj] dt = 0 donde: U∗: Co-enerǵıa total almacenada en elementos almacenadores de flujo en función de las coordenadas generalizadas de esfuerzo. T : Enerǵıa total almacenada en elementos almacenadores de esfuerzo en fun- ción de las coordenadas generalizadas de almacenamiento de esfuerzo. J : Co-contenido total en los disipadores del sistema. Un resultado de uso inmediato del análisis variacional, es el conjunto de ecuaciones Euler-Lagrange, las cuales deben de satisfacerse en tanto el in- dicador variacional δV se conserve nulo para cualquier transición dinámica 1Restricción de Compatibilidad : La suma de esfuerzos para el lazo cerrado formado por n puertos de enerǵıa debe ser cero. Restricción de Continuidad : La suma de flujos en la terminal común de n puertos de enerǵıa debe ser cero [3]. 22 permisible del sistema: d dt [ ∂L ∂q̇i ] − ∂L ∂qi + ∂J ∂q̇i = τi para i=1,...,l donde, el lagrangiano L está dado por: L = U∗(q̇1, ..., ˙qm) − T (q1, ..., qm) 2.5.2. Desarrollo de las ecuaciones Euler-Lagrange para manipuladores mecánicos de n grados de liber- tad Se puede establecer la correspondencia entre los elementos generales de la subsección anterior, y los elementos particulares de los sistemas mecánicos. En el ámbito de los sistemas mecánicos, puede identificarse a las velocidades (lineales o angulares) como las variables de esfuerzo y a los desplazamien- tos (lineales o angulares) como las variables de almacenamiento de esfuerzo. Aśı mismo, las fuerzas y torcas se corresponden con las variables de flujo, y las variables de almacenamiento asociadas son los momentos (lineales o angulares). Dadas las correspondencias anteriores, puede establecerse a la función de co-enerǵıa U∗(q̇1, ..., ˙qm) como la función de co-enerǵıa cinética2 respecto a las velocidades del sistema, y a la función T (q1, ..., qm) como la enerǵıa po- tencial en función de los desplazamientos. Para manipuladores ŕıgidos de n grados de libertad pueden aplicarse directa- mente la formulación Euler-Lagrange. Sólo se requiere encontrar la función de enerǵıa cinética ( co-enerǵıa ) y la de energia potencial. El modelo dinámico general del manipulador al que se llega desarrollando 2Para un objeto de masa constante, de acuerdo a la segunda ley de Newton, se establece una relación lineal entre el momento y la velocidad del objeto, por lo cual la co-enerǵıa cinética (área bajo la curva momento vs. velocidad) es igual a la enerǵıa cinética (área bajo la curva velocidad vs.momento). 23 el conjunto de ecuaciones Euler-Lagrange es no lineal, y está dado por la siguiente expresión [2] : H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ (2.1) siendo H(q)nxn la matriz de inercia tal que: hij = n∑ k=max(i,j) Tr(UkiJkU T kj) (2.2) donde, el término Jk representan la pseudo matriz de inercia del cuerpo k respecto al sistema de referencia xkykzk: Jk = ⎡ ⎣−Ixx+Iyy+Izz2 Ixy IxzIxy Ixx−Iyy+Izz2 Iyz Ixz Iyz Ixx+Iyy−Izz 2 ⎤ ⎦ (2.3) Además: Uij = ∂T0i ∂qj donde: T 0 j = A 0 i A 1 2...A i−1 i i=1,...,n siendo Aij la matriz de transformación del sistema j al i. En el caso de que la matriz Aij represente una transformación ortogonal, se tiene: Uij = { T 0 j−iQjT j−i j j ≤ i 0 j > i 24 donde, si qj representa una variable de almacenamiento de esfuerzo angu- lar: Qj = ⎡ ⎣0 −1 01 0 0 0 0 0 ⎤ ⎦. En cuanto a los elementos de la matriz C(q, q̇) que representa términos cen- trifugos y de Coriolis, se tiene: Cij = n∑ k=1 Ckjiq̇k (2.4) i,j=1,..,n con: Ckji = 1 2 ( ∂hij ∂qk + ∂hik ∂qj − ∂hkj ∂qi ) (2.5) Para g(q) que representa el vector de términos gravitacionales, se tiene la siguiente expresión: g(q) = ∂P ∂q (2.6) siendo P la función para la enerǵıa Potencial del sistema. La Ecuación (2.1) y las matrices de inercia H(q) y de Coriolis C(q, q̇), tienen importantes propiedades: Acotamiento y positividad de H(q)nxn: mI ≤ H(q) ≤ HT (q) ≤ mI, ∀q ∈ Rn, con 0 ≤ m ≤ m Antisimetŕıa de la matriz ˙H(q) − 2C(q, q̇): sT [ ˙H(q) − 2C(q, q̇)]s = 0, ∀s ∈ Rn Parametrización lineal. La Ecuación (2.1) puede representarse como: 25 H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ = Ψ(q, q̇, q̇, q̈)ϕ siendo ϕ un vector de parámetros de dimensión nϕ 2.6. Desarrollo del modelo En esta sección se desarrolla un modelo del sistema a partir de una geometŕıa simplificada de la plataforma. Para fines de modelado y simulación, se propone una representación simpli- ficada de la plataforma, como lo muestra la Figura 2.4. Además se definen: q=[ q1 q2 ] T donde q1 = θ1 y q2 = θ2. La plataforma mostrada se compone de dos cuerpos principales, un cilin- dro y una especie de horquilla formada a su vez por tres paralelepipedos. Figura 2.4: Cuerpos simples para representar a la plataforma de dos grados de libertad El momento de inercia del cuerpo k=1,2 se establece respecto al sistema de referencia xk−1yk−1zk−1. De tablas de momentos inerciales y utilizando el teorema de ejes paralelos ( ver la disposición de ejes en la Figura 2.3), la Tabla 2.2 resume los momentos de inercia de los cuerpos representados en la 26 Figura 2.4 3. Cuerpo Ixx Iyy Izz 1a m1a12 (b 2 + l21) + m1a( l2 2 + b 2 ) 2 m1a 12 (a 2 + b2) + m1a( l22 + b 2 ) 2 m1a 12 (l 2 1 + a 2) + m1a( l12 ) 2 1b m1b12 (b 2 + l22) + m1b(l1 − b2 )2 m1b12 (a2 + l22) m1b12 (b2 + a2) + m1b(l1 − b2 )2 1c m1a12 (b 2 + l21) + m1a( l2 2 + b 2 ) 2 m1a 12 (a 2 + b2) + m1a( l22 + b 2 ) 2 m1a 12 (l 2 1 + a 2) + m1a( l12 ) 2 2 12m2r 2 m2 12 (3r 2 + h2) m212 (3r 2 + h2) Cuadro 2.2: Tabla de Momentos de Inercia En la Ecuación (2.3): J1 = diag ⎛ ⎝ m1b24 (2a2) + m1a12 (3l21 + 2a2)m1b 24 (2b2 + 6(2l1 − b)2) + m1a12 (5l21) m1b 24 (2l22) + m1a 12 (−3l21 + 2b2 + 6(l2 + b)2) ⎞ ⎠ = diag ⎛ ⎝J1xJ1y J1z ⎞ ⎠ J2 = diag ⎛ ⎝ 112m2h21 4 m2r 2 1 4 m2r 2 ⎞ ⎠ = diag ⎛ ⎝J2xJ2y J2z ⎞ ⎠ Se tiene que: U11 = ∂A01 ∂θ1 = ⎡ ⎣−Sθ1 0 −Cθ1Cθ1 0 −Sθ1 0 0 0 ⎤ ⎦ U12 = ∂A01 ∂θ2 = 0 U21 = ∂A02 ∂θ1 = ⎡ ⎣−Sθ1Cθ2 Sθ1Sθ2 −Cθ1−Cθ1Cθ2 −Cθ1Sθ2 −Sθ1 0 0 0 ⎤ ⎦ U22 = ∂A02 ∂θ2 = ⎡ ⎣−Cθ1Sθ2 −Cθ1Cθ2 0−Sθ1Sθ2 −Sθ1Cθ2 0 −Cθ2 Sθ2 0 ⎤ ⎦ en la Ecuación (2.2), desarrollando y simplificando: h11 = J1x + J1z + J2y + J2z + (J2x − J2y)C2θ2 3Se asume para fines de modelado, que los cuerpos son simétricos y homogéneos, tales que los productos de inercia Ixy, Iyz, ... son cero 27 h12 = 0 h21 = 0 h12 = J2x + J2y En cuanto a los términos centŕıfugos y de Coriolis, se tiene de la Ecuación (2.5): C211 = (J2x − J2y)Cθ2Sθ2= C121 = −C112 todos los demás términos son cero. En la Ecuación (2.4): C11 = (J2x − J2y)Cθ2Sθ2 θ̇2 C12 = (J2x − J2y)Cθ2Sθ2 θ̇1=-C21 C22 = 0 Para el vector de términos gravitacionales (2.6), dada la disposición geométri- ca simétrica de la plataforma y la suposición de homogeneidad de los cuerpos que la componen, se tiene que: g(q) = ∂P ∂q = 0 Por último se considera al término de disipación Dq como cero. Resumiendo los resultados anteriores en la Ecuación (2.1), el modelo del sistema es: [ α + βC2θ2 0 0 γ ] [ θ̈1 θ̈2 ] + [ γCθ2Sθ2 θ̇2 γCθ2Sθ2 θ̇1 −γCθ2Sθ2 θ̇1 0 ] [ θ̇1 θ̇2 ] = [ τ1 τ2 ] (2.7) con: 28 α = J1x + J1z + J+ + 2y + J2z β = J2x − J2y γ = J2x + J2y 2.7. Modelo de fricción En el caṕıtulo de simulaciones se presenta un inciso en el que se prueba el desempeño de los distintos algoritmos ante la presencia de fricción. En esta sección se presentan generalidades de la fricción y el modelo particular de fricción que se utilizó, el modelo LuGre [7]. 2.7.1. Fenómeno de fricción [8] La fricción ocurre siempre que cuerpos en contacto experimentan un movimiento relativo. Este movimiento puede ser lineal o rotacional, pero en ambos casos la fricción se comporta básicamente de la misma forma. La fricción es la fuerza de reacción tangencial entre dos superficies en contac- to. F́ısicamente estas fuerzas de reacción son el resultado de toda una variedad de mecanismos y fenómenos que dependen de la geometŕıa y topoloǵıa del contacto, propiedades de porosidad y dureza de las superficies en contacto, existencia de sustancias entre las superficies, etc. Involucrados tantos factores en el fenómeno de friccion es de esperarse que sea altamente no lineal. En un sistema mecánico cuyo control se desea lograr, la fricción puede llevar a errores en estado estable, ciclos ĺımite y bajo desempeño en general. Existe una gran cantidad de modelos de fricción que vaŕıan tanto en comple- jidad como en su capacidad de replicar los fenómenos de fricción observados experimentalmente. Independientemente de la complejidad del modelo de fricción, se puede observar como factor común en todos ellos dos compo- nentes: una de fricción viscosa y otra de fricción Coulomb. Ambas producen una fuerza que se opone al movimiento, siendo la primera proporcional a la magnitud y signo de la velocidad, en tanto que la última depende sólo del signo de la velocidad. Las componentes de fricción anteriores no presen- tan ningún efecto de memoria, dicho de otra forma son mapeos estáticos, 29 y por ende fallan en capturar importantes efectos dinámicos observados en presencia de fuerzas de fricción. 2.7.2. Modelo de fricción LuGre [7] El modelo de fricción considerado en este apartado es el modelo LuGre, el cual captura la mayoŕıa de los efectos de la fricción observados experi- mentalmente, entre los que se encuentran el efecto Stribeck, histéresis (Fric- tional Lag), efecto “stick-slip”, desplazamiento de predeslizamiento, fuerza de rompimiento variable, “stiction”, y por supuesto fricción viscosa y de Coulomb. El modelo LuGre se relaciona con una interpretación de la fricción basa- da en cerdas. La fricción se modela como la deflexión promedio de cerdas microscópicas que actúan como resortes, Figura 2.5. Cuando una fuerza tan- gencial es aplicada, las cerdas sufren una deflexión elástica. Si la deflexión es suficientemente grande las cerdas empiezan a deslizarse. La deflexión prome- dio de las cerdas para un movimiento en estado estable queda determinado por la velocidad. La deflección promedio queda denotada por z y se modela por: Figura 2.5: Cerdas microscópicas entre dos superficies en contacto dz dt = v − |v| g(v) z (2.8) 30 siendo v la velocidad relativa entre las dos superficies. El primer término indica que la deflexión es proporcional a la integral de la velocidad relativa. El segundo término indica que la deflexión z tiende a un valor zss en estado estable, cuando v es constante: zss = v |v|g(z) = g(v)sgn(v) La función g es positiva, dependiendo de factores tales como propiedades de los materiales, lubricación, temperatura, etc. T́ıpicamente g(v) decrece monótonamente a partir de g(0) conforme v se incrementa. El modelo queda completo con la expreción de la fuerza de fricción: FL = σ0z + σ1 dz dt + σ2v (2.9) El parámetro σ0 representa la rigidez de las cerdas, σ1 es un coheficiente de amortiguamiento y σ2 es un parámetro de fricción viscosa. Para la función g(v) existe una parametrización que captura el efectro Stribeck, tal que: σ0g(v) = Fc + (Fs − Fc)e−(v/vs)2 Fc es el nivel de fricción Coulomb, Fs el nivel de fricción estática y vs la ve- locidad Stribeck. Aśı, con está parámetrización de g(v) el modelo de fricción LuGre está caracterizado por 6 parámetros: σ0, σ1, σ2, Fc, Fs y vs. El modelo de fricción anterior se introduce en un par de incisos de simulación del Caṕıtulo 4 a fin de evaluar el desempeño de los algoritmos de control ante la presencia de una dinámica no modelada. En uno de los incisos se introduce la fricción sin compensarla, mientras que en el otro se inyecta la fricción a la vez que se compensa con un observador de fricción [7]. En ambos casos, la fuerza de fricción queda fuera del análisis de estabilidad de los algoritmos de control. 31 Caṕıtulo 3 Algoritmos de Control: Comparación cualitativa 3.1. Introducción En este caṕıtulo se revisan y comparan algoritmos de interés para cumplir la tarea de control propuesta. Las leyes de control asociadas presentan dis- tintos grados de complejidad lo que es de por śı un punto de comparación. También queda de manifiesto que el nivel de simplicidad del algoritmo co- rresponde de manera inversa al peso de las suposiciones en que se basa. Las consideraciones anteriores permiten por tanto, formular ya una comparación cualitativa entre los algoritmos presentados, restando para el caṕıtulo de simulación la comparación cuantitativa del desempeño de los distintos algo- ritmos. En las secciones 3.2 y 3.3 de este caṕıtulo se pormenorizan los objetivos de control. En particular en la sección de Control de estabilización, dada la naturaleza del sensor cuya LOS se desea estabilizar, se propone un eje virtu- al para auxiliar la tarea de rechazo de perturbaciones. Al final de estas dos secciones se presenta un diagrama del sistema de control, en el que resalta el hecho de que los objetivos de control de orientación y estabilización pueden tratarse como uno solo. El resto del caṕıtulo presenta seis algoritmos de con- trol con sus respectivas expresiones y análisis de estabilidad en lazo cerrado. 32 Los algoritmos revisados se eligieron tomando en consideración su even- tual implementación. Los algoritmos presentados manejan en mayor o menor medida consideraciones de ı́ndole práctico: incertidumbres paramétricas, varia- ciones lentas del sistema, perturbaciones, dinámicas no modeladas, etc. Aśı mis- mo las leyes de control son expresiones cuya complejidad no es elevada, ni requieren un extenso conocimiento a priori. Al final del caṕıtulo se presenta un observador de fricción y una sección en que se hace una comparación cualitativa entre los controladores. 3.2. Control de Orientación Como se adelantó en el caṕıtulo introductorio, el objetivo de orientación se identifica con el de seguimiento, entendiéndose por seguimiento el llevar y/o conservar a la plataforma móvil en un punto de operación tal que la LOS del sensor que soporta (cámara) permanezca dirigido hacia el blanco. En resumen, se desea que la LOS siga una referencia, por lo general variable en el tiempo. Los comandos de orientación que definen la trayectoria deseada para la LOS de un sensor, siendo éste una cámara, pueden asociarse a varias fuentes: Generación autónoma de trayectoria de seguimiento: Si el fin ulterior de la cámara es la vigilancia autónoma y el “enganche”1 y seguimiento de blancos, los comandos de orientaciónde la LOS de- seada provendrán del procesamiento digital de las mismas imágenes capturadas por la cámara. Un algoritmo de procesamiento de imágenes puede extraer coordenadas de orientación del objeto de interés “en- ganchado”, generalmente en movimiento, y generar las coordenadas de orientación correspondientes a fin de mantener la LOS dirigida hacia dicho objeto. 2 1Término coloquial que en procesamiento de imágenes se refiere a la adquisición de un blanco en una imagen. El procesamiento extrae caracteŕısticas significativas de la ima- gen, lo cual permite identificar patrones para, por ejemplo, aislar objetos, asociarles un centroide, vector de posición, vector de velocidad, etc. 2En este trabajo de tesis no se abordan detalles del procesamiento de imágenes para 33 Generación semi-autónoma de trayectoria de seguimiento: Para fines de vigilancia o tareas de búsqueda, la LOS de una cámara comúnmente deberá seguir un patrón predeterminado que replique cierta trayectoria de barrido. Generación manual de trayectoria de seguimiento: Un opera- dor humano puede generar mediante alguna interfaz (joystick, pantalla táctil, etc.) los comandos de orientación de la LOS de una cámara 3.3. Control de Estabilización Los movimientos irregulares en las embarcaciones a la mar son el resul- tado de una gran cantidad de factores: tipo de mar que se navega (nivel del oleaje); velocidad de la embarcación; dirección y sentido de movimiento; pe- so y tamaño de la embarcacion, distribución de la carga, etc. Como puede verse se trata de un sistema muy complejo en el que lo más conveniente es centrarse en el efecto final sobre el sistema de interés, que en el caso de este trabajo son las perturbaciones rotacionales que sufre la LOS de referencia de una cámara sobre una plataforma móvil. Como en el caso de la orientación, pueden reconocerse varias fuentes que dirigen la tarea de estabilización Acelerómetros lineales: Una de las técnicas para conocer los movimien- tos lineales y rotacionales que sufre un cuerpo es adosándole sensores de aceleración lineal. Al disponer varios de estos sensores en ejes de movimiento ortogonales, y conociendo la disposicion relativa entre e- llos, se puede, con base en las mediciones lineales y operaciones de integración y geometŕıa, conocer desplazamientos lineales y angulares. Sensores de tasa de giro: Este tipo de sensor mide velocidades de giro de un objeto alrededor de ejes de movimiento perpendiculares. La integración de estas señales permite conocer los desplazamientos angulares. obtener una LOS deseada, se da por hecho que se tiene una señal que comanda la orientación de la plataforma. Las únicas referencias que se hacen al procesamiento de imágenes (en la subsección 3.3.1) quedan circunscritas a la tarea de estabilización. 34 Giros de estado sólido: Una giro de estado sólido suele componerse a su vez de acelerómetros lineales, sensores de tasa de giro e incluso sen- sores de campo magnético, para integrar su información y proporcionar lecturas de posición angular, absoluta o relativa. Tan importante como el tipo de fuente que genera la información de despla- zamientos angulares, es el lugar en que se ubica. En el próximo caṕıtulo se hacen consideraciones sobre la ubicación de los sensores para una tarea de estabilización. También se indicará a detalle como se miden los ángulos y se establecen las referencias respectivas. 3.3.1. Estabilización de balanceo: Grado de libertad “virtual” en balanceo Hasta ahora se ha considerado que el sistema propuesto opera con dos articulaciones de revolución. Como se mencionó antes, dos grados de libertad rotacionales son suficientes para mantener dirigido un haz hacia un objetivo de interés. Pero tratándose el sensor de una cámara, las rotaciones alrededor de su eje de balanceo no pueden pasarse por alto, pues detrimentan la imagen observada. Con el fin de estabilizar perturbaciones de la imagen en el eje de balanceo se propone un tercer grado de libertad en el eje de balanceo, sólo que “virtual” y que opera a nivel de procesamiento de imagen. A continuación se presentan las tareas propuestas para la implementación del grado de libertad virtual ya mencionado3: 1. Algoritmo para rotar la imagen n grados. 2. Conexión del algoritmo de rotación de imagen con el sensor de posición angular que mide el estado del eje de balanceo, a fin de efectuar el giro proporcional que estabilice la imagen. 3. Filtro suavizador y predictor para las lecturas del sensor de posición angular, que por un lado ofrezca valores “suaves” del estado del eje de 3Se pueden consultar algunos otros detalles en el apéndice “Grado de libertad virtual en eje de balanceo” 35 balanceo (lo que se traduce en rotaciones “suaves” de la imagen) y que por otro lado estime el próximo estado del eje de balanceo permitiendo un desempeño predictivo del sistema. El esquema de control propuesto es el que se ilustra en la Figura 3.1. En el puede verse como las tareas de orientación y estabilización se resuelven en una especie de “seguimiento diferencial”, como se sugeŕıa ya en la Figura 1.2 del Caṕıtulo 1. El esquema representa el caso general en que se considera la fricción y su compensación aśı como la estabilización de imagen (que no obstante, no son temas capitales de este trabajo). Figura 3.1: Esquema de control. Las lecturas del sensor de giro alimentan las correcciones mecánicas en cabeceo y guiñada y la correción en balanceo de la imagen. 3.4. Métodos de control para manipuladores No existe un método general en el diseño de controladores para sistemas no lineales. Lo que se suele hacer por tanto, es usar técnicas complementarias de análisis y śıntesis: en base al análisis del modelo del sistema por alguno o varios de los métodos disponibles (análisis de Lyapunov, método de función 36 descriptiva, análisis del plano de fase, etc.) se puede sintetizar un controlador cuyo buen desempeño en la práctica pueda presumirse en base al análisis previo y las simulaciones computacionales realizadas. 3.4.1. PD+ El primer tipo de control revisado, con una expresión bastante sencilla es el PD+. El control PD+ compensa las no linealidades modeladas del mani- pulador de interés a la vez que incorpora términos que garantizan la conver- genćıa (asintótica como se verá adelante) del error a cero en condiciones nom- inales. El PD+ puede también tener un buen desempeño en condiciones de perturbación o incertidumbre paramétrica pero a costa de valores de ganan- cia relativamente altos. Sea la ley de control PD+ [2]: τ = H(q)q̈d + C(q, q̇)q̇d + Dq̇d + g(q) − Kv ˙̃q − Kpq̃ (3.1) con D ≥ 0, Kv, Kp > 0 diagonales, y definiéndose q̃ = q − qd, siendo qd el estado deseado y q el estado actual. Se pueden analizar las propiedades de esta ley de control emplendo teoŕıa de Lyapunov. Sea (3.1) en la Ecuación (2.1): H(q)¨̃q + C(q, q̇) ˙̃q + (Kv + D) ˙̃q + Kpq̃ = 0 (3.2) Si se usa como candidata a función de Lyapunov la función: V (q̃, ˙̃q) = 1 2 ˙̃qT H(q) ˙̃q + 1 2 q̃T Kpq̃ derivando V : V̇ = 1 2 ˙̃qT ˙H(q) ˙̃q + ˙̃qT H(q)¨̃q + 1 2 q̃T Kpq̃ sustituyendo H(q)¨̃q de (3.2), agrupando términos y por la propiedad de an- tisimetŕıa de ˙H(q) − 2C(q, q̇) = 0, se tiene: 37 V (q̃, ˙̃q) = − ˙̃qT (Kv + D) ˙̃q que es una función negativa semi-definida. Empleando el teorema de La Salle de conjuntos invariantes al conjunto de puntos: {(q̃, ˙̃q) | ˙̃q = 0} en (3.2): Kpq̃ = 0 que se cumple sólo para q̃ = 0 pues por definición Kp es positiva defini- da. Se tiene pues un resultado de estabilidad asintótica para el sistema en lazo cerrado (3.2). 3.4.2. Control Adaptable La aproximación adaptable al problema de control permite lidiar con incertidumbres de orden paramétrico en el modelo del sistema, o bien con sistemas variantes (lentamente) en el tiempo. Aśı pues, la incertidumbre de los sistemas atacables con el control adaptable se atribuye al conocimienyo imprecisode los parámetros del modelo, y no a su estructura en śı. El control adaptable como método de control único en una aplicación real no es muy usado, pues no tiene un buen desempeño ante perturbaciones, dinámicas no modeladas o parámetros que vaŕıan rápidamente (este último fenómeno puede deberse a su vez a un modelado inadecuado), y por tanto suele em- plearse en complemento con un método de control robusto. Sea el sistema (2.1) representado mediante una parametrización lineal de la forma: τ = Ψ(q, q̇, q̇v, q̈v)ϕ̂0 = Ψa (3.3) siendo Ψ una matriz conocida y ϕ̂0 un vector de parámetros nominales [1]. A Ψ se le denonina matriz regresora o simplemente regresor. El control adaptable propone una ley de variación para el vector de pará- metros nominales ϕ̂0 tal que cada iteración de control ajusta dicho vector 38 de forma que el error de seguimiento disminuye, e incluso, si las condiciones son adecuadas 4, el vector nominal puede converger al vector de parámetros reales ϕ. Sea la ley de control adaptable [1] : τ = Ψ(q, q̇, q̇v, q̈v)ϕ̂0 − KvS (3.4) con la ley de adaptación: ˙̂ϕ0 = −Γ−1ΨT (q, q̇, q̇v, q̈v)S donde: Kv = D + K, K > 0 diagonal; Λ, Γ > 0 diagonales; S = q̇ − q̇v = ˙̃q + Λq̃, y q̇v = q̇d − Λq̃; qd y q̃ como se definieron en 3.4.1. La ley de control se puede reescribir como: τ = Ψϕ̂0 − KvS + Ψϕ − Ψϕ = Ψϕ − KvS + Ψϕ̃; con ϕ̃ � ϕ̂0 − ϕ. En lazo cerrado en la Ecuación del sistema (2.1): H(q)(q̈ − q̈v) + C(q, q̇)(q̇ − q̇v) + D(q̇ − q̇v) + KvS = Ψϕ̃ por la definición de S : H(q)Ṡ + C(q, q̇)S + (Kv + D)S = Ψϕ̃ (3.5) Si se propone como candidata a función Lyapunov: V = 1 2 ST H(q)S + 1 2 ϕ̃T Γϕ̃ 4La condición de convergencia paramétrica para control adaptable de sistemas no lineales y lineales se conoce como excitación persistente y en general implica que la señal de referecia contenga suficiente “riqueza” frecuencial para estimular la dinámica de adaptación. Para sistemas lineales en general se requieren m/2 frecuencias para la conver- gencia de m parámetros desconocidos. Para sistemas no lineales con parametrización lineal la regla aplica sobre la matriz regresora, tal que ∫ T 0 Ψ T Ψdt > αI para un determinado tiempo T y α > 0 39 que derivando: V̇ = 1 2 ST ˙H(q)S + ST H(q)Ṡ + ϕ̃T Γ ˙̃ϕ sustituyendo H(q)Ṡ de 3.5 y dado que ˙̃ϕ = ˙̂ϕ0 = −Γ−1ΨT S, se tiene: V̇ = −ST (D + Kv)S ≤ 0 Se puede alcanzar un resultado de estabilidad si S → 0, cuando t → ∞. El lema de Barbalat permite obtener este resultado. Dado que V tiene un ĺımite inferior y V̇ ≤ 0, entonces V (t) ≤ V (0) y S y ϕ̃ están acotados (aśı co- mo los términos asociados q, q̇, q̈, qd, q̃, ˙̃q). Puesto que V̈ = −2ST (D +Kv)Ṡ está acotada (Ṡ está en función de términos acotados) entonces V̇ → 0 con t → ∞ ⇒ S → 0 cuando t → ∞. 3.4.3. Control Robusto La implementación de la ley de control ( 3.1) requiere que el modelo dinámico y los parámetros asociados se conozcan de manera precisa y además que el conjunto de ecuaciones de movimiento se pueda calcular en tiempo re- al. En la práctica, tales requerimientos son dif́ıciles de satisfacer. Para los sistemas f́ısicos siempre existirá incertidumbre respecto a los valores de los parámetros que lo describen. Por su parte la ley de control (3.4) representa un avance permitiendo incertidumbre paramétrica, pero con la premisa de la certeza del modelo dinámico. Prácticamente siempre habrá cancelaciones inexactas de las no linealidades del sistema debido a las incertidumbres, el redondeo computacional, etc. El siguiente paso natural hacia una expresión de control es una ley que tolere la incertidumbre paramétrica y de modelado. Con relación a la parametrización lineal ( 3.3), cuando se puede hacer una aseveración del valor ρ tal que ‖ϕ̂0 − ϕ‖ ≤ ρ, siendo ϕ el valor real del vector de parámetros, entonces puede aplicarse una ley de control que compensa la incertidumbre del vector nominal ϕ̂0, tal que : τ = Ψa − KvS + ΨaU (3.6) donde: 40 U = { -ρ Ψ T a S ‖ΨTa S‖ ∥∥ΨTa S∥∥ > � -ρΨTa S/� Ψ T a S ≤ � con: Kv = D + K, K > 0 diagonal, y Ψa como en (( 3.3)) [2]. Procediendo como en la sección anterior, sumando y restando a la expresión (3.6) el valor real ϕ, en lazo cerrado en la Ecuación (2.1) y de la definición de S : H(q)Ṡ + C(q, q̇)S + KvS = Ψa(ϕ̃ + U) (3.7) con ϕ̃ = ϕ̂0 − ϕ Proponiendo como candidata a función Lyapunov: V = 1 2 ST H(q)S + qT ΛKvq̃ Derivando V, sustituyendo H(q)Ṡ de (3.7), y por Ḣ − 2C = 0, se tiene: V̇ = STΨaϕ̃ + S T ΨaU + 2q̃ T ΛKv ˙̃q − ST KvS de la definición de S, desarrollando: ST KvS = ˙̃q TKv ˙̃q + q̃ T ΛKvΛq̃ + 2 ˙̃q T KvΛq̃ Si se definen x = [q̃; ˙̃q]T y Q = [ ΛKvΛ 0 0 Kv ] , se tiene: V̇ = STΨa(ϕ̃ + U) − xT Qx CASO A: ∥∥ΨTa S∥∥ > � V̇ = STΨAϕ̃ − ρST ΨA‖ΨTa S‖ S T ΨA − xT Qx ≤ ∥∥ΨTa S∥∥ ‖ϕ̃‖ − ρ ∥∥ΨTa S∥∥− xT Qx 41 pero por definición ‖ϕ̃‖ ≤ ρ V̇ ≤ 0 CASO B: ∥∥ΨTa S∥∥ ≤ � V̇ = STΨAϕ̃ − ρ� ∥∥ΨTa S∥∥2≤ ∥∥ΨTa S∥∥ ρ − ρ� ∥∥ΨTa S∥∥2 el lado derecho de la desigualdad representa una ecuación en ∥∥ΨTa S∥∥ con un valor máximo en el intervalo [0, �] de �ρ 4 en ∥∥ΨTa S∥∥ = �2 , por tanto: V̇ ≤ −xT Qx + �ρ 4 Para matrices positivas definidas como Q existen los eigenvalores λmin(Q), λmax(Q) tales que: λmin(Q) ‖x‖2 ≤ xT Qx ≤ λmax(Q) ‖x‖2 por tanto V̇ ≤ −λmin(Q) ‖x‖2 + �ρ4 aśı mismo para toda función cuadrática como V ∃λ1, λ2 > 0 tales que: λ1 ‖x‖2 ≤ V ≤ λ2 ‖x‖2 si, V̇ < 0 ⇒ V (t) ≤ V (t0), por tanto ‖x‖ ≤ √ λ2 λ1 ‖x(t0)‖ para que V̇ < 0 es necesario que: ‖x‖ > 1 2 √ �ρ λmin(Q) (I) aśı que, cuando V̇ > 0, ‖x‖ crece hasta que (I) se vuelve a satisfacer y V̇ < 0, y ‖x‖ está acotado por: 42 ‖x‖ < 1 2 √ λ1 λ2 √ �ρ λmin(Q) y se tiene un resultado de estabilidad práctica. 3.4.4. Modos deslizantes El control por modos deslizantes es un tipo de control de los denominados de estructura variable. Un controlador robusto fuerza a los estados, combina- dos en una variable deslizante, a alcanzar una superficie o modo deslizante, en la que la dinámica se reduce. La dinámica se conserva en el modo deslizante, sobre el cual se persigue la convergencia a cero del error de seguimiento. Los modos deslizantes convencionales (lineales) son un control relevado basado en la función signo, lo que resulta en controladores de alta ganancia y con un efecto indeseable conocido como troceo o chattering, que es la conmutación excesivamente rápida de la señal de control. Ante la poca practicidad de los Modos Deslizantes Lineales, se han desarrollado otras formas como los Mo- dos Deslizantes Terminales, tipo de control basado en una función “suave” (en vez de la función discontinua signo) que resulta en un esfuerzo de control reducido en el transitorio y atenuación del chattering. Se revisan a continua- ción dos de estos algoritmos. MODOS DESLIZANTES TERMINALES I: MDT1 [15] Pártase nuevamente de la parametrización lineal del sistema, con vector de parámetros nominales ϕ̂0 tal que ‖ϕ̂0 − ϕ‖ ≤ ρ . Sea la ley de control : τ = Ψ(q, q̇, q̇r, q̈r)(ϕ̂0 + w) − Ksr (3.8) con : q̇r = q̇d − Λq̃p q̈r = q̈d − pΛdia[q̃1p−1...q̃np−1] ˙̃q q̃p � [q̃1p...q̃np]T sr � [sr1...srn]T 43 s = ˙̃q + Λq̃p 1 2 < p ≤ 1, 0 < r ≤ 1; K, Λ > 0, diagonales w = { -ρ Ψ T s ‖ΨT s‖ ∥∥ΨT s∥∥ > 0 0 ∥∥ΨT s∥∥ = 0 De (3.8) en lazo cerrado en (2.1): H(q)ṡ + C(q, q̇)s + Ksr = Ψ(q, q̇, q̇r, q̈r)(ϕ̃ + w) Proponiendo como candidata a función Lyapunov: V = 1 2 sT H(q)s derivando V y por Ḣ − 2C = 0, se tiene: V̇ = −sT Ksr + sT Ψ(ϕ̃0 + w) (3.9) Para el término sT Ksr se tiene: sT Ksr = ∑n i=1 kis r+1 i ≥ α {∑n i=1 1 2 m̄s2i }η ≥ αV η con η � (1 + r)/2, α � kmin { 2 m̄ }η , con kmin � mini {ki} cuando ∥∥ΨT s∥∥ = 0 el término sT Ψ(ϕ0 + w) es cero , y de las definiciones de w y ρ cuando ∥∥ΨT s∥∥ > 0, se tiene: sT Ψ(ϕ̃0 + w) = s T Ψ ( ϕ̃ − ρ ΨT s‖ΨT s‖ ) ≤ ∥∥sT Ψ∥∥ (‖ϕ̃‖ − ρ) ≤ 0 en resumen, conjuntando los resultados para los dos términos de (3.9): V̇ (t) ≤ −αV η, ∀t ≥ 0 (3.10) Un lema de desigualdades diferenciales establece que, siendo V(t) una función positivadefinida cuya derivada satisface (3.10), ∀t0 ≥ 0, V (t0) ≥ 0 con α > 0, 0 < η < 1, entonces, V (t) = 0, ∀t ≥ t1 con t1 = t0 + V 1−η(t0)α(1−η) . 44 Dado lo anterior, el algoritmo de control conduce a señales uniformemente acotadas y a un error de seguimiento q̃(t) = 0 para t ≥ tT con tT < ∞ MODOS DESLIZANTES TERMINALES II: MDT2 [15] Respecto al control anterior [15], en cuyo algoritmo aparece el término ρ, tal que ‖ϕ̂0 − ϕ‖ ≤ ρ, y un término w cuyo valor depende de la magnitud∥∥ΨT s∥∥, se propone una variación del control en la cual se estime ρ y la ex- presión de w conste de un sólo término. Lo anterior implica, por un lado, que no sea necesario el conocimiento a prioi de ρ, y por otro lado, que la ley de control adquiera una expresión más sencilla. Sea pues: ˙̂ρ = −σρ̂ + γ ‖Ψ T s‖ ‖ΨT s‖+� y w = −ρ̂ ΨT s‖ΨT s‖+� con �, σ, γ > 0, conservándose todos los demás términos como en el con- trol anterior. De (3.8) en lazo cerrado en (2.1) con las nuevas expresiones de w y ρ, y de la definición de s, se tiene la siguiente dinámica para el error: H(q)ṡ + C(q, q̇)s + Ksr = Ψ(q, q̇, q̇r, q̈r)(ϕ̃ + w) Sea la candidata a función Lyapunov: V = 1 2 sT H(q)s + 1 2γ ρ̃2, con ρ̃ � ρ̂ − ρ de donde la derivada de V sobre las trayectorias de la dinámica del error, es: V̇ = sT H(q)ṡ + 1 2 sT ˙H(q)s + 1 γ ρ̃ ˙̃ρ 45 V̇ = sT [−C(q, q̇) − Ksr + Ψ(ϕ̃ + w)] + 1 γ ρ̃ ˙̂ρ + 1 2 sT ˙H(q)s V̇ = −sT Ksr + sT Ψ(ϕ̃ + w) + 1 γ ρ̃ ˙̂ρ o de la definición de w y ρ̂ V̇ = −sT Ksr︸ ︷︷ ︸ −κ + sTΨ ( ϕ̃ − ρ Ψ T s ‖ΨT s‖ + � ) ︸ ︷︷ ︸ λ −ρ̃ ∥∥ΨT s∥∥2 ‖ΨT s‖ + � + 1 γ ρ̃ ˙̃ρ︸ ︷︷ ︸ µ Del inciso anterior para κ: κ ≥ αV η además para λ: λ ≤ ∥∥ΨT s∥∥(‖ϕ̃‖ − ρ ‖ΨT s‖‖ΨT s‖+� ) si ∥∥ΨT s∥∥ ≤ � : λ ≤ � 2 ρ si ∥∥ΨT s∥∥ >> � : λ ≤ 0. Para µ, dado que ˙̂ρ = ˙̃ρ, y de la definición de ρ̃: µ = ρ̃ γ ( ˙̃ρ − γ ‖Ψ T s‖ ‖ΨT s‖+� ) µ = σ γ ρ̂ρ̃ µ = −σ γ ρ̂2 + σ γ ρ 46 Conjuntando los resultados se puede establecer que: V̇ ≤ −αV η − σ γ ρ̂2 + K siendo K = σ γ ρ + � 2 ρ una constante positiva que depende del parámetro constante desconocido ρ, pero también de los parámetros controlables γ, � y σ. En cualquier caso, cuando V̇ > 0, V aumenta hasta que nuevamente V̇ < 0 y se tiene un resultado de estabilidad práctica. MODOS DESLIZANTES TERMINALES III: NMDT [16] Otra forma de Modos Deslizantes Terminales que ofrece un desempeño rápi- do y de alta precisión, es la presentada a continuación. Sea la representación del sistema en la forma: H(q)q̈ + C(q, q̇)q̇ + g(q) = τ + τd + F (q, q̇, q̈) (3.11) representando τ el control, τd un vector de perturbación externa acotada y F (q, q̇, q̈) incertidumbre concentrada del sistema. Sea pues, la siguiente ley de control: τ = τ0 + τ1 (3.12) donde: τ0 = H(q)q̈d + C(q, q̇)q̇ + g(q) τ1 = −H(q)(k1s − k2sig(s)ρ) siendo el modo deslizante: 47 s = q̃ + βsig( ˙̃qγ) = 0 con: k1 = diag(k11, ..., k1n), k2 = diag(k21, ..., k2n), k1i > 0, k2i > 0, β = diag(β1, ..., βn), βi > 0, 0 < γi < 1, 0 < ρ = ρi = ... = ρn < 1. definiéndose sig(x)γ como: sig(x)γ = [|x1|γ1 sign(x1)...sig(x)γ |xn|γn sign(xn)]. Para analizar las propiedades de estabilidad de la ley de control (3.12), se presenta el Lema 1 y una forma extendida de Lyapunov para estabilidad en tiempo finito para modos deslizantes términales [16]: Lema 1: Supóngase que a1, a2, ..., an y 0 < p < 2 son todos números posi- tivos, entonces se cumple la siguiente desigualdad: a21 + a 2 2 + ... + a 2 n ≤ (ap1 + ap2 + ... + apn)2 Forma extendida de Lyapunov para MDT: V̇ (x) + αV (x) + βV γ(x) ≤ 0, 0 < γ < 1 . Sea la candidata a función Lyapunov: V = ‖s‖ 2 2 Derivando V, sustituyendo (3.12) y utilizando el Lema 1, se tiene: V̇ = sT βγdiag( ∣∣ ˙̃q∣∣γ−1)H(q)−1(τ1 + F + τd) (3.13) Para F=0 y τd = 0 (3.13) se puede expresar como: V̇ = −sTk1s − sTk2sig(s)p con k1 = βγdiag( ∣∣˜̇qγ−1∣∣)k1 ∈ Rnxn y k2 = βγdiag(∣∣˜̇qγ−1∣∣)k2 ∈ Rnxn son 48 matrices diagonales positivas definidas si cualquier ˙̃qi = 0. Del Lema 2, se tiene: V̇ ≤ −2k1V − 2(p+1)/2k2V (p+1)/2 donde k1 = minik1i > 0 y k2 = minik2i > 0 son los mı́nimos eigenval- ores de k1 y k2 respectivamente y 1/2 < (p+1)/2 < 1. De acuerdo al criterio de estabilidad en tiempo finito, el modo deslizante terminal se alcanzará en tiempo finito y posteriormente el error de seguimiento q̃ convergirá a cero también en tiempo finito. II: Para F = 0 y τd = 0 la trayectoria del sistema converge a la vecindad del TSM s=0 tal que: ‖s‖ ≤ ∆ = min∆1, ∆2, ∆1 = ‖M−10 (q)‖(b0+b1‖q‖+b2‖q̇‖2) k1 , ∆2 = (‖M−10 (q)‖(b0+b1‖q‖+b2‖q̇‖2) k2 )1/p , donde ‖F (q, q̇, q̈)‖ ≤ b0 + b1 ‖q‖ + b2 ‖q̇‖2 y τd ≤ d El error de seguimiento q̃i y ˙̃q convergen a las regiones: |q̃i| ≤ ∆q̃ = 2∆, ∣∣ ˙̃qi∣∣ ≤ ∆ ˙̃q = (∆βi)1/γi en tiempo finito5. 3.4.5. Compensación de fricción: observador El término de fricción FL se puede integrar al modelo (2.1) como un término aditivo H(q)q̈ + C(q, q̇)q̇ + Dq + g(q) = τ − FL (3.14) Un esquema de control que compense el fenómeno de fricción debe incluir un estimador que prediga su valor. Este estimador ha de basarse en un mo- delo de fricción, en el caso considerado, el modelo LuGre, el cual como ya se 5La demostración de las propiedades enunciadas resulta extensa y no se consigna en este trabajo. Puede consultarse en [16] 49 vió depende de seis parámetros, es dinámico y tiene un estado no medible z. Si se asume que se conocen los parámetros σ0, σ1, σ2 y g(v) de (2.8) y (2.9) se puede usar un observador no lineal de fricción, tal que: dẑ dt = v − |v| g(v) ẑ − ke F̂L = σ0ẑ + σ1 dẑ dt + σ2v donde e = x − xd es el error de posición y xd es la posición deseada que se asume 2 veces diferenciable. El diagrama a bloques de la Figura 3.2 describe al sistema con la adición de la fuerza de fricción y el observador correspondiente: Figura 3.2: Diagrama a bloques del sistema con fricción y observador de fricción Como se mencionó en la sección 2.7.2, no se presenta en este trabajo prueba formal de estabilidad del sistema de control ante la presencia de fricción ni tras la inclusión del observador de fricción. Este trabajo se limita a incorporar la fricción como una dinámica no modelada, en su oportunidad simplemente compensada con la ayuda del observador ya presentado6. 6En [7] se demuestra que cuando los parámetros de fricción se conocen, el error del 50 3.5. Comparación cualitativa entre algoritmos PD+ Presenta la estructura más simple, con un término que compensa no line- alidades. La convergencia asintótica se asegura para el caso nominal y sólo una alta ganancia asegura un desempeño adecuado para casos no nominales. Es el control con más exigencias a priori y restricciones. Control Adaptable Permite lidiar con incertidumbre paramétrica, pero parte de la premisa de estructura conocida. Se sabe que su respuesta ante perturbaciones o dinámi- cas no modeladas no es muy buena. Los parámetros convergen en condición de exitación persistente, pero en caso de exitación no persistente o dinámicas no modeladas puede ocurrir un problema de deriva: el error de seguimiento puede mentenerse pequeño en tanto los parámetros divergen de los reales hasta un punto tal en que el sistema se vuelve inestable. Respecto al control PD+, aumenta el número de expresiones y por los problemas conocidos de deriva resulta un tipo de control que no se autosustenta en términos prácticos. Control Robusto Este control es un paso adelante respecto al controlador adaptable. Igual que en el control adaptable se parte del supuesto que el vector de parámetros nominales difiere del real, pero en vez de implementar una ley de adaptación para el vector de parámeros nominales, se compensa la ley de control con un término que depende de la magnitud del error entre los parámetros nominales y los reales. Esta aproximación solventa el problema de deriva de parámetros, evitando que el sistema escape y se desestabilice. A fin de cuentas se alcanza un resultado de estabilidad práctica al estar los estadosultimadamente aco- tados en función de parámetros manipulables. Este resultado de estabilidad es menos fuerte que el del caso adaptable, pero más robusto ante dinámi- cas no modeladas y perturbaciones. Se advierte en el controlador robusto un compromiso entre la cota final del vector de estados y la ganacia del control, al ser estas dos magnitudes inversamente proporcionales. observador de fricción converge asintóticamente a cero 51 Control por Modos Deslizantes MDT1 El control MDT1 al igual que el control robusto, compensa la incertidum- bre en el vector de parámetros, pero el término de compensación w es un término de magnitud constante que se aplica sólo cuando existe error de seguimiento. A diferencia de los controladores previos que presentan en la ley de control un término proporcional al error de seguimiento y a la tasa de error de seguimiento, esta ley de control presenta una función exponencial fraccionaria de dichas magnitudes. Esto tiene como efecto un control suave y con magnitudes menores a los casos anteriores (en la etapa transitoria), pero que usualmente requiere tiempos de respuesta mayores. La expresión de control resulta la más sencilla entre los controladores deslizantes revisa- dos, además de alcanzar un fuerte resultado de estabilidad, como lo es el de señales uniformenmente acotadas y convergencia del error de seguimiento a cero en tiempo finito. MDT2 Partiendo de MDT1, la ley MDT2 propone una simplificación a la expresión de control para el término w, aśı como un esquema adaptable para establecer el valor del término ρ. El esquema MDT2 representa una mejora respecto a MDT1 en los rubros de simplicidad del algoritmo y cantidad de información a priori (al no tener que conocerse de antemano el valor de ρ). Sin embargo para MDT2 se establece un resultado de estabilidad menos fuerte que para MDT1: estabilidad práctica. NMDT La expresión de control resulta la más compleja de las revisadas, pero aśı mis- mo la más completa al incluir términos que compensan expĺıcitamente las perturbaciones y dinámicas no modeladas. Los resultados de estabilidad obtenidos son fuertes: de convergencia del error a cero en tiempo finito para casos nominales y de estabilidad práctica para el caso con perturbación. 52 Caṕıtulo 4 Simulación: Comparación cuantitativa 4.1. Introducción En este caṕıtulo se realizan simulaciones del sistema para las leyes de control revisadas en el caṕıtulo anterior con lo que se pueden comparar cuan- titativamente los distintos algoritmos. En la sección 4.2 se presentan señales reales caracteŕısticas del movimiento del tipo de buque de interés, las cuales se usan para alimentar las simulaciones. En la sección 4.3 se hacen consideraciones respecto a la aproximaciónes di- recta e indirecta al realizar la disposición de los sensores que miden el giro alrededor de los ejes de interés, haciendo alusión a los resultados de [6]. Aśı mismo se ejemplifica como se realizan las mediciones angulares en el es- quema de control propuesto. En la sección 4.5 se presenta una estrategia que permite disminuir signi- ficativamente la amplitud de las transiciones abruptas de la señal de control, al suavizar las derivadas de las señales de referencia. En la sección 4.6 se resume en una tabla los algoritmos de control revisa- dos y se presentan las gráficas resultantes de las simulaciones de control del sistema representado por la Ecuación (2.7) para varias condiciones. 53 En la sección final se realiza la comparación cualitativa del desempeño de los controladres. Se presenta una tabla de parámetros ponderados en base a los cuales se califica el desempeño de los algoritmos. 4.2. Señal caracteŕıstica de la mar Como se adelantó en la sección 3.3 el movimiento que se experimenta sobre un barco depende de factores muy diversos, como por ejemplo, la ve- locidad de navegación (que para las embarcaciones de interés es de 0 a 20 nudos1), el sentido de movimiento, el estado de la mar, incluso la disposición de la carga al interior del buque. En general se pueden identificar 4 tipos de movimiento importantes del buque, a saber: el movimiento hacia adelante, el movimiento hacia atrás, el movimiento de cambio de rumbo y el estado en el que el buque debe conser- var su posición respecto al fondo del mar, en lenguaje marinero se denomina “estar al pairo”. Las gráficas de la Figura 4.1 presentan un conjunto de señales caracteŕısticas de los movimiento de rotación que experimenta un buque a la mar y permiten tener una idea de las perturbaciones a que se ve sometido un sensor abordo de una embarcación. Las señales que se presentan fueron obtenidas de giros de estado sólido en un buque de la marina de México. Cabe resaltar que la frecuencia de muestreo es de entre 9 y 10 Hz por limitaciones de las giros usadas. Ello indica que de acuerdo al teorema de Nyquist2 tal frecuencia de muestreo captura fenómenos en frecuencias dentro del rango de 0 a 5 hertz. Se tiene reportado que para las embarcaciones de interés, existe una componente de vibración persistente alrededor de 15 Hz, la cual se atribuye al conjunto estructura- sistema de máquinas del buque. No obstante, esta frecuencia resulta muy alta comparada con la dinámica del mar y su componente de enerǵıa es 1Un nudo, knt equivale a 0.515 m/s 2La frecuecia de muestreo debe ser al menos el doble del ancho de banda de la señal de entrada, si el criterio no es satisfecho existirán frecuencias cuyo muestreo coincide con el de otra(s)-el denominado aliasing- 54 Figura 4.1: Señal caracteŕıstica de las rotaciones en una embarcación a la mar. El eje horizontal tiene escala en segundos y el vertigal en grados soslayable comparada con la enerǵıa de las frecuencias por abajo de 5 Hz. La Figura 4.2 muestra un par de movimientos de buque hacia adelante, los espectros permiten ver el rango de frecuencia en que ocurre el fenómeno de perturbación. Las datos de las señales reales de giro se usan en las simulaciones com- putacionales que se presentan en la seccion final. 4.3. Sensores de giro y su disposición f́ısica: aproximación directa e indirecta La disposición del sensor de giro en una aplicación de estabilzación puede tener un impacto significativo en el desempeño del sistema. En este sentido, existen dos aproximaciones al problema de sensado de giro, la directa y la indirecta. 55 Figura 4.2: Señales caracteŕısticas de un par de movimientos del buque hacia adelante La aproximación directa, consiste en establecer los sensores de giro di- rectamente sobre la ĺınea de vista. En la aproximación indirecta, se establecen los sensores en la base de la plataforma. Por ende si la tarea es estabilizar la LOS, deben aplicarse las transformaciones necesarias para obtener la perturbación equivalente alrede- dor del eje de referencia de la LOS. La relación entre la perturbación real alrededor de la LOS y aquella medida en la base de la plataforma depen- derá de la geometŕıa de la plataforma, su rigidez estructural, la precisión de los sensores de posición (tacómetro y o codificador de posición), juegos entre los mecanismos de transmisión de movimiento, etc. En resumen, puede establecerse lo siguiente respecto a la dispocición de los 56 sensores de giro en una aplicación de estabilización: Aproximación directa • El sensor o sensores se montan directamente sobre la LOS. • La corrección de la perturbación es directa • Dependiendo del tamaño del sensor, puede impactar el tamaño de la base y limitar rangos de movimiento. • El método directo ofrece ventajas para aplicaciones de precisión pues las perturbaciones se miden directamente sobre ĺınea de vista. Aproximación indirecta • El sensor o sensores se montan en la base de la plataforma. • No se miden las perturbaciones alrededor de la LOS. • La perturbación alrededor de la LOS se obtiene mediante trans- formaciones. • Las ventajas de esta configuración son de tipo
Compartir