Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO PROGRAMA DE MAESTRÍA Y DOCTORADO EN PSICOLOGÍA NEUROCIENCIAS DE LA CONDUCTA Desarrollo de una interfaz cerebro-computadora para comunicación mediante P300 T E S I S QUE PARA OBTENER EL GRADO DE DOCTOR EN PSICOLOGÍA P R E S E N T A ÁNGEL DANIEL SANTANA VARGAS Jurado de examen de grado Directora: Dra. Feggy Ostrosky Shejet Comité: Dr. David Natanael Velázquez Martínez Dra. Verónica Medina Bañuelos Dr. Humberto Nicolini Sánchez Dra. Matilde Valencia Flores MÉXICO, D.F. 2010 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. RECONOCIMIENTOS La presente investigación se realizó completamente en el Laboratorio de Neuropsicología y Psicofisiología de la Universidad Nacional Autónoma de México a cargo de la Dra. Feggy Ostrosky Shejet. La tesis formó parte de las investigaciones iniciales para desarrollar una Interfaz cerebro-computadora basada en el componente P300 y recibió apoyo parcial del proyecto PAPIIT 2005603. El proyecto de investigación y la tesis correspondiente se realizaron con el apoyo económico de las becas de posgrado otorgadas por el Consejo Nacional de Ciencia y Tecnología, registro 189244, y por la Dirección General de Estudios de Posgrado otorgada por la Universidad Nacional Autónoma de México. AGRACIMIENTOS Deseo expresar mi sincero agradecimiento a las personas que con su guía y conocimiento contribuyeron a mi formación académica y personal. A ellas también les reconozco su calidad humana reflejada en la confianza y apoyo brindado durante este periodo de mi vida. A ellas les debo mi respeto, admiración y afecto. Agradezco a la Universidad Nacional Autónoma de México y a la Facultad de Psicología, su generosidad y la oportunidad de completar mi formación personal, profesional y académica. Agradezco a la directora de esta tesis doctoral, Dra. Feggy Ostrosky Shejet, por su dedicación, interés y apoyo brindado para la realización de mi proyecto de investigación. Por su guía profesional, su trato personal respetuoso y por la confianza depositada a lo largo de mi estancia por su laboratorio. Gracias por tu amistad, por dedicar tiempo para mi formación, por orientarme y ser paciente. Te agradezco también los consejos y sugerencias, la invitación a participar en tus proyectos de investigación y a ser parte de tu equipo de trabajo. Con ello pude beneficiarme de tu experiencia e interés por la investigación y las neurociencias. Al comité tutoral por el interés y lo pertinente de sus observaciones y sugerencias. Gracias Dr. David N. Velázquez Martínez, Dra. Verónica Medina Bañuelos, Dr. Humberto Nicolini Sánchez y Dra. Matilde Valencia Flores. A la Ing. Martha Pérez por brindarme tus conocimientos, carisma y afecto. Gracias por tu amistad, por tu ayuda y compañía. A los participantes del proyecto de investigación. A mis compañeros del laboratorio, Alicia Vélez, Ana Canseco, Azucena Lozano, César Romero, Cecilia Gaytan, Maura Ramírez, Julio Flores, Gabriela Castillo, Gabriela Orozco, Guadalupe González, Karla Díaz, Nalleli Arias, Susana Sandoval. Gracias por su amistad y por su compañía. A mi familia, Graciela, Lucy, Carlos y Alejandro, gracias por su cariño, por apoyarme incondicionalmente y por ser la esencia de mi vida. INDICE RECONOCIMIENTOS AGRADECIMIENTOS DEDICATORIA RESUMEN ......................................................................................................... 1 ABSTRACT ........................................................................................................ 2 INTRODUCCIÓN ............................................................................................... 3 1 NEUROBIOLOGÍA DE LA INTERFAZ CEREBRO-COMPUTADORA .............. 5 1.1 Actividad electrofisiológica para interfaces cerebro-computadora ............ 5 1.2 Electroencefalografía ................................................................................ 7 1.2.1 Registro del EEG ............................................................................ 8 1.2.2 Análisis del EEG ............................................................................. 9 1.2.3 Tipos de actividad en el EEG ......................................................... 10 1.3 Potenciales evocados ............................................................................... 12 1.3.1 Potenciales visuales evocados (PVE) ............................................ 12 1.4 Potenciales relacionados a eventos (PRE) ............................................... 12 1.4.1 Componentes de los PRE .............................................................. 14 1.4.2 Potenciales exógenos ..................................................................... 15 1.4.3 Potenciales endógenos .................................................................. 15 1.4.4 El componente N100 ...................................................................... 16 1.4.5 El componente N200 ...................................................................... 17 1.4.6 El componente P300 ...................................................................... 17 1.4.7 El componente N400 ...................................................................... 18 2 INTERFAZ CEREBRO-COMPUTADORA (ICC) ............................................... 19 2.1 Antecedentes ............................................................................................ 19 2.1.1 Sistemas de biocontrol ................................................................... 19 2.2 La interfaz neural ...................................................................................... 20 2.3 Señales bioeléctricas para interfaces neurales ........................................ 21 2.4 Comunicación y control basados en el EEG ............................................. 24 2.5 Interfaz cerebro-computadora ................................................................... 30 2.6 Clases de ICC ........................................................................................... 31 2.7 Modelo general de una ICC ...................................................................... 32 2.7.1 Componentes ................................................................................. 33 2.8 Bioseñales para ICC ................................................................................. 36 3 INTERFACES CEREBRO-COMPUTADORA BASADAS EN EL COMPONENTE P300 ........................................................................................ 39 3.1 El componente P300 ................................................................................. 39 3.2 Factores relevantes del componente P300 para ICC .............................. 42 3.3 El componente P300 y la ICC ................................................................... 45 3.4 Estudios sobre ICC basados en el componente P300 ............................. 47 3.5 Objetivos................................................................................................... 65 3.6 Hipótesis ................................................................................................... 66 4 MÉTODO ........................................................................................................... 68 4.1 Variables ................................................................................................... 68 4.2 Sujetos ...................................................................................................... 71 4.3 Muestreo ................................................................................................... 72 4.4 Tipo de estudio ......................................................................................... 72 4.5 Estímulos .................................................................................................. 73 4.6 Procedimiento ........................................................................................... 75 4.7 Adquisición de los PRE ............................................................................. 79 4.8 Procesamiento de los PRE ....................................................................... 81 4.8.1 Eliminación de artefactos ................................................................ 81 4.8.2 Promedio ........................................................................................ 81 4.8.3 Obtención de los grandes promedios ............................................. 84 4.8.4 Obtención de los componentes ...................................................... 85 4.8.5 Análisis morfológico ........................................................................ 85 4.8.9 Análisis estadístico ......................................................................... 86 5 RESULTADOS ................................................................................................... 88 5.1 Análisis morfológico .................................................................................. 88 5.2 Análisis estadístico ................................................................................... 97 6 DISCUSIÓN ....................................................................................................... 124 6.1 Factores asociados a la generación del componente P300 124 6.2 Implicaciones para la comunicación en ICC 133 7 CONCLUSIONES .............................................................................................. 138 7.1 Alcance y limitaciones ............................................................................... 139 8 REFERENCIAS ................................................................................................. 142 4 RESUMEN La interfaz cerebro-computadora (ICC), es un sistema por el cual se crea un canal de comunicación directa entre el cerebro de una persona y una computadora. El intercambio de información tiene lugar sin ocupar las vías eferentes neuromusculares, en su lugar, emplea sólo la actividad neurofisiológica del cerebro y la traduce en comandos con los que se puede controlar una computadora. Sus principales aplicaciones son la comunicación mediante programas para deletrear palabras y el control de aparatos, ambos destinados a personas con severas alteraciones en las vías descendentes que permiten el control voluntario de los músculos. En la actualidad existe gran variedad de sistemas, pero en esencia están constituidos por partes que desempeñan las mismas funciones: adquirir la actividad del cerebro, emplear maniobras para generar diferentes tipos de actividad, extraer sus características, clasificarlas y finalmente traducirlas en aplicaciones para que el usuario interaccione con el exterior. En la presente investigación se empleó una técnica no invasiva para registrar la actividad electroencefalográfica. El método para obtener diferentes tipos de actividad, fue mediante la presentación de estímulos para obtener potenciales relacionados a eventos. Se exploró la influencia de actos volitivos en la selección de estímulos, su contenido, el tiempo y modo de presentación. Se utilizaron métodos de promediación para extraer las características de la actividad relacionada a los estímulos, en los que posteriormente se identificó y clasificó el componente P300 mediante su amplitud, distribución y latencia. Finalmente se analizó el tipo de comunicación y los tipos de lenguaje que se generan al utilizar diferentes contenidos en los estímulos, así como su impacto en el diseño de una ICC. Los resultados mostraron que los actos volitivos tienen un efecto mayor estadísticamente significativo en la manera de seleccionar los estímulos. En los factores que afectan la generación del componente P300, se encontró que el tiempo de presentación afecta su amplitud y que el contenido de los estímulos afecta su latencia. Además, en el contexto de la ICC, el tipo de lenguaje iconográfico tiene ventajas sobre el lenguaje ortográfico. 4 ABSTRACT Brain-computer interface (BCI), is such a system that creates a direct communication channel between a person’s brain and a computer. The interchange of information occurs without the efferent neuromuscular pathways, instead, it only uses the neurophysiologic activity from the brain, and translates this activity into commands that are able to control a computer. The main applications are communication through programs to spell words and control of devices, both aimed to persons with severe disabilities in the descending pathways involved in the voluntary control of muscles. Nowadays there is a great variety of systems, constituted basically by parts which performance is in order of compliance of the same functions: acquire the brain’s activity, procedures to generate different types of activity, extract its features, make a classification and, finally translate it into applications to enable the user to interact with the external world. In the present research, a noninvasive technique to record the electroencephalographic activity was used. The method to obtain different types of activity was the presentation of stimuli in order to generate event related potentials. The influence of volitional intentions in the selection of stimuli was explored, also the stimuli content, time and mode of presentation was assessed. Methods for averaging were used in order to extract the features of event related activity to the stimuli, and further identification and classification of the P300 component bias its amplitude, distribution and, latency. Finally, analysis of the type of communication and generated language was performded, as well as their impact in the design of a BCI system. The results showed a mayor statistically significant effect of volitional acts over the selection of stimuli. Among factors affecting the generation of the P300 component, time of presentation was found affecting its amplitude, and stimuli content affects its latency. Besides, in the context of BCI, the iconographic language has advantages over the orthographic language. 4 INTRODUCCIÓN La electroencefalografía es una técnica que permite estudiar al cerebro humano mediante la actividad eléctrica registrada en la superficie del cuero cabelludo. Cuando en condiciones experimentales, una parte de esta actividad se produce en respuesta ante estímulos específicos, se le denomina potencial relacionado al evento, en el cual se identifican ondas o componentes. A su vez, los componentes son correlatos electrofisiológicos de cómo el cerebro procesa el estímulo y se han asociado a procesos cognitivos, como el componente P300, que es considerado como un índice de procesos atencionales y de la memoria de trabajo. Las electroencefalografía y los potenciales relacionados a eventos han sido utilizadosen el diagnóstico clínico, pero recientemente, varios grupos de investigadores han combinado esta técnica con otras disciplinas como la ingeniería y las ciencias de la computación, para desarrollar una novedosa tecnología de asistencia cuyo producto principal es un sistema denominado Interface Cerebro-Computadora (ICC por sus siglas en inglés), el cual utiliza la actividad del cerebro para controlar dispositivos externos, con los que una persona con alteraciones neuromusculares, podría manipular aparatos externos o comunicarse (Wolpaw, 2000) El componente P300 es uno de los correlatos de la actividad cerebral que se ha utilizado para crear un canal de transferencia de información entre el cerebro humano y una computadora. El principio de funcionamiento, consiste en la extracción de características específicas, como la amplitud y la latencia, que al ser identificadas y procesadas, permiten distinguir a los estímulos que las generan como portadores de información. Su aplicación es principalmente la comunicación, y para ello se han modificado paradigmas como el oddball, en el cual se presentan dos tipos de estímulos, uno de los cuales elicita al P300. De esta forma, el estímulo que lo genera, se asocia con una parte del estímulo que se desea comunicar. Sin embargo, las 4 investigaciones recientes se han enfocado principalmente en el procesamiento de dicha señal y no en los factores electrofisiológicos y psicológicos que influencian su generación, no obstante que entre mejores sean las características del P300, mejor será su procesamiento y clasificación. Con el objetivo de 1) obtener una mejor señal para una interface cerebro-computadora basada en el componente P300, en la presente investigación se exploraron diversos factores asociados a su obtención mediante tres diseños experimentales, en los que se manipularon cinco variables: el contenido, la forma y la duración de los estímulos, la atención y la tarea y 2) se analizaron las implicaciones que tiene para los usuarios la interacción con un sistema artificial de comunicación y la manera de facilitar y hacer más eficiente la transmisión información a partir del contenido y tipo de lenguaje. Los resultados sugieren que algunos parámetros como la atención, la duración de los estímulos y la tarea modulan la amplitud del P300 y otros, como el contenido de la matriz afectan la latencia. La organización del presente trabajo es la siguiente: en el capítulo 1, se describen las bases neurobiológicas de las ICC, como le electroencefalografía y potenciales relacionados a eventos. El capítulo 2 contiene los antecedentes de la ICC y el capítulo 3 a la ICC basada en componente P300. En el capítulo 4 se describe el método, que incluye las variables, los sujetos y el procedimiento realizado en cada uno de los tres estudios. En el capítulo 5 se muestran los resultados, en el capítulo 6 la discusión y conclusiones respectivamente. Por último cabe mencionar que la presente investigación se realizó completamente en el Laboratorio de Neuropsicología y Psicofisiología de la Universidad Nacional Autónoma de México a cargo de la Dra. Feggy Ostrosky Shejet. La tesis formó parte de las investigaciones iniciales para desarrollar una Interface cerebro-computadora basada e el componente P300 y recibió apoyo parcial del proyecto PAPIIT 2005603. 5 1 NEUROBIOLOGÍA DE LA INTERFAZ CEREBRO-COMPUTADORA 1.1 Actividad electrofisiológica para interfaces cerebro-computadora El cerebro humano puede dividirse en cuatro estructuras pr incipales: la corteza, el t allo cerebral, el cerebelo y el tálamo e hipotálamo. Para estudiar sus procesos en términos de su fisiología, estructura funcional, actividad metabólica y eléctrica, se han desarrollado técnicas c omo l a electroencefalografía ( EEG), l a m agnetoencefalografía ( MEG), l a tomografía de emisión de positrones (PET), la resonancia magnética funcional (fMRI) y la imagenología óptica entre otras. El análisis de los datos obtenidos con estas técnicas ha generado una gran cantidad de conocimiento y numerosas aplicaciones principalmente en el área clínica y constituyen una valiosa herramienta para la investigación en el campo de las Neurociencias. La i nterface c erebro-computadora ( ICC por s us s iglas e n I nglés; “ Brain Computer- Interface”), es el resultado de investigaciones conjuntas e interdisciplinarias y en ella se ven r eflejadas l as a portaciones d e l a i magenología funcional, l as c iencias d e l a computación, l as m atemáticas y la ingeniería biomédica. La ICC como s u nombre lo indica, es un sistema qu e crea un canal de c omunicación en tre el cerebro y una computadora. Para lograrlo, emplea la actividad electrofisiológica del cerebro y se asiste de computadoras par a su f uncionamiento, es dec ir, em plea al cerebro c omo f uente primaria de información (bioseñal) y a las computadoras para procesarla. Un componente esencial de una ICC es la técnica y equipo necesario para registrar dicha actividad, la cual debe cumplir con ciertos criterios funcionales como son las relacionadas con la bioseñal (resolución temporal y espacial), con el riesgo para el usuario (invasivas y no invasivas), con su facilidad de adquisición ( rapidez, costo, equipo e i nstalaciones), y por úl timo el o bjetivo d el s istema ( comunicación o c ontrol). A demás de l os r equisitos 6 funcionales, una técnica para una interface computarizada, también requiere que 1) la actividad sea el resultado de un estímulo o de un esfuerzo mental, 2) que el usuario la pueda controlar o aprenda rápido a hacerlo y 3) que sea registrada de forma convencional o de forma invasiva con electrodos implantados. Siguiendo estas consideraciones, un sistema ideal debería ser barato, poco riesgoso, con mayor r esolución temporal que espacial y s ervir para c omunicación y /o control. Por lo anterior y para su apl icación en una interface cerebro-computadora la MEG, la PET, la fMRI y la imagenología óptica, tienen muchos requisitos técnicos y son costosas. C on excepción d e l a M EG, l a P ET, l a fMRI y l a i magenología óptica, dependen d el flujo sanguíneo, lo cual implica que se requieren de tiempos excesivos de registro y de análisis para los f ines del sistema. El E EG por su parte ofrece ciertas ventajas, y a q ue es u n registro que t iene alta resolución t emporal s e obtiene como un c ontinuo en el tiempo, convencionalmente es no i nvasivo y el e quipo que em plea es r elativamente s imple y accesible. Sin embargo, aún cuando el EEG es una de las técnicas de elección para una ICC, no toda la actividad que puede observarse en él es útil para el sistema. Para considerar al EEG como una opción de control y comunicación, se t iene que establecer una correlación existente entre el registro y la realización o imaginación de movimientos y algunas tareas cognitivas (Keirn y Aunon, 1990; Lang et al., 1998; Altenmûller y Gerloff, 1999; McFarland et al., 1999). Tomando al EEG como fuente de actividad electrofisiológica, los investigadores en ICC se han enfocado en dos tipos de interfaces: La primera es usar características del EEG continuo en la cual el usuario puede modificarla con cierto grado de confiabilidad y La segunda es el uso de potenciales evocados (PE), potenciales relacionados a eventos (PRE) y sincronización/desincronización relacionada a eventos (ERD/ERDS). 7 Por último, cabe mencionar que la exploración en este tipo de investigaciones extiende las aplicaciones de la electroencefalografía a la tecnología de asistencia, además de su ya conocido empleo para evaluar alteraciones neurológicas, investigar funciones cerebrales y en la exploración con fines terapéuticos (Travis et al., 1975; Kuhlman, 1978; Rockstroh et al., 1989; Rice et al., 1993; Sterman, 2000). En el presente trabajo se seleccionóal EEG como la técnica para evaluar estímulos que eventualmente servirían para una interface cerebro-computadora. A continuación se describen brevemente algunas de sus características. 1.2 Electroencefalografía La electroencefalografía se define como una técnica de registro de la actividad eléctrica cerebral, que se realiza de forma no i nvasiva colocando electrodos en l a s uperficie del cuero cabelludo. En el electroencefalograma (EEG) se observan fluctuaciones de voltaje tanto positivas como negativas que reflejan las corrientes extracelulares de despolarización de las membranas postsinápticas en la corteza y la hiperpolarización de las neuronas piramidales ubicadas en las capas corticales superiores. Para generar tales campos el éctricos o di polos, s e h a postulado q ue l a disposición a natómica d e dichas neuronas es paralela, laminar y se orienta hacia la superficie (Coles y Rugg, 1995). La actividad sincrónica, simultánea y sumatoria de estas grandes poblaciones de neuronas dan c omo r esultado u na ac tividad c ontinua, l ocalizada y r ítmica que p uede correlacionarse con estímulos, acciones y el estado mental. 8 1.2.1 Registro del EEG Para o btener el EEG s e c olocan electrodos s uperficiales s obre el cuero c abelludo de acuerdo a una configuración internacional e standarizada 10-20 (Jasper 1958), l a cual representa posiciones del 10 y 20 por ciento de referencias anatómicas. Estas referencias son el nasion (puente de la nariz), el inion (protuberancia en la parte posterior de l a cabeza arriba d e l a nuca), y l os p untos pr eauriculares i zquierdo y d erecho (depresión frente a los oídos arriba de los pómulos). La localización de los electrodos se muestra en la figura 1.1 y se refiere la posición frontal- posterior, y utiliza las siglas (F, frontal; P, parietal; C, central; T, temporal; O, occipital) y localización izquierda-derecha (números nones = hemisferio izquierdo; números pares = hemisferio derecho; z = línea central). En el EEG se observan variaciones de voltaje (amplitud) detectadas por l os electrodos con respecto al tiempo, en el cual se comparan diferencias de potencial entre dos sitios, ya sea activos (registro bipolar) o uno activo y el otro inactivo (registro monopolar). Lo s sitios inactivos más comunes son los lóbulos de las orejas. El rango de las variaciones de los voltajes que se obtienen en el EEG es de aproximadamente -100 a +100 microvoltios (μV), por lo que es necesario amplificarlas por Figura 1.1 Localización y nomenclatura de los electrodos de acuerdo al sistema 10-20. 9 un factor aproximado de 20 000 veces para que en el canal de salida la lectura sea del orden de m ilivoltios. El v oltaje u na v ez am plificado puede s er r epresentado m ediante plumillas de tinta o en la pantalla de una computadora para análisis en línea o ser almacenada en cintas analógico-digitales o archivos para análisis posteriores. (Fig. 1.2) 1.2.2 Análisis del EEG El primer tipo de análisis que se realiza sobre el EEG es el visual, en el que se puede identificar la frecuencia de las fluctuaciones de voltaje y con ello la banda o ritmo al que pertenecen. Para su cuantificación se cuenta manualmente el tipo de actividad presente en t odo el r egistro o bien s e procesa m ediante pr ogramas de c omputadora. E n este último, se requiere primero convertir la señal amplificada del EEG mediante un convertidor análogo a digital. Esto permite la manipulación matemática. La señal es muestreada y posteriormente segmentada, as í cada f ragmento puede someterse a an álisis como el realizado con la transformada rápida de Fourier, de cuyos datos se obtiene una gráfica que representa la señal contra su amplitud o la señal contra la frecuencia al cuadrado, de manera que se obtiene la potencia absoluta. Amplificador Convertidor AD EEG Figura 1. 2 D iagrama d el r egistro d e u n electroencefalograma. L a actividad eléctrica es conducida por los electrodos hacia un amplificador y posterior mente convertida para observarse como cambios de voltaje en el EEG. 10 1.2.3 Tipos de actividad en el EEG La ac tividad espontánea qu e se obs erva en el EEG pu ede dividirse en rangos de frecuencia o bandas, las cuales son actividades per iódicas que pueden ser v istas en el registro como ondas dinámicas o ritmos. La clasificación de las ondas refiere su frecuencia denominada en Hertz (Hz, ciclos por segundo) y amplitud en μV (Fig. 1.3). Nombre Frecuencia (Hz) Amplitud (μV) Delta 0.5 – 3.5 > 100 - 200 Teta 4 – 7.5 < 30 Alfa 8 – 13 30 - 50 Beta > 13 - 30 < 20 Tabla 1.1 Actividad e spontánea que se observa en el EEG ( Coles y Rugg, 1995). Actividad delta (δ): 0.5 – 3.5 Hz, ocurre en periodos de sueño en adultos, disminuye con la edad y su presencia en vigilia es signo de anormalidad. Es la mayor actividad durante los dos primeros años de vida. Actividad t eta (θ):4 – 7.5 H z, s e postula q ue se or igina e n el t álamo, e n adultos s e presenta en pequeñas cantidades y de forma no organizada. Se asocia a condiciones de bajos niveles d e al erta, disminución en el pr ocesamiento de i nformación y c on l a maduración de los mecanismos de asociación en la corteza. En los niños aparece en los estados de somnolencia y sueño. Actividad alfa (α): la definición oficial del ritmo alfa (International Federation of Societies for E lectroencephalography and C linical Neurophysiology, 1974) es: R itmo entre 8 – 13 Hz, ocurre durante la vigilia en las regiones posteriores de la cabeza, generalmente con mayores voltajes sobre las áreas occipitales. Su amplitud es variable y es menor en los adultos. En el paciente con los ojos cerrados se observa en condiciones de relajación y 11 de relativa inactividad mental. Se bloquea o atenúa al poner atención, especialmente al realizar esfuerzo visual o mental. Actividad beta (β): 13.5 – 30 Hz, reflejan aumento de activación cortical, se observa en las regiones frontales y centrales. En la zona central se asocia al ritmo µ y puede bloquearse por a ctividad m otriz o es timulación t áctil, a uditiva o em ocional y en algunas per sonas puede bloquearse por esfuerzo voluntario al imaginarse movimiento. Actividad mu (µ): 9-11 HZ, es parecido a la actividad alfa en la frecuencia y amplitud, pero es diferente en la topografía y significado fisiológico. Se relaciona con la preparación de acciones motrices pr incipalmente en l a corteza motriz. Es asimétrico, puntiagudo en la zona negativa y r edondeado en l a p ositiva. S e as ocia c on a normalidad s i su valor es inferior a los 8 Hz. Se bloquea esencialmente de forma contralateral por el movimiento ya sea activo, pasivo o reflexivo. Figura 1.3 Ejemplos de actividad espontánea observada en el EEG. 12 1.3 Potenciales evocados 1.3.1 Potenciales visuales evocados (PVE) Se producen c omo l a r espuesta a un es tímulo sensorial específico, en este c aso a u n estímulo visual como la l uz intermitente ( flash). Su t opografía en el EEG es sobre la corteza visual y es susceptible a que su amplitud sea modificada por la persona mediante biofeedback. 1.4 Potenciales relacionados a eventos Coles y Rugg (1995), señalan que los potenciales eléctricos que están específicamente relacionados en tiempo a un evento particular se denominan potenciales relacionados a eventos (PRE). Registrados sobre el cuero cabelludo, los PRE t ienen una amplitud pequeña, menor a 20 μV, en relación a la amplitud del EEG (alrededor de 50 μV), por lo que en su análisis se emplean procedimientos de discriminación para extraer la señal de interés r especto a l a s eñal o r uido de fondo. U no de l os procedimientos e s e l de promediación de varios segmentos del EEG que contienen la actividad en un periodo de tiempoespecífico relacionado a un evento en particular; esto es, se seleccionan los segmentos que tienen una relación temporal constante a un evento. La selección del número de s egmentos depende de la relación señal-ruido, de la presencia de artefactos (parpadeos, m ovimientos oc ulares, t ensión m uscular, etc.) e ntre otras. Las s eñales varían de persona a persona y de una muestra a otra, ya sea que contengan el PRE o no. La pr omediación p ermite q ue l a ac tividad no r elacionada s e c ancele d ejando el P RE visible (Fig. 1.4). 13 Los PRE son muestras de la actividad eléctrica integrada de grandes grupos de neuronas en el cerebro. Coles y Rugg (1995), s ugieren que para que la integración ocurra, las neuronas deben tener actividad sincronizada y el campo eléctrico de cada neurona debe estar orientado de manera que su efecto sea acumulativo. Se considera que los PRE son el resultado potenciales postsinápticos acumulados, dado que tienen mayor duración y es más factible que su actividad se sincronice a diferencia de los potenciales presinápticos que t ienen al ta frecuencia y p oca d uración. P or ot ro l ado, p ara q ue l a a ctividad s ea acumulativa deben poseer una organización espacial específica para generar un campo eléctrico. L orente de No, en 1947 distinguió entre c ampos abiertos y cerrados. En l a estructura del modelo que da un campo abierto los árboles dendríticos de las neuronas están orientados hacia un lado y los axones hacia el opuesto, de esta forma, la actividad de cada neurona tiene la misma orientación y por lo tanto se suma. De esta forma sólo las es tructuras con un t ipo s imilar de conformación serían l as que generan potenciales registrables. Los campos abiertos se conforman cuando las neuronas están organizadas en capas como en la corteza, partes del tálamo, el cerebelo y otras estructuras. Los EEG Selección y promediación de segmentos PRE Figura 1.4 Ejemplo de la obtención de un PRE. En el EEG se seleccionan los segmentos que contienen la actividad relacionada al evento y se promedian, obteniéndose la actividad con mejor relación señal/ruido. 14 campos cerrados tienen una organización concéntrica, de manera que la actividad de las neuronas puede tener dirección incluso opuesta, lo que imposibilita su adición. De acuerdo a esta concepción, un PRE representa sólo una porción de la actividad del cerebro considerando sus múltiples estructuras, por lo que su ausencia ante un evento no es concluyente de que no se esté realizando algún proceso. 1.4.1 Componentes de los PREs Los componentes de los PREs son deflexiones (picos o valles) localizados en diferentes puntos de la onda. Los componentes se pueden determinar de acuerdo a: Secuencia y polaridad Polaridad y latencia Una c lasificación de P RE los denomina como potenciales exógenos y endógenos ( Fig. 1.5) POTENCIAL RELACIONADO A EVENTO Figura 1.5 Potenciales endógenos y exógenos 15 1.4.2 Potenciales exógenos Los potenciales exógenos o sensoriales son controlados por las características físicas del estímulo (intensidad, luminosidad, frecuencia, etc.), y se consideran respuestas obligatorias. No están influenciados por procesos cognitivos. Ocurren dentro de los primeros 100 ms después de la presentación del estímulo. Son provocados por la presentación d e es tímulos, v isuales, a uditivos o somatosensoriales. Se pueden generar ya sea por entrenamiento, estimulación presentada a una relativa alta frecuencia o por estímulos transitorios. Sus deflexiones están asociadas a la transmisión de información sensorial del sistema sensorial periférico hacia la corteza y/o el arribo de información a la corteza. Los potenciales son respuestas obligatorias del sistema nervioso ante un estímulo externo. Sus componentes dependen de la modalidad específica, por lo que difieren en su forma y distribución topográfica en función de la ruta o modalidad sensorial involucrada. 1.4.3 Potenciales endógenos Los potenciales endógenos corresponden a la interacción entre la persona y el estímulo, es decir, de acuerdo a la demanda psicológica del evento. S us componentes varían en función de factores c omo l a a tención, l a r elevancia de l a t area, y l a naturaleza del procesamiento requerido por el estímulo. Ocurren después de los 100 ms de la presentación del estímulo. En los últimos años se han investigado PREs en los que se han identificado varios componentes (ondas o picos) que se presentan ante determinadas funciones psicológicas complejas por ejemplo: el N1 o N100 que se ha relacionado con atención selectiva (Van Petten y Kutas, 1990); el N2 o N200 relacionado con discriminación activa; el P3 o P300, con situaciones de incertidumbre y actualización de la memoria a corto plazo (Sutton et 16 al., 1965), y el N400 generado ante el procesamiento de incongruencias semánticas de lenguaje (Kutas y Hillyard, 1980). 1.4.4 El componente N100 El N100 o N1 se determinó investigando procesos atencionales, comparando las respuestas de c uando s e at iende o no el es tímulo. ( Eason et al., 1 964; Hilly ard et al., 1973). Se ha planteado que un estímulo atendido está asociado a un PRE más negativo entre los 100 y 200 ms (Hillyard et al., 1973) De investigaciones posteriores se extraen dos temas importantes; el uso de PRE para comprobar teorías de atención selectiva y la naturaleza del efecto atencional sobre el PRE. La at ención s electiva s e r efiere a l a ha bilidad del hum ano par a pr ocesar i nformación, analizar algunos estímulos e ignorar otros. El proceso según Broadbent (1957), es un filtrado el c ual oc urre a u n ni vel p erceptual t emprano o a et apas po steriores de procesamiento. En la teoría de los recursos (Kahneman, 1973), la atención selectiva es un mecanismo por el cual el sistema asigna más recursos para procesar información en el canal que atiende el estímulo en contraste c on los canales que no l o atienden. En estudios subsecuentes se propuso que la facilitación de la onda N100 ante los estímulos relevantes era producida por la suma de otra onda que aparece con la misma latencia, a la cual se le denomino "negatividad de procesamiento" (Näätänen et al., 1978) u "onda de diferencia" (Nd) (Alain, Woods y Knight, 1998) Esta deflexión negativa esta formada por varios componentes que se originan por diferentes regiones del cerebro y son sensibles a diferentes condiciones experimentales (Hansen y Hillyard, 1980; Wood y Wolpaw, 1982). Actualmente se c onsidera que am bos m ecanismos c oexisten: l a facilitación de l a onda N100 y la presencia del Nd con distribución frontal, que se agrega a la primera durante la percepción de los estímulos en los canales atendidos (Khoe, et al., 2005). 17 1.4.5 El componente N200 El N200 o N2 se presenta aproximadamente a los 200 ms ante cierta clase de estímulos visuales y auditivos. Los estímulos deben ser a l menos de dos tipos en la que uno es infrecuente o r aro y el otro frecuente. S u am plitud v aría c on l a d etección de características en el es tímulo, s iendo m ás am plia par a el es tímulo i mprobable y n o depende de la r elevancia de l a t area s ino de l a de tección de estímulos raros (Squires, Squires y K illyard, 1 975; N äätänen, 19 82). S e di stribuye de acuerdo a l a m odalidad sensorial; máximo en la región occipital para estímulos visuales y en la centro-frontal para los auditivos. El componente N200 es independiente de la atención selectiva en el paradigma auditivo. S u l atencia depende d e l a di ficultad entre di scriminar e stímulos probables e improbables. 1.4.6 El Componente P300 El componente P300, es una onda positiva tardía con una amplitud que va de los 5 a los 20 μV; una latencia de entre 300y 900 ms, y m áximo en las áreas centro-parietales. Está asociado a la detección de eventos infrecuentes (Sutton et al., 1965), al valor o significado del evento en el contexto de la tarea y a las fuentes para el procesamiento demandadas por la tarea en particular (Duncan-Johnson y Donchin, 1977). El P300 a parece e n cualquier modalidad de estimulación. La forma más común para registrarlo es presentar dos clases de estímulos, uno raro o infrecuente y uno frecuente (paradigma “Oddball”), solicitando al participante que realice una tarea al detectar el estímulo poco probable (Ej. Contar el número de veces que aparece o apretar un botón) e ignorando el estímulo común. La amplitud de éste componente varía de acuerdo con la cantidad de información dada por el estímulo y la probabilidad con la que és te se presenta, mientras que su latencia 18 puede reflejar el tiempo de oc urrencia del proceso de decisión o puede representar el resultado de la selección de la respuesta (Donchin y Coles 1988) Tanto la probabilidad o frecuencia con que aparece el estímulo infrecuente y la atención o relevancia de l a t area i ntervienen de forma i ndependiente ( Squires et al.,. 1976). U n estímulo infrecuente independiente a la relevancia en la t area generará un componente P3a; ligeramente más temprano y con distribución más frontal que parietal, el componente 3b aparece al atender una tarea relevante. El P300 s e h a em pleado en clínica para detectar c ambios en las funciones cognitivas como en la demencia, esquizofrenia, Parkinson idiopático y la enfermedad de Huntington entre o tras ( García de l a C adena et al., 1 996; García d e l a C adena, Ostrosky-Solís y Rodríguez, 1997). El C omponente P 300 y s u r elevancia p ara l as i nterfaces c erebro-computadora s e abordará con detalle en el capítulo 3. 1.4.7 El componente N400 El componente N400 es una deflexión negativa que aparece aproximadamente a los 300 ms después de la presentación del estímulo y alcanza su mayor amplitud a los 400 ms. Este componente está asociado con el desarrollo y violación de expectativas semánticas visuales ( Kutas y H illyard, 1980) y auditivas ( McCallum et al., 1984) S u am plitud es inversamente proporcional a la expectativa de la palabra terminal e insensible a las restricciones de l a or ación, c omo el n úmero de r espuestas al ternas. T iene u na distribución t opográfica pr incipalmente en el hem isferio der echo, en z onas c entro- parietales de la corteza cerebral (Kutas y Hillyard, 1982) El N400 se emplea para probar teorías relacionadas al procesamiento semántico en el lenguaje escrito y hablado y en la memoria (Castañeda et al., 1 999; Ostrosky-Solís et al., 1995; Ostrosky-Solís y Chayo- Dichy, 1997). 19 2. INTERFAZ CEREBRO-COMPUTADORA 2.1 Antecedentes Las interfaces c erebro-computadora (ICC) tienen sus orígenes e n l os s istemas de biocontrol, los cuales evolucionaron hacia a las interfaces neurales. El término interfaz, se refiere a l a unión física y funcional e ntre dos s istemas i ndependientes. L a I CC es considerada como un tipo especial de interfaz neural, en el que la unión funcional directa es entre el cerebro y una computadora. 2.1.1 Sistemas de biocontrol Un s istema de biocontrol ( SBC), s e r efiere a u n s istema c onformado por c onexiones electrónicas que transforman parte de la actividad biológica de una persona en actividad eléctrica compatible con accesorios externos, de manera que actúen como si fueran extensiones de su propio cuerpo (Vidal, 1973). La computación y la microelectrónica son elementos indispensables en el diseño y capacidades de muchos de los instrumentos con los que se estudia la biología humana. Los SBCs se benefician de ambos; del avance tecnológico y del mayor conocimiento sobre los sistemas biológicos, en especial del sistema nervioso. Los s istemas d e bi ocontrol em pezaron a c oncebirse c omo una pos ibilidad r eal y desarrollarse e n l a década d e l os 70 . La m ilicia en E stados U nidos s e i nteresó p or desarrollar sistemas que ayudaran a sus pilotos a controlar los aviones de combate. En la actualidad su campo se ha ex tendido desde la exploración en interfaces neurales, hasta abarcar par te de l a t ecnología i nalámbrica, di seño d e ap aratos p ara at ención m édica, productos domésticos, sensores, electrodos y tecnología de rehabilitación. 20 2.2 La interfaz neural Una interface neural es un sistema de biocontrol que se refiere a la unión directa de datos entre una c omputadora y el sistema nervioso h umano por m edio de u n c anal de circulación de información. Una de las razones para desarrollarlas, son las enfermedades que dañan las rutas por las cuales el cerebro se comunica y controla el cuerpo como la esclerosis lateral amiotrófica o la parálisis cerebral. Hasta la fecha no hay tratamientos médicos efectivos para estas enfermedades, ya que en muchos casos significaría reparar de alguna forma el sistema nervioso. Las interfaces neurales son una alternativa posible gracias a la tecnología, cuyos efectos serían muy similares a los que lograría un tratamiento si éste existiera. De forma i deal e n una i nterface n eural, el us uario podría c ontrolar directamente l as actividades de una c omputadora empleando l as señales provenientes de sus nervios o músculos. El control directo implica la ausencia de una interface convencional como un teclado o un mouse. El desarrollo de sistemas con estas características requiere de la colaboración multidisciplinaria d e m uchas áreas, l as c uales s e exploran desde pl ataformas organizadas, como la de Biocontrol Systems fundada en 1987 con fines comerciales y la Brain-Computer I nterface 2 000 c on fines c ientíficos, además de pr oyectos independientes. C ada pr oyecto r eúne l os es fuerzos de ps icólogos, i ngenieros en computación, biomédicos, neurólogos, especialistas en rehabilitación, etc. En un proyecto de interface neural se puede seguir una línea de investigación muy particular, pero de m anera general, además de compartir objetivos, se comparten tres aspectos fundamentales que son: 21 • Adquisición de la señal bioeléctrica. • Procesamiento d e l a s eñal por patrones de r econocimiento o e xtracción de l os elementos deseados de la bioseñal. • Traducción del resultado del procesamiento de la señal en códigos de salida para controlar dispositivos electrónicos externos. 2.3 Señales bioeléctricas para interfaces neurales Las bi oseñales qu e s e c onsideran en es te p unto h an s ervido p ara el d esarrollo de interfaces neurales y contribuyen al entendimiento e historia de las interfaces cerebro- computadora. En la investigación de sistemas como la ICC, estas señales son importantes no por contribuir al sistema, sino como posibles fuentes de contaminación que aparecen como artefactos en el registro EEG. El objetivo de toda interface neural es hacer que un dispositivo externo acepte la actividad del sistema nervioso como señal de control. De esta manera, la voluntad o intención de una persona es transferida hacia una máquina. En el caso de una persona con un padecimiento m otriz muy severo, el a fectado puede perder t odas l as formas de control muscular voluntario, quedando completamente atrapado dentro de su cuerpo y sin posibilidades de comunicarse por cualquier otro medio. Una alternativa para contrarrestar esta i ncapacidad es em plear un a i nterface que aumente s us posibilidades de comunicación y c ontrol. Las i nterfaces n eurales em plean s eñales bioeléctricas p ara funcionar. Las principales a considerar son: • Electromiograma (EMG) • Electrooculograma (EOG) 22 Electromiograma El electromiograma (EMG) es el registro continuo de la actividad eléctrica intrínseca asociada conla contracción muscular obtenida a través de electrodos superficiales o d e aguja. El electromiograma se registra en la superficie de la piel y representa la actividad sumada de l as fibras m usculares, dado que cada fibra genera un potencial el éctrico cuando s e contrae y relaja. La información relevante que se obtiene de este tipo de registro, es el estado f isiológico del músculo es quelético y de su i nervación. En el caso de p arálisis muscular, ayuda a ubicar el lugar de la lesión (neurona motora superior, neurona motora inferior, médula espinal, placa motora o fibra muscular). La señal del EMG es aleatoria y su amplitud es proporcional al tipo de contracción: grande para contracciones fuertes y pequeña para contracciones débiles. Su representación se puede h acer m ediante una función d e di stribución G auseana donde el promedio d e energía del EMG varía de acuerdo a la fuerza de la contracción muscular. Esta información es m uy útil por que m uestra en t iempo r eal l a fuerza y l a v elocidad d e l a contracción y relajación del músculo. El EMG fue la primer bioseñal que se empleó para desarrollar sistemas de biocontrol, y es quizá la señal bioeléctrica más accesible ya que utiliza el control voluntario del músculo. Tanto el control muscular voluntario como la señal que se obtiene, son elementos clave para crear una tecnología de tipo interfaz neural. Para que la señal sea útil o aprovechada Amplitud Frecuencia Potencia 0 a 6 mV (pico a pico) 0 a 1.5 mV (rms) 2 – 10 000 Hz 50 – 150 Hz Tabla 2.1 Características electrofisiológicas del electromiograma 23 por el s istema d e biocontrol, t iene q ue s er procesada p or c omponentes y c ircuitos electrónicos, es decir, tiene que haber compatibilidad entre las señales provenientes del músculo y las que em plean las par tes el ectrónicas, que a s u vez se comunicarán con otros di spositivos q ue l as ejecutarán. P ara ello s e p ueden ex traer c aracterísticas específicas como reconocer sus patrones, determinar amplitud, frecuencia, etc. El objetivo es convertir la actividad del músculo en el lenguaje de las computadoras. Una de las aplicaciones de esta tecnología es dar acceso y control vía computadoras a personas con daño muscular, en las que se pueden restituir algunas funciones utilizando zonas cercanas a la ruta que controla los músculos y no es afectada por la lesión (Hoffer et al., 1996; Kilgore et al., 1997; Ferguson et al., 1999). Electrooculograma El el ectrooculograma ( EOG) s e o btiene d e u na t écnica n o i nvasiva que r egistra un potencial de d escanso, conocido como el potencial corneo-retinal, generado dentro de globo ocular por la actividad metabólica de la retina, la cual tiene un ligero voltaje negativo respecto de la córnea. C on un electrodo adecuadamente colocado, se puede registrar este dipolo que es indicativo del movimiento del ojo, dado que la amplitud de este potencial varía proporcionalmente a su movimiento. Los voltajes que se registran en el EOG varían de acuerdo a la rotación de los ojos en un rango de 30 grados desde el centro. Esta actividad se ha estudiado desde 1953, año en que Aserinsky y Kleitman lo emplearon para estudiar los patrones de movimiento ocular durante periodos de sueño, y más r ecientemente, para p osicionar u n c ursor en l a pantalla d e u na c omputadora (LaCourse y Hladik, 1990) En relación a su aplicación a s istemas de biocontrol, el EOG presenta i nterferencia del parpadeo, la señal del m úsculo ocular y contaminación de l a línea base por la migración espontánea de iones hacia el electrodo. El ruido es confundido con el movimiento verdadero del ojo, por lo que se han implementado arreglos 24 que aíslan la señal mediante diferentes niveles de rechazo y filtrado. Para registrar las señales de las posiciones vertical y horizontal se requieren al menos dos canales y las computadoras que procesan las señales deben estar equipadas con analizadores de tipo red neuronal artificial o de memoria asociativa. Las aplicaciones del EOG están orientadas a mejorar la comunicación de personas con severo daño muscular, incrementando las capacidades de las rutas remanentes. S i se tiene control voluntario sobre los músculos oculares, éstos podrían substituir a los músculos paralizados (Damper et al., 1987; LaCourse y Hludik, 1990; Chen et al., 1999; Kubota et al., 2000). 2.4 Comunicación y control basados en el EEG La comunicación tanto verbal como no verbal, así como el control voluntario de los movimientos del c uerpo, s on el r esultado de l a participación y buen f uncionamiento de neuronas motoras, nervios y músculos esqueléticos. Cuando por enfermedad o accidente existe un daño o alteración en la ruta de salida de la información de una vía motora, el movimiento disminuye, se pierde el control o de saparece totalmente. E l resultado es el menoscabo d e ha bilidades c omo el l enguaje o el c ontrol e i nteracción c on el m undo externo. L as habilidades motrices así como el lenguaje son dos aspectos en los que la tecnología de rehabilitación se ha enfocado por ser indispensables para la independencia funcional, s ocial y l a c omunicación c on o tras p ersonas. C omo s e m encionó c on anterioridad, las i nterfaces neurales y l os s istemas de biocontrol históricamente s e han desarrollado para substituir o aumentar las habilidades afectadas o perdidas, las cuales pueden dividirse en habilidades o funciones dirigidas para lograr el control muscular y en habilidades o funciones dirigidas para la comunicación. 25 En el caso del control muscular, se pueden emplear técnicas en las que se substituye un grupo muscular afectado por uno intacto o menos dañado. También se utilizan aparatos que aumentan l as funciones r emanentes c omo las pr ótesis o algún t ipo de s istema de biocontrol. En el caso de la comunicación, las opciones son rehabilitar a la persona para que pueda volver a hablar, utilizar técnicas alternativas como los gestos o el lenguaje signado. Aumentar la comunicación mediante técnicas de presentación como la escritura en papel o pizarrones, técnicas basadas en símbolos como los tableros pictográficos, alfabéticos o de íconos para c ompactación semántica, técnicas de transmisión electrónica como los sintetizadores de voz y t écnicas d e señalación di recta, de opción en pa nel o de codificación. En las t écnicas an teriores t anto p ara comunicación como p ara c ontrol, l os i ndividuos requieren forzosamente d e al gún t ipo d e c ontrol m uscular v oluntario para aumentar o cambiar las capacidades por formas alternativas o substitutivas. Sin embargo, hay casos en los que el control es insuficiente para aplicar estas técnicas y para ello, tanto el EMG como el EOG ofrecen una opción adicional con la cual se han desarrollado métodos que al i gual qu e l as anteriores, a umentan l as funciones perdidas o r emanentes, pero a diferencia de estas, utilizan sensores y dispositivos microelectrónicos que monitorean o transforman l a ac tividad el éctrica o m uscular e n s eñales para c ontrolar s eñaladores o neuroprótesis. Un tercer grupo de personas son quienes no poseen ningún control muscular voluntario o el que l es queda es impreciso y poco confiable o s e f atiga pronto y por lo t anto no es factible ut ilizar un a t écnica o a parato c onvencional par a r estaurar s us funciones. L a alternativa es c rear un canal de t ransmisión de información totalmente independiente al control de los músculos y a la ruta nerviosa de salida que normalmente emplea el cerebro. Este nuevo c anal de t ransferencia d e i nformación es diferente a l os q ue emplean l as 26 técnicas convencionales para s ubstituir o aumentar las habilidades afectadas. E n esta forma de transmisión, la información no provienede los impulsos nerviosos con los que se controlan los músculos incluyendo los del habla, sino que es el resultado de tareas cognitivas específicas y se observa únicamente como parte de la actividad fisiológica del cerebro. Sus características dependen de la forma con la que se registre la actividad. Por ejemplo, en técnicas no invasivas como el EEG, la actividad espontánea es muy diferente a la actividad evocada, lo mismo que los métodos con que se hacen evidentes las características d e c ada una. E n l a actividad es pontánea s on útiles s ólo algunas frecuencias en regiones específicas, mientras que en la actividad evocada además de la localización es necesario un marcador temporal asociado al estímulo. Por ejemplo, en el procesamiento de la información que se observa en la actividad espontánea, está contenida en la frecuencia y su aparición, aumento, disminución o desaparición puede ser traducida por procedimientos externos a las funciones del cerebro y representados en una pantalla como movimientos de un cursor hacia la derecha/izquierda o arriba/abajo. En la actividad evocada, la amplitud y latencia en los promedios significa presencia o ausencia de la intención de seleccionar una letra o una imagen en la pantalla que la contiene. A di ferencia de l as t écnicas al ternativas y a umentativas de c omunicación ( AAC), el movimiento del cursor y la selección de elementos en una pantalla, no son el resultado de la acción directa del individuo sobre el objeto que controla el dispositivo como puede ser el mouse o un teclado. E l movimiento del cursor es el resultado de la interpretación de una frecuencia producida en el cerebro y registrada en la superficie por electrodos y la intención no era mover el cursor sino por ejemplo, la imaginación de un movimiento. La selección de una letra en la pantalla es el resultado de la traducción de la amplitud de un potencial ev ocado o btenido c on una t area q ue i nvolucra l a atención y l a m emoria d e trabajo y n o el d eseo d e s eleccionarlo. E n a mbos c asos l a actividad d el c erebro e s extraída y transformada en productos intencionales sobre un objeto específico ya sea el 27 movimiento de un cursor o la selección de una letra. La manera en que la transmisión de la información es posible, es gracias a una serie de pasos que realiza la interface cerebro- computadora. En estos pasos el manejo de la información es crucial para que el producto final s ea ej ecutado, de ot ra f orma el us uario nunc a not aría s i ef ectivamente es tá controlando un aparato con productos de la actividad de su cerebro. En otras palabras, una I CC que utiliza al E EG c omo fuente d e bioseñal s e basa e n l a extracción de componentes propios del EEG c ontinuo, en l as c uales p or ej emplo, el us uario es entrenado para modificarlas con cierto grado de confiabilidad (ritmos beta y mu), no dependen de paradigmas específicos o de l a conservación de l a v ía, o bien, m ediante actividad relacionada di recta y específicamente a una tarea y t iempo (P300), con mejor relación señal-ruido obtenida por promediación de los dos tipos de estímulos. En ambas, es i mportante l a el iminación de artefactos que contaminen el r egistro c omo parpadeos, movimientos oculares, de cabeza, deglución, etc., Una desventaja respecto a los registros obtenidos c on electrodos y m icroelectrodos i mplantados, es que l a t écnica s e r eserva para situaciones y sujetos con demasiadas complicaciones. Como se ha descrito, el EEG es una de las opciones más viables para generar interfaces destinadas al control s imple de aparatos y especialmente para la comunicación, pu esto que A) se obtiene de forma no invasiva, B) corresponde a funciones normales del cerebro que pu eden detectarse y pr ocesarse e n t iempo r eal, C ) ex iste un a c orrelación en el tiempo ya sea en la realización de tareas mentales mediante estímulos estereotipados o con l a i maginación d e m ovimientos ( McFarland et al., 19 99; Pfurtscheller et al, 19 93; Wolpaw et al., 1991; Farwell y Donchin, 1988). 28 Comunicación basada en el EEG La actividad que s e observa mediante el ectrodos colocados en la superficie del cuero cabelludo h asta h ace unas d écadas s ólo había t enido s ignificancia c línica, o era monitoreada p ara ev idenciar t areas c ognitivas y per ceptuales e n l aboratorios de investigación. Esta actividad había despertado la sospecha de contener codificada dentro de l a actividad espontánea, c aracterísticas qu e un s istema ex terno p udiera r econocer para t ransformarlas en impulsos reconocibles por máquinas que a s u vez ejecutaran la intención del usuario ( Vaughan, Wolpaw & Donchin, 1996) La parte de interés dentro de la ac tividad d e fondo d el E EG s e de nomina bi oseñal o s eñal p ara el s istema, y generalmente es el reflejo del procesamiento de información en una tarea cognitiva o de la ac tividad espontánea d el c erebro r elacionada a un estímulo e xógeno o e ndógeno. Además, d ebe a parecer a un t iempo es pecífico d espués del es tímulo y t ener características particulares distinguibles de la actividad espontánea o de fondo, es decir, poseer ciertos patrones de forma constante para que puedan ser reconocidos, extraídos y clasificados. Estos patrones tienen la forma de frecuencias o de variaciones de voltaje en el EEG (Ritmos beta y mu, Potenciales evocados). Las señales reconocibles en el EEG son diferentes a cualquier otro tipo de actividad en el cerebro. Como se mencionó anteriormente, para que el resultado final sea el movimiento de un cursor en la pantalla, el individuo no se imagina moviendo el cursor, sino que realiza una tarea cognitiva como imaginarse mover una mano, esperar a que una luz cambie de color, hac er un c álculo m ental, r otar u n c ubo o poner atención s ostenida. C on entrenamiento, se ha descrito que personas pueden realizar estas tareas incluso pensando en otras cosas a la vez (Curran et al., 2003) Con potenciales visuales evocados, l a s elección d e u n e lemento de una m atriz en u na pantalla, el c ual s e intensifica a u na frecuencia di stinta de o tros el ementos, el i ndividuo s ólo d ebe p oner atención en él, mientras en su cerebro la corteza v isual r eacciona ante ese patrón de 29 intensificación d e l a i magen. C uando l a per sona des ea s eleccionar ot ro elemento, simplemente dirige su atención hacia él. Otra forma de seleccionar un elemento en una matriz por ej emplo una l etra, es r ealizar una t area m ental c ada vez que ese el emento cambia en sus propiedades f ísicas, como el c olor de gris a blanco. Al r ealizar l a t area mental (cuenta numérica de las veces que cambia de color), en el EEG aparece un patrón distinto a cuando no está contando. Las tareas cognitivas son una fuente de señales útiles para la comunicación basada en el EEG, y son el primer tipo de interacción que se da entre el usuario y la máquina, es decir, que l a i nteracción es facilitada por el paradigma c on el que se obtiene l a bioseñal. E l segundo tipo de interacción es el que se obtiene como retroalimentación y también lo provee el paradigma de estimulación, por ejemplo el movimiento del cursor o la selección de una l etra o u na i magen detectada p or el usuario q ue l a generó. A partir de l a retroalimentación un tercer participante que puede ser otra máquina o una persona puede proveer de i nformación al us uario, es to o curriría c uando u na persona c omprenda y reaccione ante el mensaje mostrado en la pantalla o bien, cuando se ejecute un comando de voz en un sintetizador o un movimiento en una ortrosis neuroprostética. EEG y la comunicación basada en texto Para comunicación con otras personas, las señales más útiles que se obtienen en el EEG son aquellas en las que el producto es la selección de letraso imágenes en la pantalla, lo cual da l ugar a un l enguaje basado en t exto el c ual puede t ransmitirse en t iempo r eal (para di ferenciarlo del t exto c onvencional i mpreso) o bi en, puede t ransmitirse de forma oral mediante un sintetizador de voz. El lenguaje basado en texto puede tener dos formas de comunicación 1) sincrónica: que ocurre en t iempo r eal, c uyo texto es i nteractivo o c onversacional y es c omúnmente empleado en ambientes en donde se tiene acceso a un equipo electrónico de mensajes 30 instantáneos tipo IRC o “chat” o cualquier método de mensajería de texto instantáneo y 2) la comunicación asincrónica: que puede ser de texto no conversacional o suplementario el cual n o oc urre e n t iempo r eal, y s e c aracteriza por el i ntercambio de m ensajes electrónicos como en el correo electrónico y en los teléfonos celulares (Gybels, 2008) En este tipo de interacción para las personas con discapacidades del lenguaje o motrices, el mensaje de texto o iconográfico es preferible o alternativo al oral, dadas las facilidades que éste proporciona c omo s on: dar respuestas cortas, añadir i conos que representen ideas o emociones en forma c ompactada y principalmente por s er un equivalente a la conversación or al, y a qu e es ta es u na c apacidad a l a qu e no t ienen ac ceso o es ta perdida. E n el c ampo de l a ICC, s e ha m anifestado que una primera apl icación s ería contestar preguntas con opciones simples como (Si/No), además de contar con matrices alfabéticas para deletrear palabras letra por letra (Sellers y Donchin; 2006. En el presente trabajo se explora la comunicación mediante imágenes tipo PCS (sistema de comunicación pictográfico) ya empleadas en r ehabilitación y en diversas técnicas como las de la comunicación alternativa y aumentativa (AAC) 2.5 Interfaz cerebro-computadora El término Interfaz Cerebro-Computadora ( ICC) fue descrito por Jaques Vidal en los 70 (Vidal, 1 973; 1977), p ara d esignar c ualquier s istema c omputarizado que i nvolucrara información obtenida a partir del funcionamiento del cerebro. Posteriormente en 2002, en la primer reunión internacional sobre Interfaces cerebro- computadora, se definió a la ICC como ... “un sistema de comunicación y/o control, que emplea la actividad eléctrica del cerebro como una bioseñal que representa mensajes u órdenes que un individuo envía al mundo externo, los cuales no utilizan las rutas normales de salida del cerebro como son los nervios periféricos y los músculos, sino que lo hace a través de un sistema artificial que las extrae, codifica y aplica” (Wolpaw 2002). 31 El sistema de una ICC, cambia la señal electrofisiológica de ser un reflejo de la actividad del Sistema Nervioso Central, por productos intencionales de dicha actividad, los cuales pueden ser respuestas simples que sirven para enviar mensajes u órdenes que controlen aparatos, procesar p alabras y expresar frases c on l o c ual s e puede aum entar la interacción con el entorno. 2.6 Clases de ICC Las ICCs pueden ser de dos clases: dependiente e independiente. Una ICC dependiente no emplea las rutas de salida normales del cerebro para transmitir el mensaje, sólo utiliza su actividad. Las monitorea registrando la actividad cerebral ante un estímulo dado. Por ejemplo, se puede monitorear la posición de la mirada mediante el EEG colocando electrodos en el cuero cabelludo sobre la corteza visual. Un ejemplo de interface que monitorea la posición de la vista mediante el EEG, emplea una matriz de letras q ue s e i luminan u na a u na e n u n t iempo d ado y que el us uario s elecciona observándolas, generando así un potencial visual evocado (PVE), de manera que cuando la letra de interés se ilumina, el PVE es más grande que cuando la letra permanece sin iluminar (Sutter, 1992). En este caso el canal de salida es el EEG, pero la señal depende de l a di rección d e l a m irada, l o c ual i mplica l os m úsculos ex traoculares y l os ner vios craneales que los controlan. Una I CC i ndependiente no d epende de l as r utas n ormales de s alida del c erebro. El mensaje no es registrado por la actividad de los nervios periféricos o músculos, es decir, su actividad no es necesaria para obtener la actividad cerebral que lleva el mensaje. En cambio, provee al cerebro de totalmente nuevos canales de salida. Por ejemplo (Farwell y Donchin, 1988; Donchin et al., 2000) desarrollaron una ICC que utilizaba como canal de salida al EEG. En l a I CC s e pr esentada u na m atriz d e l etras que s e iluminaba 32 aleatoriamente p or r englones y c olumnas produciendo el c omponente P 300. L a generación de la bioseñal en el EEG fue el resultado de la intención del individuo y no de la orientación de los ojos. Esto es particularmente importante para alteraciones motoras severas en las que se pierde incluso el movimiento ocular. 2.7 Modelo general de una ICC Un modelo general de una ICC implica un sistema en el cual una persona puede operar dispositivos externos mediante componentes funcionales. El s istema pa rte de l a ac tividad electrofisiológica d el us uario, l a c ual es am plificada y convertida a un formato que puede ser interpretado por una computadora. El siguiente módulo o c omponente es el q ue pr ocesa l a s eñal e n t res p asos. E l pr imero extrae o reconoce la señal, el segundo la traduce y el tercero las convierte en señales operativas que r econoce el ap arato ej ecutor. E l di spositivo o c omponente ej ecutor c onsta d el aparato y su propio controlador. La figura 2.1 representa de forma esquemática el modelo general de una ICC Figura. 2.1 Modelo general de una ICC en el que se explican las etapas de funcionamiento y de procesamiento de la señal, desde su adquisición, hasta su aplicación. 33 2.7.1 Componentes Las par tes de un a Interface Cerebro-computadora s e pueden definir e n t érminos operacionales (Wolpow et al., 2002) o por sus componentes funcionales (Mason y Birch, 2003). En la actualidad los sistemas que se ha desarrollado están en fase experimental, por l o q ue m uchas d e l as c onsideraciones aún s on t eóricas o s e es tán i nvestigando (Moore, 2003). Componentes operacionales: • Adquisición de la señal: Inicia con el registro de las señales, mediante electrodos. El método p uede ser no invasivo, colocando electrodos superficiales sobre el cuero c abelludo ( Electroencefalograma), i nvasivo en el q ue l os electrodos s e insertan en la corteza cerebral (Electrocorticograma) o ambos. La s eñal p uede s er ev ocada ( PRE) o es pontánea ( ritmos en el E EG s obre l a corteza sensoriomotora). Los primeros dependen de un estímulo como flashes de luz y no requieren entrenamiento; los segundos no dependen de la estimulación, sino del esfuerzo del sujeto y se obtienen luego de un periodo de entrenamiento. Finalmente la señal es amplificada y digitalizada. • Procesamiento d e l a s eñal: l a s eñal digitalizada es s ometida a uno o v arios procesos de extracción t ales c omo filtros es paciales, m ediciones de am plitud y latencia, análisis espectral, e tc. Los PRE por ejemplo, se caracterizan por ser funciones que dependen de l a amplitud y el t iempo, en cambio l os r itmos m u o beta son funciones de la frecuencia. Las señales además deben estar libres de interferencias como la actividad muscular o la ocular. La señal extraída es traducida por algoritmos, cuya función es convertir la señal a un l enguaje que s ea c ompatible c on el di spositivo a c ontrolar. Los al goritmos funcionan e n t res ni veles adaptativos. El pr imero ajusta el s istema al t ipo y características de la s eñal q ue proporcione el us uario ( amplitud, l atencia, 34 frecuencia) y a la velocidad con que se genera las respuestas. El segundo realiza ajustesperiódicos en línea, dado que el usuario puede variar en su ejecución por factores como el ambiente, fatiga, enfermedad, etc. E l tercero adapta el nivel de ejecución o capacidades del usuario para controlar el desempeño del dispositivo externo. • Dispositivo / aparato ejecutor: una vez que la señal se ha procesado, pasa a un controlador o di rectamente al c anal d e salida para que la intención final sea ejecutada. E l dispositivo más común es la pantalla de una computadora, aunque puede ser cualquier otro equipo compatible. El resultado final de una operación es variable, desde la selección de objetivos, letras, iconos hasta m over un cursor. Este producto final retroalimenta nuevamente al usuario para mantener, aumentar la velocidad o la exactitud de acuerdo al protocolo de operación. • Protocolo de operación: es un formato que guía la operación de la ICC, en el cual se definen las op eraciones o ac tividades, su e stado, gr ado de des arrollo y d e ejecución, las intervenciones del usuario y el sistema, el tiempo en que se realizan, su secuencia, velocidad, especificidad, etc. Componentes funcionales: Los pr incipales componentes f uncionales de un a ICC son los siguientes: us uario; amplificador; convertidor analógico-digital; extractor, traductor y controlador de la señal; el dispositivo y su controlador y el ambiente de interacción. • Usuario: es el controlador del sistema; provee las bioseñales mediante dispositivos de toma como los electrodos. - Electrodos: convierten las bioseñales en señales eléctricas analógicas. - Aislamiento óptico: en el s istema i nterviene l a corriente el éctrica y por l o tanto existe el riesgo de choque eléctrico. El aislamiento es la interrupción 35 de la corriente por una señal óptica que se transmite a corta distancia, de manera qu e l a s eñal p asa l ibremente p ero s e r educe l a pos ibilidad d e recibir un daño. • Amplificador: amplifica la señal analógica multiplicándola por un factor adecuado (Ej. 20 000 veces) de manera que el voltaje original, que es del orden de -100 a +100 microvoltios, esté disponible en el canal de salida en el orden de milivoltios, el cual ya es compatible con el convertidor analógico-digital. • Convertidor analógico-digital (A-a-D o A/D): esencialmente convierte la señal continua o analógica a funciones de series discretas de puntos que se aproximan a l a f unción original. C ada punto es ex presado en par es or denados de puntos (x,y) en donde “x” es el voltaje y “y” el tiempo. • Procesamiento de la señal: el procesador de la señal es un circuito integrado que funciona a manera de u nidad de procesamiento c entral ( CPU), cuya función es realizar cálculos numéricos con diversos objetivos: - Extracción: t ransforma l a s eñal amplificada y di gitalizada e n v alores que correspondan al mecanismo neurológico implicado (Ej. P300, ritmos mu o beta en el E EG), es to es , r econoce patrones c onocidos c omo el v ector característica que son secuencias numéricas específicas provenientes del convertidor analógico-digital. - Traducción: t raduce m ediante al goritmos l as s eñales del v ector característica en s eñales l ógicas d e c ontrol i ndependientes al a parato o dispositivo ejecutor. - Controlador: c onvierte l a s eñal l ógica e n un l enguaje c ompatible con el dispositivo externo. 36 • Dispositivo ex terno: el di spositivo o aparato ex terno es el ej ecutor de l as tareas que le asigna el usuario a través del sistema, es decir, transforma las señales procesadas en señales físicas que interactúan tanto con el ambiente como con el usuario. Las señales pueden ser acumuladas hasta completar una secuencia a la que el aparato responda o funcionar automáticamente (silla de ruedas, sintetizador de voz, pantalla). • Ambiente de interacción: es el mundo físico al cual el usuario tiene acceso. Puede ser desde l a c omunicación c on otras personas o l a m anipulación de objetos, el control de prótesis o computadoras. 2.8 Bioseñales para ICC El gr upo de bi oseñales ex ploradas h asta l a f echa c aen de ntro de c inco grupos: Potenciales v isuales evocados, potenciales corticales lentos, actividad neuronal cortical, ritmos beta y mu y potenciales P300 (Ver figura 2.2) Potenciales visuales evocados El tipo de sistema que emplea los potenciales visuales evocados (PVE), los registra sobre la c orteza v isual y c on el lo s e det ermina l a posición de l a m irada. S on s istemas dependientes cuya base para comunicar es la determinación de los PVE y el movimiento ocular determinado por alguna técnica de seguimiento de la mirada. En la primer interface de este tipo se intentaba dirigir un cursor hacia la dirección en que el usuario lo deseaba mover (Vidal, 1973, 1977). Otro sistema parecido, la “Brain Response I nterface ( BRI)”, em plea u na gradilla c on s ímbolos c olocados e n di ferentes subgrupos los cuales cambiaban de color en la pantalla de video; el sujeto los seleccionaba produciendo alrededor de 10 -12 p alabras p or m inuto ( Sutter, 1992) P or último, Middendorf et al., (2000), determinaban la posición de la mirada midiendo la 37 frecuencia de l a r espuesta a l a l uz en l a c orteza v isual y c on el lo po der s eleccionar botones virtuales que destellaban en una pantalla. Potenciales corticales lentos Los potenciales corticales lentos (PCLs) son variaciones de voltaje que se generan en la corteza cerebral y cambian cada 0.5 - 10.0 segundos. Con un entrenamiento que puede durar semanas o m eses una persona puede aprender a c ontrolar este t ipo de actividad. La i nterface que em plea esta c lase d e s eñales t iene u n ar reglo e n el c ual s e puede controlar el m ovimiento de u n c ursor e n un a p antalla c omo e n el “ Tought T ranslation Device ( TTD) o D ispositivo t raductor de p ensamientos” ( Birbaumer et al ., 20 00), q ue selecciona objetivos en promedio cada 6 segundos. Si el usuario logra una exactitud igual o superior al 75 %, pasa a la segunda fase donde puede seleccionar letras para formar POTENCIALES CORTICALES LENTOS RITMOS BETA Y MU ACTIVIDAD NEURONAL CORTICAL POTENCIALES P300 Figura 2.2 Ejemplos de bioseñales utilizadas para desarrollar ICCs. Adaptada de Wolpaw et al., (2002) 38 palabras en un programa especial de soporte (LSP) con un rendimiento de 0.15-3.0 letras/min. Ritmos beta y mu La actividad mu es producida en áreas sensoriales o motoras de la corteza en personas en estado de vigilia. Si no se está procesando un estímulo sensorial o generando actividad motora aparecen con una frecuencia de 8 a 1 2 Hz. El ritmo mu se genera en una minoría de adultos (Chatrian, 1976; Pfurtscheller, 1989) Los ritmos beta t ienen una frecuencia de 18 a 26 Hz. Ambas se registran en el EEG y están asociadas a la preparación de m ovimientos, en c uyo caso disminuyen. E sta d esincronización relacionada al evento (ERD) es op uesta a la s incronización que oc urre des pués del movimiento (ERS) Las personas pueden ser entrenadas imaginando movimientos para generar y controlar estos ritmos que acoplados a una ICC pueden dirigir un cursor en una pantalla (Wolpow et al., 1991; McFarland et al., 1999; Pfurtscheller et al., 1993). Actividad neuronal cortical Se emplea una t écnica invasiva en la que se implantan electrodos neurotróficos en la corteza motora para detectar potenciales de acción neuronales. Después de un periodo de e ntrenamiento, l as s eñales s on c onvertidas a pul sos el éctricos para c ontrolar u n cursor, seleccionar letras para formar palabras y expresarlas en un procesador de textos o mediante un sintetizador de voz (Kennedy y Bakay, 1998; Kennedy et al., 2000). Componente P300 Las características relevantes del componente P300 para interfaces cerebro-computadora
Compartir