Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
INSTITUTO TECNOLOGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY UNIVERSIDAD VIRTUAL CAMPUS MONTERREY SOBRE LA ELABORACION DE ESQUEMAS CONCEPTI1ALES RELACIONADA CON EL CONTENIDO TEMATICO DE ADMINISTRACION DEL CONOCIMIENTO: UNA APROXIMACION CONEXIONISTA. TESIS PRESENTADA COMO REQUISITO PARCIAL PARA OPTAR POR EL TITULO DE MAESTRIA EN EDUCACION ESPECIALIDAD EN DESARROLLO COGNITIVO ALEJANDRA CAROLINA MORALES NASSER ASESOR: DR. ERNESTO OCTAVIO LOPEZ RAMIREZ MONTERREY, N. L. MAYO 2000 INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY UNIVERSIDAD VIRTUAL CAMPUS MONTERREY SOBRE LA ELABORACIÓN DE ESQUEMAS CONCEPTUALES RELACIONADA CON EL CONTENIDO TEMÁTICO DE ADMINISTRACIÓN DEL CONOCIMIENTO: UNA APROXIMACIÓN CONEXIONISTA. Tesis presentada como requisito parcial para optar por el título de MAESTRIA EN EDUCACIÓN ESPECIALIDAD EN DESARROLLO COGNITIVO ALEJANDRA CAROLINA MORALES NASSER Asesor: Dr. Ernesto Octavio López Ramírez Monterrey, N.L. Mayo 2000 INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY UNIVERSIDAD VIRTUAL CAMPUS MONTERREY SOBRE LA ELABORACIÓN DE ESQUEMAS CONCEPTUALES RELACIONADA CON EL CONTENIDO TEMÁTICO DE ADMINISTRACIÓN DEL CONOCIMIENTO: UNA APROXIMACIÓN CONEXIONISTA. Tesis presentada como requisito parcial para optar por el título de MAESTRIA EN EDUCACIÓN ESPECIALIDAD EN DESARROLLO COGNITIVO ALEJANDRA CAROLINA MORALES NASSER Asesor: Dr. Ernesto Octavio López Ramírez Monterrey, N.L. Mayo 2000 INSTITUfO TECNOLOGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY UNIVERSIDAD VIRTUAL CAMPUS MONTERREY ACTA DE EXAMEN Y AUTORIZACION DE LA EXPEDICION DE GRADO ACADEMICO 032 Los suscritos, miembros del jurado calificador del examen de grado sustentado hoy por ALEJANDRA CAROLINA MORALES NASSER en opción al grado académico de MAESTRA EN EDUCACION, ESPECIALIDAD EN DESARROLLO COGNITIVO hacemos constar que el sustent Hago constar que el sustentante, de acuer expediente, ha cumplido con los requisitos de graduación, establecidos en el Reglamento Académico de los pro as de graduados de la Universidad Virtual. Expídase el grado académico mencionado, con fecha ING. CARLOS ENRIQUE CRUZ LIMON Rector de la Universidad Virtual 1 de junio de 2000 KMjJ~~ /IN~ RAMON DE LA PEÑA MANRIQUE Rector del Campus Monterrey, N. L., a 29 de mayo del 2000 11¿Quién soy yo, Señor, y qué es mi casa, para que me hayas favorecido tanto hasta el presente? Y no contento con esto, extiendes ahora tus promesas también a mis descendientes. Ciertamente, Señor, no es así como proceden los hombres." Segundo libro de Samuel 7, 18-19. "Señor, tu lo sabes todo, tu sabes que te amo." Pedro (33) y yo (2000). A Alejandra Carolina Orañegui Oliveros, importante pilar de mi existencia, como una constancia de su vida. A mis tan amados padres, Zoila y Jesús Angel, ejemplo invaluable de amor a Dios, amor a la vida, honestidad, bondad, paciencia, trabajo, inteligencia, en fin, lo más cercano a la impecabilidad que he tenido en esta vida. También a mis otros tan amados padres, Josefina y Agustín, a quienes les debo gran parte de la felicidad de la segunda etapa de mi vida y para quienes solo tengo palabras de amor y agradecimiento. A mis hermanos, Zoila Angélica, Jesús Angel, Eduardo y Angel, tan parecidos a mi y tan amados. Con quienes tuve una infancia realmente envidiable. También a mis otros hermanos, Maru, Luis, Lauris, Guada, Amparín y David, personas realmente valiosas y amorosas, de quienes sólo he recibido siempre muestras de amor. A mi esposo, Agustín, quien dio un giro total a mi vida y de quien he aprendido tanto acerca de mí misma. Por ser el hombre más digno de admiración y de amor que existe en el planeta, razones por las que lo elegí como compañero de mi "viaje astral". A mis hijos, Alejandra Carolina, Angel Alberto y Gracia Cristina, fuente inagotable de amor, alegría y sorpresa y cuya vida es cada día un milagro constante. AGRADECIMIENTOS Al Dr. Miechislaw Choynowski, ejemplo profesional impecable, por haberme enseñado el gran valor de ser un "hombre irracional". Con profundo respeto y cariño. Aún extraño sus consejos y sus asesorías. A Hanna Choynowska, pintora, excelente persona y gran amiga, por su confianza y afecto. Al Dr. Ernesto Octavio López Ramírez, por saber ser muy buen maestro, muy buen asesor y especialmente muy buena persona y muy buen amigo. Agradezco mucho tu apoyo y tus consejos. Al Dr. Ricardo Flores, por su amistad y su atinada sinodalía. Al Dr. Javier Carrillo, Director el ese, por haberme apoyado en la realización de esta maestría. Finalmente agradezco mucho al cocodrilo que mordió la trompa del elefante (es un cuento hindú). Para todos los cocodrilos que existen en el mundo no puede haber más que amor, considerando además que todos jugamos, alguna vez el papel de cocodrilo y que ojalá y todos pudiéramos hacer como aquel elefante. "There are two ways to live your lite. One is though nothing is a miracle. The other is though everything is a miracle." Albert Einstein (1879-1955) RESUMEN La investigación realizada constituye un estudio descriptivo de campo que pretendió observar la forma en cómo elaboran sus esquemas de conocimiento los estudiantes del curso Administración del Conocimiento de la Maestría en Administración de la Tecnología de la Información, del Instituto Tecnológico y de Estudios Superiores de Monterrey, Campus Monterrey. Para este propósito se utilizó una técnica de análisis de redes semánticas como medio para observar la forma en cómo los estudiantes integran la información del curso en sus memorias. Como resultado se obtuvieron valores de organización semántica de las redes de información antes y después del curso. La densidad semántica se mantiene proporcional, G1=3.06 y G2= 3.07. El valor promedio de riqueza conceptual fue J1= 48.95 y J2= 36.75. El número de conexiones entre conceptos fue de 121 para la primera aplicación y de 145 para la segunda. Los definidores comunes más importantes fueron "Aprendizaje" y "Valor" para la primera aplicación y "Valor y "Conocimiento" para la segunda aplicación, lo cual resulta congruente con la ejecución del experto, cuyos resultados muestran a los mismos conceptos "Valor" y "Conocimiento" como los definidores comunes más importantes. Esto es un indicador de que la adquisición del esquema de Administración del Conocimiento se realizó de manera adecuada. Los objetivos de la investigación fueron cumplidos. Finalmente se ofrecen perspectivas de posibles investigaciones relacionadas con el modelo teórico y la técnica utilizados en este trabajo. CAPfTULO 1. INTRODUCCIÓN 1.1. Problema de Investigación. 1.2. Objetivos 1.3. Hipótesis CAPITULO 2. MARCO TEÓRICO INDICE 2.1. El surgimiento de la ciencia cognitiva. 2.2. Aspectos filosóficos. 2.3. Sobre el concepto de esquema. La representación del conocimiento 1 9 9 10 12 15 19 a través de redes semánticas y esquemas de conocimiento. 24 2.4. Antecedentes del Modelo de Procesamiento Distribuido en Paralelo (POP). - 2.4.1. La Teoría del Procesamiento Humano de la Información (PHI). 29 - 2.4.2. Los Sistemas de Memoria Humana. 37 - 2.4.3. La representación del conocimiento. 40 - 2.4.4. Análisis de Redes Semánticas para la organización del conocimiento en la memoria humana. 44 - 2.4.5. La aproximación conexionista al estudio de la memoria humana. 49 - 2.4.6. Los modelos conexionistas de esquemas de conocimiento. 56 CAPÍTULO 3. METODO 3.1. Tipo de estudio. 3.2. Participantes. 3.3. Materiales e instrumentos. 3.4. Procedimiento. CAPÍTULO 4. RESULTADOS CAPÍTULO 5. DISCUSIÓN Y CONCLUSIONES ANEXOS Anexo A: Instrumento. Anexo B: índices de densidad semántica. Primera aplicación. Segunda Aplicación. REFERENCIAS BIBLIOGRÁFICAS 68 68 68 71 74 80 85 89 94 101 CAPÍTULO 1. INTRODUCCIÓNEl concepto de esquema está en el centro teórico de la psicología cognitiva moderna. Aunque no se cuenta con una definición única del concepto de esquema, éste frecuentemente se refiere a una forma de representar, en las memorias de los individuos, estructuras de datos que contienen grupos de conceptos los cuales constituyen el conocimiento genérico sobre eventos, escenarios y acciones, que han sido adquiridas por experiencias pasadas. La mayoría de la investigación científica sobre la forma de integrar información en un esquema de conocimiento se han caracterizado por tratar de entender aspectos globales de un texto, secuencias de eventos, o narrativas de historias. Sin embargo, de acuerdo con Rumelhart y Norman (1985), aún en el nivel de análisis de redes semánticas (definiciones específicas y locales de un evento), las propiedades de un esquema pueden ser analizadas e investigadas. Una contribución teórica en esta dirección fue realizada por Rumelhart, Smolensky, McClelland y Hinton en 1986. Estos autores presentaron una red neural de satisfacción de hipótesis limitada que simula el esquema para "CUARTO". Ellos propusieron un modelo de Procesamiento Distribuido en Paralelo (PDP; el cual se explicará a detalle en páginas posteriores), en el que los conceptos fueron unidades locales (como una red semántica) y su relación esquemática fue distribuida entre las unidades. Los pesos de conexión entre conceptos tuvieron implícitamente la habilidad de generar estados de conceptos activados que correspondían con un esquema. Para instrumentar su modelo, ellos le pidieron a participantes de un estudio seleccionar palabras descriptoras de cuartos (por ejemplo: techo, ventana, chimenea) que mejor describieran ejemplos relacionados con el esquema a definir (el cual constituía el concepto objetivo o concepto meta), esto es, CUARTO. Otros conceptos objetivo fueron OFICINA, COCINA, etc. Aquí, la ca-ocurrencia o no ca- ocurrencia de dos conceptos dados como descriptores para los esquemas relacionados, reflejó la probabilidad bayesiana de que un descriptor (Xj) llegue a ser activado por otro descriptor (X¡) (vease también Hinton y Sejnowsky, 1983). Este valor de probabilidad refleja su peso de asociación en la red semántica. La idea central de este tipo de simulaciones computacionales era que al activar (grapar) un(os) concepto(s) en la red, otros conceptos relacionados con los conceptos activados se activaban también en diferentes grados de intensidad dependiendo del grado de relación de esquema que existe entre ellos. Esta red neural mostró que el activar un concepto en la red ocasionaba que otros conceptos se activaran, siempre y cuando estos últimos tuvieran una relación de esquema con el primero, lo cual sugirió que estas simulaciones pueden tener una validez psicológica. Por ejemplo, al activar el concepto HORNO se activaban conceptos tales como cafetera, tostador, refrigerador, taza, etc., y no se activaban conceptos como alfombra, máquina de escribir, televisión, etc. Schvanelveldt (1990) propuso una mejora al modelo de Rumelhart et al., la cual consistía en preguntar, él directamente a los individuos, la probabilidad de ca- ocurrencia de duplas de definidores del concepto de CUARTO. La idea era evitar que se presupusiera algún tipo de esquema en particular. Los resultados de Schvanelveldt no replicaron los de Rumelhart et al. De acuerdo con Schvanelveldt 2 esto se debió a que la red no poseía un balance de conectividad positiva y negativa. López y Theios (1992) por su parte sugieren que es el tipo de tarea de definición conceptual de una red semántica el factor relevante para dar validez psicológica a los resultados de las simulaciones. Lo interesante de este debate, acerca de encontrar evidencia para poder discriminar entre cuál es la mejor opción teórica para explicar integración de información esquemática, es el hecho de que se generó la posibilidad de usar una herramienta que permite construir y analizar, a través de índices de organización semántica, la forma en cómo los individuos organizan la información en sus memorias. Como veremos posteriormente, es posible usar dichas herramientas en el análisis de la información adquirida en un curso de Administración del Conocimiento (AC) de la Maestría en Tecnología e Informática del ITESM. Una discusión central dentro del tópico de las redes neurales que producen comportamiento de esquema es el desbalance existente en la positividad/negatividad de los valores de asociación de los nodos de información de una red semántica, ya que, como asegura Schvaneveldt (1990), solo un balance apropiado entre positividad y negatividad de los pesos de asociación garantiza el funcionamiento correcto de la red neural. Por ejemplo, obsérvese la Figura 1.1 en la que se presentan dos gráficas de superficie de matrices de conectividad. Aquí se supone una matriz en donde cada columna representa un concepto. Cada renglón representa otro concepto. Dado que es una matriz simétrica los mismos conceptos que aparecen en las columnas son los que aparecen en los renglones, en el mismo orden. Las celdas de la matriz contienen un valor de asociación entre conceptos. En el caso de la figura, los picos 3 corresponden con valores positivos. Nótese que también existen valores negativos indicando que hay conceptos que no solo no se asocian el una con el otro, sino que al activarse uno de ellos tiende a inhibir al otro. La Figura 1.1 a muestra valores de una matriz de 40 x 40 conceptos según el modelo de Rumelhart et al. (obtenida de McClelland y Rumelhart, 1988) y la Figura 1.1 b muestra valores de una matriz de 70 x 70 según el modelo SASO de López y Theios (1992). La matriz de Rumelhart et al. muestra una superficie con valores cercanos a cero (O), esto indica que los descriptores tienden a aparecer de una forma independiente a través de varios conceptos a definir. Por otra parte, la matriz SASO muestra valores altamente positivos y negativos rodeados por muchos valores cercanos a cero (O). b Figura 1.1 Diferencia de valores negativos y positivos entre el modelo (a) de Rumelhart et al. ( 1986) y el de SASO (b) de López y Theios ( 1992). 4 Esto es en general un indicador de que los definidores conceptuales de los participantes tienden a aparecer y desaparecer conjuntamente en agrupaciones conceptuales. En otras palabras, la mayoría de los términos definidores de un concepto no aparecen en las otras definiciones de grupos de otros conceptos. Aquí, un índice que describe qué tan bien están interconectadas las definiciones conceptuales en un campo de conocimiento son los definidores comunes, esto es, conceptos que no solamente definen a un solo concepto sino a varios. Por lo tanto, una diferencia mayor entre el modelo SASO y el de Rumelhart et al. consiste en que, en el caso de SASO, los participantes agruparon los conceptos definidores con baja interconexión a través de los grupos conceptuales. López (1996) asegura que dicha falta de interconectividad representa una realidad psicológica necesaria para la propia discriminación de un estímulo entrante a la red neural. Para ilustrar esto, López presenta una matriz de conectividad de un campo de conocimiento altamente estructurado como es el caso de las matemáticas, la cual se muestra en la Figura 1.2. La matriz fue obtenida de definiciones conceptuales a 20 conceptos de geometría, los cuales fueron escogidos por tres maestros de una preparatoria. A criterio de estos maestros los conceptos a definir están esquemáticamente interrelacionados y son necesarios para poder pasar el curso. Después, 64 estudiantes de una escuela proveyeron los términos definidores para la construcción de una matriz de valores de asociación entre conceptos definidores que forman la base de simulaciones de esquemas de conocimiento. Lo que es más representativode la figura de esta 5 matriz es que aún en campos de dominio bien estructurados como es el caso de la geometría no existe alta interconectividad entre definiciones conceptuales. 11 I -9.19 Figura 1.2 Aún en áreas de conocimiento altamente interconectado como la Geometría, existe una gran conectividad negativa Por otra parte, López forzó la interconectividad entre conceptos de una forma artificial. Por ejemplo, definidores de un grupo conceptual específico estaban conectados con otro grupo conceptual a través de un o unos definidores comunes. 6 De esta forma la distancia de un definidor de un grupo conceptual a otro se componía de la distancia del mismo al definidor común, más la distancia del definidor común al definidor del otro grupo conceptual. Al elevar la interconectividad por sólo un concepto con respecto los demás, la red empieza a perder capacidad de discriminación en la generación de un esquema. De esta forma (como se indicará con más precisión posteriormente) la herramienta propuesta por López y Theios permite el análisis de interconectivida y densidad semántica de la información adquirida por un grupo de individuos. En el caso de este trabajo, se pretende investigar cómo se integra el conocimiento en la memoria de los estudiantes participantes del Curso de Administración del Conocimiento en la Maestría en Administración de Tecnología en Informática. De acuerdo con lo hasta aquí expuesto, se espera que el esquema de conocimiento del contenido temático de Administración del Conocimiento, se adquiera de la forma propuesta por el modelo SASO de López y Theios; para, de esta manera, poder observar índices de organización semántica en esta área de conocimiento. La materia en cuestión es ofrecida por el Centro de Sistemas del Conocimiento CSC, éste es un centro de investigación y desarrollo cuya misión consiste en " ... estudiar la Economía del Conocimiento y desarrollar sistemas que permitan a los individuos desarrollar estrategias sustentables dentro de esa economía" (Carrillo, 1998). El trabajo del CSC se ubica, de manera general, en dos niveles de acción, a saber: Uno sería el nivel de los proyectos contractados en diversas industrias cuya principal característica es que se realizan en una modalidad "a la medida" de los requerimientos muy específicos de cada industria; el otro sería en 7 el nivel de la oferta educativa empaquetada, significando esto el trabajo que se realiza dentro de la modalidad de educación formal escolarizada. En este CSC se llevan a cabo varias líneas de investigación, una de ellas es la línea de Administración y Aprendizaje dentro de la que se ubica el interés por la investigación en procesos de aprendizaje. Se observa entonces, que el presente trabajo muestra dos vertientes de conveniencia para su realización, es decir, su importancia específica se encuentra, por un lado, en el hecho de que arrojará luz acerca de la comprensión de cómo integran los estudiantes la información de los contenidos de una materia específica. Estos resultados, que serán provenientes de la comprensión de un contenido teórico (se le llama de esta manera para diferenciarlo de un contenido que requiere específicamente habilidad numérica para su comprensión y representación), proporcionarían al profesor una herramienta más para la, cada vez más adecuada, conducción de su materia. Por otro lado, esta materia específica con la que se trabajó (Administración del Conocimiento) constituye la materia introductoria de la especialidad del mismo nombre, por lo que, una adecuada integración conceptual de sus contenidos proporcionará a los estudiantes varias y sustantivas ventajas, tales como las siguientes: Contarán con un esquema antecedente bien integrado y fundamentado que les permitirá integrar la información posterior de otras materias, de una manera más significativa. Ello constituye un aspecto importante para poder realizar actividades cognitivas de relevancia como lo es la transferencia de conocimiento, la realización de inferencias y la elaboración conceptual que pueda en algún momento proporcionar aportación nueva e incluso innovadora dentro del campo, ya que la AC es una 8 disciplina relativamente nueva, por cuyas características sui generis está siempre en constante desarrollo y evolución, a la par del desarrollo y evolución social y económica. PROBLEMA DE INVESTIGACIÓN: En vista de tales condiciones y características, se consideró adecuado plantearse las siguientes preguntas de investigación: ¿Cómo integran los estudiantes la información del curso en sus memorias? ¿Qué efecto tendrá el manipular conceptos centrales, sobre la organización de la red de conocimiento de los estudiantes? ¿Cuáles serán los conceptos que tendrán mayor impacto al ser manipulados? Las anteriores preguntas se pueden traducir en el siguiente problema a investigar en esta tesis: ¿Cómo organizan la información de Administración del Conocimiento en su memoria los estudiantes de la Maestría en Administración de Tecnología en Informática, en términos de densidad semántica, conectividad y riqueza de definiciones conceptuales? Los objetivos de la investigación realizada fueron los siguientes: Objetivo General: Describir cómo elaboran sus esquemas de conocimiento los estudiantes del curso de Administración del Conocimiento. 9 Objetivos Específicos: 1. Describir la forma en cómo los estudiantes integran la información en sus memorias. En particular, observar índices de densidad semántica, interconectividad, riqueza de red conceptual, etc. 2. Identificar los conceptos de mayor impacto dentro de la red de conocimiento de los estudiantes. 3. Determinar si existen mecanismos inhibitorios de organización semántica en los esquemas de los estudiantes en el área de AC y así contribuir a proveer evidencia que permita seleccionar modelos de organización esquemática en la memoria de los individuos. Así mismo, aunque se trata de un estudio descriptivo de campo, como ya se ha mencionado anteriormente, se consideró conveniente plantear las siguientes hipótesis: 1. Si la integración de información se realiza adecuadamente, entonces, los conceptos clave de mayor impacto reportados por el estudiante tenderán a semejarse a los del profesor. 2. Si la integración de información se realiza adecuadamente, entonces, los índices de densidad semántica (valor G), la interconectividad y la riqueza de red (valor J), deberán aumentar. 3. Si la información se integra adecuadamente, entonces, el número de palabras definidoras comunes de los conceptos clave del curso, tenderá a JO aumentar al finalizar éste, comparado con las palabras definidoras comunes que se obtengan antes del inicio del curso. Tales hipótesis no fueron planteadas con el propósito de llevar a cabo una metodología estadística de prueba de hipótesis, simplemente se plantearon como probables expectativas del comportamiento cognitivo de los alumnos bajo estudio. 11 CAPÍTULO 2. MARCO TEÓRICO. El presente trabajo se ubica dentro del contexto de la Ciencia Cognitiva, la cual es una disciplina bastante joven que está integrada por otras disciplinas tales como psicología, lingüística, inteligencia artificial, neurociencias y filosofía, dentro de esta última muy especialmente la rama epistemológica. Dentro de la ciencia psicológica, es de la rama de la psicología cognitiva de donde se desprende el fundamento teórico que ha guiado el diseño y la realización de esta investigación. Específicamente se trabajó bajo el enfoque de los modelos conexionistas de procesamiento de información. Tales modelos de cognición basan sus explicaciones sobre la concepción de que el procesamiento humano de la información no se realiza de una manera ordenada serialmente, sino que consideran que el procesamiento se realiza de manera paralela y distribuida en múltiplesy pequeñas unidades interconectadas (Haberlandt, 1997). De ahí su nombre de modelos conexionistas de redes, más comúnmente conocidos como modelos de procesamiento distribuido en paralelo (POP) (McClelland, Rumelhart y Hinton, 1986). La forma de procesamiento se distingue esencialmente en que el procesamiento en paralelo ocurre de una manera más o menos simultánea, mientras que el procesamiento serial ocurre de manera secuencial y lineal. El procesamiento distribuido puede encontrar una ejemplificación muy sencilla en la descripción que proporciona Varela (1996 p.75), respecto de lo que sucede en general en los procesos cognitivos " ... La conducta ( ... ) se parece más a una animada charla en una fiesta que a una cadena de mando." 12 Según Driscoll (1994), otra característica distintiva de los modelos conexionistas es que se interesan en describir la cognición a un nivel conductual, y no al nivel real de patrones del cerebro (como lo haría las neurociencias, por ejemplo). Además, los modelos POP, afirma McClelland (1988), consideran como los elementos componentes de la memoria a las unidades y conexiones, y no a los nodos conceptuales ni a los rasgos semánticos, ni a las proposiciones. Las unidades y conexiones son, por lo tanto, de naturaleza subsimbólica, es decir que no corresponden con o no son equiparables a partículas de información significativa, como ocurriría con los nodos conceptuales y con las proposiciones. Más bien, las unidades son divisas simples de procesamiento, y las conexiones describen cómo tales unidades interactúan entre ellas. Al interactuar forman una gran red a través de la cual se asume que el procesamiento se ha distribuido. Cuando ocurre el aprendizaje (Driscoll, 1994), el estímulo -sea éste ambiental o proveniente de la propia red- activa las conexiones entre unidades, reforzando así algunas conexiones, al tiempo que debilita otras. Son estos patrones de activación los que representan a los conceptos y principios del conocimiento, es decir, que el conocimiento es almacenado en las conexiones entre las unidades en procesamiento. Debido a que se asume que las conexiones entre unidades están cargadas con diferentes pesos de asociación, el aprendizaje ocurre en ese continuo ajuste de pesos. Y desde luego, ya que el procesamiento ocurre en paralelo, una gran cantidad de diferentes ajustes puede ocurrir (de hecho ocurren) simultáneamente y pueden existir ajustes continuos de errores en función o en dependencia de nueva información. 13 Los modelos POP presentan varias y sustantivas ventajas en relación con otros modelos de procesamiento de la información. Por un lado, representan una contribución importante dentro de la Ciencia Cognitiva, ya que, como lo señala Varela (op. cit.), la Inteligencia Artificial (IA) cognitivista y la neurociencia no contaban con suficientes resultados adecuados para explicar o reconstruir procesos cognitivos, ahora los modelos POP los proporcionan; además, los modelos POP se sitúan mucho más cerca de los sistemas biológicos, de modo que es posible trabajar con un grado de integración entre la IA y la neurociencia que anteriormente era impensable; finalmente, los modelos POP presentan un grado de generalidad que hace posible su aplicación, con algunas pequeñas modificaciones desde luego, en diferentes áreas de la cognición humana. Por otro lado, dentro de la propia psicología cognitiva, se señalan las siguientes ventajas: a) Al parecer explican adecuadamente la naturaleza de incremento continuo del aprendizaje humano. De acuerdo con Estes (1988), a través del reajuste constante de los pesos de conexión, los modelos POP proporcionan una representación más dinámica del aprendizaje humano. b) Ofrecen "por primera vez una manera conveniente de incorporar metas dentro de las dinámicas de los sistemas de procesamiento de información" (Estes, op.cit. p. 207). Es decir, que los pesos de conexión en la mayoría de los sistemas POP se ajustan para reducir la disparidad entre su respuesta y la respuesta meta o respuesta requerida. e) McClelland (1988) afirma que en los modelos POP existe el potencial para explicar el desarrollo cognitivo. Cierto conocimiento, en términos de pesos de conexión preestablecidos, puede ser construido dentro de la red. El 14 explorar diferentes configuraciones de la arquitectura inicial de memoria, podría conducir a avances sustanciales para determinar qué tanto de la memoria humana es de aparición constante en los diferentes periodos de la vida. 2.1 El surgimiento de la Ciencia Cognitiva. Según Stillings et al. (1995) un origen histórico de la ciencia cognitiva fue el interés de los filósofos griegos en el razonamiento deductivo. Aristóteles demostró que los argumentos deductivamente válidos, con frecuencia toman una de entre un pequeño número de formas generales. Aprender a razonar deductivamente, entonces, puede ser visto como aprender una manera o un estilo de procesar información por medio del cual es posible reconocer y reproducir las formas válidas de un argumento. Las raíces de la ciencia cognitiva y de la psicología en general bien pueden ser remitidas al siglo 17, cuando los filósofos comenzaron a encontrar nuevas maneras de aproximarse a problemas acerca de la naturaleza del pensamiento y de la mente. Empezaron los debates acerca de la relación entre mente y cuerpo, entre lenguaje y pensamiento, entre pensamientos o percepciones y los objetos pensados o percibidos, si las ideas son innatas o adquiridas, y acerca de la naturaleza de la estructura de la mente. Por ese entonces Descartes (c. 1633a/1985) argumentaba que todo nuestro conocimiento del mundo externo está mediado por las representaciones, a las cuales las consideraba como objetos mentales que de alguna manera corresponden con las cosas del mundo externo. El pensamiento, afirmaba 15 Descartes, siempre involucra la manipulación, a través de la inferencia o de otros procesos mentales, de tales representaciones. Por su parte, Hobbes (1651/1962) argumentaba que todo pensamiento era un tipo de cálculo, quizás inconsciente, usando operaciones formales con los símbolos almacenados en la mente. Como pcdemos observar, las afirmaciones de estos dos filósofos se complementan y constituyen el prototipo de la ciencia cognitiva contemporánea. No sólo nuestros estados y procesos mentales son concebidos como formando un tipo de sistema representacional autónomo; sino que, de hecho, van a ser pensados como objetos matemáticos, al menos a cierto nivel, y las operaciones que realiza nuestra mente sobre ellos cuando pensamos son concebidas como computaciones. Esta elaboración, no es ni obvia ni necesariamente verdadera. Podría ser, como algunos conexionistas sostienen, que aunque representamos al mundo, nuestras representaciones no son en ningún sentido propio objetos formales en sí mismos. Lo destacable es que los frutos de la filosofía del siglo 17 contienen las semillas de la ciencia cognitiva contemporánea. En los siguientes trescientos años la aproximación Cartesiana a la filosofía de la mente estuvo dentro y fuera de moda, a la vez que fue refinada y relacionada con otras aproximaciones. Al final del siglo 19 la filosofía dio lugar al nacimiento de la psicología (Marx M. H. y Hillis, W. A., 1985). Esa primera psicología, algunas veces llamada introspeccionismo era de orientación muy Cartesiana, pero pronto dio lugar al conductismo, una escuela de psicología decididamente anti-Cartesiana que tuvo gran influencia dentro de la Psicología en general, especialmente en el Continente Americano debido a la gran influencia de la Psicología Norteamericana 16 sobre los avances científicos dentro de la psicología del resto de los países del continente. Después, a principios de 1950 ocurrió un importante desarrollo, el Conductismo, al mostrar sus limitacionespara explicar fenómenos psicológicos complejos, comenzó a dar lugar a que los científicos incursionaran en otras formas y otras metodologías, iniciando con ello el surgimiento de la psicología cognitiva, una rama de la psicología que toma muy seriamente la versión computacional de la teoría representacional de la mente. Según Haberland (1997), la Psicología Cognitiva comprende el estudio científico de la mente y para ello se aboca a una amplia gama de procesos psicológicos, tales como la sensopercepción, reconocimiento de patrones, conciencia, aprendizaje, memoria, atención, formación de conceptos, pensamiento, lenguaje, etc. Las razones para el decaimiento del conductismo y el florecimiento de la psicología cognitiva tienen que ver, como se ha mencionado, con las dificultades que los conductistas tenían para extender sus modelos bastante simples de formación de hábitos y aprendizaje a teorías de conducta compleja, razonamiento, memoria, solución de problemas, adquisición de lenguaje, etc., coincidentemente las cosas que Descartes y Hobbes encontraban más interesantes y justamente los procesos a cuyo estudio se aboca ahora la psicología cognitiva. Esta rama de la psicología, como se puede observar, surgió como respuesta a una necesidad científica de conocimiento y explicación de los fenómenos psicológicos complejos. Motivados por la misma visión Cartesiana-Hobbesiana de la mente como una divisa de cálculo operando sobre representaciones, los científicos computacionales comenzaron la investigación en inteligencia artificial. Es justamente de este modo como la Ciencia Cognitiva fue concebida. 17 Diversos autores (Varela, 1996, Stillings et al. 1995) coinciden en señalar al surgimiento de la Ciencia Cognitiva como uno de los más importantes desarrollos en el campo intelectual de las últimas tres décadas. Actualmente, bajo el rubro de Ciencia Cognitiva se designa al análisis científico moderno del conocimiento en todas sus dimensiones (Varela, 1996). Los científicos cognitivos buscan entender fenómenos tales como la percepción, el pensamiento, el recuerdo, la comprensión del lenguaje, el aprendizaje y otros fenómenos mentales, puesto que, de manera genérica, la Ciencia Cognitiva es considerada entonces, como la ciencia de la mente. Esta ciencia, como ya se ha mencionado, relativamente joven, se formó a partir de varias disciplinas interesadas -como se puede ver- por los mismos fenómenos, por lo que constituye un campo de estudio interdisciplinario en el que convergen disciplinas tales como la psicología, la lingüística, las ciencias computacionales, la filosofía y la neurociencia. Todas éstas son también ciencias jóvenes que han emergido de la filosofía durante los últimos cien años más o menos. Según lo reportan Stilllings et al. (1995) la Psicología nació como ciencia independiente en las últimas décadas del siglo 19. La Neurociencia tiene sus inicios alrededor del mismo tiempo, sin embargo, su verdadero desarrollo para convertirse en una prometedora empresa teórica es mucho más reciente. La Lingüística, tal y como la conocemos actualmente, comenzó a emerger en 1920 y aún se encuentra en su proceso de llegar a ser independiente, con algunos de sus problemas -particularmente aquellos que tienen que ver con la lógica y la semántica- aún cayendo tanto dentro del dominio de la filosofía como dentro de su 18 propio dominio. La Ciencia Computacional ha existido sólo desde alrededor de 1950, aunque sus raíces están primariamente dentro de las matemáticas. Los científicos cognitivos consideran a la mente humana como un sistema complejo que recibe, almacena, recupera, transforma y transmite información. Estos tipos de operaciones son llamados procesos de información, que se realizan, según el enfoque del científico cognitivo, dentro de una concepción de la mente como un sistema de procesamiento de información. 2.2 Aspectos Filosóficos. Claramente se observa que la filosofía ha jugado un papel muy importante en la historia de la ciencia cognitiva. La filosofía es una disciplina fundacional cuyo trabajo no sólo hace posible la construcción de otras disciplinas, sino que además presta una constante atención a la conformación de tales disciplinas conforme éstas son puestas en práctica y se van desarrollando. Los filósofos ayudan a los científicos a definir su orientación y a clarificar su objeto de estudio, lo que deben ser sus métodos, y qué relaciones sostener entre las entidades estudiadas por las diferentes disciplinas. Esta función es particularmente importante en una empresa nueva e interdisciplinaria como lo es la ciencia cognitiva, en la que las entidades que están siendo estudiadas -procesos mentales abstractos y computacionales- con frecuencia son difíciles de determinar, y en la que los practicantes de diferentes disciplinas están trabajando de diferentes maneras en problemas relacionados. De acuerdo con Stillings (1995), podemos distinguir tres áreas de contribución filosófica: la definición de la empresa y obtención de una visión sinóptica de ella (filosofía de la ciencia); interesarse en la naturaleza de las estructuras abstractas 19 que están siendo estudiadas por la ciencia cognitiva, y en su relación con cosas más concretas (metafísica); y pensar acerca de las interrelaciones entre las representaciones y cómo la mente las organiza y las usa para generar conocimiento (epistemología). Para ejemplificar estas tres áreas de contribución filosófica parece adecuado hacer referencia a lo que Von Gelder (1998) reporta como los diferentes roles que la filosofía juega en Ciencia Cognitiva. El primero de tales roles sería el de "pionero", que se manifiesta cuando el filósofo trata con problemas que otros profesionistas no saben aún cómo tratar, con el propósito de transformarlos en fenómenos susceptibles de ser estudiados científicamente. Así, es posible observar a lo largo de la historia cómo ha sido el filósofo quien en primera instancia ha abordado fenómenos tales como los siguientes: la naturaleza de la inteligencia y del conocimiento, la percepción, la imaginación, conceptos, representaciones mentales, la relación de procesos del pensamiento con el cerebro, etc. Específicamente, el postulado teórico clave en Ciencia Cognitiva, referente a la existencia y naturaleza del lenguaje del pensamiento (Fodor, 1975), inicialmente fue debatido filosóficamente en la época medieval (Normore, 1990; Spade, 1980). Actualmente existen métodos no filosóficos de tratar el fenómeno, los cuales fueron desarrollados a partir de los trabajos filosóficos. De la misma manera, es posible hacer alusión a las ideas básicas a partir de las cuales se ha construido la ciencia cognitiva. Una de ellas, muy importante, es la idea de que los procesos humanos de pensamiento constituyen la operación de un cierto tipo de sistema físico. Lo mismo sucede con las hipótesis fundacionales de la ciencia cognitiva clásica respecto de que el pensamiento es una forma de 20 computación subsimbólica; aún la noción de computación, como se ha mencionado en párrafos anteriores, es de origen filosófico. Resulta evidente, como lo afirma Pylyshyn (1984) que la ciencia cognitiva debe en parte su existencia a los esfuerzos pioneros de filósofos tales como Leibnitz, Frege, Russell, Whitehead y Turing quienes, en su conjunto, son responsables de que ahora se comprenda cómo la manipulación de objetos físicos, apropiadamente estructurada puede, de cierta manera, tender un puente entre la aparente brecha del mundo físico de las causas y efectos por un lado, y las propiedades semánticas y aspectos mentales de significado, verdad e inteligencia, por el otro lado. Von Gelder (op. cit.) reseña inclusive ejemplos dentro de la ciencia cognitiva reciente, que fueron primero tratados en un nivel filosófico. Tal es el caso de algunos avances dentrodel campo de la inteligencia artificial que han adaptado e instrumentado teorías del conocimiento científico desarrolladas por filósofos, a saber, los sistemas expertos Dendral y Meta-Dendral. Otro ejemplo es el interés y progresos hechos en aspectos de la modularidad en arquitectura cognitiva. Este interés en la modularidad se debe en gran medida al trabajo monográfico pionero de Jerry Fodor en 1983 "La Modularidad de la Mente". En ese libro Fodor reabrió un tópico de gran importancia que había permanecido latente, y en el que a través, tanto de la clarificación de conceptos como de la perspectiva histórica, produjo una nueva tesis de la modularidad que ha llegado a ser el punto principal de orientación para el trabajo subsecuente que se ha realizado en esta área. Más aún, existen todavía tópicos de suma importancia, que son los filósofos quienes deberán hacer progresos considerables antes de que los científicos cognitivos puedan aproximarse a ellos de manera aceptablemente confiable. Entre 00008~ 21 tales tópicos se encuentran los siguientes: el problema mente-cuerpo, la naturaleza de la intencionalidad y el problema de la conciencia. Como puede apreciarse, el rol del pionero bien puede ser considerado dentro de la función filosófica fundacional. Otro de los roles de la filosofía es el que Van Gelder denomina "inspector de la construcción" puesto que, aún en las disciplinas ya constituidas, continuamente se aboca a revisar o "inspeccionar" la calidad de tal construcción. Esto deberá entenderse como la continua verificación de la congruencia de las acepciones teóricas que guían a la investigación en el campo determinado; puesto que suele suceder que resultados de investigaciones muestren que algo está mal en las acepciones que le han guiado o en las que se ha basado, pero es tarea de la filosofía el reflexionar para comprender qué es lo que está incongruente y eliminar el problema. Un ejemplo de este tipo sería lo que sucedió con el conductismo, el cual apareció inicialmente como una rama de investigación psicológica muy fructífera, pero cuando los filósofos investigaron cuidadosamente para articular sus presupuestos básicos, quedó demostrada su inconveniencia. Trabajo filosófico de este tipo debe realizarse continuamente dentro de la ciencia cognitiva, preferentemente por parte de científicos cognitivos que se involucren muy activamente dentro de la filosofía en su contribución epistemológica. Existe también el rol del cartógrafo quien tiene como objetivo el entender y describir qué tan apropiadamente los diferentes elementos de la ciencia cognitiva se relacionan unos con otros (o no se relacionan, o se contradicen, según sea el caso). Un ejemplo de este tipo de trabajo lo encontramos en el libro sobre inteligencia artificial del filósofo John Haugeland (1985, en Van Gelder, 1998). En 22 este libro él pretende llegar a una comprensión de lo que es la IA en términos de su más amplio contexto histórico y conceptual. Inicia bosquejando la historia de ciertas ideas y problemas clave, desde Copernico y Galileo hasta Descartes, Hobbes y Hume. Después dedica dos capítulos a la articulación de lo que es una computadora, en términos de conceptos tales como sistemas formales, digitalidad, independencia de medio, algoritmos, automación, significado e interpretación. En fin, que lo que el escrito realiza o consigue, es un entendimiento de lo que es IA en términos de cómo ésta encaja dentro de un contexto más amplio de ideas y ambiciones filosóficas. La intención de ejemplificar estos roles que juega la filosofía dentro de los diversos campos de la ciencia cognitiva es mostrar la importancia tan preponderante de la interacción de una con la otra, pues sin duda alguna deberá aceptarse que los mejores productos filosóficos dentro de la ciencia cognitiva serán realizados por aquellos cuyo pensamiento esté enteramente fundamentado en el trabajo empírico, de la misma manera que la mejor y más fructífera investigación empírica será aquella que esté informada y guiada por la perspectiva y el rigor filosófico. Es la convicción personal de quien escribe que la conciencia acerca de la influencia de la filosofía sobre la disciplina empírica con la que se trabaja proporciona una visión más acertada del contexto teórico del cual se parte y de sus metodologías, así como de la realidad a la cual el profesionista se aproxima. Al parecer, con las reflexiones anteriores ello ha quedado evidenciado. 23 2.3 Sobre el Concepto de Esquema. La Representación del Conocimiento a través de Redes Semánticas y Esquemas de Conocimiento. Como ya se ha mencionado, el concepto de esquema está en el centro teórico de la psicología cognitiva moderna. Kant (1787/1963; citado en Kintsch y Mross, 1985), originalmente propuso la idea de esquema como estructuras innatas para organizar nuestra percepción del mundo. Según Kant los esquemas son reglas de categorías que hacen posible la comprensión y que son aplicadas a la experiencia y a la adquisición de conocimiento. Esta noción mentalista dentro de la psicología cognitiva vino primero de Europa con Piaget (1926) para explicar cómo los individuos desarrollan procesos de pensamiento a través de su desarrollo cognitivo. También Bartlet (1932) usó el concepto de esquema para explicar cómo las personas tienden a reconstruir historias de sus conocimientos previos. En América el concepto de esquema se desarrolló a mediados de los 70's como una forma de explicar de manera sistemática y parsimoniosa los resultados que se obtenían de investigaciones acerca de los efectos del conocimiento previo sobre el nuevo aprendizaje. El concepto fue retomado por investigadores del campo de la Inteligencia Artificial para mejorar simulaciones computarizadas de capacidades cognitivas humanas (Minsky, 1975; Schank y Abelson, 1977). El inicio del concepto de esquema en psicología como una herramienta explicativa de cómo organizan y procesan la información los humanos en la memoria fue difícil debido al contexto teórico dominante dentro del cual nació. Estas nociones mentalistas fueron consideradas como imprecisas, subjetivas, e inobservables. 24 Sin embargo, en la psicología cognitiva de los 70s, con el interesante crecimiento dentro del campo de las representaciones mentales, el concepto de esquema fue restablecido. La evidencia experimental para esta realidad psicológica ha sido acumulada desde entonces (Bransford y Johnson, 1973; Anderson y Pichert, 1978), y las versiones modernas tales como el modelo de esquema+etiqueta (Graesser y Nakamura, 1982) o el modelo de procesamiento distribuido en paralelo de esquemas PDP (del cual ya se ha tratado en párrafos anteriores) por Rumelhart, Smolensky, McClelland, y Hinton (1986), juegan un importante papel dentro de las actuales teorías de la memoria humana. Rumelhart y Ortony (1977) listaron las siguientes características como las más importantes del concepto de esquema (esquemata en plural): (1) La esquemata tiene variables. (2) La esquemata puede estar incluida una dentro de otra. (3) La esquemata representa conocimientos de todos los niveles de abstracción. (4) La esquemata representa conocimientos y no definiciones de vocabulario. (5) La esquemata son dispositivos de reconocimiento usados para evaluar la forma en cómo conocimiento previo se relaciona con la información que está siendo procesada. La tercera característica, que se refiere a que la esquemata puede representar conocimientos de todos los niveles de abstracción, esto es, que va desde ideologías y realidades culturales (Anderson, 1991 ), hasta el significado de una simple palabra, ha permitido a los investigadores explorar una amplia variedad de dominios de conocimiento. Por ejemplo, en un nivel de abstracción molar y 25 entendiendo el concepto de esquema como un proceso activo (característicanúmero. 5), Schank y Ableson (1977) extendieron la idea de esquema para explicar las secuencias de eventos complejos como es el hecho de ir a comer a un restaurante (lo cual involucra acciones dirigidas, actores y objetos); esto puede ser representado por estructuras de conocimiento llamadas "guiones" ("scripts", en inglés). Los guiones son elementos que funcionan con valores intrínsecos y que nos permiten inferir lo que no está explícitamente establecido. Al igual que la esquemata, los guiones pueden incluir escenas organizadas jerárquicamente y subguiones. La mayoría de las investigaciones sobre la teoría de esquemas ha sido dirigida a niveles molares de abstracción (para una revisión completa ver Alba y Hasher, 1983). Esto es así porque en el nivel de análisis molecular, los procesos complejos de asociación en la memoria a largo plazo se describen mejor como si fueran definiciones de diccionario así como por la interconexión entre conceptos. A este campo de investigación de nivel molecular se le conoce como estudios de análisis de memoria semántica. Existe una amplia tradición de investigación sobre memoria semántica que ha perdurado desde hace 25 años en la psicología cognitiva. Empezó con el modelo de red semántica de Collins y Quillian (1969) y los modelos más representativos se encuentran en Anderson (1976), Anderson y Bower (1973), Brachman (1977), Collins y Loftus (1975), Lindsay y Norman (1977), y más recientemente con Feldman (1988), y Rumelhart (1990). Volviendo a la especificación del concepto de esquema, en general parece adecuado, tal como Stillings, Weisler et al. (1995) lo enuncian, considerar bajo el término esquema a toda estructura cognitiva que especifique las propiedades o 26 características generales de un tipo de objeto o evento y excluya cualquier especificación de detalles que le sean irrelevantes. Un esquema por lo tanto, bajo esta perspectiva y en congruencia con las características enunciadas anteriormente, será una abstracción que permite que objetos o eventos particulares sean asignados a categorías generales. Dentro del campo de la psicología cognitiva y de su vástago (como la designa Varela, 1996) la Inteligencia Artificial, se han estudiado tres tipos de esquemata, a saber: 1) esquemata del tipo contexto o frames que se refieren a escenas visuales complejas, por ejemplo cómo se ve una habitación (Minsky, 1977); 2) esquemata del tipo guiones o scripts referidos a actividades complejas, tales como ir a un restaurante (Schank y Abelson, 1977); y 3) esquemata de la personalidad de la gente como tipos de gente, que incluyen la propia concepción de sí mismo o el autoesquema (Cantor y Mischel, 1979; Markus, 1980). Respecto de las propiedades de ejecución, según Stillings y cols. (1995), los esquemata poseen las siguientes: 1. Una vez que el esquema es activado por alguna de las características del ambiente, sea éste externo o cognitivo, actúa sobre la distribución de la atención y los recursos de la memoria de trabajo, sirviendo como un filtro que descarta información irrelevante y concentra su procesamiento en lo que es relevante. 2. Debido a que puede funcionar como un trozo individual en la memoria de trabajo, facilita el procesamiento. 3. Ya que organiza la atención y el procesamiento, puede tener efectos en la memoria a largo plazo. 27 4. Ya que representa generalizaciones acerca del mundo, impulsa u ocasiona las inferencias o predicciones que guían el pensamiento y la acción. 5. Actúa para clasificar objetos y situaciones, para asignarlos a categorías. 6. Incluso, la cognición guiada por esquemata, puede conducir a varios tipos de error ya que la dominancia de un esquema determinado puede llevarnos a realizar inferencias inapropiadas o a ignorar características que, dado el contexto específico o las metas, son importantes. La esquemata pues, son estructuras genéricas de conocimiento que contienen los elementos esenciales o generales de una serie de experiencias relacionadas. La estructura y contenido de un esquema son los productos de generalizar o abstraer de una secuencia de experiencias similares. Representan aquello a lo que nos referimos bajo el término de conceptos, principios, patrones de actividad, procedimientos, ideas, creencias. La esquemata no sólo trabaja en la interpretación y creación de nuevas representaciones de experiencias similares sino que también determina cómo trabaja la memoria. Según Nuthall (1999), el olvido o la pérdida de conocimientos ocurre conforme los detalles incluidos en una representación específica se pierden y la misma llega a ser absorbida dentro de los esquemata involucrados en su creación. Conforme esto sucede, la información genérica contenida en el esquema es usada para reemplazar los detalles de la experiencia original. Lo que se recuerda es conocimiento general y no los detalles de la experiencia original. Debido a que la representación de una nueva experiencia está ligada a la diferente esquemata que está implicada en interpretar y almacenar la representación, las nuevas experiencias también crean ligas entre la esquemata 28 ya existente. A través de este proceso de crear ligas entre esquemata, se establece una red jerárquica de conocimiento, con la esquemata más específica en la parte más baja de la jerarquía y la esquemata más genérica e inclusiva en la parte más alta de ella. Esta es la manera en que la corriente conexionista explica la adquisición de nuevo conocimiento en relación con el conocimiento que ya se posee; se le conoce como teoría del esquema (Derry, 1966; Kintsch, 1988; Rumelhart, 1980; Schank, 1990) y según ésta, una experiencias nueva es comprendida e interpretada por medio de crear una representación mental de la experiencia que esté ligada a aquellas estructuras de conocimiento (esquemata, guiones) que ya existen en la memoria. El contenido y la estructura de la nueva representación están determinados por la interacción entre el contenido de esa experiencia y las estructuras de los esquemas relevantes en la memoria a largo plazo. Esta explicación, como puede observarse, es esencialmente la misma que se ha dado respecto de los modelos POP y la adquisición de conocimiento con base en el cambio de pesos de asociación en las conexiones de una red semántica. Desde luego que en esencia es la misma puesto que se trata de la misma orientación teórica. 2.4 Antecedentes del Modelo de Procesamiento Distribuido en Paralelo PDP 2.4.1 La teoría del Procesamiento Humano de Información (PHI) Hasta ahora, se ha mostrado el panorama teórico actual con base en el que se desarrolla este trabajo. Para una mejor comprensión, cabe realizar ahora una 29 revisión breve del mismo contexto teórico que ha dado lugar al estado actual de esta empresa teórica. Los teóricos del PHI inicialmente han postulado que los humanos somos básicamente procesadores de información simbólica. De acuerdo con esta teoría, desde edades muy tempranas los humanos somos capaces de crear representaciones conceptuales que forman la base de nuestros procesos mentales posteriores. Así por ejemplo, como se ilustra en la Figura 2.1, y de acuerdo con Lindsay y Norman (1977), la actividad motora de un niño que mueve una sonaja crea en el infante una representación mental (esquema) que asocia estados internos del individuo (sonido placentero) con conceptualizaciones de eventos del mundo externo. Estas representaciones mentales permiten la organización de la información de acuerdo con las propiedades del objeto representado (Rumelhart, 1977). La Figura 2.1, por ejemplo, indica dos acciones motoras diferentes (chupar la sonaja y mover la sonaja) y su relación con el objeto afectado por dichos movimientos. Nótese que representaciones conceptuales con líneas más anchas son ejemplos de representación de conocimiento procedimental, estoes, conocimiento de cómo hacer algo; mientras que las asociaciones con flecha delgada muestran un ejemplo de una representación declarativa, esto es ¿qué es ese objeto brillante, azul, alargado y que cuando lo mueves produce un sonido placentero? La sonaja. Esta esquemata de conocimiento es lo que posteriormente nos permite clasificar, reconocer, y obtener significados de nuestro medio ambiente. Sin embargo, conforme nos vamos desarrollando a través de nuestras vidas, el 30 proceso de la formación de estas representaciones mentales está frecuentemente sujeto a errores. Este es el caso de un niño que observa un perro por primera vez. De acuerdo con la teoría del PHI, el niño al ver un perro crea una representación conceptual que incluye información como la siguiente: "se llama perro", "se mueve", "tiene cuatro patas", "tiene color", etc. Sin embargo, al igual que el perro, también el gato, la ardilla e incluso objetos como un carrito poseen características semejantes y el niño tenderá a sobregeneralizar (ver Figura 2.2). 31 <:l'ltOl'IC<:::: ;-.-..;.;.;.;;.;..;;...,;,;, _ __._ < Soraido > pl::1ccratcro ----~--- ·-··- _,,) ......__ ----~-------- ---~~ Figura 2.1. Representación motora del movimiento de una sonaja 32 Figura 2.2. Ejemplo de sobregeneralización de conocimiento 33 El caso opuesto a la sobregeneralización es cuando se comete el error de no generalizar apropiadamente un esquema de conocimiento, esto es, la sobrediscriminación. Esto se ilustra en la Figura 2.3. Figura 2.3. Ejemplo de sobrediscriminación de un objeto 34 Como se puede ver la formación apropiada de esquemas de conocimiento es de vital importancia para la obtención de significados correctos. De esta forma y mientras crecemos, es a través de una intensa actividad de acomodación y asimilación del conocimiento nuevo con el previo que logramos un desarrollo intelectual. Las funciones primordiales de nuestro intelecto están estrechamente relacionadas con dicha evolución, la cual nos habilita como seres pensantes y sociales. Por ejemplo, en el caso de la lengua, es la transmisión correcta de esquemas de conocimiento lo que nos permite transmitir y recibir significados durante una conversación. Esto se ilustra gráficamente en la Figura 2.4 en donde el emisor (Alina) trata de emitir no sólo la información que le interesa, sino también trata de asegurarse de que el escucha comprende la conversación a través del señalamiento de cómo se asocia un conocimiento nuevo del emisor con un conocimiento previo del escucha. 35 E::::tructur:;¡ inici:;¡I de conocimiento de KeYin Figura 2.4. Ejemplo de la transmisión de un esquema de conocimiento a un escucha Dicha transmisión y manipulación de conocimiento implica además una serie de procesos cognitivos, entre ellos la codificación, decodificación y almacenamiento del mismo. Como se describe a continuación, el entendimiento de dichos procesos contribuye en gran medida al entendimiento de cómo es que los humanos comprendemos y producimos la lengua y del origen de muchos de nuestros procesos cognitivos superiores 36 2.4.2 Los sistemas de memoria humana Desde el enfoque de la teoría de PHI, los humanos somos capaces de organizar y almacenar información simbólica de nuestro medio ambiente y de nosotros mismos. Un modelo de procesamiento de información que se somete a esta idea es el modelo de sistemas de memoria propuesto por Atkinson y Shiffrin (1980). En este modelo se describen tres almacenes de información de la siguiente manera: a) La memoria sensorial, b) La memoria a corto plazo, y c) La memoria a largo plazo. La memoria sensorial retiene información por un intervalo de 250 milisegundos a 4 segundos (Neisser, 1967), la memoria a corto plazo retiene información por un espacio de 12 segundos o más si se recicla la información (Atkinson y Shiffrin, 1980), mientras que la información en la memoria a largo plazo puede ser retenida por un tiempo indefinido (Loftus y Loftus, 1976; Lachman y Butterfield, 1979; Solso 1997). Una ilustración de este concepto se puede observar en la Figura 5. El modelo de Atkinson y Shiffrin constituye entre otros (Lindsay y Norman, 1977; Dodd y White, 1980; Anderson 1981) una parte seminal de los orígenes del modelo PHI. La idea general postulada por este tipo de sistemas es que la información ambiental es primero almacenada en una memoria sensorial (o icónica), dicha información sensorial es codificada en información simbólica y almacenada en la memoria a corto plazo (MCP). Si existe interés en la información almacenada en MCP, el proceso de atención se encarga de reciclar la información en MCP hasta que carezca de valor o se almacene en la memoria a largo plazo (MLP). La información almacenada en MLP es organizada y estructurada de tal forma que después una regla heurística permita facilitar su acceso y recuperación 37 (Puff, 1979; Puff, 1982). ~ e: o U) z w U) ~ e: o ~ w ~ DECAIMIENTO DE , MEMORIA A CORTO PlAZO MCP DECAIMIENTO DE LA INFORMACIÓN RECUPERACIÓN DE INFORl'v\A.CIÓN MEMORIA A LARGO PLAZ MLP Figura 2.5. El modelo de cajas de almacenamiento y manipulación de información basado en la propuesta de sistema de memorias de Atkinson y Shiffrin Nótese que en la Figura 2.5 se señala un procesador central que se encarga de coordinar el flujo de información entre sistemas. Esta idea fue importada directamente del área de la computación en donde el procesador central de una computadora es el encargado del control de varias de las funciones de registro y manipulación de la información. Dentro de la teoría de cognición, este procesador esta relacionado con la autorregulación de uno mismo y con la metacognición 38 (Mayor, Suengas y González, 1995). Es importante sin embargo, señalar algo relevante respecto del concepto de decaimiento de la información señalado en la Figura 2.5. El decaimiento y el olvido de la información en la memoria son dos cosas diferentes. Para poder señalar la diferencia mas claramente cabe considerar la siguiente pregunta: ¿Cuál es el recuerdo más viejo? ¿ Tal vez el color del tapiz de la habitación o tal vez un juguete de la niñez? Ciertamente, las personas tienden, en promedio, a recordar eventos de entre los 4 y 5 años de edad. Claro está que existen quienes recuerdan algo de edades mas tempranas o tardías, pero ¿recuerda usted cómo es que aprendió a hablar, a socializar o a caminar? Es interesante notar que la infancia es la edad en la que más parece que se aprende y al mismo tiempo es la edad de la que menos se recuerda. Por otra parte, cabe imaginar que no fuera posible olvidar, que pudiera recordarse todo, que se recordara el color de los calcetines usados en un lunes a las 10:00 a.m. a la edad de 9 años. La vida sería insoportable. Luria (1983) documentó uno de estos casos en el que un individuo, quien acabó por quitarse la vida, no podía olvidar. Este individuo pasaba de una a otra idea en una interminable cadena de recuerdos. Olvidar, por lo tanto, es necesario, es un mecanismo para la estabilidad mental y sin embargo no implica que la información se haya perdido, sino que ya no se tiene acceso a ella. Este no es el caso para el decaimiento de la información en la MCP. Una vez que la información no es utilizada y si no es relevante, simplemente decae y se pierde. Así por ejemplo, si a usted se le pide que ejecute una operación aritmética, usted accederá a su MLP por información sobre cómo realizar operaciones aritméticas, entonces aplicará estos procedimientos sobre la información en su MCP, razón 39 por la cual también se le llama memoria de trabajo. Una vez procesada la información ésta puede ser desechada o, en caso de tener una importancia significativa para la persona, ésta podría ser pasada a la MCP. Por otra parte, el recordar no siempre significa que se estéaccesando a información en la memoria de algo que realmente sucedió. Este es el caso de la implantación de memorias falsas en la memoria (Weingardt, Leonesio y Loftus, 1994). El punto a señalar es que la memoria humana presenta muchas facetas en las que olvido y decaimiento, recuerdo y acceso son procesos diferentes que forman parte esencial en nuestro aprendizaje. 2.4.3 La representación del conocimiento Como ya se ha mencionado, existen diferentes formatos para representar la información que se maneja en el sistema de información humano (Rumelhart y Ortony, 1977). Estos formatos se clasifican al menos en tres tipos de conocimiento: a) Conocimiento procedimental b) Conocimiento declarativo, c) Conocimiento de imágenes. De acuerdo con lo que se mencionó en breve anteriormente, el conocimiento procedimental es aquel tipo de conocimiento que señala o indica el procedimiento (¿Cómo se hace?) para realizar alguna tarea. Por ejemplo, el tipo de conocimierito que permite conducir un carro o una bicicleta, desplazarse de un lugar a otro sin perder la ubicación, etc. El conocimiento procedimental supone un conjunto de reglas condicionales como la siguiente: "SI... ESTO SUCEDE. .. ENTONCES PROCEDE CON ... "; por ello se le conoce también como conocimiento condicional y se almacenan como una red de conceptos de forma 40 proposicional. Así por ejemplo, Chomsky (en Lenneberg, 1981), propone que los humanos para generar la lengua deben usar un conjunto de reglas condicionales o reglas de producción como las siguientes: 1. O 7 FN; FV 2. FN 7 O; N 3. FV 7 COP; ADJ; V; S 4. F 7 FN; FV En donde: O= Oración, FN = Frase nominal, FV = Frase verbal, S = Sintagma, V = Verbo, COP = Copulativo, ADJ = Adjetivo, N = Sustantivo, F = Frase. Siguiendo una secuencia correcta de estas reglas de producción es posible generar oraciones gramaticalmente correctas. Estas producciones gramaticales se conocen como: "Gramáticas libres de contexto" (Patrick, 1984). La primera regla de producción se puede leer: SI "O" ENTONCES "FN" o "FV'. Un ejemplo de tal producción se observa en la Figura 2.6 en la que se ilustra la oración "Javier no come patatas" (De Vega, 1992). La parte inferior de la Figura 2.6 muestra el equivalente de estas reglas de producción en formato de red conceptual o formato proposicional. El conocimiento declarativo (Rumelhart y Norman, 1985; Lindsay y Norman, 1977), describe y explica las características y significado de algo (responde a la pregunta ¿qué es un objeto?). Por ejemplo, algo que tiene branquias, nada en el agua y tiene escamas, ¿qué es? Este conocimiento también se organiza preposicionalmente en la memoria y se le conoce como redes semánticas de 41 conocimiento ya que el significado de un objeto se construye al recorrer la red de conceptos que se asocian y describen las propiedades del objeto. La Figura 2.7 describe de una manera simplificada una red semántica relacionada con el concepto de un pez. o A Representación Chomskyana ------ --------FN 1 F / ~ FN FV 1 / N V JAVIER COME B. Representación conceptual OBJETO PATATA----- ~ N PATATAS JAVIER SUJETO --- RELACION COMER FV / \ COP ADJ ES FALSO RELACION FALSO Figura 2.6. Dos formatos de reglas de producción de lenguaje La forma como estos conceptos se relacionan y organizan unos con respecto de otros es a través de la forma de relación que existe entre ellos. Por ejemplo, pares de conceptos que se asocian frecuentemente sostienen una relación asociativa (doctor-enfermera). También existe el caso en el que los conceptos se relacionan por categoría. por ejemplo, animal-pez (Neely, 1991 ). 42 Además se da también la situación en la que los conceptos se organizan para formar un esquema, el cual pretende ser un modelo del objeto a representar. Un ejemplo de dichas asociaciones conceptuales son los conceptos microhorno- mesero, para el esquema de Restaurante, o jefe-escritorio, para el esquema de Oficina (Rumelhart, Smolensky, McClelland y Hinton, 1986; Schvaneveldt, 1990; López, 1992, 1996). Los estudios de los procesos de asociación compleja en forma de red conceptual en la MLP se denominan análisis de redes semánticas. ~ MAMIFERO G:)j ~ e ESCAMAS SALMON ~ ~ Figura 2.7. Ejemplo de una red semántica 43 2.4.4 Sobre el análisis de Redes Semánticas para la organización del conocimiento en la memoria humana Las representaciones proposicionales o redes semánticas son un lenguaje formal de carácter abstracto y universal que pretende reflejar el pensamiento puro. Su creador fue Frege, el padre de la lógica contemporánea, en 1892, al considerar que el lenguaje natural era inadecuado para formular las leyes racionales de la lógica, ya que estaba contaminado por los procesos psíquicos y resultaba ambiguo e impreciso (De Vega, 1992). Las características de las proposiciones son las siguientes: • Son unidades de significado sujetas a valores de verdad, es decir, que una proposición necesariamente es aseverativa y por tanto se puede juzgar como verdadera o falsa. • Son abstractas y semánticas, es decir, que no se trata de representaciones análogas, sino que reflejan conceptos y relaciones. Tampoco son equiparables a expresiones lingüísticas sino que subyacen a éstas. Desde un punto de vista formal, las proposiciones suelen representarse como redes o árboles (aunque no necesariamente) con dos tipos de elementos estructurales, a saber: los nodos, que representan unidades conceptuales (aunque suelen estar etiquetados con palabras); y los eslabones, que son las líneas que unen dos nodos entre sí y que representan algún tipo de relación entre éstos (gramatical, semántica o asociativa). 44 Las proposiciones pueden asumir ciertas restricciones, acomodándose a algunas reglas explícitas de formación. Las reglas de formación son más o menos arbitrarias y dependen de la función para la que se creó el sistema proposicional. El formalismo proposicional muestra algunas ventajas como las siguientes: Las proposiciones se acomodan a algunas propiedades de la memoria y el lenguaje humanos, por ejemplo: La invarianza del significado a pesar de las variaciones léxicas y gramaticales; éste es un fenómeno psicológico empírico que se incorpora en el formalismo proposicional sin ninguna dificultad. El carácter inferencia! de la memoria y el lenguaje se mimetizan perfectamente en las proposiciones; esto no es extraño, ya que el cálculo proposicional fue ideado por los lógicos precisamente como instrumento de razonamiento deductivo. La posibilidad de organizar las proposiciones en complejas redes jerárquicas se acomoda bien a la descripción de un sistema de conocimientos complejo y articulado como la memoria humana. Una segunda ventaja es el hecho de que casi cualquier tipo de información se puede reducir a proposiciones. Lo anterior ha permitido la elaboración de teorías psicológicas en las que se prescinde de imágenes. Una tercera ventaja es el hecho de que las proposiciones son computables. Los programas de inteligencia artificial, de memoria y comprensión del lenguaje emplean un formato proposicional como base de datos. Las proposiciones rebasan el hecho de ser sólo representaciones descriptivas, sino que además operan eficazmente en programas de cómputo. Por esto se puede simular el comportamiento de la memoria humana y de los procesos lingüísticos y comprobar las teorías psícológicas. 45 Como anteriormente se mencionó, las proposiciones suelen representarse como redes o árboles. Una red proposicional consta de varios elementos, a saber: a) una elipse central que representa el nodo proposicional, es decir el concepto más abstracto; b) las etiquetas nominales, son nodos terminales que representan conceptos específicos; y c) las flechas que corresponden con relaciones asociativas entre los conceptosy la proposición o, dicho de otro modo, reflejan el papel que desempeñan los nodos conceptuales en la proposición. (De Vega, 1992). En toda red proposicional se deben distinguir los conceptos genéricos y los ejemplos particulares de un concepto. Para elaborar una red proposicional Anderson (1990) propone las siguientes instrucciones que permiten transformar la mayoría de las expresiones lingüísticas en redes proposicionales: 1. Identificar los términos relacionales, principalmente verbos, adjetivos, etc. 2. Escribir frases simples para cada relación. Estas frases implicarán sólo la relación y sus argumentos nominales. 3. Para iniciar la construcción de la red, trazar una elipse que represente el nodo de cada proposición. 4. Escribir la relación para cada proposición próxima a su nodo. Conectar el nodo proposicional a la relación con una flecha designada relación. 5. Crear nodos para cada unidad nominal de las proposiciones. 6. Trazar flechas entre cada nodo proposicional y los nodos nominales que incluye. Denominar cada flecha con la etiqueta semántica apropiada. 7. Reconstruir la red para hacerla más clara. (De Vega, 1992). 46 Un aspecto interesante para resaltar es la versatilidad de las proposiciones, ya que no sólo se adecuan perfectamente a la representación semántica de expresiones verbales sino que tienen el poder de describir formalmente cualquier representación que se encuentre en la memoria semántica y episódica, como son dibujos, emociones, reglas ejecutivas, etc. Según los psicólogos proposicionalistas (Pylyshyn, 1973; Anderson, 1978, 1983), esto se debe a que cuando una persona recuerda algo como un dibujo o una emoción, no necesariamente recuerda una imagen, sino un significado que puede ser traducido a una proposición. Las redes proposicionales han tenido una aplicación muy específica en los modelos cognitivos. A continuación se tratará solamente de las teorías proposicionales de la memoria semántica, es decir las teorías que sitúan el énfasis en la estructura del conocimiento tal como supuestamente se organiza en la memoria permanente. Existen diferentes teorías psicológicas cognitivas con sus respectivas variantes cada una, sin embargo, cabe señalar las siguientes características que son generales a todas: Incluyen procesos y representaciones. Las proposiciones no ofrecen una visión estática de la memoria sino que reflejan un análisis de los procesos de codificación, recuperación, etc. Las teorías proposicionales están ligadas al desarrollo de programas de Inteligencia Artificial. Los formalismos proposicionales empleados en las teorías no son idénticos, sino que se acomodan a reglas de construcción particulares y ligeramente diferentes entre sí, ya que la lógica es muy similar. 47 Quillian en 1969 inició los primeros trabajos sobre la memoria semántica, dando paso así a un período de casi una década en el que los teóricos de la memoria construyeron varios modelos y teorías proposicionales alternativas. Dos ejemplos de este tipo de teorías son las presentadas por Rumelhart, Norman y Lindsay (LNR) y por Anderson (ACT), las cuales son consideradas teorías de amplio espectro, es decir, que pretenden explicar varios procesos mentales como comprensión, generación de frases, memoria, razonamiento. El proyecto LNR considera que hay tres tipos de unidades psicológicas que pueden representarse en la memoria humana: conceptos, eventos y episodios. Los conceptos corresponden con ideas relativamente elementales. Un evento corresponde con una acción e incluye generalmente un escenario, actores y objetos. Los episodios son macrounidades compuestas de varios eventos interconectados. Una propuesta muy novedosa fue el introducir el concepto de "primitivos semánticos", que son los que permiten reflejar adecuadamente los componentes elementales del significado. Por su parte, Anderson en su proyecto ACT (1976, 1983) propone la teoría más reciente sobre el tema. Aunque tiene muchos aspectos en común con otras teorías, asume dos supuestos nuevos, a saber: 1) el procesamiento es paralelo. La exigencia de serialidad parece limitarse a tareas controladas y conscientes, mientras que los procesos automáticos sobreaprendidos se realizan de modo simultáneo. 2) Hay dos tipos de conocimiento: el declarativo y el procedimental. Esta dualidad corresponde con la distinción filosófica entre saber qué y saber cómo. El conocimiento declarativo es descriptivo y factual; se refiere a objetos y eventos. El conocimiento procedimental 48 tiene que ver con las destrezas ejecutivas dirigidas a la acción. Se puede poseer parcialmente, se adquiere de forma gradual por la práctica y es difícil de verbalizar 2.4.5 La aproximación conexionista al estudio de la memoria humana Como ya se ha dicho, la psicología cognitiva tiene alrededor de 50 años de haber nacido. Por lo mismo y como corresponde con cualquier ciencia joven, se esperan cambios e innovaciones conforme ésta progresa. Este es el caso de la aproximación del procesamiento distribuido en paralelo, también llamada "teoría conexionista" (McClelland, Rumelhart y el grupo POP, 1986) que ha venido a reformular postulados centrales del PHI y de la teoría del desarrollo cognitivo en la psicología cognitiva. Para mejor entender esta nueva aproximación es necesario revisar los dos siguientes conceptos: El concepto de fenómeno emergente holístico y el concepto de memoria distribuida. Un fenómeno holístico emergente puede entenderse como aquel fenómeno que es más que sólo la suma de sus componentes y cuyo comportamiento o manifestación depende de las condiciones contextuales específicas del momento, tanto como del tipo de relaciones interdependientes que se establezcan en ese momento. Una forma de ejemplificar este fenómeno es imaginar una caja completamente vacía en la que se introduce una molécula de aire. El comportamiento errático de dicha molécula por sí mismo difícilmente será de interés académico para alguien. Si se introducen una o tres moléculas más, el comportamiento errático de dichas moléculas puede ocasionalmente producir choques entre ellas y eso es todo. ¿Qué pasaría si se meten billones de partículas en la caja? Se observaría que dentro de la caja se ha formado una onda de aire. 49 No existía nada en la conducta de una o unas cuantas de estas moléculas chocando entre ellas que indicara la posibilidad de que cantidades masivas de ellas en la caja pudieran emerger un estado de auto-organización -la onda de aire. De igual forma, el cerebro posee alrededor de 1010 neuronas interactuando juntas y la actividad conjunta y masiva de estas neuronas, se supone genera estados emergentes de auto-organización. Dichos fenómenos emergentes constituyen la naturaleza de varias de nuestras funciones intelectuales como la conciencia (Calvin, 1998; Rumelhart et al., 1986), la memoria (Hinton, 1981) y la lengua (Sharkey, 1989; Balota, 1990). Por otra parte el concepto de memoria distribuida se refiere a la observación de que nuestras memorias no se encuentran localizadas en una zona especifica en nuestro cerebro. Mas bien se asume que éstas están almacenadas de una forma distribuida a lo largo de zonas neurales de nuestro cerebro. Como analogía tome de ejemplo la mantequilla en un pastel. No está en un lugar en específico sino distribuida en todo el pastel. Ahora bien, suponga que añadimos vainilla y azúcar, estos ingredientes se distribuirán y se mezclarán en el pastel dándole un sabor diferente. De forma análoga nuestras memorias se superponen de forma distribuida en una misma estructura neural en nuestro cerebro. Para estudiar dichas propiedades emergentes, investigadores en ciencia cognitiva han utilizado una clase de computadores "inspirados" en la fisiología del cerebro humano. A dichos computadores se les conoce como redes neurales y la Figura 2.8
Compartir