Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE PSICOLOGÍA REFORZAMIENTO DE ESTRUCTURAS CONDUCTUALES: UN ESTUDIO DE RESURGIMIENTO TESIS QUE PARA OBTENER EL TÍTULO DE LICENCIADO EN PSICOLOGÍA PRESENTA NATALIA FAVILA VÁZQUEZ TUTOR: DR. GUSTAVO BACHÁ MÉNDEZ REVISOR: DR. OSCAR VLADIMIR ORDUÑA TRUJILLO SINODALES: DR. ROGELIO ESCOBAR HERNÁNDEZ DR. ÁLVARO TORRES CHÁVEZ DR. OSCAR ZAMORA AREVALO Ciudad universitaria, D.F. Mayo de 2013 Proyecto de investigación financiado por PAPIIT IN303811-2 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. Agradezco el apoyo de la Universidad Nacional Autónoma de México y el financiamiento del proyecto PAPIIT IN 303811-2 A mis padres, por todo el cariño y apoyo. Agradecimientos A mis padres que ante todo me han brindado una vida llena de cariño y apoyo. Gracias por la total confianza en lo que hago. A mi hermana por quererme así como soy y darme un ejemplo a seguir de una gran persona. A mi abuela y abuelo (Q.E.P) por ser una parte muy importante de mi vida, siempre apoyándome y brindándome todo su cariño. Al Dr. Bachá, gracias por abrirme las puertas de su laboratorio y enseñarme tantas cosas. Le agradezco mucho todo. Siempre empujándome a pensar las cosas de una manera crítica y analítica. A mi revisor de tesis el Dr. Vladimir Orduña y a mis sinodales el Dr. Rogelio Escobar, el Dr. Oscar Zamora y el Dr. Álvaro Torres. Les agradezco sus valiosos comentarios que me ayudaron mucho en la realización de la tesis. A Ixel, gracias por todos los comentarios, pláticas y regaños para que saliera la tesis y por la amistad que me has dado durante mi estancia en el laboratorio. A Alma, quien ha compartido conmigo los llantos, enojos y buenos momentos de lo que es hacer una tesis. A mis compañeros de laboratorio: Rafa, Erikita, Hammurabi, Adriana y Toño por compartir conmigo experiencias en el laboratorio. A Marlene y Mou porque han estado conmigo desde hace tantos años! A pesar de que cada una está en carreras diferentes, me han acompañado durante todo el proceso. A Israel, porque fuiste el que vivió todo conmigo y supo escucharme con mucha paciencia. Gracias por el cariño que me has dado durante estos años. A mis compañeros del área: Nun, Paco, Dario, Ele, Marisol, Ale, M.J. y de la carrera: Adriana, Ile, Mary y Dulce, por compartir bonitas experiencias durante estos cinco años. A mis ratitas, porque sin ellas no habría tesis. Contenido Resumen…………………………………………………………………………………..…1 Introducción Secuencias de respuestas…………………………………………………………….3 Resurgimiento.………………………………………………………...………….....8 Resurgimiento de patrones conductuales.…………………….…………………....18 Planteamiento del problema.……………………………………………………………… 21 Método.…………………………………………………………………………………….23 Sujetos……………………………………………………………………………...23 Aparatos…………………………………………………………………………….23 Procedimiento………………………………………………………………………23 Diseño experimental………………………………………………………………..25 Resultados………………………………………………………………………………….26 Discusión…………………………………………………………………………………...44 Referencias…………………………………………………………………………………53 1 Resumen Un tema de interés en el análisis experimental de la conducta es el estudio de secuencias de respuestas como una operante. Al utilizar una secuencia como unidad conductual, el reforzador se hace depender no sólo de una respuesta, sino de una serie de ellas ejecutadas en un orden específico. Las secuencias pueden tener diferentes estructuras espacio- temporales y existen estudios que sugieren que la curva de aprendizaje varía de acuerdo a la estructura de la secuencia siendo reforzada. Por otro lado, se observa que patrones conductuales (secuencias) previamente establecidos y aparentemente extintos, pueden volver a presentarse en el repertorio conductual de los organismos. Un fenómeno que llama la atención es el resurgimiento de conductas extintas, el cual es estudiado principalmente con unidades de respuestas discretas. Un primer propósito del presente trabajo fue estudiar el efecto de la estructura de las secuencias reforzadas en la distribución de la conducta. Un segundo objetivo fue analizar si se observaría el resurgimiento de secuencias previamente reforzadas y si éste dependería de la estructura de las secuencias. Para ello, se llevó a cabo un experimento de tres fases. En la primera fase, se reforzaron dos secuencias con la misma estructura (ABB, ABA o AAB), quedando tres grupos de acuerdo a la estructura reforzada. En la segunda fase, se cambió a las secuencias reforzadas a una condición de extinción por reforzamiento de otra secuencia. En la tercera fase, ningún comportamiento fue reforzado. Los resultados mostraron que la manera en que el comportamiento de los sujetos se distribuyó dependió de la estructura de las secuencias reforzadas. Cada estructura reforzada produjo un patrón de conducta distintivo y repetitivo en estado estable. El reforzador no sólo impactó la fuerza de las secuencias de las cuales dependía su entrega, sino que también modificó la distribución de otras secuencias. Asimismo, de acuerdo a la asíntota de reforzamiento alcanzada en la primera fase, se encontró un gradiente de dificultad en función de la estructura reforzada, similar al reportado en otros estudios. En cuanto a resurgimiento, se encontró que aunque la estructura pudo haber influido, los datos no presentan suficiente orden. Otras variables como el número de sesiones o la frecuencia de reforzamiento en la primera fase pudieron haber afectado los resultados observados. 2 En el estudio de la conducta la decisión sobre como dividir el comportamiento en unidades de análisis ha sido una tarea difícil. Tradicionalmente, en el análisis experimental de la conducta se ha utilizado como unidad de análisis una operante discreta (como presionar una palanca o picar una tecla) sobre la cual se hace contingente el reforzamiento. Sin embargo, no hay razón para asumir que el efecto del reforzador se restringe a la respuesta discreta que lo produce. La demora entre algunas respuestas y el reforzador puede variar, pero no por ello el reforzador no actúa sobre ellas (Catania, 1971). Asimismo, las contingencias de reforzamiento no solo fortalecen aquellas operantes establecidas por el experimentador, sino que al mismo tiempo muchas otras conductas experimentan cambios en su fuerza (Schick, 1971). Entonces ¿Qué es lo que “fortalece” el reforzador? Aunque la contigüidad temporal entre la respuesta y el reforzador es fundamental, una sola respuesta podría ser parte de una unidad más grande de varias respuestas y al suponer que solo se fortalece la más contigua al reforzador, se podrían estar perdiendo otras relaciones ordenadas (Shimp, 1976). De acuerdo con Timberlake (1993),la conducta de los organismos puede ser clasificada en sistemas conductuales, los cuales están organizados alrededor de funciones importantes, como alimentación o reproducción. Diversos componentes de la conducta se van integrando en patrones cada vez más generales, hasta llegar a grandes sistemas. Los cambios en el ambiente pueden afectar tanto a los sistemas conductuales como a sus componentes particulares, generando múltiples efectos sobre la conducta. Entonces, el substrato sobre el cual el reforzamiento ejerce control no es una acción discreta, sino patrones de respuestas más generales. Timberlake sugirió que el modelo simple de reforzamiento respuesta-reforzador podría estar sobre-simplificando un fenómeno biológico mucho más complejo. No obstante, no cualquier patrón de comportamiento puede funcionar como una unidad de conducta, por ello, son necesarios algunos criterios para establecer qué es una unidad conductual. Operacionalmente, una unidad queda definida como aquella clase de conducta que se establece como requisito para la obtención del reforzador. La probabilidad de ocurrencia de una unidad conductual debe de ser afectada por sus consecuencias, es decir, debe de ser condicionable (Zeiler, 1983). Asimismo, se ha sugerido que una manera de definir unidades conductuales es demostrando que las relaciones funcionales entre ellas 3 y ciertos eventos del ambiente son similares a las encontradas con otras unidades (Branch, 1977). Secuencias de respuestas De acuerdo con lo anterior, muchas respuestas pueden ocurrir altamente organizadas, pero no por ello ser unidades condicionables. Operacionalmente, al usar secuencias de respuestas el reforzador depende no sólo de una respuesta, sino de una serie de respuestas en un orden temporal específico. Para demostrar que una secuencia de respuestas puede funcionar como una unidad, se debe probar que su probabilidad de ocurrencia depende de sus consecuencias. Grayson y Wasserman (1979) llevaron a cabo un experimento en el que reforzaron una secuencia de dos respuestas a dos operandos durante varias fases. Los resultados demostraron que una secuencia de dos respuestas es una propiedad diferenciable del comportamiento de los animales. En cada fase, la frecuencia de la secuencia reforzada aumentó y la de las otras secuencias disminuyó, lo que parece indicar que el reforzamiento fortaleció a la secuencia como una unidad. No obstante, un resultado interesante fue que al reforzar una secuencia heterogénea como izquierda (I) – derecha (D), una secuencia que se presentaba con mucha frecuencia, era aquella en la que ocurrían dos respuestas en el operando en el que las respuestas eran más contiguas al reforzamiento (en este caso DD). Se ha sugerido que esto ocurre porque al reforzar una secuencia como ID, el animal le asigna mayor crédito a la respuesta más contigua al reforzamiento, que en este caso sería la respuesta D (Catania, 1971). Este experimento apoya la idea de que las secuencias pueden funcionar como unidades funcionales y demuestra cómo el reforzamiento afecta la distribución de una variedad de secuencias. Otros investigadores han descubierto que algunos procesos -como igualación o el control de estímulos- encontrados con operantes discretas, también se dan de manera ordenada si se utilizan secuencias de respuestas como unidad de análisis (Fetterman & Stubbs, 1982; Wasserman, Deich, & Cox, 1984). En otra serie de estudios llamados de “elección libre”, se ha encontrado que aun cuando el procedimiento no requiere la organización de la conducta en unidades, los animales desarrollan secuencias de respuestas dominantes y altamente estereotipadas. Por ejemplo, Schwartz (1980) utilizó un procedimiento en el que palomas tenían que picar dos 4 teclas (I y D), cuatro veces cada una, en el orden que fuera, con el fin de mover una luz del extremo superior izquierdo al extremo inferior derecho de una matriz de focos de 5x5. Cada respuesta en la tecla I movía la luz en la matriz hacia el foco de la derecha. Cada respuesta en la tecla D movía la luz hacía el foco de abajo. Aunque había 70 posibles secuencias que llevaban a la obtención del reforzador, todos los sujetos desarrollaron solo una secuencia estereotipada que dominó su comportamiento. Cuando se cambiaron las contingencias de reforzamiento, la secuencia dominante mantuvo su organización interna. Esto invita a inferir que la secuencia dominante se volvió una unidad integrada. No obstante, un detalle importante de este estudio es que cada respuesta fue señalada por un estímulo discriminativo (el movimiento de las luces en la matriz de focos 5x5). Al quitar la matriz de luces, se encontró un aumento en la variabilidad y se perdió la organización interna de la secuencia dominante, lo que sugiere que la conducta estaba bajo el control de los estímulos discriminativos, no que se haya conformado en una unidad conductual. No obstante, Reid, Chadwick, Dunham y Miller (2001) encontraron que aún en un procedimiento de operante libre, reforzando dos secuencias de dos respuestas con la misma probabilidad y sin estímulos discriminativos, los sujetos desarrollaban una secuencia dominante altamente organizada. Al analizar los tiempos entre respuestas (TER), Reid et al. (2001) encontraron que los TER entre secuencias fueron más largos que los TER entre respuestas de una secuencia. Lo cual sugiere que la conducta se organizó en “conjuntos” de respuestas diferenciables de acuerdo a las contingencias de reforzamiento, apoyando la idea de que una secuencia se puede volver una porción diferenciable del flujo conductual de los animales. Aunque se han desarrollado estudios tanto con secuencias de respuestas señaladas por estímulos (cadenas), como sin ellos (secuencias), existe una diferencia en los procedimientos. En la investigación con cadenas, cada respuesta es señalada por un estímulo discriminativo o guía y no se permite la ejecución completa de las respuestas incorrectas, por lo que no es posible monitorear todas las posibles secuencias de respuestas. Esto imposibilita especificar si un patrón de respuestas se ha diferenciado de otro. En cambio con secuencias, se permite a los sujetos la ejecución de todas las posibles combinaciones de respuestas, aunque no sean la secuencia reforzada (Grayson & Wasserman, 1979). Los diferentes procedimientos con y sin estímulos discriminativos han 5 dado resultados diferentes en cuanto a la conformación de unidades conductuales. Se ha encontrado que si se entrenan cadenas, al quitar los estímulos guía la conducta se desordena (Schwartz, 1980). Esto podría implicar que aunque se realice muy bien la secuencia de respuestas bajo el control de estímulos, no significa que se haya aprendido a ejecutar la secuencia completa y que ésta se haya vuelto una unidad funcional. Con secuencias, dado que no hay estímulos discriminativos explícitos, es más factible afirmar que el individuo ha integrado una serie de respuestas individuales en una unidad más grande. Terrace (1984) mencionó que la propuesta de encadenamiento tiene problemas para explicar cómo se conforman secuencias de respuestas en preparaciones de encadenamiento simultáneo, en donde todos los estímulos y operandos son presentados al mismo tiempo. No obstante, responder en un operando podría tener por sí mismo propiedades discriminativas que influyeran en la probabilidad de las siguientes respuestas. Estructura en secuencias de respuestas El uso de secuencias de respuestas hace posible situaciones en las que la estructura de la conducta puede estudiarse directamente, manipulando el orden temporal de las respuestas de una secuencia. Por ejemplo, al utilizar secuencias de tres respuestas a dos operandos (I y D) existen ocho posibles maneras de realizar una secuencia (III, IDD, IDI, IID, DDD, DII, DIDy DDI), las cuales pueden ser agrupadas en cuatro estructuras que llamaremos: AAA, ABB, ABA y AAB. A cada estructura le corresponde una regla general de ejecución que aplica a dos secuencias. Por ejemplo, para la estructura ABA, la regla es alternar dos veces de operando, en este caso tanto la secuencia IDI como DID tienen la estructura ABA. En la Figura 1 se muestra un diagrama de cómo se conforman las ocho posibles secuencias de tres respuestas a dos operandos y su agrupación por estructura. Uno de los primeros estudios en los que se encontró un efecto diferencial según la estructura de las secuencias de respuestas fue hecho por Polidora (1963). Polidora entrenó a un grupo de ratas a realizar una serie de secuencias de respuestas con diferente estructura (manipulando el largo de la secuencia, el número de alternaciones entre operandos, etc.). Cuando las respuestas de las ratas alcanzaron un estado estable en las diferentes secuencias (i.e. durante tres sesiones consecutivas la tasa de respuestas y la proporción de secuencias correctas se mantuvieron constantes), se les inyectó la droga JB 329 en tres diferentes 6 dosis: 0.25, 0.5 y 1 mg/kg. Se encontró que el efecto de la droga dependía de una interacción entre la dosis y la estructura de la secuencia entrenada. El desempeño de secuencias “sencillas” (las más cortas y con menos alternaciones) fue menos afectado por las diferentes dosis administradas que el desempeño de secuencias “difíciles”. Polidora propuso que el uso de secuencias de respuestas provee un medio para estudiar un continuo de conducta compleja, y a partir de las diferentes estructuras planteó el siguiente gradiente de complejidad: 1) secuencias más cortas son más sencillas que secuencias más largas; 2) secuencias que requieren el regreso a un operando son más complejas; 3) las secuencias más complejas son las “secuencias de conteo” (e.g. AAB, porque implica “contar” dos respuestas en un mismo operando (A) y luego cambiar a otro operando (B)). No obstante, Polidora no llevó a cabo un estudio sistemático tomando en cuenta todas las posibles combinaciones de secuencias, sino que escogió aleatoriamente algunas de las posibles secuencias de dos, tres y cuatro respuestas, por lo que no pudo estudiar el panorama completo de todas las posibles estructuras. Más recientemente, Neuringer, Kornell y Olufs (2001) en un experimento sobre variabilidad con secuencias de tres respuestas a tres operandos también sugirieron que parece haber un gradiente de dificultad en la ejecución de secuencias. Estos autores realizaron una serie de experimentos en los que en una primera fase reforzaron variabilidad, de tal manera que una secuencia de respuestas recibía reforzamiento solo si había sido realizada con una frecuencia relativa menor o igual a .05 en los ensayos anteriores. En una segunda fase, se pasó a los sujetos a una condición de extinción, en donde ninguna Figura 1. Diagrama de todas las posibles secuencias de tres respuestas a dos operandos (izquierda y derecha) y su agrupación por estructura. 7 conducta fue reforzada. Se observó que durante la primera fase se desarrolló una jerarquía de ejecución, en donde secuencias de respuestas aparentemente más sencillas (como dar tres respuestas en un mismo operando) ocurrieron más frecuentemente que secuencias difíciles (como alternar las respuestas entre los tres operandos). Al pasar a una fase de extinción, aunque hubo un aumento en la variabilidad, la distribución de las posibles secuencias se mantuvo constante, es decir, las secuencias más probables durante reforzamiento, también lo fueron en extinción. Lo que se aprendió durante la fase de reforzamiento se vio reflejado en la fase de extinción. Asimismo, durante extinción las secuencias mantuvieron la integridad y organización interna que habían desarrollado durante el reforzamiento. Los resultados de Neuringer et al. (2001) sugieren que las contingencias pudieron haber estado actuando a nivel de las secuencias completas, en vez de en las respuestas individuales que componen a las secuencias. No obstante, Reid, Dixon y Gray (2008) mencionaron que esto implicaría que cada una de las 27 posibles secuencias de tres respuestas a tres operandos se volvió una unidad con fuerza independiente, lo cual resulta muy poco probable. Es posible que algunas de las secuencias más frecuentes se conformaran en unidades conductuales, pero algunas de las secuencias fueron ejecutadas muy poco y casi no fueron reforzadas. Al re-analizar los datos, estos autores encontraron que la primera respuesta parecía depender únicamente de los estímulos que indicaban el fin del ensayo anterior, tales como la entrega de comida o el apagón de luces (cuando la secuencia emitida había sido incorrecta). La segunda y tercera respuesta parecen haber dependido únicamente del operando en que había sido ejecutada la respuesta anterior, el operando seleccionado dos respuestas antes no parece haber influido en la respuesta actual. Es por ello que Reid et al. (2008) sugieren que la distribución de secuencias observada en el experimento de Neuringer et al. (2001) se pudo haber debido a procesos a nivel de las respuestas individuales más que a nivel de las secuencias como unidades. Por su parte, Robles (2012) observó que la estructura es una variable importante en el aprendizaje de una nueva secuencia de respuestas. Robles (2012) estudió directamente la estructura reforzada de secuencias de tres respuestas en dos operandos en un experimento de dos fases. En la primera fase, se reforzó una secuencia de tres respuestas con una determinada estructura, quedando cuatro grupos: AAA, ABB, ABA y AAB, dependiendo de la estructura de la secuencia reforzada. En la segunda fase, se reforzó una secuencia 8 diferente, de manera que la nueva secuencia reforzada difiriera de la anterior en la primera o última respuesta de la secuencia. Por ejemplo, si en la primera fase se había reforzado la secuencia IID, en la segunda fase a la mitad de los sujetos se les reforzaba DID (cambio en la primera respuesta) y a la otra mitad III (cambio en la última respuesta). Sus resultados mostraron que la velocidad de adquisición y la asíntota de reforzamiento alcanzada en una fase de estado estable, dependieron de la estructura reforzada en ambas fases, independientemente de en qué respuesta fueran diferentes la primera de la segunda secuencia entrenada. Asimismo, sus resultados también sugieren un gradiente de dificultad en función de la estructura de la secuencia reforzada. De acuerdo a sus resultados la estructura AAA es la más sencilla dado que las respuestas alcanzan una asíntota de reforzamiento obtenido alta en poco tiempo; y la estructura AAB es la más difícil, ya que las respuestas alcanzan una asíntota de reforzamiento obtenido baja y tardan comparativamente más tiempo en llegar a este nivel. Este gradiente concuerda a grandes rasgos con lo reportado tanto por Polidora (1963) como por Neuringer et al. (2001). Dada la evidencia experimental, parecería que hay razón para tomar a una secuencia de respuestas como unidad de análisis. Al reforzar una sola respuesta, la variabilidad que se puede llegar a estudiar está limitada por los parámetros físicos de la respuesta. En cambio, al utilizar secuencias de respuestas se puede cuantificar el conjunto de todas las posibles secuencias de respuestas y con ello estudiar la distribución y variabilidad de la conducta de manera sistemática. Asimismo, al usar unidades conductuales pequeñas podríamos estar limitando la generalidad de nuestras leyes conductuales (Shimp, 1976). Al usar las secuencias como unidad de análisis, es posible cuantificar cómo el reforzador afecta no sólo a la secuencia sujeta a reforzamiento, sino a todas las posibles secuencias. Resurgimiento El análisis de cómo las condicionesde reforzamiento pasadas interactúan con la conducta en el presente, se ha realizado en estudios que investigan los efectos de programas de reforzamiento usados previamente sobre la conducta actual. Uno de los métodos generales para estudiar la historia de reforzamiento consta de tres fases. En la primera, una respuesta particular es establecida. En la segunda, la tasa de respuesta mantenida inicialmente es reducida a cero. En la tercera, se realiza una prueba de persistencia de la 9 conducta (Lieving & Lattal, 2003). Existe una literatura creciente sobre el papel de estas variables que se describen como históricas, ya que se ha observado que en diversas instancias, patrones conductuales previamente establecidos y aparentemente extintos, vuelven a presentarse en el repertorio conductual. Se conocen varios fenómenos de reemergencia de la conducta, tales como: renovación, restablecimiento, recuperación espontánea y resurgimiento. Estos fenómenos han sido de importancia en el análisis experimental de la conducta ya que han dado evidencia de que lo aprendido en un momento puede sobrevivir a tratamientos de extinción, y que la disminución en la tasa de respuesta por el retiro del reforzador, no significa que el aprendizaje original haya sido borrado (Bouton & Peck, 1989). Aunque estos fenómenos comparten efectos similares, ya que en todos se observa la re-emergencia de conductas extintas, los procedimientos que se han empleado para su estudio difieren entre sí. Con excepción de resurgimiento, los demás fenómenos han sido estudiados principalmente con procedimientos de condicionamiento clásico (Bouton, Winterbauer, & Todd, 2012; Bouton, 2002), no obstante, también existen estudios en los que se ha usado el procedimiento operante (Nakajima, Tanaka, Urushihara, & Imada, 2000). Específicamente, en renovación, la reaparición de una conducta extinta ocurre por un cambio en el contexto en el que se llevó a cabo su extinción. En restablecimiento, la respuesta extinta regresa como resultado de la presentación de reforzadores independientes de la respuesta después de extinción. En recuperación espontánea, la respuesta regresa si se deja pasar un tiempo entre sesiones de extinción. En resurgimiento, la respuesta extinta reaparece si un comportamiento alternativo que estaba siendo reforzado, deja de serlo (Lattal, St. Peter, & Escobar, 2013). En la Tabla 1 se muestran con más detalle los diferentes procedimientos de estos fenómenos; sin embargo, no queda claro en la literatura si estas diferencias de procedimiento implican que el mecanismo subyacente a cada fenómeno es diferente, o si es posible hablar de un mecanismo general de recuperación de la respuesta. Dentro de estos fenómenos, uno que ha llamado la atención de varios investigadores ha sido el resurgimiento. De acuerdo con Epstein (1983) cuando en una situación dada, un comportamiento que recientemente estaba siendo reforzado deja de serlo, conductas que en 10 el pasado fueron reforzadas bajo circunstancias similares tienden a resurgir. Resurgimiento es un fenómeno robusto que se ha replicado en varios experimentos usando diferentes tipos de respuestas y en una variedad de especies que va de ratas a humanos (Epstein, 1983; Wilson & Hayes, 1996; Cleland, Foster, & Temple, 2000). En los primeros estudios sobre resurgimiento, se hizo una comparación con el concepto de regresión Freudiano. Sanders (1937) basándose en las propuestas de Freud, encontró que al colocar ratas bajo situaciones de alto estrés, éstas tendían a regresar a patrones conductuales que en el pasado habían sido exitosos. Regresión se refiere a la reaparición en situaciones emocionales de comportamientos que fueron establecidos durante la niñez. Resurgimiento es cualquier comportamiento, ocurrido en cualquier Tabla 1 Fenómenos de recuperación de la respuesta Fenómeno Definición Método general Renovación Recurrencia de una conducta extinta que ocurre si después de extinción se vuelve a presentar el contexto en que se adquirió la conducta u otro contexto. Fase 1Adquisición en contexto A Fase 2 Extinción en contexto B Fase 3 Exposición al contexto A o C Restablecimiento Recurrencia de una conducta extinta que ocurre cuando se presentan reforzadores independientes de la respuesta después de extinción. Fase 1 Adquisición en contexto A Fase 2Extinción en contexto A Fase 3 Entrega de reforzadores independientes de la respuesta en contexto A Recuperación espontánea Recurrencia de una conducta previamente reforzada al inicio de periodos sucesivos de extinción. Fase 1 Adquisición en contexto A Fase 2 Extinción en contexto A Fase 3 Intervalo de tiempo en contexto B Fase 4 Extinción en contexto A Resurgimiento Recurrencia de una conducta extinta que ocurre cuando un comportamiento actual deja de ser reforzado. Fase 1 Adquisición de conducta 1 Fase 2 Extinción de conducta 1 y adquisición de conducta 2 Fase 3 Extinción de conducta 2 11 momento del pasado, que puede volver a presentarse, no se limita a comportamientos establecidos durante la niñez. Asimismo, regresión se refiere a un mecanismo psicodinámico, mientras que resurgimiento fue definido puramente de manera descriptiva por Epstein (1985). Por último, regresión suele ser entendida como una respuesta ante situaciones de castigo, en vez de simplemente no-reforzamiento. El método para el estudio de resurgimiento consta de tres fases: en una primera fase un comportamiento operante es reforzado; en una segunda fase, mientras se extingue el primer comportamiento, una segunda respuesta alternativa es entrenada y reforzada; en la última fase, se realiza una prueba de re-emergencia o persistencia de la primera conducta mediante la extinción del segundo comportamiento. De acuerdo con Lieving y Lattal (2003) las condiciones que evocan resurgimiento podrían estar en un continuo de disponibilidad del reforzador, en donde a menor disponibilidad mayor resurgimiento. No obstante, estos autores mencionan que metodológicamente el tipo de extinción para realizar una prueba de resurgimiento debe ser mediante el retiro completo del reforzador, ya que si se extingue mediante la entrega independiente de reforzadores se trata de restablecimiento y si se extingue mediante la entrega de reforzadores dependientes de la respuesta, se podría tratar de inducción. Dentro del paradigma de condicionamiento operante, una de las primeras demostraciones de resurgimiento fue hecha por Leitenberg, Rawson y Mulick (1975). Estos investigadores estaban interesados en observar si al extinguir una conducta y al mismo tiempo reforzar otra, la extinción de la primera sería más rápida y eficiente que si era extinguida solamente mediante el retiro del reforzador. Lo que encontraron fue que la respuesta previamente entrenada dejaba de ocurrir más rápido al ser extinta mediante el reforzamiento de un comportamiento alternativo; sin embargo, este efecto resultó ser transitorio, pues al retirar el reforzador de la conducta alternativa, la respuesta que ya estaba extinta resurgía. El tema central del estudio de Leitenberg et al. (1975) fue la extinción, el resurgimiento de una conducta extinta fue más bien una observación incidental, y por ello no existieron todos los controles experimentales necesarios. Epstein (1983) abordó este problema diferenciando resurgimiento de un efecto de frustración o de la variabilidad típicamente observada durante extinción (Antonitis, 1951). Para distinguir entre resurgimiento y otros efectos, Epstein incluyó un operando extra en la cámara 12 experimental, en el cual las respuestas nunca recibieron reforzamiento. Si las respuestas observadas fueran un efecto de frustración o variabilidadaleatoria, los sujetos del estudio responderían azarosamente tanto al operando utilizado en el experimento, como al operando extra. El experimento llevado a cabo por Epstein (1983) constó de cuatro fases. En la primera fase, se reforzó la conducta de picar una tecla en un programa de intervalo variable (IV) en un grupo de palomas y se les mantuvo en éste hasta que alcanzaron un estado estable. En la segunda fase, se extinguió la conducta de picar la tecla, durante un periodo que varió de 1 a 12 sesiones. Una vez que los sujetos habían pasado por el periodo de extinción de la primera respuesta, en la tercera fase se reforzó una conducta alternativa que fuera topográficamente incompatible con picar la tecla (e.g. aletear o mover la cabeza de arriba abajo), hasta que obtuvieron 20 reforzadores. En la última fase, se retiró todo reforzamiento. Se encontró que a pesar de que algunas palomas estuvieron expuestas hasta por 12 sesiones consecutivas a extinción del picoteo a la tecla, en todas se encontró resurgimiento de esta última conducta. Asimismo, los resultados mostraron que el picoteo resurgió sólo en el operando correlacionado con una historia de reforzamiento previa y no en el otro. De esta manera, Epstein demostró que resurgimiento no sólo es el resultado de variabilidad aleatoria u otros efectos de extinción, sino que es un fenómeno por sí mismo y que vale la pena estudiar. Variables que afectan el resurgimiento Se han realizado varias investigaciones para conocer cuáles son las variables de las que depende el grado de resurgimiento encontrado en diferentes preparaciones. Se pueden realizar diversas manipulaciones en las tres fases del proceso de resurgimiento descritas en un inicio, obteniendo diferentes resultados. A continuación se mencionan algunas de las variantes que se han realizado en la fase de formación de la historia de reforzamiento. Las contingencias que prevalecen durante la fase de formación de la historia de reforzamiento (Fase 1) afectan la naturaleza y magnitud del resurgimiento. Dos variables que han probado ser importantes son el programa de reforzamiento y el tiempo de exposición a éste durante la primera fase. Winterbauer, Lucke y Bouton (2012) realizaron un experimento para observar cuál era el papel de estas variables. En la primera fase tuvieron cuatro grupos de sujetos, a dos de ellos se les sometió a un programa de razón 13 aleatoria (RA), y a los otros dos a un programa de IV. De los dos grupos en cada programa, uno de ellos estuvo en la primera fase durante 4 sesiones y el otro durante 12. En la segunda fase, se extinguió el primer comportamiento mediante el reforzamiento de una conducta alternativa. En la tercera fase, se realizó la prueba de resurgimiento de la conducta mediante extinción. Los resultados mostraron que el tipo de programa tuvo un efecto en el desempeño durante la primera fase, ya que los sujetos en el programa de razón tuvieron tasas de respuestas más altas que los sujetos en el programa de intervalo. Asimismo, a mayor número de sesiones de entrenamiento se observó mayor tasa de respuesta y de reforzamiento obtenido. El patrón de respuestas desarrollado en la primera fase se vio reflejado en la fase de resurgimiento. Los sujetos que en la primera fase estuvieron en el programa de razón con una historia de reforzamiento larga, mostraron mayor grado de resurgimiento que los sujetos que estuvieron en el programa de intervalo con una historia de reforzamiento corta. Los autores sugieren que la tasa de respuestas al final de la fase uno, más que la tasa de reforzamiento obtenido, es el mejor predictor de la magnitud del resurgimiento. Reed y Morgan (2007) de acuerdo con lo mencionado por Winterbauer et al. (2012), también proponen que la tasa de respuesta adquirida en la primera fase es lo que se ve reflejado en resurgimiento. Estos autores llevaron a cabo un experimento en el que en la primera fase entrenaron a ratas en un programa múltiple RA, intervalo aleatorio (IA). Esto llevó a una tasa de respuestas alta en el componente RA y a una tasa de respuestas baja en el componente IA. Mediante un procedimiento de acoplamiento intra-sujeto se igualaron las tasas de reforzamiento de ambos componentes. Este entrenamiento inicial fue seguido por una segunda fase en la que se expuso a las ratas a un programa múltiple IF-60 s, IF-60 s. En una última fase, todo comportamiento dejó de ser reforzado. Se encontró que a pesar de que en la primera fase se mantuvo la tasa de reforzamiento igual para las dos conductas, la conducta con la tasa de respuesta más alta era la que invariablemente mostraba mayor resurgimiento y mayor resistencia al cambio. A partir de estos resultados los autores proponen que es posible que el patrón conductual generado en la primera fase se comporte como una unidad integrada y que lo que resurge en la tercera fase es esta unidad conductual previamente aprendida. 14 No obstante, existen investigaciones que contradicen lo propuesto por Reed y Morgan (2007) y Winterbauer et al. (2012). Por ejemplo, Podlesnik y Shahan (2009, 2010) han encontrado que el resurgimiento depende más de la tasa de reforzamiento que de la tasa de respuesta de la primera fase. Estos autores observaron este efecto en una serie de experimentos de resurgimiento en donde en la primera fase manipularon la tasa de reforzamiento de dos componentes de un programa múltiple. En uno de los componentes los sujetos recibieron reforzadores en un programa de IV 30 s, mientras que en el otro, además de recibir estos reforzadores, recibieron reforzadores independientes de la respuesta. Así, uno de los componentes quedó asociado a una tasa de reforzamiento “rica” y el otro a una “pobre”. En la segunda fase se reforzó otra respuesta y se extinguió el primer comportamiento asociado a ambos componentes. Finalmente, en la última fase se implementó extinción. Los resultados mostraron que en la primera fase, los sujetos tuvieron tasas de respuestas más bajas en el componente “rico” que en el componente “pobre”. En las subsecuentes dos fases, se encontró mayor resistencia al cambio y mayor resurgimiento en el componente “rico” en reforzamiento, esto a pesar de que en la primera fase la tasa de respuesta asociada a este componente fue la más baja. Los autores proponen que las condiciones de reforzamiento de la primera fase tienen mayor impacto sobre resurgimiento que la tasa de respuesta, incluso si los reforzadores son presentados de manera independiente a la conducta objetivo. Hay que tener en cuenta que Podlesnik y Shahan (2010) mostraron sus resultados en términos de proporciones y no en valores absolutos, lo cual puede hacer una diferencia en cuanto a la interpretación de los datos. Generalmente, en la primera fase de resurgimiento sólo se refuerza un comportamiento sobre un operando, que más adelante se espera resurja; sin embargo, de acuerdo con Da Silva, Maxwell y Lattal (2008) el uso de un programa concurrente permite la evaluación de resurgimiento diferencial. Estos autores realizaron un experimento en el que reforzaron dos conductas con un programa concurrente IV-1 min, IV-6 min, generando tasas de respuestas diferentes, pero manteniendo la tasa de reforzamiento igual para ambas en la primera fase. Después llevaron a cabo las siguientes dos fases necesarias para analizar resurgimiento. Con respecto a los datos absolutos, el grado de resurgimiento se relacionó con el patrón y tasa de respuesta observados en la primera fase y no con la tasa de reforzamiento adquirida. La conducta que en la primera fase había mostrado una tasa de 15 respuesta alta tuvo mayor resurgimiento que la que había mostrado una tasa de respuesta baja. No obstante, al realizar el análisis en términos de proporciones con respecto a la primera fase, no se encontraron diferencias en elgrado de resurgimiento. Tomando en cuenta todos los resultados, los autores sugieren que el resurgimiento podría ser una función combinada de tasa de reforzamiento (la cual determina la probabilidad de ocurrencia) y tasa de respuesta (la cual determina la naturaleza estructural del resurgimiento, tal como tiempos entre respuestas). Dada las diferencias encontradas en los resultados según la medida utilizada, queda la pregunta de cuál es la mejor manera de presentar los datos, en valores absolutos o en proporciones. Por último, cabe mencionar que se han estudiado otras variables de resurgimiento como la topografía conductual (Leitenberg et al., 1975) o el tipo de reforzador empleado (Winterbauer et al., 2012), pero ninguno ha resultado en diferencias significativas en el grado de resurgimiento observado. Explicaciones del resurgimiento Han surgido varias explicaciones acerca de los procesos subyacentes al fenómeno de resurgimiento, de las cuales en la siguiente sección se revisan tres. Una de las primeras explicaciones fue la hipótesis de prevención de respuestas (Rawson, Leitenberg, Mulick & Lefebvre, 1977). Esta hipótesis sugiere que al reforzar una conducta alternativa durante la extinción de otra, se impide al animal realizar físicamente la respuesta que está en la condición de extinción. La respuesta es remplazada tan rápidamente por la nueva conducta que realmente nunca pasa por extinción, ya que los sujetos no experimentan suficientes asociaciones entre la respuesta y el no-reforzamiento. Entonces la respuesta original nunca se extingue, solamente es inhibida por el reforzamiento de otra conducta. Al interrumpir el reforzamiento de la respuesta alternativa, la original vuelve a estar disponible y por ello se observa resurgimiento. A pesar de que esta hipótesis parece predecir de manera adecuada algunos resultados, tiene problemas para explicar otros. Como ya se había mencionado, su principal propuesta es que resurgimiento se debe a que el primer comportamiento nunca es realmente extinguido. No obstante, existen experimentos en los que la primera conducta es explícitamente extinguida antes de pasar a la segunda fase y aun así se observa resurgimiento (Epstein, 1983; Lieving & Lattal, 2003). 16 Por otro lado, el resurgimiento también ha sido abordado desde la perspectiva de momentum conductual. La teoría de momentum ha dado un marco conceptual para entender cómo diferentes condiciones de reforzamiento afectan la resistencia al cambio de una conducta. Al pasar sujetos de una fase estable de reforzamiento a una condición de extinción, la disminución en la tasa de respuesta provee una medida de resistencia al cambio de una conducta. Un hallazgo general de momentum conductual es que la conducta más resistente al cambio es aquella que está asociada a estímulos discriminativos con tasas de reforzamiento altas (i.e. la relación relevante en resistencia al cambio es la de estímulo discriminativo-reforzador). Es así que resistencia al cambio ha sido interpretada como un reflejo de reforzamiento y como una medida de fuerza de la respuesta (Podlesnik & Shahan, 2010). Podlesnik y Shahan (2009) encontraron que varios efectos de recuperación de la respuesta dependen de la relación estímulo discriminativo-reforzador, de la misma manera que resistencia al cambio. En una serie de experimentos, estos autores observaron que mientras más resistencia al cambio mostraba una conducta, mayor recuperación de la respuesta se observaba en procedimientos de restablecimiento, resurgimiento y renovación. Los resultados de sus experimentos sugieren que el grado de recuperación de una respuesta que se puede llegar a observar, depende de la tasa de reforzamiento en la presencia de un estímulo discriminativo en la primera fase, es decir, de la relación pavloviana estímulo- reforzador. Parecería que la resistencia al cambio y el resurgimiento dependen de las mismas variables, y por lo tanto deberían de ser impactados de maneras similares. Por último, se ha propuesto que el resurgimiento puede ser explicado en términos de señales contextuales. De acuerdo con Bouton (2002), en todos los fenómenos donde se puede observar reemergencia de la conducta, existe una falla en generalizar lo aprendido en el contexto de extinción a otros contextos. Al pasar a extinción a una respuesta que primero había sido asociada con reforzamiento, se le deja con dos asociaciones (reforzamiento y no- reforzamiento) y por lo tanto se vuelve ambigua. Entonces el contexto se vuelve fundamental, ya que señala la ocasión en la que se debe recuperar la relación respuesta- reforzador. El ejemplo más claro de esto, es el fenómeno de renovación, en el cual el organismo falla en recuperar la asociación de extinción fuera del contexto en que ésta se dio (Bouton & Peck, 1989). A partir de esto, Winterbauer y Bouton (2010) han propuesto que resurgimiento puede ser entendido como otro ejemplo de renovación. De acuerdo con 17 estos autores, en el procedimiento para observar resurgimiento hay un claro cambio en los estímulos contextuales en la transición de fase a fase (considerando que la propia conducta de los individuos, el paso del tiempo y la presencia o ausencia de reforzadores pueden funcionar como estímulos discriminativos de un contexto). En específico, durante la segunda fase del procedimiento de resurgimiento, la presencia del segundo comportamiento y la recompensa asociada a él funcionan como estímulos de un contexto en donde la primera conducta no es reforzada. Al pasar a la tercera fase de extinción, se eliminan estos estímulos discriminativos (el segundo comportamiento y el reforzador), cambiando el contexto en el que se extinguió la primera conducta. Como se mencionó anteriormente, al sacar a los animales del contexto de extinción, la conducta que ya estaba extinta reaparece y por ello se observa resurgimiento, que de acuerdo con esta perspectiva sería un caso más de renovación. Esta explicación de resurgimiento como renovación, es compatible con la explicación de extinción que propone que la respuesta deja de ocurrir cuando el animal no generaliza entre condicionamiento y extinción (Capaldi, 1994). De esta manera, para el caso de resurgimiento se puede predecir que si se generalizan los contextos entre la segunda y la tercera fase, habrá poco resurgimiento. Winterbauer y Bouton (2010, 2012) han encontrado evidencia de que al utilizar programas de reforzamiento con tasas de reforzamiento bajas en la segunda fase, se observa menos resurgimiento. Este resultado podría deberse a que los animales generalizan de la segunda fase a extinción, ya que el cambio en el contexto no es claro en cuanto a los reforzadores entregados. Aunque parece una explicación que podría dar cuenta de por qué sucede resurgimiento, Winterbauer et al. (2012) realizaron un estudio en donde los datos no apoyan completamente esta hipótesis. Estos investigadores realizaron un experimento en donde el primer y el segundo comportamiento fueron entrenados con diferentes reforzadores, pellets regulares y de sacarosa. Esta manipulación debió haber agregado un estímulo discriminativo a cada contexto, haciendo los cambios de fase a fase más diferenciables y con ello, debería observarse mayor grado de resurgimiento. Sin embargo, se encontró que al usar diferentes tipos de reforzadores para cada fase, el grado de resurgimiento obtenido era comparable al grado de resurgimiento que se observa si se usa el mismo tipo de reforzador en ambas fases. Este resultado no concuerda con la idea de que resurgimiento es un tipo de renovación. 18 Resurgimiento de patrones conductuales Más allá de la evaluación general de resurgimiento en función de las contingencias pasadas, las investigaciones sobre las variables y mecanismos mencionadas previamente se han centrado principalmenteen el análisis de respuestas discretas. El estudio de la conducta vista como un patrón de respuestas y no como una sola respuesta parece importante, ya que se ha encontrado que no todos los principios que aplican a respuestas simples, también lo hacen a patrones conductuales más complejos (Reid et al., 2001). De acuerdo con esto, Canҫado y Lattal (2011) analizaron el resurgimiento de patrones de respuestas temporalmente organizados. Se llevó a cabo un experimento en donde en la primera fase se reforzaron las respuestas de palomas bajo un programa múltiple de dos componentes (IV e intervalo fijo (IF)). En la segunda fase se reforzó otra conducta, y en la tercera se pasó a extinción. En la primera fase, en el componente IV el patrón conductual observado fue una tasa de respuesta constante, mientras que en el IF se observó un patrón de festoneo. Las propiedades estructurales adquiridas en la primera fase se mantuvieron al momento de resurgir, es decir, no sólo resurgió la respuesta entrenada, sino también el patrón temporal de respuestas desarrollado. Si en la primera fase se adquirió un patrón de festón, en la fase de resurgimiento se volvía a presentar. Estos resultados concuerdan con lo propuesto por Da Silva et al. (2008), los cuales utilizando como unidad de análisis una respuesta simple, sugirieron que las propiedades estructurales de la conducta establecida en la primera fase -tales como tiempo entre respuestas- se ven reflejadas en resurgimiento y no la respuesta sola. Aunque un análisis molecular como el realizado por Canҫado y Lattal (2011) permite un estudio más detallado de la conducta, el uso de secuencias de respuestas hace posible estudiar situaciones en las que la estructura de la conducta es directamente manipulable (Neuringer et al., 2001; Robles, 2012). Asimismo, el uso de secuencias de respuestas permite observar cómo patrones conductuales complejos se conforman en unidades conductuales (Grayson & Wasserman, 1979). El procedimiento de resurgimiento aplicado a secuencias de respuestas ha sido utilizado como una demostración de que el reforzamiento llevado a cabo durante la primera fase fortalece a la secuencia de respuestas como unidad, de manera que ésta resurge en una tercera fase de manera íntegra. Bachá-Méndez, Reid y Mendoza-Soylovna (2007) llevaron 19 a cabo un experimento en el que encontraron que una secuencia de dos respuestas a dos operandos resurge como una unidad. El experimento constó de 4 fases. En la primera fase se reforzó una secuencia heterogénea (ID o DI). En la segunda y tercera fase se reforzó una secuencia homogénea (II o DD) diferente para cada fase. En la última fase se reforzó otra secuencia heterogénea. En las fases 1 y 4 en las que una secuencia heterogénea estaba siendo reforzada, se observó que el error más frecuente fue repetir la respuesta más cercana a la entrega del reforzador (e.g. si la secuencia ID estaba siendo reforzada, una secuencia errónea muy frecuente era DD). Esto parece haber sido controlado por procesos a nivel de respuesta, ya que la posición ordinal de las respuestas en la secuencia afectó diferencialmente la producción de los errores. En cuanto a resurgimiento, todos los sujetos mostraron resurgimiento íntegro de la secuencia heterogénea entrenada en la primera fase, lo que parece indicar que resurgimiento es un proceso que operó a nivel de la secuencia como unidad. Estos resultados sugieren que los sujetos emitieron la secuencia reforzada como si fuera una unidad conductual, afectada por las contingencias como un todo. No obstante, fue posible observar tanto procesos a nivel de respuesta como a nivel de secuencia operando simultáneamente, dentro de una unidad conductual claramente establecida. El resurgimiento de secuencias como una unidad íntegra también ha sido encontrado en secuencias de respuestas más largas. Sánchez-Carrasco y Nieto (2005), utilizando secuencias de tres respuestas a dos operandos observaron que éstas resurgían de manera íntegra en un procedimiento de resurgimiento. Asimismo, Reed y Morgan (2006) también usando secuencias de tres respuestas a dos operandos, encontraron evidencia de un efecto de primacía y recencia. En el estudio realizado por estos autores, seis ratas fueron entrenadas a realizar tres secuencias heterogéneas de manera consecutiva y posteriormente, se pasó a una condición de extinción. Los resultados mostraron que en extinción, la secuencia de respuestas más frecuente fue la última en haber sido entrenada (efecto de recencia). La segunda secuencia más frecuente fue la primera secuencia entrenada (efecto de primacía). Los efectos de primacía y recencia operaron sobre las secuencias como un todo, y no en cada uno de sus elementos por separado. En los estudios de Sánchez-Carrasco y Nieto (2005) y Reed y Morgan (2006) no se tomó en cuenta que en secuencias de tres respuestas a dos operandos existen cuatro estructuras posibles (Robles, 2012). Dado que se conoce que de acuerdo a la estructura hay 20 un gradiente de dificultad de adquisición, esto pudo haber influido en los resultados observados. De esta forma, un análisis en función de la estructura de las secuencias reforzadas parece importante. 21 Planteamiento del problema Un tema de interés en el análisis experimental de la conducta ha sido el estudio de secuencias de respuestas como operantes. Varios trabajos han encontrado que al entrenar secuencias de respuestas, éstas pueden ser integradas en unidades conductuales (Grayson & Wasserman, 1979; Reid et al., 2001), lo que las hace una unidad de análisis válida para el estudio de diversos fenómenos. El uso de secuencias de respuestas hace posible estudiar situaciones en las que la estructura de la conducta es directamente manipulable. Por ejemplo, al utilizar secuencias de tres respuestas a dos operandos existen ocho posibles maneras de realizar una secuencia, las cuales pueden ser agrupadas en 4 estructuras (AAA, ABB, ABA y AAB) de acuerdo al orden temporal de las respuestas de la secuencia (véase la Figura 1). Se ha encontrado que la estructura es una variable importante en la adquisición de una secuencia. Asimismo, algunos estudios sugieren que existe un gradiente de dificultad según la estructura de la secuencia reforzada, esto de acuerdo a la velocidad de adquisición y a la asíntota de reforzamiento alcanzada en fases de estado estable (Neuringer et al., 2001; Robles, 2012). Por otro lado, se ha observado que cuando una conducta que estaba siendo efectiva para obtener reforzadores deja de serlo, comportamientos que fueron exitosos en el pasado son los más probables en aparecer (Epstein, 1983). Este fenómeno recibe el nombre de resurgimiento y se ha observado en una variedad de especies, que va de ratas a humanos (Wilson & Hayes, (1996); Winterbauer et al., 2012). El método general para estudiar resurgimiento consta de tres fases: 1) reforzamiento de la conducta 1, 2) extinción de la conducta 1 y reforzamiento de la conducta 2 y 3) extinción de la conducta 2. Con este procedimiento, la conducta aprendida en la primera fase, que generalmente es una sola respuesta discreta, se espera resurja en la tercera fase de extinción. En la mayoría de los estudios de resurgimiento se ha utilizado como unidad de análisis una respuesta discreta. Existen pocos trabajos en los que se haya estudiado resurgimiento de secuencias de respuestas. No obstante, Bachá-Méndez et al. (2007) encontraron que al reforzar una secuencia de dos respuestas a dos operandos en una primera fase, se puede observar resurgimiento de ésta como una unidad integrada. En el presente trabajo se realizó un experimento con las tres fases propuestas por Epstein (1983) para observar resurgimiento, pero como unidad conductual se utilizaronsecuencias de respuestas. Un primer propósito 22 fue estudiar cómo los animales distribuyen su comportamiento al reforzarse dos secuencias de tres respuestas con la misma estructura en una primera fase. Un segundo propósito fue analizar si se observaría resurgimiento de los patrones conductuales desarrollados en la primera fase. Los objetivos específicos fueron: -Analizar cómo los animales distribuyen su conducta al reforzarse dos secuencias de tres respuestas con la misma estructura. -Estudiar si la estructura de las secuencias reforzadas es una variable importante en la manera en que los animales ordenan su comportamiento. -Analizar si al reforzar las dos secuencias correspondientes a cada estructura se encuentra un gradiente de dificultad en función a ésta. -Observar si en la tercera fase hay resurgimiento de los patrones conductuales establecidos en la primera fase. -Observar si la estructura reforzada en la primera fase es una variable importante en el grado de resurgimiento presentado en la tercera fase. -Analizar si la distribución de la conducta establecida al final de la primera fase se mantiene durante la prueba de resurgimiento. 23 Método Sujetos Se utilizaron nueve ratas hembras de la cepa Wistar experimentalmente ingenuas, con aproximadamente 4 meses de edad al inicio del experimento. Fueron mantenidas al 80% de su peso ad libitum durante el transcurso de todo el experimento y se alojaron en cajas habitación individuales con acceso libre a agua. Las sesiones experimentales se llevaron a cabo 5 días por semana. Dos horas después de cada sesión se alimentó a las ratas para mantener su peso corporal. Aparatos Se utilizaron cuatro cámaras experimentales de condicionamiento operante (MED Associates), cada una de ellas ubicada dentro de una caja sono-amortiguadora. Todas las cajas estuvieron conectadas a una interfase MED Associates que controló cada sesión experimental. El techo y las paredes laterales de las cámaras fueron de acrílico, mientras que el panel frontal y posterior fueron de acero inoxidable. El piso fue de barras cilíndricas de acero. En el panel posterior se encontraba una luz general de 28 v. En el panel frontal se encontraban dos palancas: una del lado izquierdo y una del derecho, arriba de cada una se encontraba un foco de 28 v. Entre las dos palancas había una abertura cúbica de 4 cm por lado, con un orificio en la parte inferior a través del cual subía una copa que estaba en el extremo de un brazo que era activado dependiendo del programa de reforzamiento. La copa proporcionaba 0.1 ml de leche ultra-pasteurizada Procedimiento Moldeamiento. Para entrenar a las ratas a presionar las palancas se les expuso a un programa de reforzamiento concurrente razón fija (RF) 1 RF 1 en las dos palancas, de tal manera que cada respuesta dada a cualquiera de las dos palancas entregaba 0.1ml de leche ultra-pasteurizada. Un programa concomitante (Imam & Lattal, 1992) entregaba un reforzador independiente de las respuestas del sujeto conforme a un programa de tiempo fijo (TF). En la primera sesión, el valor del TF fue de 20 segundos para todos los sujetos. En las sesiones subsecuentes se incrementó el valor del TF de acuerdo a la ejecución de 24 cada sujeto. Se mantuvo a los sujetos en este programa hasta que en una sesión obtuvieron al menos 20 reforzadores en el programa concurrente. Entrenamiento. El entrenamiento constó de tres fases. Se llamó a los operandos de acuerdo a su localización: izquierda (I) y derecha (D). En la primera fase de entrenamiento, se reforzó cualquiera de las cuatro posibles secuencias de dos respuestas a dos operandos, es decir, si los sujetos ejecutaban cualquiera de las siguientes combinaciones: II, ID, DI o DD, obtenían un reforzador. Cada sesión inició con la luz general y las luces sobre las palancas prendidas hasta que el sujeto emitía una secuencia de respuestas. Al ejecutarse cualquiera de las secuencias de dos respuestas a dos operandos se apagaban todas las luces, sonaba un tono durante 5 segundos y se entregaba 0.1 ml de leche. Se mantuvo a los sujetos en esta fase hasta que se entregaron 50 reforzadores en una sesión. La segunda fase de entrenamiento consistió en el reforzamiento únicamente de las secuencias heterogéneas de dos respuestas a dos operandos, las cuales son: ID y DI. Al ejecutarse cualquiera de las secuencias heterogéneas, se apagaban todas las luces, sonaba un tono durante 5 segundos y se entregaba 0.1 ml de leche. Si ejecutaban cualquier otra secuencia, entonces todas las luces se apagaban durante 2 segundos y las respuestas emitidas durante este periodo no tenían ningún efecto programado. Esto se realizó para entrenar a las ratas a alternar entre las dos palancas. Esta condición se mantuvo durante ocho sesiones. La última parte del entrenamiento consistió en el reforzamiento de todas las secuencias heterogéneas de tres respuestas a dos operandos: IDD, IDI, IID, DII, DID y DDI. Para todas las ratas esta fase duró al menos 10 sesiones, y hasta que obtuvieran 70 reforzadores por sesión, durante tres sesiones consecutivas. Fases experimentales. En la primera fase experimental se asignó aleatoriamente a las ratas a uno de tres grupos: ABB, ABA y AAB. Cada grupo quedó conformado por tres sujetos. En el grupo ABB los sujetos recibieron 0.1 ml de leche al ejecutar las secuencias de respuestas IDD o DII. Si ejecutaban cualquier otra secuencia, entonces todas las luces se apagaban durante 2 segundos y las respuestas emitidas durante este periodo no tenían ningún efecto programado. El grupo ABA obtuvo el reforzador al realizar la secuencia IDI 25 o la secuencia DID, la ejecución de cualquier otra secuencia no fue reforzada. Por último, el grupo AAB obtuvo el reforzador al ejecutar la secuencia IID o la secuencia DDI. Cada ensayo consistía de tres respuestas, tanto secuencias de respuestas correctas, como incorrectas. Las sesiones duraron 150 ensayos o 30 minutos. Esta fase se terminó cuando las ratas obtuvieron en total 2,000 reforzadores. En la segunda fase del experimento, se reforzó una secuencia homogénea de tres respuestas, III o DDD, durante 15 sesiones. A cada sujeto se le asignó de manera aleatoria que secuencia era la reforzada, controlando que en todos los grupos hubiera al menos un sujeto al que se le reforzaba III y uno al que se le reforzaba DDD. En la última fase, todas las ratas pasaron a extinción, es decir, ninguna respuesta fue reforzada durante 15 sesiones. El diseño completo del experimento se puede observar en la Tabla 2. Tabla 2 Diseño experimental Grupo Fases 1 2 3 ABB n=3 IDD DII III o DDD Extinción ABA n=3 IDI DID AAB n=3 IID DDI 2,000 reforzadores 15 sesiones 15 sesiones 26 Resultados Con el propósito de conocer cómo las diferentes posibles estructuras y secuencias se distribuyeron durante la primera fase, el análisis de resultados se inició con la frecuencia de ocurrencia de todas las posibles estructuras y secuencias de respuestas. En la Figura 2 se muestran los resultados de la primera fase separando por estructura para cada sujeto. En el panel superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques de 5 sesiones y el eje de las ordenadas la frecuencia de cada estructura. Los rombos blancos representan la estructura AAA, los cuadrados negros la estructura ABB, los círculos negros la estructura ABA y los triángulos blancos la estructura AAB. Cada estructura es la suma de la frecuencia de las dos secuencias de respuestas correspondientes.La línea roja indica la estructura reforzada a cada sujeto. En la Figura 2 se puede observar cómo los animales distribuyeron su conducta entre las cuatro posibles estructuras según la estructura reforzada a lo largo de la primera fase. Para el grupo ABB se observa que los sujetos tardaron entre 5 y 7 bloques de 5 sesiones en completar la primera fase. La estructura reforzada (línea roja) fue la más frecuente de las cuatro estructuras y alcanzó una asíntota de frecuencia que varió entre 68 y 100 en los últimos dos bloques. La segunda estructura más frecuente fue AAA para los tres sujetos del grupo y fue ejecutada con una frecuencia que varió de 26 a 46 durante las últimas sesiones de la fase. La estructura AAB fue realizada con una frecuencia entre 20 y 30 a lo largo de la fase. Por último, la estructura ABA fue la menos ejecutada, con una frecuencia menor a 15 durante toda la fase. Para el grupo ABA se observa que dos de los sujetos, N1 y N6, tardaron 5 bloques y que el sujeto N8 tardó 8 bloques de 5 sesiones en completar la primera fase. La estructura ABA, la cual fue reforzada, fue la más frecuente de las cuatro estructuras y alcanzó una asíntota de frecuencia entre 76 y 97 en los últimos dos bloques de 5 sesiones. Las estructuras ABB y AAB fueron ejecutadas con frecuencias similares, entre 15 y 30. La estructura AAA fue la menos frecuente durante toda la fase, con una frecuencia menor a 20. En el grupo AAB se observa que los sujetos tardaron entre 9 y 11 bloques en completar la primera fase. Este fue el grupo que tardó más en completarla. La estructura reforzada no fue la más frecuente de las cuatro estructuras, siendo ejecutada con una 27 Fase 1 por estructura F re cu en ci a d e es tr u ct u ra Bloques de 5 sesiones ABB ABA AAB Figura 2. Ejecución por estructura de cada sujeto de los tres grupos ABB (panel superior), ABA (panel intermedio) y AAB (panel inferior). La línea en rojo indica la estructura reforzada a cada sujeto. --:>-AAA ....... ABB 150 150 150 N2 N5 N7 __ AB A 120 120 120 _ AAB 90 ><=:: : 90 90 60 60 60 30 30 30 • • • • O --- O • • • O --- - 2 3 4 5 6 2 3 4 5 6 7 2 3 4 5 150 150 150 " 1 ~6 N8 120 120 120 90 / • • 90 90 ~ • 60 60 60 30 ~ ;:::J ~ 30 :- ~ -; J 30 O O O 2 3 4 5 2 3 4 5 2 3 4 5 6 7 8 150 150 150 N3 N4 N9 120 120 120 90 90 90 (,0 ?!FS;:~ 60 60 ~ 30 30 _lO O O O 2 3 4 5 6 7 ~ 9 2 3 4 5 6 7 ~ 9 10 II 2 3 4 5 6 7 ~ 9 10 II 28 frecuencia entre 44 y 54, la frecuencia más baja para la estructura reforzada de los tres grupos. La estructura ABB fue efectuada con mayor frecuencia que la estructura reforzada para el sujeto N3 y aproximadamente con la misma frecuencia que la estructura reforzada para los sujetos N4 y N9. La estructura ABA también fue realizada con una frecuencia similar a la estructura reforzada, con valores entre 30 y 45 para los sujetos N4 y N9. El sujeto N3 fue el único en realizar esta estructura con una frecuencia menor a 30. La estructura AAA fue la menos ejecutada por todos los sujetos al final de la fase, con una frecuencia alrededor de 20. Se realizó un ANOVA de medidas repetidas de las cuatro estructuras (AAA, ABB, ABA y AAB) en el último bloque de la primera fase y como variable entre-sujetos se tuvo a los tres grupos. Se encontró un efecto principal de estructura, F (3, 18)= 20.06, p < .05. No se encontró un efecto significativo de grupo, F (2, 6)= 0.56, p > .05. No obstante, se encontró un efecto significativo de la interacción de estructura con grupo F (6, 18) = 52.35, p < .05. Se realizaron contrastes para la interacción entre estructura y grupo. Se encontró que los contraste de las estructuras AAA-AAB, F (2, 6)= 52.43, p < .05., el ABB-AAB, F (2, 6)= 29.24, p < .05, y el ABA-AAB, F (2, 6)= 94.74, p < .05., fueron significativamente diferente entre los grupos. La comparación de las estructuras AAA, ABB y ABA con respecto a la estructura AAB, fue diferente de acuerdo al grupo. Esto parece estar indicando que las diferentes estructuras se distribuyeron de diferente manera según el grupo (i.e. según la estructura reforzada). Con el fin de analizar más detalladamente la distribución de la conducta entre las cuatro posibles estructuras en estado estable, en la Figura 3 se muestra por grupo el promedio de frecuencia de cada estructura en el último bloque de la primera fase. En el grupo ABB la estructura más frecuente fue la reforzada (ABB). Después de la reforzada, la estructura AAA fue la siguiente más frecuente, seguida por la estructura AAB y por último, la estructura ABA que prácticamente no fue ejecutada. En el caso del grupo ABA se observa que la estructura reforzada ABA fue la más frecuente. Después de la estructura reforzada, la estructura AAB fue la siguiente más frecuente, seguida de las estructuras ABB y AAA que fueron las menos ejecutadas de todas las estructuras. 29 Por último, para el grupo AAB se puede observar que tanto la estructura reforzada AAB como la estructura ABB tuvieron frecuencias muy cercanas y fueron las más frecuentes. La siguiente estructura más frecuente fue ABA. Por último, la estructura AAA fue la menos ejecutada por este grupo. Para analizar si durante la primera fase las secuencias de respuestas reforzadas se diferenciaron de las otras posibles secuencias en la Figura 4 se muestran las frecuencias de las diferentes posibles secuencias a lo largo de la primera fase para cada sujeto. En el panel superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques de 5 sesiones y el eje de las ordenadas la frecuencia de cada secuencia. Los rombos blancos representan la secuencia III, los rombos negros la secuencia DDD, los cuadrados blancos la Estructura F re cu en ci a d e es tr u ct u ra Grupo ABB Grupo ABA Grupo AAB Figura 3. Frecuencia promedio de cada estructura durante el último bloque de 5 sesiones de la primera fase por grupo. La gráfica superior izquierda muestra los resultados del grupo ABB, la inferior los del grupo AAB y la superior derecha los del grupo ABA. 30 secuencia IDD, los cuadrados negros la secuencia DII, los triángulos blancos la secuencia IID y los triángulos negros la secuencia DDI. Las líneas rojas indican las dos secuencias de respuestas reforzadas. En esta figura se puede observar que la frecuencia de las ocho posibles secuencias difirió entre grupos. Para el grupo ABB se observa que todos los sujetos realizaron sólo una de las dos secuencias con las que podían obtener reforzamiento. Los sujetos N2 y N7 ejecutaron la secuencia DII con una frecuencia cercana a 90, la secuencia IDD que también estaba programada para entregar reforzadores al ser ejecutada tuvo una frecuencia cercana a cero. Para estos dos animales, la siguiente secuencia más ejecutada consistentemente fue III, es decir, tres respuestas en el operando más contiguo temporalmente a la entrega del reforzador. Las demás secuencias fueron efectuadas con una frecuencia menor a 30. El sujeto N5 realizó la secuencia IDD con una frecuencia de 67 al final de la primera fase, la otra secuencia no la emitió. Consistente con los otros dos sujetos la siguiente secuencia más ejecutada por el sujeto N5 fue aquella que involucraba tres respuestas al operando en el que las respuestas eran las más contiguas al reforzador, en este caso DDD. Las demás secuencias las emitió con una frecuencia menor a 30. Para el grupo ABA se observa que todas las ratas realizaron las dos secuencias con las que podían obtener el reforzador, este fue el único grupo que consistentemente realizó ambas secuencias programadas para el reforzamiento. Cada sujeto realizó las dos secuencias reforzadas con frecuencias muy similares, entre 40 y 50 veces cada secuencia alfinal de la primera fase. Aún el sujeto N8 que tardó más tiempo que los otros sujetos en completar la fase, muestra el mismo patrón en las secuencias reforzadas. Las demás secuencias fueron realizadas con una frecuencia menor a 30 durante toda la fase, con excepción del sujeto N8, el cual en los primeros cuatro bloques de la fase realizó la secuencia IDD con una frecuencia mayor a 30. Para el grupo AAB se observa que los tres sujetos de este grupo realizaron con mayor frecuencia una de las dos posibles secuencias con las que podían obtener el reforzador. Para dos sujetos la diferenciación de una de las secuencias reforzadas fue clara, los sujetos N3 y N4 realizaron una de las secuencias de manera dominante con una frecuencia entre 30 y 45 al final de la primera fase. Mientras que la otra secuencia reforzada 31 ABA AAB Fase 1 por secuencia F re cu en ci a d e se cu en ci a Figura 4. Ejecución de las ocho posibles secuencia de respuestas por sujeto. Se muestran los resultados del grupo ABB (panel superior), ABA (panel intermedio) y AAB (panel inferior). La línea en rojo indica las dos posibles secuencias reforzadas a cada sujeto. Bloques de 5 sesiones ABB 32 fue ejecutada con frecuencias menores a 15 al final de la fase. Para el sujeto N9 la diferenciación entre las dos secuencias reforzadas no fue tan clara, este sujeto realizó ambas secuencias con frecuencias cercanas, aunque una de las secuencias reforzadas siempre tuvo mayor frecuencia que la otra, consistente con el patrón de ejecución de los demás sujetos del grupo. El error más común en este grupo fue la ejecución de las secuencias IDD y DII, dependiendo de cuál de las dos posibles secuencias reforzadas era realizada con mayor frecuencia por cada sujeto. Por ejemplo, el sujeto N3 realizó la secuencia reforzada DDI con mayor frecuencia y el error que más ejecutó fue DII, es decir, una respuesta de más en el operando en el que las respuestas eran más contiguas al reforzamiento. El sujeto N4 realizó la secuencia reforzada IID de manera dominante, y la secuencia errónea que ejecutó con mayor frecuencia fue IDD. Estas secuencias no reforzadas (IDD y DII) fueron las más ejecutadas por todos los sujetos, con frecuencias entre 30 y 60 al final de la primera fase, frecuencia por arriba de las secuencias que recibían el reforzador al ser realizadas. Dependiendo del sesgo de las respuestas de cada sujeto, las secuencias de estructura ABA (IDI o DID) también fueron ejecutadas con frecuencias altas, entre 20 y 25 veces por sesión a lo largo de la fase. Las secuencias de respuestas homogéneas (III y DDD) casi no fueron ejecutadas por los sujetos de este grupo. Con el fin de analizar si de acuerdo a los reforzadores obtenidos se encontraba algún gradiente de dificultad, en la Figura 5 se muestra por grupo el promedio de frecuencia sólo de las secuencias reforzadas en el último bloque de la primera fase. En el caso de los grupos ABB y AAB, se promedió la frecuencia de la secuencia a la que se sesgaron las respuestas de los sujetos independientemente de que fueran diferentes. Por ejemplo, en el grupo ABB, los sujetos N2 y N7 realizaron de manera dominante la secuencia DII, mientras que el sujeto N5 ejecutó dominantemente IDD; no obstante, se promedió la frecuencia de estas secuencias dominantes para cada sujeto independientemente de que fueran DII o IDD. En el grupo ABA no se tuvo que hacer esto ya que ambas secuencias reforzadas fueron ejecutadas con frecuencias similares. En esta figura, se puede observar que el grupo ABB realizó una de las dos posibles secuencias reforzadas con mayor frecuencia con un promedio de 84.5 y desviación estándar de 16.2. La otra posible secuencia reforzada casi nunca fue ejecutada. En el caso del grupo ABA se puede observar que ambas secuencias reforzadas tuvieron frecuencias similares, 46 33 para IDI y 41 para DID en promedio, con desviación estándar de 5.4 y 2.5 respectivamente. Cada secuencia por separado no fue ejecutada más de 50 veces. El grupo AAB realizó una de las dos posibles secuencias reforzadas con mayor frecuencia, con un promedio de 35 y una desviación estándar de 8.5. La otra secuencia no la realizó más de 15 veces en promedio y desviación estándar de 8.4. En la Figura 6 se muestran los resultados de la frecuencia de las diferentes secuencias a lo largo de la segunda fase para cada sujeto. En la segunda fase del experimento, se reforzó una secuencia homogénea de tres respuestas, III o DDD, durante 15 sesiones. En el panel superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques de 5 sesiones y el eje de las ordenadas la frecuencia de cada secuencia. Los rombos blancos representan la secuencia III, los rombos negros la secuencia DDD, los cuadrados blancos la secuencia IDD, los cuadrados negros la secuencia DII, los círculos blancos la secuencia IDI, los círculos negros la secuencia DID, los triángulos blancos la secuencia IID y los triángulos negros la secuencia DDI. La línea roja indica la secuencia homogénea (III o DDD) que fue reforzada a cada sujeto. En esta figura se puede observar que independientemente del grupo todos los sujetos mostraron patrones similares. La secuencia reforzada en esta fase, fuera III o DDD, fue adquirida rápidamente y para el Grupo F re cu en ci a d e se cu en ci a Figura 5. Promedio y desviación estándar de la frecuencia de las secuencias reforzadas en el último bloque de 5 sesiones de la primera fase por grupo. 34 segundo bloque de 5 sesiones todos los sujetos realizaron la secuencia reforzada con una frecuencia muy cercana a 150. Durante los últimos dos bloques de 5 sesiones todos los sujetos dedicaron prácticamente el 100% de los ensayos a realizar la secuencia reforzada. Todas las demás secuencias dejaron de ser emitidas, independientemente de las secuencias reforzadas en la fase anterior. En los últimos dos bloques, todas las secuencias que no estaban siendo reforzadas no fueron emitidas o fueron realizadas con frecuencias cercanas a cero. Para analizar cómo las secuencias reforzadas aumentaron y disminuyeron su frecuencia a lo largo de todo el experimento, en la Figura 7 se muestran sus frecuencias por sujeto a lo largo de las tres fases. En la gráfica de la izquierda de cada sujeto las líneas punteadas rojas separan la ejecución de las secuencias reforzadas durante los últimos cuatro días de la primera fase (sección izquierda), durante los primeros y últimos tres días de la segunda fase (sección media), y durante los primeros cuatro días de la tercera fase (sección derecha). La gráfica de la derecha muestra un acercamiento a los primeros 4 días de la tercera fase, con el eje de las ordenadas modificado a un valor máximo de 30. En el panel superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra sesiones y el eje de las ordenadas la frecuencia de las secuencias. Los cuadrados blancos representan la secuencia IDD, los cuadrados negros la secuencia DII, los círculos blancos la secuencia IDI, los círculos negros la secuencia DID, los triángulos blancos la secuencia IID y los triángulos negros la secuencia DDI. En general, en la Figura 7 se puede observar la frecuencia de las secuencias reforzadas al final de la primera fase, como disminuyó su frecuencia durante la segunda fase y como en la tercera fase volvió a aumentar la frecuencia con que fueron ejecutadas. Para el grupo ABB, los resultados muestran que sólo una de las dos secuencias reforzadas al final de la primera fase tuvo una frecuencia muy alta, la otra secuencia casi no fue emitida, con frecuencias muy cercanas
Compartir