Logo Studenta

Reforzamiento-de-estructuras-conductuales--un-estudio-de-resurgimiento

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO 
 
 
 FACULTAD DE PSICOLOGÍA 
 
 
 REFORZAMIENTO DE ESTRUCTURAS CONDUCTUALES: UN 
 ESTUDIO DE RESURGIMIENTO 
 
 
 TESIS 
 QUE PARA OBTENER EL TÍTULO DE 
 LICENCIADO EN PSICOLOGÍA 
 PRESENTA 
 NATALIA FAVILA VÁZQUEZ 
 
 
 TUTOR: DR. GUSTAVO BACHÁ MÉNDEZ 
 REVISOR: DR. OSCAR VLADIMIR ORDUÑA TRUJILLO 
 SINODALES: DR. ROGELIO ESCOBAR HERNÁNDEZ 
 DR. ÁLVARO TORRES CHÁVEZ 
 DR. OSCAR ZAMORA AREVALO 
 
 
 Ciudad universitaria, D.F. Mayo de 2013 
 Proyecto de investigación financiado por 
 PAPIIT IN303811-2 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Agradezco el apoyo de la Universidad Nacional Autónoma de México y el 
financiamiento del proyecto PAPIIT IN 303811-2 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
A mis padres, por todo el cariño y apoyo. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Agradecimientos 
A mis padres que ante todo me han brindado una vida llena de cariño y apoyo. Gracias por 
la total confianza en lo que hago. 
A mi hermana por quererme así como soy y darme un ejemplo a seguir de una gran 
persona. 
A mi abuela y abuelo (Q.E.P) por ser una parte muy importante de mi vida, siempre 
apoyándome y brindándome todo su cariño. 
Al Dr. Bachá, gracias por abrirme las puertas de su laboratorio y enseñarme tantas cosas. 
Le agradezco mucho todo. Siempre empujándome a pensar las cosas de una manera crítica 
y analítica. 
A mi revisor de tesis el Dr. Vladimir Orduña y a mis sinodales el Dr. Rogelio Escobar, el 
Dr. Oscar Zamora y el Dr. Álvaro Torres. Les agradezco sus valiosos comentarios que me 
ayudaron mucho en la realización de la tesis. 
A Ixel, gracias por todos los comentarios, pláticas y regaños para que saliera la tesis y por 
la amistad que me has dado durante mi estancia en el laboratorio. 
A Alma, quien ha compartido conmigo los llantos, enojos y buenos momentos de lo que es 
hacer una tesis. 
A mis compañeros de laboratorio: Rafa, Erikita, Hammurabi, Adriana y Toño por compartir 
conmigo experiencias en el laboratorio. 
A Marlene y Mou porque han estado conmigo desde hace tantos años! A pesar de que cada 
una está en carreras diferentes, me han acompañado durante todo el proceso. 
A Israel, porque fuiste el que vivió todo conmigo y supo escucharme con mucha paciencia. 
Gracias por el cariño que me has dado durante estos años. 
A mis compañeros del área: Nun, Paco, Dario, Ele, Marisol, Ale, M.J. y de la carrera: 
Adriana, Ile, Mary y Dulce, por compartir bonitas experiencias durante estos cinco años. 
A mis ratitas, porque sin ellas no habría tesis. 
 
 
 
 
 
 
 
Contenido 
Resumen…………………………………………………………………………………..…1 
Introducción 
Secuencias de respuestas…………………………………………………………….3 
Resurgimiento.………………………………………………………...………….....8 
Resurgimiento de patrones conductuales.…………………….…………………....18 
Planteamiento del problema.……………………………………………………………… 21 
Método.…………………………………………………………………………………….23 
Sujetos……………………………………………………………………………...23 
Aparatos…………………………………………………………………………….23
Procedimiento………………………………………………………………………23 
Diseño experimental………………………………………………………………..25 
Resultados………………………………………………………………………………….26 
Discusión…………………………………………………………………………………...44 
Referencias…………………………………………………………………………………53
 
1 
 
Resumen 
Un tema de interés en el análisis experimental de la conducta es el estudio de secuencias de 
respuestas como una operante. Al utilizar una secuencia como unidad conductual, el 
reforzador se hace depender no sólo de una respuesta, sino de una serie de ellas ejecutadas 
en un orden específico. Las secuencias pueden tener diferentes estructuras espacio-
temporales y existen estudios que sugieren que la curva de aprendizaje varía de acuerdo a la 
estructura de la secuencia siendo reforzada. Por otro lado, se observa que patrones 
conductuales (secuencias) previamente establecidos y aparentemente extintos, pueden 
volver a presentarse en el repertorio conductual de los organismos. Un fenómeno que llama 
la atención es el resurgimiento de conductas extintas, el cual es estudiado principalmente 
con unidades de respuestas discretas. Un primer propósito del presente trabajo fue estudiar 
el efecto de la estructura de las secuencias reforzadas en la distribución de la conducta. Un 
segundo objetivo fue analizar si se observaría el resurgimiento de secuencias previamente 
reforzadas y si éste dependería de la estructura de las secuencias. Para ello, se llevó a cabo 
un experimento de tres fases. En la primera fase, se reforzaron dos secuencias con la misma 
estructura (ABB, ABA o AAB), quedando tres grupos de acuerdo a la estructura reforzada. 
En la segunda fase, se cambió a las secuencias reforzadas a una condición de extinción por 
reforzamiento de otra secuencia. En la tercera fase, ningún comportamiento fue reforzado. 
Los resultados mostraron que la manera en que el comportamiento de los sujetos se 
distribuyó dependió de la estructura de las secuencias reforzadas. Cada estructura reforzada 
produjo un patrón de conducta distintivo y repetitivo en estado estable. El reforzador no 
sólo impactó la fuerza de las secuencias de las cuales dependía su entrega, sino que también 
modificó la distribución de otras secuencias. Asimismo, de acuerdo a la asíntota de 
reforzamiento alcanzada en la primera fase, se encontró un gradiente de dificultad en 
función de la estructura reforzada, similar al reportado en otros estudios. En cuanto a 
resurgimiento, se encontró que aunque la estructura pudo haber influido, los datos no 
presentan suficiente orden. Otras variables como el número de sesiones o la frecuencia de 
reforzamiento en la primera fase pudieron haber afectado los resultados observados. 
 
 
 
2 
 
En el estudio de la conducta la decisión sobre como dividir el comportamiento en unidades 
de análisis ha sido una tarea difícil. Tradicionalmente, en el análisis experimental de la 
conducta se ha utilizado como unidad de análisis una operante discreta (como presionar una 
palanca o picar una tecla) sobre la cual se hace contingente el reforzamiento. Sin embargo, 
no hay razón para asumir que el efecto del reforzador se restringe a la respuesta discreta 
que lo produce. La demora entre algunas respuestas y el reforzador puede variar, pero no 
por ello el reforzador no actúa sobre ellas (Catania, 1971). Asimismo, las contingencias de 
reforzamiento no solo fortalecen aquellas operantes establecidas por el experimentador, 
sino que al mismo tiempo muchas otras conductas experimentan cambios en su fuerza 
(Schick, 1971). Entonces ¿Qué es lo que “fortalece” el reforzador? Aunque la contigüidad 
temporal entre la respuesta y el reforzador es fundamental, una sola respuesta podría ser 
parte de una unidad más grande de varias respuestas y al suponer que solo se fortalece la 
más contigua al reforzador, se podrían estar perdiendo otras relaciones ordenadas (Shimp, 
1976). 
De acuerdo con Timberlake (1993),la conducta de los organismos puede ser 
clasificada en sistemas conductuales, los cuales están organizados alrededor de funciones 
importantes, como alimentación o reproducción. Diversos componentes de la conducta se 
van integrando en patrones cada vez más generales, hasta llegar a grandes sistemas. Los 
cambios en el ambiente pueden afectar tanto a los sistemas conductuales como a sus 
componentes particulares, generando múltiples efectos sobre la conducta. Entonces, el 
substrato sobre el cual el reforzamiento ejerce control no es una acción discreta, sino 
patrones de respuestas más generales. Timberlake sugirió que el modelo simple de 
reforzamiento respuesta-reforzador podría estar sobre-simplificando un fenómeno biológico 
mucho más complejo. 
No obstante, no cualquier patrón de comportamiento puede funcionar como una 
unidad de conducta, por ello, son necesarios algunos criterios para establecer qué es una 
unidad conductual. Operacionalmente, una unidad queda definida como aquella clase de 
conducta que se establece como requisito para la obtención del reforzador. La probabilidad 
de ocurrencia de una unidad conductual debe de ser afectada por sus consecuencias, es 
decir, debe de ser condicionable (Zeiler, 1983). Asimismo, se ha sugerido que una manera 
de definir unidades conductuales es demostrando que las relaciones funcionales entre ellas 
 
3 
 
y ciertos eventos del ambiente son similares a las encontradas con otras unidades (Branch, 
1977). 
 
Secuencias de respuestas 
De acuerdo con lo anterior, muchas respuestas pueden ocurrir altamente 
organizadas, pero no por ello ser unidades condicionables. Operacionalmente, al usar 
secuencias de respuestas el reforzador depende no sólo de una respuesta, sino de una serie 
de respuestas en un orden temporal específico. Para demostrar que una secuencia de 
respuestas puede funcionar como una unidad, se debe probar que su probabilidad de 
ocurrencia depende de sus consecuencias. Grayson y Wasserman (1979) llevaron a cabo un 
experimento en el que reforzaron una secuencia de dos respuestas a dos operandos durante 
varias fases. Los resultados demostraron que una secuencia de dos respuestas es una 
propiedad diferenciable del comportamiento de los animales. En cada fase, la frecuencia de 
la secuencia reforzada aumentó y la de las otras secuencias disminuyó, lo que parece 
indicar que el reforzamiento fortaleció a la secuencia como una unidad. No obstante, un 
resultado interesante fue que al reforzar una secuencia heterogénea como izquierda (I) – 
derecha (D), una secuencia que se presentaba con mucha frecuencia, era aquella en la que 
ocurrían dos respuestas en el operando en el que las respuestas eran más contiguas al 
reforzamiento (en este caso DD). Se ha sugerido que esto ocurre porque al reforzar una 
secuencia como ID, el animal le asigna mayor crédito a la respuesta más contigua al 
reforzamiento, que en este caso sería la respuesta D (Catania, 1971). Este experimento 
apoya la idea de que las secuencias pueden funcionar como unidades funcionales y 
demuestra cómo el reforzamiento afecta la distribución de una variedad de secuencias. 
Otros investigadores han descubierto que algunos procesos -como igualación o el control de 
estímulos- encontrados con operantes discretas, también se dan de manera ordenada si se 
utilizan secuencias de respuestas como unidad de análisis (Fetterman & Stubbs, 1982; 
Wasserman, Deich, & Cox, 1984). 
En otra serie de estudios llamados de “elección libre”, se ha encontrado que aun 
cuando el procedimiento no requiere la organización de la conducta en unidades, los 
animales desarrollan secuencias de respuestas dominantes y altamente estereotipadas. Por 
ejemplo, Schwartz (1980) utilizó un procedimiento en el que palomas tenían que picar dos 
 
4 
 
teclas (I y D), cuatro veces cada una, en el orden que fuera, con el fin de mover una luz del 
extremo superior izquierdo al extremo inferior derecho de una matriz de focos de 5x5. Cada 
respuesta en la tecla I movía la luz en la matriz hacia el foco de la derecha. Cada respuesta 
en la tecla D movía la luz hacía el foco de abajo. Aunque había 70 posibles secuencias que 
llevaban a la obtención del reforzador, todos los sujetos desarrollaron solo una secuencia 
estereotipada que dominó su comportamiento. Cuando se cambiaron las contingencias de 
reforzamiento, la secuencia dominante mantuvo su organización interna. Esto invita a 
inferir que la secuencia dominante se volvió una unidad integrada. No obstante, un detalle 
importante de este estudio es que cada respuesta fue señalada por un estímulo 
discriminativo (el movimiento de las luces en la matriz de focos 5x5). Al quitar la matriz de 
luces, se encontró un aumento en la variabilidad y se perdió la organización interna de la 
secuencia dominante, lo que sugiere que la conducta estaba bajo el control de los estímulos 
discriminativos, no que se haya conformado en una unidad conductual. No obstante, Reid, 
Chadwick, Dunham y Miller (2001) encontraron que aún en un procedimiento de operante 
libre, reforzando dos secuencias de dos respuestas con la misma probabilidad y sin 
estímulos discriminativos, los sujetos desarrollaban una secuencia dominante altamente 
organizada. Al analizar los tiempos entre respuestas (TER), Reid et al. (2001) encontraron 
que los TER entre secuencias fueron más largos que los TER entre respuestas de una 
secuencia. Lo cual sugiere que la conducta se organizó en “conjuntos” de respuestas 
diferenciables de acuerdo a las contingencias de reforzamiento, apoyando la idea de que 
una secuencia se puede volver una porción diferenciable del flujo conductual de los 
animales. 
Aunque se han desarrollado estudios tanto con secuencias de respuestas señaladas 
por estímulos (cadenas), como sin ellos (secuencias), existe una diferencia en los 
procedimientos. En la investigación con cadenas, cada respuesta es señalada por un 
estímulo discriminativo o guía y no se permite la ejecución completa de las respuestas 
incorrectas, por lo que no es posible monitorear todas las posibles secuencias de respuestas. 
Esto imposibilita especificar si un patrón de respuestas se ha diferenciado de otro. En 
cambio con secuencias, se permite a los sujetos la ejecución de todas las posibles 
combinaciones de respuestas, aunque no sean la secuencia reforzada (Grayson & 
Wasserman, 1979). Los diferentes procedimientos con y sin estímulos discriminativos han 
 
5 
 
dado resultados diferentes en cuanto a la conformación de unidades conductuales. Se ha 
encontrado que si se entrenan cadenas, al quitar los estímulos guía la conducta se desordena 
(Schwartz, 1980). Esto podría implicar que aunque se realice muy bien la secuencia de 
respuestas bajo el control de estímulos, no significa que se haya aprendido a ejecutar la 
secuencia completa y que ésta se haya vuelto una unidad funcional. Con secuencias, dado 
que no hay estímulos discriminativos explícitos, es más factible afirmar que el individuo ha 
integrado una serie de respuestas individuales en una unidad más grande. Terrace (1984) 
mencionó que la propuesta de encadenamiento tiene problemas para explicar cómo se 
conforman secuencias de respuestas en preparaciones de encadenamiento simultáneo, en 
donde todos los estímulos y operandos son presentados al mismo tiempo. No obstante, 
responder en un operando podría tener por sí mismo propiedades discriminativas que 
influyeran en la probabilidad de las siguientes respuestas. 
 
Estructura en secuencias de respuestas 
El uso de secuencias de respuestas hace posible situaciones en las que la estructura 
de la conducta puede estudiarse directamente, manipulando el orden temporal de las 
respuestas de una secuencia. Por ejemplo, al utilizar secuencias de tres respuestas a dos 
operandos (I y D) existen ocho posibles maneras de realizar una secuencia (III, IDD, IDI, 
IID, DDD, DII, DIDy DDI), las cuales pueden ser agrupadas en cuatro estructuras que 
llamaremos: AAA, ABB, ABA y AAB. A cada estructura le corresponde una regla general 
de ejecución que aplica a dos secuencias. Por ejemplo, para la estructura ABA, la regla es 
alternar dos veces de operando, en este caso tanto la secuencia IDI como DID tienen la 
estructura ABA. En la Figura 1 se muestra un diagrama de cómo se conforman las ocho 
posibles secuencias de tres respuestas a dos operandos y su agrupación por estructura. 
Uno de los primeros estudios en los que se encontró un efecto diferencial según la 
estructura de las secuencias de respuestas fue hecho por Polidora (1963). Polidora entrenó a 
un grupo de ratas a realizar una serie de secuencias de respuestas con diferente estructura 
(manipulando el largo de la secuencia, el número de alternaciones entre operandos, etc.). 
Cuando las respuestas de las ratas alcanzaron un estado estable en las diferentes secuencias 
(i.e. durante tres sesiones consecutivas la tasa de respuestas y la proporción de secuencias 
correctas se mantuvieron constantes), se les inyectó la droga JB 329 en tres diferentes 
 
6 
 
dosis: 0.25, 0.5 y 1 mg/kg. Se encontró que el efecto de la droga dependía de una 
interacción entre la dosis y la estructura de la secuencia entrenada. El desempeño de 
secuencias “sencillas” (las más cortas y con menos alternaciones) fue menos afectado por 
las diferentes dosis administradas que el desempeño de secuencias “difíciles”. Polidora 
propuso que el uso de secuencias de respuestas provee un medio para estudiar un continuo 
de conducta compleja, y a partir de las diferentes estructuras planteó el siguiente gradiente 
de complejidad: 1) secuencias más cortas son más sencillas que secuencias más largas; 2) 
secuencias que requieren el regreso a un operando son más complejas; 3) las secuencias 
más complejas son las “secuencias de conteo” (e.g. AAB, porque implica “contar” dos 
respuestas en un mismo operando (A) y luego cambiar a otro operando (B)). No obstante, 
Polidora no llevó a cabo un estudio sistemático tomando en cuenta todas las posibles 
combinaciones de secuencias, sino que escogió aleatoriamente algunas de las posibles 
secuencias de dos, tres y cuatro respuestas, por lo que no pudo estudiar el panorama 
completo de todas las posibles estructuras. 
Más recientemente, Neuringer, Kornell y Olufs (2001) en un experimento sobre 
variabilidad con secuencias de tres respuestas a tres operandos también sugirieron que 
parece haber un gradiente de dificultad en la ejecución de secuencias. Estos autores 
realizaron una serie de experimentos en los que en una primera fase reforzaron variabilidad, 
de tal manera que una secuencia de respuestas recibía reforzamiento solo si había sido 
realizada con una frecuencia relativa menor o igual a .05 en los ensayos anteriores. En una 
segunda fase, se pasó a los sujetos a una condición de extinción, en donde ninguna 
Figura 1. Diagrama de todas las posibles secuencias de tres respuestas a dos operandos 
(izquierda y derecha) y su agrupación por estructura. 
 
7 
 
conducta fue reforzada. Se observó que durante la primera fase se desarrolló una jerarquía 
de ejecución, en donde secuencias de respuestas aparentemente más sencillas (como dar 
tres respuestas en un mismo operando) ocurrieron más frecuentemente que secuencias 
difíciles (como alternar las respuestas entre los tres operandos). Al pasar a una fase de 
extinción, aunque hubo un aumento en la variabilidad, la distribución de las posibles 
secuencias se mantuvo constante, es decir, las secuencias más probables durante 
reforzamiento, también lo fueron en extinción. Lo que se aprendió durante la fase de 
reforzamiento se vio reflejado en la fase de extinción. Asimismo, durante extinción las 
secuencias mantuvieron la integridad y organización interna que habían desarrollado 
durante el reforzamiento. Los resultados de Neuringer et al. (2001) sugieren que las 
contingencias pudieron haber estado actuando a nivel de las secuencias completas, en vez 
de en las respuestas individuales que componen a las secuencias. No obstante, Reid, Dixon 
y Gray (2008) mencionaron que esto implicaría que cada una de las 27 posibles secuencias 
de tres respuestas a tres operandos se volvió una unidad con fuerza independiente, lo cual 
resulta muy poco probable. Es posible que algunas de las secuencias más frecuentes se 
conformaran en unidades conductuales, pero algunas de las secuencias fueron ejecutadas 
muy poco y casi no fueron reforzadas. Al re-analizar los datos, estos autores encontraron 
que la primera respuesta parecía depender únicamente de los estímulos que indicaban el fin 
del ensayo anterior, tales como la entrega de comida o el apagón de luces (cuando la 
secuencia emitida había sido incorrecta). La segunda y tercera respuesta parecen haber 
dependido únicamente del operando en que había sido ejecutada la respuesta anterior, el 
operando seleccionado dos respuestas antes no parece haber influido en la respuesta actual. 
Es por ello que Reid et al. (2008) sugieren que la distribución de secuencias observada en el 
experimento de Neuringer et al. (2001) se pudo haber debido a procesos a nivel de las 
respuestas individuales más que a nivel de las secuencias como unidades. 
Por su parte, Robles (2012) observó que la estructura es una variable importante en 
el aprendizaje de una nueva secuencia de respuestas. Robles (2012) estudió directamente la 
estructura reforzada de secuencias de tres respuestas en dos operandos en un experimento 
de dos fases. En la primera fase, se reforzó una secuencia de tres respuestas con una 
determinada estructura, quedando cuatro grupos: AAA, ABB, ABA y AAB, dependiendo 
de la estructura de la secuencia reforzada. En la segunda fase, se reforzó una secuencia 
 
8 
 
diferente, de manera que la nueva secuencia reforzada difiriera de la anterior en la primera 
o última respuesta de la secuencia. Por ejemplo, si en la primera fase se había reforzado la 
secuencia IID, en la segunda fase a la mitad de los sujetos se les reforzaba DID (cambio en 
la primera respuesta) y a la otra mitad III (cambio en la última respuesta). Sus resultados 
mostraron que la velocidad de adquisición y la asíntota de reforzamiento alcanzada en una 
fase de estado estable, dependieron de la estructura reforzada en ambas fases, 
independientemente de en qué respuesta fueran diferentes la primera de la segunda 
secuencia entrenada. Asimismo, sus resultados también sugieren un gradiente de dificultad 
en función de la estructura de la secuencia reforzada. De acuerdo a sus resultados la 
estructura AAA es la más sencilla dado que las respuestas alcanzan una asíntota de 
reforzamiento obtenido alta en poco tiempo; y la estructura AAB es la más difícil, ya que 
las respuestas alcanzan una asíntota de reforzamiento obtenido baja y tardan 
comparativamente más tiempo en llegar a este nivel. Este gradiente concuerda a grandes 
rasgos con lo reportado tanto por Polidora (1963) como por Neuringer et al. (2001). 
Dada la evidencia experimental, parecería que hay razón para tomar a una secuencia 
de respuestas como unidad de análisis. Al reforzar una sola respuesta, la variabilidad que se 
puede llegar a estudiar está limitada por los parámetros físicos de la respuesta. En cambio, 
al utilizar secuencias de respuestas se puede cuantificar el conjunto de todas las posibles 
secuencias de respuestas y con ello estudiar la distribución y variabilidad de la conducta de 
manera sistemática. Asimismo, al usar unidades conductuales pequeñas podríamos estar 
limitando la generalidad de nuestras leyes conductuales (Shimp, 1976). Al usar las 
secuencias como unidad de análisis, es posible cuantificar cómo el reforzador afecta no sólo 
a la secuencia sujeta a reforzamiento, sino a todas las posibles secuencias. 
 
Resurgimiento 
El análisis de cómo las condicionesde reforzamiento pasadas interactúan con la 
conducta en el presente, se ha realizado en estudios que investigan los efectos de programas 
de reforzamiento usados previamente sobre la conducta actual. Uno de los métodos 
generales para estudiar la historia de reforzamiento consta de tres fases. En la primera, una 
respuesta particular es establecida. En la segunda, la tasa de respuesta mantenida 
inicialmente es reducida a cero. En la tercera, se realiza una prueba de persistencia de la 
 
9 
 
conducta (Lieving & Lattal, 2003). Existe una literatura creciente sobre el papel de estas 
variables que se describen como históricas, ya que se ha observado que en diversas 
instancias, patrones conductuales previamente establecidos y aparentemente extintos, 
vuelven a presentarse en el repertorio conductual. Se conocen varios fenómenos de 
reemergencia de la conducta, tales como: renovación, restablecimiento, recuperación 
espontánea y resurgimiento. Estos fenómenos han sido de importancia en el análisis 
experimental de la conducta ya que han dado evidencia de que lo aprendido en un momento 
puede sobrevivir a tratamientos de extinción, y que la disminución en la tasa de respuesta 
por el retiro del reforzador, no significa que el aprendizaje original haya sido borrado 
(Bouton & Peck, 1989). 
Aunque estos fenómenos comparten efectos similares, ya que en todos se observa la 
re-emergencia de conductas extintas, los procedimientos que se han empleado para su 
estudio difieren entre sí. Con excepción de resurgimiento, los demás fenómenos han sido 
estudiados principalmente con procedimientos de condicionamiento clásico (Bouton, 
Winterbauer, & Todd, 2012; Bouton, 2002), no obstante, también existen estudios en los 
que se ha usado el procedimiento operante (Nakajima, Tanaka, Urushihara, & Imada, 
2000). Específicamente, en renovación, la reaparición de una conducta extinta ocurre por 
un cambio en el contexto en el que se llevó a cabo su extinción. En restablecimiento, la 
respuesta extinta regresa como resultado de la presentación de reforzadores independientes 
de la respuesta después de extinción. En recuperación espontánea, la respuesta regresa si se 
deja pasar un tiempo entre sesiones de extinción. En resurgimiento, la respuesta extinta 
reaparece si un comportamiento alternativo que estaba siendo reforzado, deja de serlo 
(Lattal, St. Peter, & Escobar, 2013). En la Tabla 1 se muestran con más detalle los 
diferentes procedimientos de estos fenómenos; sin embargo, no queda claro en la literatura 
si estas diferencias de procedimiento implican que el mecanismo subyacente a cada 
fenómeno es diferente, o si es posible hablar de un mecanismo general de recuperación de 
la respuesta. 
Dentro de estos fenómenos, uno que ha llamado la atención de varios investigadores 
ha sido el resurgimiento. De acuerdo con Epstein (1983) cuando en una situación dada, un 
comportamiento que recientemente estaba siendo reforzado deja de serlo, conductas que en 
 
10 
 
el pasado fueron reforzadas bajo circunstancias similares tienden a resurgir. Resurgimiento 
es un fenómeno robusto que se ha replicado en varios experimentos usando diferentes tipos 
 
de respuestas y en una variedad de especies que va de ratas a humanos (Epstein, 1983; 
Wilson & Hayes, 1996; Cleland, Foster, & Temple, 2000). 
En los primeros estudios sobre resurgimiento, se hizo una comparación con el 
concepto de regresión Freudiano. Sanders (1937) basándose en las propuestas de Freud, 
encontró que al colocar ratas bajo situaciones de alto estrés, éstas tendían a regresar a 
patrones conductuales que en el pasado habían sido exitosos. Regresión se refiere a la 
reaparición en situaciones emocionales de comportamientos que fueron establecidos 
durante la niñez. Resurgimiento es cualquier comportamiento, ocurrido en cualquier 
Tabla 1 
Fenómenos de recuperación de la respuesta 
Fenómeno Definición Método general 
Renovación Recurrencia de una conducta extinta 
que ocurre si después de extinción se 
vuelve a presentar el contexto en que 
se adquirió la conducta u otro 
contexto. 
 
Fase 1Adquisición en contexto A 
Fase 2 Extinción en contexto B 
Fase 3 Exposición al contexto A o C 
 
Restablecimiento Recurrencia de una conducta extinta 
que ocurre cuando se presentan 
reforzadores independientes de la 
respuesta después de extinción. 
Fase 1 Adquisición en contexto A 
Fase 2Extinción en contexto A 
Fase 3 Entrega de reforzadores 
 independientes de la respuesta 
 en contexto A 
 
Recuperación 
espontánea 
Recurrencia de una conducta 
previamente reforzada al inicio de 
periodos sucesivos de extinción. 
Fase 1 Adquisición en contexto A 
Fase 2 Extinción en contexto A 
Fase 3 Intervalo de tiempo en 
 contexto B 
Fase 4 Extinción en contexto A 
 
Resurgimiento Recurrencia de una conducta extinta 
que ocurre cuando un 
comportamiento actual deja de ser 
reforzado. 
Fase 1 Adquisición de conducta 1 
Fase 2 Extinción de conducta 1 y 
 adquisición de conducta 2 
Fase 3 Extinción de conducta 2 
 
11 
 
momento del pasado, que puede volver a presentarse, no se limita a comportamientos 
establecidos durante la niñez. Asimismo, regresión se refiere a un mecanismo 
psicodinámico, mientras que resurgimiento fue definido puramente de manera descriptiva 
por Epstein (1985). Por último, regresión suele ser entendida como una respuesta ante 
situaciones de castigo, en vez de simplemente no-reforzamiento. 
El método para el estudio de resurgimiento consta de tres fases: en una primera fase 
un comportamiento operante es reforzado; en una segunda fase, mientras se extingue el 
primer comportamiento, una segunda respuesta alternativa es entrenada y reforzada; en la 
última fase, se realiza una prueba de re-emergencia o persistencia de la primera conducta 
mediante la extinción del segundo comportamiento. De acuerdo con Lieving y Lattal 
(2003) las condiciones que evocan resurgimiento podrían estar en un continuo de 
disponibilidad del reforzador, en donde a menor disponibilidad mayor resurgimiento. No 
obstante, estos autores mencionan que metodológicamente el tipo de extinción para realizar 
una prueba de resurgimiento debe ser mediante el retiro completo del reforzador, ya que si 
se extingue mediante la entrega independiente de reforzadores se trata de restablecimiento y 
si se extingue mediante la entrega de reforzadores dependientes de la respuesta, se podría 
tratar de inducción. 
Dentro del paradigma de condicionamiento operante, una de las primeras 
demostraciones de resurgimiento fue hecha por Leitenberg, Rawson y Mulick (1975). Estos 
investigadores estaban interesados en observar si al extinguir una conducta y al mismo 
tiempo reforzar otra, la extinción de la primera sería más rápida y eficiente que si era 
extinguida solamente mediante el retiro del reforzador. Lo que encontraron fue que la 
respuesta previamente entrenada dejaba de ocurrir más rápido al ser extinta mediante el 
reforzamiento de un comportamiento alternativo; sin embargo, este efecto resultó ser 
transitorio, pues al retirar el reforzador de la conducta alternativa, la respuesta que ya estaba 
extinta resurgía. El tema central del estudio de Leitenberg et al. (1975) fue la extinción, el 
resurgimiento de una conducta extinta fue más bien una observación incidental, y por ello 
no existieron todos los controles experimentales necesarios. Epstein (1983) abordó este 
problema diferenciando resurgimiento de un efecto de frustración o de la variabilidad 
típicamente observada durante extinción (Antonitis, 1951). Para distinguir entre 
resurgimiento y otros efectos, Epstein incluyó un operando extra en la cámara 
 
12 
 
experimental, en el cual las respuestas nunca recibieron reforzamiento. Si las respuestas 
observadas fueran un efecto de frustración o variabilidadaleatoria, los sujetos del estudio 
responderían azarosamente tanto al operando utilizado en el experimento, como al 
operando extra. El experimento llevado a cabo por Epstein (1983) constó de cuatro fases. 
En la primera fase, se reforzó la conducta de picar una tecla en un programa de intervalo 
variable (IV) en un grupo de palomas y se les mantuvo en éste hasta que alcanzaron un 
estado estable. En la segunda fase, se extinguió la conducta de picar la tecla, durante un 
periodo que varió de 1 a 12 sesiones. Una vez que los sujetos habían pasado por el periodo 
de extinción de la primera respuesta, en la tercera fase se reforzó una conducta alternativa 
que fuera topográficamente incompatible con picar la tecla (e.g. aletear o mover la cabeza 
de arriba abajo), hasta que obtuvieron 20 reforzadores. En la última fase, se retiró todo 
reforzamiento. Se encontró que a pesar de que algunas palomas estuvieron expuestas hasta 
por 12 sesiones consecutivas a extinción del picoteo a la tecla, en todas se encontró 
resurgimiento de esta última conducta. Asimismo, los resultados mostraron que el picoteo 
resurgió sólo en el operando correlacionado con una historia de reforzamiento previa y no 
en el otro. De esta manera, Epstein demostró que resurgimiento no sólo es el resultado de 
variabilidad aleatoria u otros efectos de extinción, sino que es un fenómeno por sí mismo y 
que vale la pena estudiar. 
 
Variables que afectan el resurgimiento 
Se han realizado varias investigaciones para conocer cuáles son las variables de las 
que depende el grado de resurgimiento encontrado en diferentes preparaciones. Se pueden 
realizar diversas manipulaciones en las tres fases del proceso de resurgimiento descritas en 
un inicio, obteniendo diferentes resultados. A continuación se mencionan algunas de las 
variantes que se han realizado en la fase de formación de la historia de reforzamiento. 
Las contingencias que prevalecen durante la fase de formación de la historia de 
reforzamiento (Fase 1) afectan la naturaleza y magnitud del resurgimiento. Dos variables 
que han probado ser importantes son el programa de reforzamiento y el tiempo de 
exposición a éste durante la primera fase. Winterbauer, Lucke y Bouton (2012) realizaron 
un experimento para observar cuál era el papel de estas variables. En la primera fase 
tuvieron cuatro grupos de sujetos, a dos de ellos se les sometió a un programa de razón 
 
13 
 
aleatoria (RA), y a los otros dos a un programa de IV. De los dos grupos en cada programa, 
uno de ellos estuvo en la primera fase durante 4 sesiones y el otro durante 12. En la 
segunda fase, se extinguió el primer comportamiento mediante el reforzamiento de una 
conducta alternativa. En la tercera fase, se realizó la prueba de resurgimiento de la conducta 
mediante extinción. Los resultados mostraron que el tipo de programa tuvo un efecto en el 
desempeño durante la primera fase, ya que los sujetos en el programa de razón tuvieron 
tasas de respuestas más altas que los sujetos en el programa de intervalo. Asimismo, a 
mayor número de sesiones de entrenamiento se observó mayor tasa de respuesta y de 
reforzamiento obtenido. El patrón de respuestas desarrollado en la primera fase se vio 
reflejado en la fase de resurgimiento. Los sujetos que en la primera fase estuvieron en el 
programa de razón con una historia de reforzamiento larga, mostraron mayor grado de 
resurgimiento que los sujetos que estuvieron en el programa de intervalo con una historia 
de reforzamiento corta. Los autores sugieren que la tasa de respuestas al final de la fase 
uno, más que la tasa de reforzamiento obtenido, es el mejor predictor de la magnitud del 
resurgimiento. 
 Reed y Morgan (2007) de acuerdo con lo mencionado por Winterbauer et al. 
(2012), también proponen que la tasa de respuesta adquirida en la primera fase es lo que se 
ve reflejado en resurgimiento. Estos autores llevaron a cabo un experimento en el que en la 
primera fase entrenaron a ratas en un programa múltiple RA, intervalo aleatorio (IA). Esto 
llevó a una tasa de respuestas alta en el componente RA y a una tasa de respuestas baja en 
el componente IA. Mediante un procedimiento de acoplamiento intra-sujeto se igualaron las 
tasas de reforzamiento de ambos componentes. Este entrenamiento inicial fue seguido por 
una segunda fase en la que se expuso a las ratas a un programa múltiple IF-60 s, IF-60 s. En 
una última fase, todo comportamiento dejó de ser reforzado. Se encontró que a pesar de que 
en la primera fase se mantuvo la tasa de reforzamiento igual para las dos conductas, la 
conducta con la tasa de respuesta más alta era la que invariablemente mostraba mayor 
resurgimiento y mayor resistencia al cambio. A partir de estos resultados los autores 
proponen que es posible que el patrón conductual generado en la primera fase se comporte 
como una unidad integrada y que lo que resurge en la tercera fase es esta unidad conductual 
previamente aprendida. 
 
14 
 
No obstante, existen investigaciones que contradicen lo propuesto por Reed y 
Morgan (2007) y Winterbauer et al. (2012). Por ejemplo, Podlesnik y Shahan (2009, 2010) 
han encontrado que el resurgimiento depende más de la tasa de reforzamiento que de la tasa 
de respuesta de la primera fase. Estos autores observaron este efecto en una serie de 
experimentos de resurgimiento en donde en la primera fase manipularon la tasa de 
reforzamiento de dos componentes de un programa múltiple. En uno de los componentes 
los sujetos recibieron reforzadores en un programa de IV 30 s, mientras que en el otro, 
además de recibir estos reforzadores, recibieron reforzadores independientes de la 
respuesta. Así, uno de los componentes quedó asociado a una tasa de reforzamiento “rica” y 
el otro a una “pobre”. En la segunda fase se reforzó otra respuesta y se extinguió el primer 
comportamiento asociado a ambos componentes. Finalmente, en la última fase se 
implementó extinción. Los resultados mostraron que en la primera fase, los sujetos tuvieron 
tasas de respuestas más bajas en el componente “rico” que en el componente “pobre”. En 
las subsecuentes dos fases, se encontró mayor resistencia al cambio y mayor resurgimiento 
en el componente “rico” en reforzamiento, esto a pesar de que en la primera fase la tasa de 
respuesta asociada a este componente fue la más baja. Los autores proponen que las 
condiciones de reforzamiento de la primera fase tienen mayor impacto sobre resurgimiento 
que la tasa de respuesta, incluso si los reforzadores son presentados de manera 
independiente a la conducta objetivo. Hay que tener en cuenta que Podlesnik y Shahan 
(2010) mostraron sus resultados en términos de proporciones y no en valores absolutos, lo 
cual puede hacer una diferencia en cuanto a la interpretación de los datos. 
Generalmente, en la primera fase de resurgimiento sólo se refuerza un 
comportamiento sobre un operando, que más adelante se espera resurja; sin embargo, de 
acuerdo con Da Silva, Maxwell y Lattal (2008) el uso de un programa concurrente permite 
la evaluación de resurgimiento diferencial. Estos autores realizaron un experimento en el 
que reforzaron dos conductas con un programa concurrente IV-1 min, IV-6 min, generando 
tasas de respuestas diferentes, pero manteniendo la tasa de reforzamiento igual para ambas 
en la primera fase. Después llevaron a cabo las siguientes dos fases necesarias para analizar 
resurgimiento. Con respecto a los datos absolutos, el grado de resurgimiento se relacionó 
con el patrón y tasa de respuesta observados en la primera fase y no con la tasa de 
reforzamiento adquirida. La conducta que en la primera fase había mostrado una tasa de 
 
15 
 
respuesta alta tuvo mayor resurgimiento que la que había mostrado una tasa de respuesta 
baja. No obstante, al realizar el análisis en términos de proporciones con respecto a la 
primera fase, no se encontraron diferencias en elgrado de resurgimiento. Tomando en 
cuenta todos los resultados, los autores sugieren que el resurgimiento podría ser una 
función combinada de tasa de reforzamiento (la cual determina la probabilidad de 
ocurrencia) y tasa de respuesta (la cual determina la naturaleza estructural del 
resurgimiento, tal como tiempos entre respuestas). Dada las diferencias encontradas en los 
resultados según la medida utilizada, queda la pregunta de cuál es la mejor manera de 
presentar los datos, en valores absolutos o en proporciones. 
Por último, cabe mencionar que se han estudiado otras variables de resurgimiento 
como la topografía conductual (Leitenberg et al., 1975) o el tipo de reforzador empleado 
(Winterbauer et al., 2012), pero ninguno ha resultado en diferencias significativas en el 
grado de resurgimiento observado. 
 
Explicaciones del resurgimiento 
Han surgido varias explicaciones acerca de los procesos subyacentes al fenómeno 
de resurgimiento, de las cuales en la siguiente sección se revisan tres. Una de las primeras 
explicaciones fue la hipótesis de prevención de respuestas (Rawson, Leitenberg, Mulick & 
Lefebvre, 1977). Esta hipótesis sugiere que al reforzar una conducta alternativa durante la 
extinción de otra, se impide al animal realizar físicamente la respuesta que está en la 
condición de extinción. La respuesta es remplazada tan rápidamente por la nueva conducta 
que realmente nunca pasa por extinción, ya que los sujetos no experimentan suficientes 
asociaciones entre la respuesta y el no-reforzamiento. Entonces la respuesta original nunca 
se extingue, solamente es inhibida por el reforzamiento de otra conducta. Al interrumpir el 
reforzamiento de la respuesta alternativa, la original vuelve a estar disponible y por ello se 
observa resurgimiento. A pesar de que esta hipótesis parece predecir de manera adecuada 
algunos resultados, tiene problemas para explicar otros. Como ya se había mencionado, su 
principal propuesta es que resurgimiento se debe a que el primer comportamiento nunca es 
realmente extinguido. No obstante, existen experimentos en los que la primera conducta es 
explícitamente extinguida antes de pasar a la segunda fase y aun así se observa 
resurgimiento (Epstein, 1983; Lieving & Lattal, 2003). 
 
16 
 
Por otro lado, el resurgimiento también ha sido abordado desde la perspectiva de 
momentum conductual. La teoría de momentum ha dado un marco conceptual para 
entender cómo diferentes condiciones de reforzamiento afectan la resistencia al cambio de 
una conducta. Al pasar sujetos de una fase estable de reforzamiento a una condición de 
extinción, la disminución en la tasa de respuesta provee una medida de resistencia al 
cambio de una conducta. Un hallazgo general de momentum conductual es que la conducta 
más resistente al cambio es aquella que está asociada a estímulos discriminativos con tasas 
de reforzamiento altas (i.e. la relación relevante en resistencia al cambio es la de estímulo 
discriminativo-reforzador). Es así que resistencia al cambio ha sido interpretada como un 
reflejo de reforzamiento y como una medida de fuerza de la respuesta (Podlesnik & 
Shahan, 2010). Podlesnik y Shahan (2009) encontraron que varios efectos de recuperación 
de la respuesta dependen de la relación estímulo discriminativo-reforzador, de la misma 
manera que resistencia al cambio. En una serie de experimentos, estos autores observaron 
que mientras más resistencia al cambio mostraba una conducta, mayor recuperación de la 
respuesta se observaba en procedimientos de restablecimiento, resurgimiento y renovación. 
Los resultados de sus experimentos sugieren que el grado de recuperación de una respuesta 
que se puede llegar a observar, depende de la tasa de reforzamiento en la presencia de un 
estímulo discriminativo en la primera fase, es decir, de la relación pavloviana estímulo-
reforzador. Parecería que la resistencia al cambio y el resurgimiento dependen de las 
mismas variables, y por lo tanto deberían de ser impactados de maneras similares. 
Por último, se ha propuesto que el resurgimiento puede ser explicado en términos de 
señales contextuales. De acuerdo con Bouton (2002), en todos los fenómenos donde se 
puede observar reemergencia de la conducta, existe una falla en generalizar lo aprendido en 
el contexto de extinción a otros contextos. Al pasar a extinción a una respuesta que primero 
había sido asociada con reforzamiento, se le deja con dos asociaciones (reforzamiento y no- 
reforzamiento) y por lo tanto se vuelve ambigua. Entonces el contexto se vuelve 
fundamental, ya que señala la ocasión en la que se debe recuperar la relación respuesta-
reforzador. El ejemplo más claro de esto, es el fenómeno de renovación, en el cual el 
organismo falla en recuperar la asociación de extinción fuera del contexto en que ésta se 
dio (Bouton & Peck, 1989). A partir de esto, Winterbauer y Bouton (2010) han propuesto 
que resurgimiento puede ser entendido como otro ejemplo de renovación. De acuerdo con 
 
17 
 
estos autores, en el procedimiento para observar resurgimiento hay un claro cambio en los 
estímulos contextuales en la transición de fase a fase (considerando que la propia conducta 
de los individuos, el paso del tiempo y la presencia o ausencia de reforzadores pueden 
funcionar como estímulos discriminativos de un contexto). En específico, durante la 
segunda fase del procedimiento de resurgimiento, la presencia del segundo comportamiento 
y la recompensa asociada a él funcionan como estímulos de un contexto en donde la 
primera conducta no es reforzada. Al pasar a la tercera fase de extinción, se eliminan estos 
estímulos discriminativos (el segundo comportamiento y el reforzador), cambiando el 
contexto en el que se extinguió la primera conducta. Como se mencionó anteriormente, al 
sacar a los animales del contexto de extinción, la conducta que ya estaba extinta reaparece y 
por ello se observa resurgimiento, que de acuerdo con esta perspectiva sería un caso más de 
renovación. Esta explicación de resurgimiento como renovación, es compatible con la 
explicación de extinción que propone que la respuesta deja de ocurrir cuando el animal no 
generaliza entre condicionamiento y extinción (Capaldi, 1994). De esta manera, para el 
caso de resurgimiento se puede predecir que si se generalizan los contextos entre la segunda 
y la tercera fase, habrá poco resurgimiento. Winterbauer y Bouton (2010, 2012) han 
encontrado evidencia de que al utilizar programas de reforzamiento con tasas de 
reforzamiento bajas en la segunda fase, se observa menos resurgimiento. Este resultado 
podría deberse a que los animales generalizan de la segunda fase a extinción, ya que el 
cambio en el contexto no es claro en cuanto a los reforzadores entregados. 
Aunque parece una explicación que podría dar cuenta de por qué sucede 
resurgimiento, Winterbauer et al. (2012) realizaron un estudio en donde los datos no 
apoyan completamente esta hipótesis. Estos investigadores realizaron un experimento en 
donde el primer y el segundo comportamiento fueron entrenados con diferentes 
reforzadores, pellets regulares y de sacarosa. Esta manipulación debió haber agregado un 
estímulo discriminativo a cada contexto, haciendo los cambios de fase a fase más 
diferenciables y con ello, debería observarse mayor grado de resurgimiento. Sin embargo, 
se encontró que al usar diferentes tipos de reforzadores para cada fase, el grado de 
resurgimiento obtenido era comparable al grado de resurgimiento que se observa si se usa 
el mismo tipo de reforzador en ambas fases. Este resultado no concuerda con la idea de que 
resurgimiento es un tipo de renovación. 
 
18 
 
Resurgimiento de patrones conductuales 
Más allá de la evaluación general de resurgimiento en función de las contingencias 
pasadas, las investigaciones sobre las variables y mecanismos mencionadas previamente se 
han centrado principalmenteen el análisis de respuestas discretas. El estudio de la conducta 
vista como un patrón de respuestas y no como una sola respuesta parece importante, ya que 
se ha encontrado que no todos los principios que aplican a respuestas simples, también lo 
hacen a patrones conductuales más complejos (Reid et al., 2001). 
De acuerdo con esto, Canҫado y Lattal (2011) analizaron el resurgimiento de 
patrones de respuestas temporalmente organizados. Se llevó a cabo un experimento en 
donde en la primera fase se reforzaron las respuestas de palomas bajo un programa múltiple 
de dos componentes (IV e intervalo fijo (IF)). En la segunda fase se reforzó otra conducta, 
y en la tercera se pasó a extinción. En la primera fase, en el componente IV el patrón 
conductual observado fue una tasa de respuesta constante, mientras que en el IF se observó 
un patrón de festoneo. Las propiedades estructurales adquiridas en la primera fase se 
mantuvieron al momento de resurgir, es decir, no sólo resurgió la respuesta entrenada, sino 
también el patrón temporal de respuestas desarrollado. Si en la primera fase se adquirió un 
patrón de festón, en la fase de resurgimiento se volvía a presentar. Estos resultados 
concuerdan con lo propuesto por Da Silva et al. (2008), los cuales utilizando como unidad 
de análisis una respuesta simple, sugirieron que las propiedades estructurales de la conducta 
establecida en la primera fase -tales como tiempo entre respuestas- se ven reflejadas en 
resurgimiento y no la respuesta sola. 
Aunque un análisis molecular como el realizado por Canҫado y Lattal (2011) 
permite un estudio más detallado de la conducta, el uso de secuencias de respuestas hace 
posible estudiar situaciones en las que la estructura de la conducta es directamente 
manipulable (Neuringer et al., 2001; Robles, 2012). Asimismo, el uso de secuencias de 
respuestas permite observar cómo patrones conductuales complejos se conforman en 
unidades conductuales (Grayson & Wasserman, 1979). 
El procedimiento de resurgimiento aplicado a secuencias de respuestas ha sido 
utilizado como una demostración de que el reforzamiento llevado a cabo durante la primera 
fase fortalece a la secuencia de respuestas como unidad, de manera que ésta resurge en una 
tercera fase de manera íntegra. Bachá-Méndez, Reid y Mendoza-Soylovna (2007) llevaron 
 
19 
 
a cabo un experimento en el que encontraron que una secuencia de dos respuestas a dos 
operandos resurge como una unidad. El experimento constó de 4 fases. En la primera fase 
se reforzó una secuencia heterogénea (ID o DI). En la segunda y tercera fase se reforzó una 
secuencia homogénea (II o DD) diferente para cada fase. En la última fase se reforzó otra 
secuencia heterogénea. En las fases 1 y 4 en las que una secuencia heterogénea estaba 
siendo reforzada, se observó que el error más frecuente fue repetir la respuesta más cercana 
a la entrega del reforzador (e.g. si la secuencia ID estaba siendo reforzada, una secuencia 
errónea muy frecuente era DD). Esto parece haber sido controlado por procesos a nivel de 
respuesta, ya que la posición ordinal de las respuestas en la secuencia afectó 
diferencialmente la producción de los errores. En cuanto a resurgimiento, todos los sujetos 
mostraron resurgimiento íntegro de la secuencia heterogénea entrenada en la primera fase, 
lo que parece indicar que resurgimiento es un proceso que operó a nivel de la secuencia 
como unidad. Estos resultados sugieren que los sujetos emitieron la secuencia reforzada 
como si fuera una unidad conductual, afectada por las contingencias como un todo. No 
obstante, fue posible observar tanto procesos a nivel de respuesta como a nivel de secuencia 
operando simultáneamente, dentro de una unidad conductual claramente establecida. 
El resurgimiento de secuencias como una unidad íntegra también ha sido encontrado 
en secuencias de respuestas más largas. Sánchez-Carrasco y Nieto (2005), utilizando 
secuencias de tres respuestas a dos operandos observaron que éstas resurgían de manera 
íntegra en un procedimiento de resurgimiento. Asimismo, Reed y Morgan (2006) también 
usando secuencias de tres respuestas a dos operandos, encontraron evidencia de un efecto 
de primacía y recencia. En el estudio realizado por estos autores, seis ratas fueron 
entrenadas a realizar tres secuencias heterogéneas de manera consecutiva y posteriormente, 
se pasó a una condición de extinción. Los resultados mostraron que en extinción, la 
secuencia de respuestas más frecuente fue la última en haber sido entrenada (efecto de 
recencia). La segunda secuencia más frecuente fue la primera secuencia entrenada (efecto 
de primacía). Los efectos de primacía y recencia operaron sobre las secuencias como un 
todo, y no en cada uno de sus elementos por separado. 
En los estudios de Sánchez-Carrasco y Nieto (2005) y Reed y Morgan (2006) no se 
tomó en cuenta que en secuencias de tres respuestas a dos operandos existen cuatro 
estructuras posibles (Robles, 2012). Dado que se conoce que de acuerdo a la estructura hay 
 
20 
 
un gradiente de dificultad de adquisición, esto pudo haber influido en los resultados 
observados. De esta forma, un análisis en función de la estructura de las secuencias 
reforzadas parece importante. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
21 
 
Planteamiento del problema 
Un tema de interés en el análisis experimental de la conducta ha sido el estudio de 
secuencias de respuestas como operantes. Varios trabajos han encontrado que al entrenar 
secuencias de respuestas, éstas pueden ser integradas en unidades conductuales (Grayson & 
Wasserman, 1979; Reid et al., 2001), lo que las hace una unidad de análisis válida para el 
estudio de diversos fenómenos. 
El uso de secuencias de respuestas hace posible estudiar situaciones en las que la 
estructura de la conducta es directamente manipulable. Por ejemplo, al utilizar secuencias 
de tres respuestas a dos operandos existen ocho posibles maneras de realizar una secuencia, 
las cuales pueden ser agrupadas en 4 estructuras (AAA, ABB, ABA y AAB) de acuerdo al 
orden temporal de las respuestas de la secuencia (véase la Figura 1). Se ha encontrado que 
la estructura es una variable importante en la adquisición de una secuencia. Asimismo, 
algunos estudios sugieren que existe un gradiente de dificultad según la estructura de la 
secuencia reforzada, esto de acuerdo a la velocidad de adquisición y a la asíntota de 
reforzamiento alcanzada en fases de estado estable (Neuringer et al., 2001; Robles, 2012). 
Por otro lado, se ha observado que cuando una conducta que estaba siendo efectiva 
para obtener reforzadores deja de serlo, comportamientos que fueron exitosos en el pasado 
son los más probables en aparecer (Epstein, 1983). Este fenómeno recibe el nombre de 
resurgimiento y se ha observado en una variedad de especies, que va de ratas a humanos 
(Wilson & Hayes, (1996); Winterbauer et al., 2012). El método general para estudiar 
resurgimiento consta de tres fases: 1) reforzamiento de la conducta 1, 2) extinción de la 
conducta 1 y reforzamiento de la conducta 2 y 3) extinción de la conducta 2. Con este 
procedimiento, la conducta aprendida en la primera fase, que generalmente es una sola 
respuesta discreta, se espera resurja en la tercera fase de extinción. En la mayoría de los 
estudios de resurgimiento se ha utilizado como unidad de análisis una respuesta discreta. 
Existen pocos trabajos en los que se haya estudiado resurgimiento de secuencias de 
respuestas. No obstante, Bachá-Méndez et al. (2007) encontraron que al reforzar una 
secuencia de dos respuestas a dos operandos en una primera fase, se puede observar 
resurgimiento de ésta como una unidad integrada. En el presente trabajo se realizó un 
experimento con las tres fases propuestas por Epstein (1983) para observar resurgimiento, 
pero como unidad conductual se utilizaronsecuencias de respuestas. Un primer propósito 
 
22 
 
fue estudiar cómo los animales distribuyen su comportamiento al reforzarse dos secuencias 
de tres respuestas con la misma estructura en una primera fase. Un segundo propósito fue 
analizar si se observaría resurgimiento de los patrones conductuales desarrollados en la 
primera fase. 
Los objetivos específicos fueron: 
-Analizar cómo los animales distribuyen su conducta al reforzarse dos secuencias de tres 
respuestas con la misma estructura. 
-Estudiar si la estructura de las secuencias reforzadas es una variable importante en la 
manera en que los animales ordenan su comportamiento. 
-Analizar si al reforzar las dos secuencias correspondientes a cada estructura se encuentra 
un gradiente de dificultad en función a ésta. 
-Observar si en la tercera fase hay resurgimiento de los patrones conductuales establecidos 
en la primera fase. 
-Observar si la estructura reforzada en la primera fase es una variable importante en el 
grado de resurgimiento presentado en la tercera fase. 
-Analizar si la distribución de la conducta establecida al final de la primera fase se 
mantiene durante la prueba de resurgimiento. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
23 
 
Método 
Sujetos 
Se utilizaron nueve ratas hembras de la cepa Wistar experimentalmente ingenuas, 
con aproximadamente 4 meses de edad al inicio del experimento. Fueron mantenidas al 
80% de su peso ad libitum durante el transcurso de todo el experimento y se alojaron en 
cajas habitación individuales con acceso libre a agua. Las sesiones experimentales se 
llevaron a cabo 5 días por semana. Dos horas después de cada sesión se alimentó a las ratas 
para mantener su peso corporal. 
 
Aparatos 
Se utilizaron cuatro cámaras experimentales de condicionamiento operante (MED 
Associates), cada una de ellas ubicada dentro de una caja sono-amortiguadora. Todas las 
cajas estuvieron conectadas a una interfase MED Associates que controló cada sesión 
experimental. El techo y las paredes laterales de las cámaras fueron de acrílico, mientras 
que el panel frontal y posterior fueron de acero inoxidable. El piso fue de barras cilíndricas 
de acero. En el panel posterior se encontraba una luz general de 28 v. En el panel frontal se 
encontraban dos palancas: una del lado izquierdo y una del derecho, arriba de cada una se 
encontraba un foco de 28 v. Entre las dos palancas había una abertura cúbica de 4 cm por 
lado, con un orificio en la parte inferior a través del cual subía una copa que estaba en el 
extremo de un brazo que era activado dependiendo del programa de reforzamiento. La copa 
proporcionaba 0.1 ml de leche ultra-pasteurizada 
 
Procedimiento 
Moldeamiento. Para entrenar a las ratas a presionar las palancas se les expuso a un 
programa de reforzamiento concurrente razón fija (RF) 1 RF 1 en las dos palancas, de tal 
manera que cada respuesta dada a cualquiera de las dos palancas entregaba 0.1ml de leche 
ultra-pasteurizada. Un programa concomitante (Imam & Lattal, 1992) entregaba un 
reforzador independiente de las respuestas del sujeto conforme a un programa de tiempo 
fijo (TF). En la primera sesión, el valor del TF fue de 20 segundos para todos los sujetos. 
En las sesiones subsecuentes se incrementó el valor del TF de acuerdo a la ejecución de 
 
24 
 
cada sujeto. Se mantuvo a los sujetos en este programa hasta que en una sesión obtuvieron 
al menos 20 reforzadores en el programa concurrente. 
 
Entrenamiento. El entrenamiento constó de tres fases. Se llamó a los operandos de 
acuerdo a su localización: izquierda (I) y derecha (D). En la primera fase de entrenamiento, 
se reforzó cualquiera de las cuatro posibles secuencias de dos respuestas a dos operandos, 
es decir, si los sujetos ejecutaban cualquiera de las siguientes combinaciones: II, ID, DI o 
DD, obtenían un reforzador. Cada sesión inició con la luz general y las luces sobre las 
palancas prendidas hasta que el sujeto emitía una secuencia de respuestas. Al ejecutarse 
cualquiera de las secuencias de dos respuestas a dos operandos se apagaban todas las luces, 
sonaba un tono durante 5 segundos y se entregaba 0.1 ml de leche. Se mantuvo a los sujetos 
en esta fase hasta que se entregaron 50 reforzadores en una sesión. 
La segunda fase de entrenamiento consistió en el reforzamiento únicamente de las 
secuencias heterogéneas de dos respuestas a dos operandos, las cuales son: ID y DI. Al 
ejecutarse cualquiera de las secuencias heterogéneas, se apagaban todas las luces, sonaba 
un tono durante 5 segundos y se entregaba 0.1 ml de leche. Si ejecutaban cualquier otra 
secuencia, entonces todas las luces se apagaban durante 2 segundos y las respuestas 
emitidas durante este periodo no tenían ningún efecto programado. Esto se realizó para 
entrenar a las ratas a alternar entre las dos palancas. Esta condición se mantuvo durante 
ocho sesiones. 
La última parte del entrenamiento consistió en el reforzamiento de todas las 
secuencias heterogéneas de tres respuestas a dos operandos: IDD, IDI, IID, DII, DID y 
DDI. Para todas las ratas esta fase duró al menos 10 sesiones, y hasta que obtuvieran 70 
reforzadores por sesión, durante tres sesiones consecutivas. 
 
Fases experimentales. En la primera fase experimental se asignó aleatoriamente a 
las ratas a uno de tres grupos: ABB, ABA y AAB. Cada grupo quedó conformado por tres 
sujetos. En el grupo ABB los sujetos recibieron 0.1 ml de leche al ejecutar las secuencias de 
respuestas IDD o DII. Si ejecutaban cualquier otra secuencia, entonces todas las luces se 
apagaban durante 2 segundos y las respuestas emitidas durante este periodo no tenían 
ningún efecto programado. El grupo ABA obtuvo el reforzador al realizar la secuencia IDI 
 
25 
 
o la secuencia DID, la ejecución de cualquier otra secuencia no fue reforzada. Por último, el 
grupo AAB obtuvo el reforzador al ejecutar la secuencia IID o la secuencia DDI. Cada 
ensayo consistía de tres respuestas, tanto secuencias de respuestas correctas, como 
incorrectas. Las sesiones duraron 150 ensayos o 30 minutos. Esta fase se terminó cuando 
las ratas obtuvieron en total 2,000 reforzadores. 
En la segunda fase del experimento, se reforzó una secuencia homogénea de tres 
respuestas, III o DDD, durante 15 sesiones. A cada sujeto se le asignó de manera aleatoria 
que secuencia era la reforzada, controlando que en todos los grupos hubiera al menos un 
sujeto al que se le reforzaba III y uno al que se le reforzaba DDD. 
En la última fase, todas las ratas pasaron a extinción, es decir, ninguna respuesta fue 
reforzada durante 15 sesiones. El diseño completo del experimento se puede observar en la 
Tabla 2. 
 
 
 
 
 
 
 
Tabla 2 
Diseño experimental 
Grupo 
Fases 
1 2 3 
ABB 
n=3 
 
IDD 
DII 
 
 
 
III o DDD 
 
 
Extinción 
ABA 
n=3 
 
IDI 
DID 
 
AAB 
n=3 
IID 
DDI 
 2,000 reforzadores 15 sesiones 15 sesiones 
 
26 
 
Resultados 
Con el propósito de conocer cómo las diferentes posibles estructuras y secuencias se 
distribuyeron durante la primera fase, el análisis de resultados se inició con la frecuencia de 
ocurrencia de todas las posibles estructuras y secuencias de respuestas. En la Figura 2 se 
muestran los resultados de la primera fase separando por estructura para cada sujeto. En el 
panel superior se encuentran los resultados del grupo ABB, en el panel intermedio los del 
grupo ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques 
de 5 sesiones y el eje de las ordenadas la frecuencia de cada estructura. Los rombos blancos 
representan la estructura AAA, los cuadrados negros la estructura ABB, los círculos negros 
la estructura ABA y los triángulos blancos la estructura AAB. Cada estructura es la suma 
de la frecuencia de las dos secuencias de respuestas correspondientes.La línea roja indica 
la estructura reforzada a cada sujeto. 
En la Figura 2 se puede observar cómo los animales distribuyeron su conducta entre 
las cuatro posibles estructuras según la estructura reforzada a lo largo de la primera fase. 
Para el grupo ABB se observa que los sujetos tardaron entre 5 y 7 bloques de 5 sesiones en 
completar la primera fase. La estructura reforzada (línea roja) fue la más frecuente de las 
cuatro estructuras y alcanzó una asíntota de frecuencia que varió entre 68 y 100 en los 
últimos dos bloques. La segunda estructura más frecuente fue AAA para los tres sujetos del 
grupo y fue ejecutada con una frecuencia que varió de 26 a 46 durante las últimas sesiones 
de la fase. La estructura AAB fue realizada con una frecuencia entre 20 y 30 a lo largo de la 
fase. Por último, la estructura ABA fue la menos ejecutada, con una frecuencia menor a 15 
durante toda la fase. 
Para el grupo ABA se observa que dos de los sujetos, N1 y N6, tardaron 5 bloques 
y que el sujeto N8 tardó 8 bloques de 5 sesiones en completar la primera fase. La estructura 
ABA, la cual fue reforzada, fue la más frecuente de las cuatro estructuras y alcanzó una 
asíntota de frecuencia entre 76 y 97 en los últimos dos bloques de 5 sesiones. Las 
estructuras ABB y AAB fueron ejecutadas con frecuencias similares, entre 15 y 30. La 
estructura AAA fue la menos frecuente durante toda la fase, con una frecuencia menor a 20. 
En el grupo AAB se observa que los sujetos tardaron entre 9 y 11 bloques en 
completar la primera fase. Este fue el grupo que tardó más en completarla. La estructura 
reforzada no fue la más frecuente de las cuatro estructuras, siendo ejecutada con una
 
27 
 
Fase 1 por estructura 
F
re
cu
en
ci
a 
d
e 
es
tr
u
ct
u
ra
 
Bloques de 5 sesiones 
ABB 
ABA 
AAB 
Figura 2. Ejecución por estructura de cada sujeto de los tres grupos ABB (panel superior), ABA (panel intermedio) y AAB (panel 
inferior). La línea en rojo indica la estructura reforzada a cada sujeto. 
--:>-AAA 
....... ABB 150 150 150 
N2 N5 N7 __ AB A 
120 120 120 
_ AAB 
90 ><=:: : 90 90 60 60 60 
30 30 30 
• • • • O --- O • • • O --- -
2 3 4 5 6 2 3 4 5 6 7 2 3 4 5 
150 150 150 
" 1 ~6 N8 
120 120 120 
90 / • • 90 90 
~ 
• 
60 60 60 
30 
~ ;:::J ~ 
30 :- ~ -; J 30 
O O O 
2 3 4 5 2 3 4 5 2 3 4 5 6 7 8 
150 150 150 
N3 N4 N9 
120 120 120 
90 90 90 
(,0 
?!FS;:~ 
60 60 
~ 30 30 _lO O O O 
2 3 4 5 6 7 ~ 9 2 3 4 5 6 7 ~ 9 10 II 2 3 4 5 6 7 ~ 9 10 II 
 
28 
frecuencia entre 44 y 54, la frecuencia más baja para la estructura reforzada de los tres 
grupos. La estructura ABB fue efectuada con mayor frecuencia que la estructura reforzada 
para el sujeto N3 y aproximadamente con la misma frecuencia que la estructura reforzada 
para los sujetos N4 y N9. La estructura ABA también fue realizada con una frecuencia 
similar a la estructura reforzada, con valores entre 30 y 45 para los sujetos N4 y N9. El 
sujeto N3 fue el único en realizar esta estructura con una frecuencia menor a 30. La 
estructura AAA fue la menos ejecutada por todos los sujetos al final de la fase, con una 
frecuencia alrededor de 20. 
 Se realizó un ANOVA de medidas repetidas de las cuatro estructuras (AAA, ABB, 
ABA y AAB) en el último bloque de la primera fase y como variable entre-sujetos se tuvo a 
los tres grupos. Se encontró un efecto principal de estructura, F (3, 18)= 20.06, p < .05. No 
se encontró un efecto significativo de grupo, F (2, 6)= 0.56, p > .05. No obstante, se 
encontró un efecto significativo de la interacción de estructura con grupo F (6, 18) = 52.35, 
p < .05. Se realizaron contrastes para la interacción entre estructura y grupo. Se encontró 
que los contraste de las estructuras AAA-AAB, F (2, 6)= 52.43, p < .05., el ABB-AAB, F 
(2, 6)= 29.24, p < .05, y el ABA-AAB, F (2, 6)= 94.74, p < .05., fueron significativamente 
diferente entre los grupos. La comparación de las estructuras AAA, ABB y ABA con 
respecto a la estructura AAB, fue diferente de acuerdo al grupo. Esto parece estar indicando 
que las diferentes estructuras se distribuyeron de diferente manera según el grupo (i.e. 
según la estructura reforzada). 
Con el fin de analizar más detalladamente la distribución de la conducta entre las 
cuatro posibles estructuras en estado estable, en la Figura 3 se muestra por grupo el 
promedio de frecuencia de cada estructura en el último bloque de la primera fase. En el 
grupo ABB la estructura más frecuente fue la reforzada (ABB). Después de la reforzada, la 
estructura AAA fue la siguiente más frecuente, seguida por la estructura AAB y por último, 
la estructura ABA que prácticamente no fue ejecutada. 
En el caso del grupo ABA se observa que la estructura reforzada ABA fue la más 
frecuente. Después de la estructura reforzada, la estructura AAB fue la siguiente más 
frecuente, seguida de las estructuras ABB y AAA que fueron las menos ejecutadas de todas 
las estructuras. 
 
 
29 
Por último, para el grupo AAB se puede observar que tanto la estructura reforzada 
AAB como la estructura ABB tuvieron frecuencias muy cercanas y fueron las más 
frecuentes. La siguiente estructura más frecuente fue ABA. Por último, la estructura AAA 
fue la menos ejecutada por este grupo. 
Para analizar si durante la primera fase las secuencias de respuestas reforzadas se 
diferenciaron de las otras posibles secuencias en la Figura 4 se muestran las frecuencias de 
las diferentes posibles secuencias a lo largo de la primera fase para cada sujeto. En el panel 
superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo 
ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques de 5 
sesiones y el eje de las ordenadas la frecuencia de cada secuencia. Los rombos blancos 
representan la secuencia III, los rombos negros la secuencia DDD, los cuadrados blancos la 
Estructura 
F
re
cu
en
ci
a 
d
e 
es
tr
u
ct
u
ra
 
Grupo ABB Grupo ABA 
Grupo AAB 
Figura 3. Frecuencia promedio de cada estructura durante el último bloque de 5 sesiones de 
la primera fase por grupo. La gráfica superior izquierda muestra los resultados del grupo 
ABB, la inferior los del grupo AAB y la superior derecha los del grupo ABA. 
 
 
30 
secuencia IDD, los cuadrados negros la secuencia DII, los triángulos blancos la secuencia 
IID y los triángulos negros la secuencia DDI. Las líneas rojas indican las dos secuencias de 
respuestas reforzadas. 
En esta figura se puede observar que la frecuencia de las ocho posibles secuencias 
difirió entre grupos. Para el grupo ABB se observa que todos los sujetos realizaron sólo una 
de las dos secuencias con las que podían obtener reforzamiento. Los sujetos N2 y N7 
ejecutaron la secuencia DII con una frecuencia cercana a 90, la secuencia IDD que también 
estaba programada para entregar reforzadores al ser ejecutada tuvo una frecuencia cercana a 
cero. Para estos dos animales, la siguiente secuencia más ejecutada consistentemente fue 
III, es decir, tres respuestas en el operando más contiguo temporalmente a la entrega del 
reforzador. Las demás secuencias fueron efectuadas con una frecuencia menor a 30. El 
sujeto N5 realizó la secuencia IDD con una frecuencia de 67 al final de la primera fase, la 
otra secuencia no la emitió. Consistente con los otros dos sujetos la siguiente secuencia más 
ejecutada por el sujeto N5 fue aquella que involucraba tres respuestas al operando en el que 
las respuestas eran las más contiguas al reforzador, en este caso DDD. Las demás 
secuencias las emitió con una frecuencia menor a 30. 
Para el grupo ABA se observa que todas las ratas realizaron las dos secuencias con 
las que podían obtener el reforzador, este fue el único grupo que consistentemente realizó 
ambas secuencias programadas para el reforzamiento. Cada sujeto realizó las dos 
secuencias reforzadas con frecuencias muy similares, entre 40 y 50 veces cada secuencia alfinal de la primera fase. Aún el sujeto N8 que tardó más tiempo que los otros sujetos en 
completar la fase, muestra el mismo patrón en las secuencias reforzadas. Las demás 
secuencias fueron realizadas con una frecuencia menor a 30 durante toda la fase, con 
excepción del sujeto N8, el cual en los primeros cuatro bloques de la fase realizó la 
secuencia IDD con una frecuencia mayor a 30. 
Para el grupo AAB se observa que los tres sujetos de este grupo realizaron con 
mayor frecuencia una de las dos posibles secuencias con las que podían obtener el 
reforzador. Para dos sujetos la diferenciación de una de las secuencias reforzadas fue clara, 
los sujetos N3 y N4 realizaron una de las secuencias de manera dominante con una 
frecuencia entre 30 y 45 al final de la primera fase. Mientras que la otra secuencia reforzada 
 
31 
ABA 
AAB 
Fase 1 por secuencia 
F
re
cu
en
ci
a 
d
e 
se
cu
en
ci
a
 
Figura 4. Ejecución de las ocho posibles secuencia de respuestas por sujeto. Se muestran los resultados del grupo ABB (panel superior), 
ABA (panel intermedio) y AAB (panel inferior). La línea en rojo indica las dos posibles secuencias reforzadas a cada sujeto. 
Bloques de 5 sesiones 
ABB 
 
32 
fue ejecutada con frecuencias menores a 15 al final de la fase. Para el sujeto N9 la 
diferenciación entre las dos secuencias reforzadas no fue tan clara, este sujeto realizó ambas 
secuencias con frecuencias cercanas, aunque una de las secuencias reforzadas siempre tuvo 
mayor frecuencia que la otra, consistente con el patrón de ejecución de los demás sujetos 
del grupo. El error más común en este grupo fue la ejecución de las secuencias IDD y DII, 
dependiendo de cuál de las dos posibles secuencias reforzadas era realizada con mayor 
frecuencia por cada sujeto. Por ejemplo, el sujeto N3 realizó la secuencia reforzada DDI 
con mayor frecuencia y el error que más ejecutó fue DII, es decir, una respuesta de más en 
el operando en el que las respuestas eran más contiguas al reforzamiento. El sujeto N4 
realizó la secuencia reforzada IID de manera dominante, y la secuencia errónea que ejecutó 
con mayor frecuencia fue IDD. Estas secuencias no reforzadas (IDD y DII) fueron las más 
ejecutadas por todos los sujetos, con frecuencias entre 30 y 60 al final de la primera fase, 
frecuencia por arriba de las secuencias que recibían el reforzador al ser realizadas. 
Dependiendo del sesgo de las respuestas de cada sujeto, las secuencias de estructura ABA 
(IDI o DID) también fueron ejecutadas con frecuencias altas, entre 20 y 25 veces por sesión 
a lo largo de la fase. Las secuencias de respuestas homogéneas (III y DDD) casi no fueron 
ejecutadas por los sujetos de este grupo. 
Con el fin de analizar si de acuerdo a los reforzadores obtenidos se encontraba algún 
gradiente de dificultad, en la Figura 5 se muestra por grupo el promedio de frecuencia sólo 
de las secuencias reforzadas en el último bloque de la primera fase. En el caso de los grupos 
ABB y AAB, se promedió la frecuencia de la secuencia a la que se sesgaron las respuestas 
de los sujetos independientemente de que fueran diferentes. Por ejemplo, en el grupo ABB, 
los sujetos N2 y N7 realizaron de manera dominante la secuencia DII, mientras que el 
sujeto N5 ejecutó dominantemente IDD; no obstante, se promedió la frecuencia de estas 
secuencias dominantes para cada sujeto independientemente de que fueran DII o IDD. En el 
grupo ABA no se tuvo que hacer esto ya que ambas secuencias reforzadas fueron 
ejecutadas con frecuencias similares. 
En esta figura, se puede observar que el grupo ABB realizó una de las dos posibles 
secuencias reforzadas con mayor frecuencia con un promedio de 84.5 y desviación estándar 
de 16.2. La otra posible secuencia reforzada casi nunca fue ejecutada. En el caso del grupo 
ABA se puede observar que ambas secuencias reforzadas tuvieron frecuencias similares, 46
 
33 
para IDI y 41 para DID en promedio, con desviación estándar de 5.4 y 2.5 respectivamente. 
Cada secuencia por separado no fue ejecutada más de 50 veces. 
El grupo AAB realizó una de las dos posibles secuencias reforzadas con mayor 
frecuencia, con un promedio de 35 y una desviación estándar de 8.5. La otra secuencia no 
la realizó más de 15 veces en promedio y desviación estándar de 8.4. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
En la Figura 6 se muestran los resultados de la frecuencia de las diferentes 
secuencias a lo largo de la segunda fase para cada sujeto. En la segunda fase del 
experimento, se reforzó una secuencia homogénea de tres respuestas, III o DDD, durante 15 
sesiones. En el panel superior se encuentran los resultados del grupo ABB, en el panel 
intermedio los del grupo ABA y en el panel inferior los del grupo AAB. El eje de las 
abscisas muestra bloques de 5 sesiones y el eje de las ordenadas la frecuencia de cada 
secuencia. Los rombos blancos representan la secuencia III, los rombos negros la secuencia 
DDD, los cuadrados blancos la secuencia IDD, los cuadrados negros la secuencia DII, los 
círculos blancos la secuencia IDI, los círculos negros la secuencia DID, los triángulos 
blancos la secuencia IID y los triángulos negros la secuencia DDI. La línea roja indica la 
secuencia homogénea (III o DDD) que fue reforzada a cada sujeto. En esta figura se puede 
observar que independientemente del grupo todos los sujetos mostraron patrones similares. 
La secuencia reforzada en esta fase, fuera III o DDD, fue adquirida rápidamente y para el 
Grupo 
F
re
cu
en
ci
a 
d
e 
se
cu
en
ci
a
 
Figura 5. Promedio y desviación estándar de la frecuencia de las secuencias reforzadas 
en el último bloque de 5 sesiones de la primera fase por grupo. 
 
34 
segundo bloque de 5 sesiones todos los sujetos realizaron la secuencia reforzada con una 
frecuencia muy cercana a 150. 
Durante los últimos dos bloques de 5 sesiones todos los sujetos dedicaron 
prácticamente el 100% de los ensayos a realizar la secuencia reforzada. Todas las demás 
secuencias dejaron de ser emitidas, independientemente de las secuencias reforzadas en la 
fase anterior. En los últimos dos bloques, todas las secuencias que no estaban siendo 
reforzadas no fueron emitidas o fueron realizadas con frecuencias cercanas a cero. 
Para analizar cómo las secuencias reforzadas aumentaron y disminuyeron su 
frecuencia a lo largo de todo el experimento, en la Figura 7 se muestran sus frecuencias por 
sujeto a lo largo de las tres fases. En la gráfica de la izquierda de cada sujeto las líneas 
punteadas rojas separan la ejecución de las secuencias reforzadas durante los últimos cuatro 
días de la primera fase (sección izquierda), durante los primeros y últimos tres días de la 
segunda fase (sección media), y durante los primeros cuatro días de la tercera fase (sección 
derecha). La gráfica de la derecha muestra un acercamiento a los primeros 4 días de la 
tercera fase, con el eje de las ordenadas modificado a un valor máximo de 30. En el panel 
superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo 
ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra sesiones y el 
eje de las ordenadas la frecuencia de las secuencias. Los cuadrados blancos representan la 
secuencia IDD, los cuadrados negros la secuencia DII, los círculos blancos la secuencia 
IDI, los círculos negros la secuencia DID, los triángulos blancos la secuencia IID y los 
triángulos negros la secuencia DDI. 
En general, en la Figura 7 se puede observar la frecuencia de las secuencias 
reforzadas al final de la primera fase, como disminuyó su frecuencia durante la segunda 
fase y como en la tercera fase volvió a aumentar la frecuencia con que fueron ejecutadas. 
Para el grupo ABB, los resultados muestran que sólo una de las dos secuencias reforzadas 
al final de la primera fase tuvo una frecuencia muy alta, la otra secuencia casi no fue 
emitida, con frecuencias muy cercanas

Continuar navegando