Reforzamiento-de-estructuras-conductuales--un-estudio-de-resurgimiento

•

Biológicas / Saúde

Medicina Fácil

6/8/2022

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Medicina

250.157 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

FACULTAD DE PSICOLOGÍA

REFORZAMIENTO DE ESTRUCTURAS CONDUCTUALES: UN
ESTUDIO DE RESURGIMIENTO

TESIS
QUE PARA OBTENER EL TÍTULO DE
LICENCIADO EN PSICOLOGÍA
PRESENTA
NATALIA FAVILA VÁZQUEZ

TUTOR: DR. GUSTAVO BACHÁ MÉNDEZ
REVISOR: DR. OSCAR VLADIMIR ORDUÑA TRUJILLO
SINODALES: DR. ROGELIO ESCOBAR HERNÁNDEZ
DR. ÁLVARO TORRES CHÁVEZ
DR. OSCAR ZAMORA AREVALO

Ciudad universitaria, D.F. Mayo de 2013
Proyecto de investigación financiado por
PAPIIT IN303811-2

UNAM – Dirección General de Bibliotecas
Tesis Digitales
Restricciones de uso

DERECHOS RESERVADOS ©
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL

Todo el material contenido en esta tesis esta protegido por la Ley Federal
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México).
El uso de imágenes, fragmentos de videos, y demás material que sea
objeto de protección de los derechos de autor, será exclusivamente para
fines educativos e informativos y deberá citar la fuente donde la obtuvo
mencionando el autor o autores. Cualquier uso distinto como el lucro,
reproducción, edición o modificación, será perseguido y sancionado por el
respectivo titular de los Derechos de Autor.

Agradezco el apoyo de la Universidad Nacional Autónoma de México y el
financiamiento del proyecto PAPIIT IN 303811-2

A mis padres, por todo el cariño y apoyo.

Agradecimientos
A mis padres que ante todo me han brindado una vida llena de cariño y apoyo. Gracias por
la total confianza en lo que hago.
A mi hermana por quererme así como soy y darme un ejemplo a seguir de una gran
persona.
A mi abuela y abuelo (Q.E.P) por ser una parte muy importante de mi vida, siempre
apoyándome y brindándome todo su cariño.
Al Dr. Bachá, gracias por abrirme las puertas de su laboratorio y enseñarme tantas cosas.
Le agradezco mucho todo. Siempre empujándome a pensar las cosas de una manera crítica
y analítica.
A mi revisor de tesis el Dr. Vladimir Orduña y a mis sinodales el Dr. Rogelio Escobar, el
Dr. Oscar Zamora y el Dr. Álvaro Torres. Les agradezco sus valiosos comentarios que me
ayudaron mucho en la realización de la tesis.
A Ixel, gracias por todos los comentarios, pláticas y regaños para que saliera la tesis y por
la amistad que me has dado durante mi estancia en el laboratorio.
A Alma, quien ha compartido conmigo los llantos, enojos y buenos momentos de lo que es
hacer una tesis.
A mis compañeros de laboratorio: Rafa, Erikita, Hammurabi, Adriana y Toño por compartir
conmigo experiencias en el laboratorio.
A Marlene y Mou porque han estado conmigo desde hace tantos años! A pesar de que cada
una está en carreras diferentes, me han acompañado durante todo el proceso.
A Israel, porque fuiste el que vivió todo conmigo y supo escucharme con mucha paciencia.
Gracias por el cariño que me has dado durante estos años.
A mis compañeros del área: Nun, Paco, Dario, Ele, Marisol, Ale, M.J. y de la carrera:
Adriana, Ile, Mary y Dulce, por compartir bonitas experiencias durante estos cinco años.
A mis ratitas, porque sin ellas no habría tesis.

Contenido
Resumen…………………………………………………………………………………..…1
Introducción
Secuencias de respuestas…………………………………………………………….3
Resurgimiento.………………………………………………………...………….....8
Resurgimiento de patrones conductuales.…………………….…………………....18
Planteamiento del problema.……………………………………………………………… 21
Método.…………………………………………………………………………………….23
Sujetos……………………………………………………………………………...23
Aparatos…………………………………………………………………………….23
Procedimiento………………………………………………………………………23
Diseño experimental………………………………………………………………..25
Resultados………………………………………………………………………………….26
Discusión…………………………………………………………………………………...44
Referencias…………………………………………………………………………………53

Resumen
Un tema de interés en el análisis experimental de la conducta es el estudio de secuencias de
respuestas como una operante. Al utilizar una secuencia como unidad conductual, el
reforzador se hace depender no sólo de una respuesta, sino de una serie de ellas ejecutadas
en un orden específico. Las secuencias pueden tener diferentes estructuras espacio-
temporales y existen estudios que sugieren que la curva de aprendizaje varía de acuerdo a la
estructura de la secuencia siendo reforzada. Por otro lado, se observa que patrones
conductuales (secuencias) previamente establecidos y aparentemente extintos, pueden
volver a presentarse en el repertorio conductual de los organismos. Un fenómeno que llama
la atención es el resurgimiento de conductas extintas, el cual es estudiado principalmente
con unidades de respuestas discretas. Un primer propósito del presente trabajo fue estudiar
el efecto de la estructura de las secuencias reforzadas en la distribución de la conducta. Un
segundo objetivo fue analizar si se observaría el resurgimiento de secuencias previamente
reforzadas y si éste dependería de la estructura de las secuencias. Para ello, se llevó a cabo
un experimento de tres fases. En la primera fase, se reforzaron dos secuencias con la misma
estructura (ABB, ABA o AAB), quedando tres grupos de acuerdo a la estructura reforzada.
En la segunda fase, se cambió a las secuencias reforzadas a una condición de extinción por
reforzamiento de otra secuencia. En la tercera fase, ningún comportamiento fue reforzado.
Los resultados mostraron que la manera en que el comportamiento de los sujetos se
distribuyó dependió de la estructura de las secuencias reforzadas. Cada estructura reforzada
produjo un patrón de conducta distintivo y repetitivo en estado estable. El reforzador no
sólo impactó la fuerza de las secuencias de las cuales dependía su entrega, sino que también
modificó la distribución de otras secuencias. Asimismo, de acuerdo a la asíntota de
reforzamiento alcanzada en la primera fase, se encontró un gradiente de dificultad en
función de la estructura reforzada, similar al reportado en otros estudios. En cuanto a
resurgimiento, se encontró que aunque la estructura pudo haber influido, los datos no
presentan suficiente orden. Otras variables como el número de sesiones o la frecuencia de
reforzamiento en la primera fase pudieron haber afectado los resultados observados.

En el estudio de la conducta la decisión sobre como dividir el comportamiento en unidades
de análisis ha sido una tarea difícil. Tradicionalmente, en el análisis experimental de la
conducta se ha utilizado como unidad de análisis una operante discreta (como presionar una
palanca o picar una tecla) sobre la cual se hace contingente el reforzamiento. Sin embargo,
no hay razón para asumir que el efecto del reforzador se restringe a la respuesta discreta
que lo produce. La demora entre algunas respuestas y el reforzador puede variar, pero no
por ello el reforzador no actúa sobre ellas (Catania, 1971). Asimismo, las contingencias de
reforzamiento no solo fortalecen aquellas operantes establecidas por el experimentador,
sino que al mismo tiempo muchas otras conductas experimentan cambios en su fuerza
(Schick, 1971). Entonces ¿Qué es lo que “fortalece” el reforzador? Aunque la contigüidad
temporal entre la respuesta y el reforzador es fundamental, una sola respuesta podría ser
parte de una unidad más grande de varias respuestas y al suponer que solo se fortalece la
más contigua al reforzador, se podrían estar perdiendo otras relaciones ordenadas (Shimp,
1976).
De acuerdo con Timberlake (1993),la conducta de los organismos puede ser
clasificada en sistemas conductuales, los cuales están organizados alrededor de funciones
importantes, como alimentación o reproducción. Diversos componentes de la conducta se
van integrando en patrones cada vez más generales, hasta llegar a grandes sistemas. Los
cambios en el ambiente pueden afectar tanto a los sistemas conductuales como a sus
componentes particulares, generando múltiples efectos sobre la conducta. Entonces, el
substrato sobre el cual el reforzamiento ejerce control no es una acción discreta, sino
patrones de respuestas más generales. Timberlake sugirió que el modelo simple de
reforzamiento respuesta-reforzador podría estar sobre-simplificando un fenómeno biológico
mucho más complejo.
No obstante, no cualquier patrón de comportamiento puede funcionar como una
unidad de conducta, por ello, son necesarios algunos criterios para establecer qué es una
unidad conductual. Operacionalmente, una unidad queda definida como aquella clase de
conducta que se establece como requisito para la obtención del reforzador. La probabilidad
de ocurrencia de una unidad conductual debe de ser afectada por sus consecuencias, es
decir, debe de ser condicionable (Zeiler, 1983). Asimismo, se ha sugerido que una manera
de definir unidades conductuales es demostrando que las relaciones funcionales entre ellas

y ciertos eventos del ambiente son similares a las encontradas con otras unidades (Branch,
1977).

Secuencias de respuestas
De acuerdo con lo anterior, muchas respuestas pueden ocurrir altamente
organizadas, pero no por ello ser unidades condicionables. Operacionalmente, al usar
secuencias de respuestas el reforzador depende no sólo de una respuesta, sino de una serie
de respuestas en un orden temporal específico. Para demostrar que una secuencia de
respuestas puede funcionar como una unidad, se debe probar que su probabilidad de
ocurrencia depende de sus consecuencias. Grayson y Wasserman (1979) llevaron a cabo un
experimento en el que reforzaron una secuencia de dos respuestas a dos operandos durante
varias fases. Los resultados demostraron que una secuencia de dos respuestas es una
propiedad diferenciable del comportamiento de los animales. En cada fase, la frecuencia de
la secuencia reforzada aumentó y la de las otras secuencias disminuyó, lo que parece
indicar que el reforzamiento fortaleció a la secuencia como una unidad. No obstante, un
resultado interesante fue que al reforzar una secuencia heterogénea como izquierda (I) –
derecha (D), una secuencia que se presentaba con mucha frecuencia, era aquella en la que
ocurrían dos respuestas en el operando en el que las respuestas eran más contiguas al
reforzamiento (en este caso DD). Se ha sugerido que esto ocurre porque al reforzar una
secuencia como ID, el animal le asigna mayor crédito a la respuesta más contigua al
reforzamiento, que en este caso sería la respuesta D (Catania, 1971). Este experimento
apoya la idea de que las secuencias pueden funcionar como unidades funcionales y
demuestra cómo el reforzamiento afecta la distribución de una variedad de secuencias.
Otros investigadores han descubierto que algunos procesos -como igualación o el control de
estímulos- encontrados con operantes discretas, también se dan de manera ordenada si se
utilizan secuencias de respuestas como unidad de análisis (Fetterman & Stubbs, 1982;
Wasserman, Deich, & Cox, 1984).
En otra serie de estudios llamados de “elección libre”, se ha encontrado que aun
cuando el procedimiento no requiere la organización de la conducta en unidades, los
animales desarrollan secuencias de respuestas dominantes y altamente estereotipadas. Por
ejemplo, Schwartz (1980) utilizó un procedimiento en el que palomas tenían que picar dos

teclas (I y D), cuatro veces cada una, en el orden que fuera, con el fin de mover una luz del
extremo superior izquierdo al extremo inferior derecho de una matriz de focos de 5x5. Cada
respuesta en la tecla I movía la luz en la matriz hacia el foco de la derecha. Cada respuesta
en la tecla D movía la luz hacía el foco de abajo. Aunque había 70 posibles secuencias que
llevaban a la obtención del reforzador, todos los sujetos desarrollaron solo una secuencia
estereotipada que dominó su comportamiento. Cuando se cambiaron las contingencias de
reforzamiento, la secuencia dominante mantuvo su organización interna. Esto invita a
inferir que la secuencia dominante se volvió una unidad integrada. No obstante, un detalle
importante de este estudio es que cada respuesta fue señalada por un estímulo
discriminativo (el movimiento de las luces en la matriz de focos 5x5). Al quitar la matriz de
luces, se encontró un aumento en la variabilidad y se perdió la organización interna de la
secuencia dominante, lo que sugiere que la conducta estaba bajo el control de los estímulos
discriminativos, no que se haya conformado en una unidad conductual. No obstante, Reid,
Chadwick, Dunham y Miller (2001) encontraron que aún en un procedimiento de operante
libre, reforzando dos secuencias de dos respuestas con la misma probabilidad y sin
estímulos discriminativos, los sujetos desarrollaban una secuencia dominante altamente
organizada. Al analizar los tiempos entre respuestas (TER), Reid et al. (2001) encontraron
que los TER entre secuencias fueron más largos que los TER entre respuestas de una
secuencia. Lo cual sugiere que la conducta se organizó en “conjuntos” de respuestas
diferenciables de acuerdo a las contingencias de reforzamiento, apoyando la idea de que
una secuencia se puede volver una porción diferenciable del flujo conductual de los
animales.
Aunque se han desarrollado estudios tanto con secuencias de respuestas señaladas
por estímulos (cadenas), como sin ellos (secuencias), existe una diferencia en los
procedimientos. En la investigación con cadenas, cada respuesta es señalada por un
estímulo discriminativo o guía y no se permite la ejecución completa de las respuestas
incorrectas, por lo que no es posible monitorear todas las posibles secuencias de respuestas.
Esto imposibilita especificar si un patrón de respuestas se ha diferenciado de otro. En
cambio con secuencias, se permite a los sujetos la ejecución de todas las posibles
combinaciones de respuestas, aunque no sean la secuencia reforzada (Grayson &
Wasserman, 1979). Los diferentes procedimientos con y sin estímulos discriminativos han

dado resultados diferentes en cuanto a la conformación de unidades conductuales. Se ha
encontrado que si se entrenan cadenas, al quitar los estímulos guía la conducta se desordena
(Schwartz, 1980). Esto podría implicar que aunque se realice muy bien la secuencia de
respuestas bajo el control de estímulos, no significa que se haya aprendido a ejecutar la
secuencia completa y que ésta se haya vuelto una unidad funcional. Con secuencias, dado
que no hay estímulos discriminativos explícitos, es más factible afirmar que el individuo ha
integrado una serie de respuestas individuales en una unidad más grande. Terrace (1984)
mencionó que la propuesta de encadenamiento tiene problemas para explicar cómo se
conforman secuencias de respuestas en preparaciones de encadenamiento simultáneo, en
donde todos los estímulos y operandos son presentados al mismo tiempo. No obstante,
responder en un operando podría tener por sí mismo propiedades discriminativas que
influyeran en la probabilidad de las siguientes respuestas.

Estructura en secuencias de respuestas
El uso de secuencias de respuestas hace posible situaciones en las que la estructura
de la conducta puede estudiarse directamente, manipulando el orden temporal de las
respuestas de una secuencia. Por ejemplo, al utilizar secuencias de tres respuestas a dos
operandos (I y D) existen ocho posibles maneras de realizar una secuencia (III, IDD, IDI,
IID, DDD, DII, DIDy DDI), las cuales pueden ser agrupadas en cuatro estructuras que
llamaremos: AAA, ABB, ABA y AAB. A cada estructura le corresponde una regla general
de ejecución que aplica a dos secuencias. Por ejemplo, para la estructura ABA, la regla es
alternar dos veces de operando, en este caso tanto la secuencia IDI como DID tienen la
estructura ABA. En la Figura 1 se muestra un diagrama de cómo se conforman las ocho
posibles secuencias de tres respuestas a dos operandos y su agrupación por estructura.
Uno de los primeros estudios en los que se encontró un efecto diferencial según la
estructura de las secuencias de respuestas fue hecho por Polidora (1963). Polidora entrenó a
un grupo de ratas a realizar una serie de secuencias de respuestas con diferente estructura
(manipulando el largo de la secuencia, el número de alternaciones entre operandos, etc.).
Cuando las respuestas de las ratas alcanzaron un estado estable en las diferentes secuencias
(i.e. durante tres sesiones consecutivas la tasa de respuestas y la proporción de secuencias
correctas se mantuvieron constantes), se les inyectó la droga JB 329 en tres diferentes

dosis: 0.25, 0.5 y 1 mg/kg. Se encontró que el efecto de la droga dependía de una
interacción entre la dosis y la estructura de la secuencia entrenada. El desempeño de
secuencias “sencillas” (las más cortas y con menos alternaciones) fue menos afectado por
las diferentes dosis administradas que el desempeño de secuencias “difíciles”. Polidora
propuso que el uso de secuencias de respuestas provee un medio para estudiar un continuo
de conducta compleja, y a partir de las diferentes estructuras planteó el siguiente gradiente
de complejidad: 1) secuencias más cortas son más sencillas que secuencias más largas; 2)
secuencias que requieren el regreso a un operando son más complejas; 3) las secuencias
más complejas son las “secuencias de conteo” (e.g. AAB, porque implica “contar” dos
respuestas en un mismo operando (A) y luego cambiar a otro operando (B)). No obstante,
Polidora no llevó a cabo un estudio sistemático tomando en cuenta todas las posibles
combinaciones de secuencias, sino que escogió aleatoriamente algunas de las posibles
secuencias de dos, tres y cuatro respuestas, por lo que no pudo estudiar el panorama
completo de todas las posibles estructuras.
Más recientemente, Neuringer, Kornell y Olufs (2001) en un experimento sobre
variabilidad con secuencias de tres respuestas a tres operandos también sugirieron que
parece haber un gradiente de dificultad en la ejecución de secuencias. Estos autores
realizaron una serie de experimentos en los que en una primera fase reforzaron variabilidad,
de tal manera que una secuencia de respuestas recibía reforzamiento solo si había sido
realizada con una frecuencia relativa menor o igual a .05 en los ensayos anteriores. En una
segunda fase, se pasó a los sujetos a una condición de extinción, en donde ninguna
Figura 1. Diagrama de todas las posibles secuencias de tres respuestas a dos operandos
(izquierda y derecha) y su agrupación por estructura.

conducta fue reforzada. Se observó que durante la primera fase se desarrolló una jerarquía
de ejecución, en donde secuencias de respuestas aparentemente más sencillas (como dar
tres respuestas en un mismo operando) ocurrieron más frecuentemente que secuencias
difíciles (como alternar las respuestas entre los tres operandos). Al pasar a una fase de
extinción, aunque hubo un aumento en la variabilidad, la distribución de las posibles
secuencias se mantuvo constante, es decir, las secuencias más probables durante
reforzamiento, también lo fueron en extinción. Lo que se aprendió durante la fase de
reforzamiento se vio reflejado en la fase de extinción. Asimismo, durante extinción las
secuencias mantuvieron la integridad y organización interna que habían desarrollado
durante el reforzamiento. Los resultados de Neuringer et al. (2001) sugieren que las
contingencias pudieron haber estado actuando a nivel de las secuencias completas, en vez
de en las respuestas individuales que componen a las secuencias. No obstante, Reid, Dixon
y Gray (2008) mencionaron que esto implicaría que cada una de las 27 posibles secuencias
de tres respuestas a tres operandos se volvió una unidad con fuerza independiente, lo cual
resulta muy poco probable. Es posible que algunas de las secuencias más frecuentes se
conformaran en unidades conductuales, pero algunas de las secuencias fueron ejecutadas
muy poco y casi no fueron reforzadas. Al re-analizar los datos, estos autores encontraron
que la primera respuesta parecía depender únicamente de los estímulos que indicaban el fin
del ensayo anterior, tales como la entrega de comida o el apagón de luces (cuando la
secuencia emitida había sido incorrecta). La segunda y tercera respuesta parecen haber
dependido únicamente del operando en que había sido ejecutada la respuesta anterior, el
operando seleccionado dos respuestas antes no parece haber influido en la respuesta actual.
Es por ello que Reid et al. (2008) sugieren que la distribución de secuencias observada en el
experimento de Neuringer et al. (2001) se pudo haber debido a procesos a nivel de las
respuestas individuales más que a nivel de las secuencias como unidades.
Por su parte, Robles (2012) observó que la estructura es una variable importante en
el aprendizaje de una nueva secuencia de respuestas. Robles (2012) estudió directamente la
estructura reforzada de secuencias de tres respuestas en dos operandos en un experimento
de dos fases. En la primera fase, se reforzó una secuencia de tres respuestas con una
determinada estructura, quedando cuatro grupos: AAA, ABB, ABA y AAB, dependiendo
de la estructura de la secuencia reforzada. En la segunda fase, se reforzó una secuencia

diferente, de manera que la nueva secuencia reforzada difiriera de la anterior en la primera
o última respuesta de la secuencia. Por ejemplo, si en la primera fase se había reforzado la
secuencia IID, en la segunda fase a la mitad de los sujetos se les reforzaba DID (cambio en
la primera respuesta) y a la otra mitad III (cambio en la última respuesta). Sus resultados
mostraron que la velocidad de adquisición y la asíntota de reforzamiento alcanzada en una
fase de estado estable, dependieron de la estructura reforzada en ambas fases,
independientemente de en qué respuesta fueran diferentes la primera de la segunda
secuencia entrenada. Asimismo, sus resultados también sugieren un gradiente de dificultad
en función de la estructura de la secuencia reforzada. De acuerdo a sus resultados la
estructura AAA es la más sencilla dado que las respuestas alcanzan una asíntota de
reforzamiento obtenido alta en poco tiempo; y la estructura AAB es la más difícil, ya que
las respuestas alcanzan una asíntota de reforzamiento obtenido baja y tardan
comparativamente más tiempo en llegar a este nivel. Este gradiente concuerda a grandes
rasgos con lo reportado tanto por Polidora (1963) como por Neuringer et al. (2001).
Dada la evidencia experimental, parecería que hay razón para tomar a una secuencia
de respuestas como unidad de análisis. Al reforzar una sola respuesta, la variabilidad que se
puede llegar a estudiar está limitada por los parámetros físicos de la respuesta. En cambio,
al utilizar secuencias de respuestas se puede cuantificar el conjunto de todas las posibles
secuencias de respuestas y con ello estudiar la distribución y variabilidad de la conducta de
manera sistemática. Asimismo, al usar unidades conductuales pequeñas podríamos estar
limitando la generalidad de nuestras leyes conductuales (Shimp, 1976). Al usar las
secuencias como unidad de análisis, es posible cuantificar cómo el reforzador afecta no sólo
a la secuencia sujeta a reforzamiento, sino a todas las posibles secuencias.

Resurgimiento
El análisis de cómo las condicionesde reforzamiento pasadas interactúan con la
conducta en el presente, se ha realizado en estudios que investigan los efectos de programas
de reforzamiento usados previamente sobre la conducta actual. Uno de los métodos
generales para estudiar la historia de reforzamiento consta de tres fases. En la primera, una
respuesta particular es establecida. En la segunda, la tasa de respuesta mantenida
inicialmente es reducida a cero. En la tercera, se realiza una prueba de persistencia de la

conducta (Lieving & Lattal, 2003). Existe una literatura creciente sobre el papel de estas
variables que se describen como históricas, ya que se ha observado que en diversas
instancias, patrones conductuales previamente establecidos y aparentemente extintos,
vuelven a presentarse en el repertorio conductual. Se conocen varios fenómenos de
reemergencia de la conducta, tales como: renovación, restablecimiento, recuperación
espontánea y resurgimiento. Estos fenómenos han sido de importancia en el análisis
experimental de la conducta ya que han dado evidencia de que lo aprendido en un momento
puede sobrevivir a tratamientos de extinción, y que la disminución en la tasa de respuesta
por el retiro del reforzador, no significa que el aprendizaje original haya sido borrado
(Bouton & Peck, 1989).
Aunque estos fenómenos comparten efectos similares, ya que en todos se observa la
re-emergencia de conductas extintas, los procedimientos que se han empleado para su
estudio difieren entre sí. Con excepción de resurgimiento, los demás fenómenos han sido
estudiados principalmente con procedimientos de condicionamiento clásico (Bouton,
Winterbauer, & Todd, 2012; Bouton, 2002), no obstante, también existen estudios en los
que se ha usado el procedimiento operante (Nakajima, Tanaka, Urushihara, & Imada,
2000). Específicamente, en renovación, la reaparición de una conducta extinta ocurre por
un cambio en el contexto en el que se llevó a cabo su extinción. En restablecimiento, la
respuesta extinta regresa como resultado de la presentación de reforzadores independientes
de la respuesta después de extinción. En recuperación espontánea, la respuesta regresa si se
deja pasar un tiempo entre sesiones de extinción. En resurgimiento, la respuesta extinta
reaparece si un comportamiento alternativo que estaba siendo reforzado, deja de serlo
(Lattal, St. Peter, & Escobar, 2013). En la Tabla 1 se muestran con más detalle los
diferentes procedimientos de estos fenómenos; sin embargo, no queda claro en la literatura
si estas diferencias de procedimiento implican que el mecanismo subyacente a cada
fenómeno es diferente, o si es posible hablar de un mecanismo general de recuperación de
la respuesta.
Dentro de estos fenómenos, uno que ha llamado la atención de varios investigadores
ha sido el resurgimiento. De acuerdo con Epstein (1983) cuando en una situación dada, un
comportamiento que recientemente estaba siendo reforzado deja de serlo, conductas que en

el pasado fueron reforzadas bajo circunstancias similares tienden a resurgir. Resurgimiento
es un fenómeno robusto que se ha replicado en varios experimentos usando diferentes tipos

de respuestas y en una variedad de especies que va de ratas a humanos (Epstein, 1983;
Wilson & Hayes, 1996; Cleland, Foster, & Temple, 2000).
En los primeros estudios sobre resurgimiento, se hizo una comparación con el
concepto de regresión Freudiano. Sanders (1937) basándose en las propuestas de Freud,
encontró que al colocar ratas bajo situaciones de alto estrés, éstas tendían a regresar a
patrones conductuales que en el pasado habían sido exitosos. Regresión se refiere a la
reaparición en situaciones emocionales de comportamientos que fueron establecidos
durante la niñez. Resurgimiento es cualquier comportamiento, ocurrido en cualquier
Tabla 1
Fenómenos de recuperación de la respuesta
Fenómeno Definición Método general
Renovación Recurrencia de una conducta extinta
que ocurre si después de extinción se
vuelve a presentar el contexto en que
se adquirió la conducta u otro
contexto.

Fase 1Adquisición en contexto A
Fase 2 Extinción en contexto B
Fase 3 Exposición al contexto A o C

Restablecimiento Recurrencia de una conducta extinta
que ocurre cuando se presentan
reforzadores independientes de la
respuesta después de extinción.
Fase 1 Adquisición en contexto A
Fase 2Extinción en contexto A
Fase 3 Entrega de reforzadores
independientes de la respuesta
en contexto A

Recuperación
espontánea
Recurrencia de una conducta
previamente reforzada al inicio de
periodos sucesivos de extinción.
Fase 1 Adquisición en contexto A
Fase 2 Extinción en contexto A
Fase 3 Intervalo de tiempo en
contexto B
Fase 4 Extinción en contexto A

Resurgimiento Recurrencia de una conducta extinta
que ocurre cuando un
comportamiento actual deja de ser
reforzado.
Fase 1 Adquisición de conducta 1
Fase 2 Extinción de conducta 1 y
adquisición de conducta 2
Fase 3 Extinción de conducta 2

momento del pasado, que puede volver a presentarse, no se limita a comportamientos
establecidos durante la niñez. Asimismo, regresión se refiere a un mecanismo
psicodinámico, mientras que resurgimiento fue definido puramente de manera descriptiva
por Epstein (1985). Por último, regresión suele ser entendida como una respuesta ante
situaciones de castigo, en vez de simplemente no-reforzamiento.
El método para el estudio de resurgimiento consta de tres fases: en una primera fase
un comportamiento operante es reforzado; en una segunda fase, mientras se extingue el
primer comportamiento, una segunda respuesta alternativa es entrenada y reforzada; en la
última fase, se realiza una prueba de re-emergencia o persistencia de la primera conducta
mediante la extinción del segundo comportamiento. De acuerdo con Lieving y Lattal
(2003) las condiciones que evocan resurgimiento podrían estar en un continuo de
disponibilidad del reforzador, en donde a menor disponibilidad mayor resurgimiento. No
obstante, estos autores mencionan que metodológicamente el tipo de extinción para realizar
una prueba de resurgimiento debe ser mediante el retiro completo del reforzador, ya que si
se extingue mediante la entrega independiente de reforzadores se trata de restablecimiento y
si se extingue mediante la entrega de reforzadores dependientes de la respuesta, se podría
tratar de inducción.
Dentro del paradigma de condicionamiento operante, una de las primeras
demostraciones de resurgimiento fue hecha por Leitenberg, Rawson y Mulick (1975). Estos
investigadores estaban interesados en observar si al extinguir una conducta y al mismo
tiempo reforzar otra, la extinción de la primera sería más rápida y eficiente que si era
extinguida solamente mediante el retiro del reforzador. Lo que encontraron fue que la
respuesta previamente entrenada dejaba de ocurrir más rápido al ser extinta mediante el
reforzamiento de un comportamiento alternativo; sin embargo, este efecto resultó ser
transitorio, pues al retirar el reforzador de la conducta alternativa, la respuesta que ya estaba
extinta resurgía. El tema central del estudio de Leitenberg et al. (1975) fue la extinción, el
resurgimiento de una conducta extinta fue más bien una observación incidental, y por ello
no existieron todos los controles experimentales necesarios. Epstein (1983) abordó este
problema diferenciando resurgimiento de un efecto de frustración o de la variabilidad
típicamente observada durante extinción (Antonitis, 1951). Para distinguir entre
resurgimiento y otros efectos, Epstein incluyó un operando extra en la cámara

experimental, en el cual las respuestas nunca recibieron reforzamiento. Si las respuestas
observadas fueran un efecto de frustración o variabilidadaleatoria, los sujetos del estudio
responderían azarosamente tanto al operando utilizado en el experimento, como al
operando extra. El experimento llevado a cabo por Epstein (1983) constó de cuatro fases.
En la primera fase, se reforzó la conducta de picar una tecla en un programa de intervalo
variable (IV) en un grupo de palomas y se les mantuvo en éste hasta que alcanzaron un
estado estable. En la segunda fase, se extinguió la conducta de picar la tecla, durante un
periodo que varió de 1 a 12 sesiones. Una vez que los sujetos habían pasado por el periodo
de extinción de la primera respuesta, en la tercera fase se reforzó una conducta alternativa
que fuera topográficamente incompatible con picar la tecla (e.g. aletear o mover la cabeza
de arriba abajo), hasta que obtuvieron 20 reforzadores. En la última fase, se retiró todo
reforzamiento. Se encontró que a pesar de que algunas palomas estuvieron expuestas hasta
por 12 sesiones consecutivas a extinción del picoteo a la tecla, en todas se encontró
resurgimiento de esta última conducta. Asimismo, los resultados mostraron que el picoteo
resurgió sólo en el operando correlacionado con una historia de reforzamiento previa y no
en el otro. De esta manera, Epstein demostró que resurgimiento no sólo es el resultado de
variabilidad aleatoria u otros efectos de extinción, sino que es un fenómeno por sí mismo y
que vale la pena estudiar.

Variables que afectan el resurgimiento
Se han realizado varias investigaciones para conocer cuáles son las variables de las
que depende el grado de resurgimiento encontrado en diferentes preparaciones. Se pueden
realizar diversas manipulaciones en las tres fases del proceso de resurgimiento descritas en
un inicio, obteniendo diferentes resultados. A continuación se mencionan algunas de las
variantes que se han realizado en la fase de formación de la historia de reforzamiento.
Las contingencias que prevalecen durante la fase de formación de la historia de
reforzamiento (Fase 1) afectan la naturaleza y magnitud del resurgimiento. Dos variables
que han probado ser importantes son el programa de reforzamiento y el tiempo de
exposición a éste durante la primera fase. Winterbauer, Lucke y Bouton (2012) realizaron
un experimento para observar cuál era el papel de estas variables. En la primera fase
tuvieron cuatro grupos de sujetos, a dos de ellos se les sometió a un programa de razón

aleatoria (RA), y a los otros dos a un programa de IV. De los dos grupos en cada programa,
uno de ellos estuvo en la primera fase durante 4 sesiones y el otro durante 12. En la
segunda fase, se extinguió el primer comportamiento mediante el reforzamiento de una
conducta alternativa. En la tercera fase, se realizó la prueba de resurgimiento de la conducta
mediante extinción. Los resultados mostraron que el tipo de programa tuvo un efecto en el
desempeño durante la primera fase, ya que los sujetos en el programa de razón tuvieron
tasas de respuestas más altas que los sujetos en el programa de intervalo. Asimismo, a
mayor número de sesiones de entrenamiento se observó mayor tasa de respuesta y de
reforzamiento obtenido. El patrón de respuestas desarrollado en la primera fase se vio
reflejado en la fase de resurgimiento. Los sujetos que en la primera fase estuvieron en el
programa de razón con una historia de reforzamiento larga, mostraron mayor grado de
resurgimiento que los sujetos que estuvieron en el programa de intervalo con una historia
de reforzamiento corta. Los autores sugieren que la tasa de respuestas al final de la fase
uno, más que la tasa de reforzamiento obtenido, es el mejor predictor de la magnitud del
resurgimiento.
Reed y Morgan (2007) de acuerdo con lo mencionado por Winterbauer et al.
(2012), también proponen que la tasa de respuesta adquirida en la primera fase es lo que se
ve reflejado en resurgimiento. Estos autores llevaron a cabo un experimento en el que en la
primera fase entrenaron a ratas en un programa múltiple RA, intervalo aleatorio (IA). Esto
llevó a una tasa de respuestas alta en el componente RA y a una tasa de respuestas baja en
el componente IA. Mediante un procedimiento de acoplamiento intra-sujeto se igualaron las
tasas de reforzamiento de ambos componentes. Este entrenamiento inicial fue seguido por
una segunda fase en la que se expuso a las ratas a un programa múltiple IF-60 s, IF-60 s. En
una última fase, todo comportamiento dejó de ser reforzado. Se encontró que a pesar de que
en la primera fase se mantuvo la tasa de reforzamiento igual para las dos conductas, la
conducta con la tasa de respuesta más alta era la que invariablemente mostraba mayor
resurgimiento y mayor resistencia al cambio. A partir de estos resultados los autores
proponen que es posible que el patrón conductual generado en la primera fase se comporte
como una unidad integrada y que lo que resurge en la tercera fase es esta unidad conductual
previamente aprendida.

No obstante, existen investigaciones que contradicen lo propuesto por Reed y
Morgan (2007) y Winterbauer et al. (2012). Por ejemplo, Podlesnik y Shahan (2009, 2010)
han encontrado que el resurgimiento depende más de la tasa de reforzamiento que de la tasa
de respuesta de la primera fase. Estos autores observaron este efecto en una serie de
experimentos de resurgimiento en donde en la primera fase manipularon la tasa de
reforzamiento de dos componentes de un programa múltiple. En uno de los componentes
los sujetos recibieron reforzadores en un programa de IV 30 s, mientras que en el otro,
además de recibir estos reforzadores, recibieron reforzadores independientes de la
respuesta. Así, uno de los componentes quedó asociado a una tasa de reforzamiento “rica” y
el otro a una “pobre”. En la segunda fase se reforzó otra respuesta y se extinguió el primer
comportamiento asociado a ambos componentes. Finalmente, en la última fase se
implementó extinción. Los resultados mostraron que en la primera fase, los sujetos tuvieron
tasas de respuestas más bajas en el componente “rico” que en el componente “pobre”. En
las subsecuentes dos fases, se encontró mayor resistencia al cambio y mayor resurgimiento
en el componente “rico” en reforzamiento, esto a pesar de que en la primera fase la tasa de
respuesta asociada a este componente fue la más baja. Los autores proponen que las
condiciones de reforzamiento de la primera fase tienen mayor impacto sobre resurgimiento
que la tasa de respuesta, incluso si los reforzadores son presentados de manera
independiente a la conducta objetivo. Hay que tener en cuenta que Podlesnik y Shahan
(2010) mostraron sus resultados en términos de proporciones y no en valores absolutos, lo
cual puede hacer una diferencia en cuanto a la interpretación de los datos.
Generalmente, en la primera fase de resurgimiento sólo se refuerza un
comportamiento sobre un operando, que más adelante se espera resurja; sin embargo, de
acuerdo con Da Silva, Maxwell y Lattal (2008) el uso de un programa concurrente permite
la evaluación de resurgimiento diferencial. Estos autores realizaron un experimento en el
que reforzaron dos conductas con un programa concurrente IV-1 min, IV-6 min, generando
tasas de respuestas diferentes, pero manteniendo la tasa de reforzamiento igual para ambas
en la primera fase. Después llevaron a cabo las siguientes dos fases necesarias para analizar
resurgimiento. Con respecto a los datos absolutos, el grado de resurgimiento se relacionó
con el patrón y tasa de respuesta observados en la primera fase y no con la tasa de
reforzamiento adquirida. La conducta que en la primera fase había mostrado una tasa de

respuesta alta tuvo mayor resurgimiento que la que había mostrado una tasa de respuesta
baja. No obstante, al realizar el análisis en términos de proporciones con respecto a la
primera fase, no se encontraron diferencias en elgrado de resurgimiento. Tomando en
cuenta todos los resultados, los autores sugieren que el resurgimiento podría ser una
función combinada de tasa de reforzamiento (la cual determina la probabilidad de
ocurrencia) y tasa de respuesta (la cual determina la naturaleza estructural del
resurgimiento, tal como tiempos entre respuestas). Dada las diferencias encontradas en los
resultados según la medida utilizada, queda la pregunta de cuál es la mejor manera de
presentar los datos, en valores absolutos o en proporciones.
Por último, cabe mencionar que se han estudiado otras variables de resurgimiento
como la topografía conductual (Leitenberg et al., 1975) o el tipo de reforzador empleado
(Winterbauer et al., 2012), pero ninguno ha resultado en diferencias significativas en el
grado de resurgimiento observado.

Explicaciones del resurgimiento
Han surgido varias explicaciones acerca de los procesos subyacentes al fenómeno
de resurgimiento, de las cuales en la siguiente sección se revisan tres. Una de las primeras
explicaciones fue la hipótesis de prevención de respuestas (Rawson, Leitenberg, Mulick &
Lefebvre, 1977). Esta hipótesis sugiere que al reforzar una conducta alternativa durante la
extinción de otra, se impide al animal realizar físicamente la respuesta que está en la
condición de extinción. La respuesta es remplazada tan rápidamente por la nueva conducta
que realmente nunca pasa por extinción, ya que los sujetos no experimentan suficientes
asociaciones entre la respuesta y el no-reforzamiento. Entonces la respuesta original nunca
se extingue, solamente es inhibida por el reforzamiento de otra conducta. Al interrumpir el
reforzamiento de la respuesta alternativa, la original vuelve a estar disponible y por ello se
observa resurgimiento. A pesar de que esta hipótesis parece predecir de manera adecuada
algunos resultados, tiene problemas para explicar otros. Como ya se había mencionado, su
principal propuesta es que resurgimiento se debe a que el primer comportamiento nunca es
realmente extinguido. No obstante, existen experimentos en los que la primera conducta es
explícitamente extinguida antes de pasar a la segunda fase y aun así se observa
resurgimiento (Epstein, 1983; Lieving & Lattal, 2003).

Por otro lado, el resurgimiento también ha sido abordado desde la perspectiva de
momentum conductual. La teoría de momentum ha dado un marco conceptual para
entender cómo diferentes condiciones de reforzamiento afectan la resistencia al cambio de
una conducta. Al pasar sujetos de una fase estable de reforzamiento a una condición de
extinción, la disminución en la tasa de respuesta provee una medida de resistencia al
cambio de una conducta. Un hallazgo general de momentum conductual es que la conducta
más resistente al cambio es aquella que está asociada a estímulos discriminativos con tasas
de reforzamiento altas (i.e. la relación relevante en resistencia al cambio es la de estímulo
discriminativo-reforzador). Es así que resistencia al cambio ha sido interpretada como un
reflejo de reforzamiento y como una medida de fuerza de la respuesta (Podlesnik &
Shahan, 2010). Podlesnik y Shahan (2009) encontraron que varios efectos de recuperación
de la respuesta dependen de la relación estímulo discriminativo-reforzador, de la misma
manera que resistencia al cambio. En una serie de experimentos, estos autores observaron
que mientras más resistencia al cambio mostraba una conducta, mayor recuperación de la
respuesta se observaba en procedimientos de restablecimiento, resurgimiento y renovación.
Los resultados de sus experimentos sugieren que el grado de recuperación de una respuesta
que se puede llegar a observar, depende de la tasa de reforzamiento en la presencia de un
estímulo discriminativo en la primera fase, es decir, de la relación pavloviana estímulo-
reforzador. Parecería que la resistencia al cambio y el resurgimiento dependen de las
mismas variables, y por lo tanto deberían de ser impactados de maneras similares.
Por último, se ha propuesto que el resurgimiento puede ser explicado en términos de
señales contextuales. De acuerdo con Bouton (2002), en todos los fenómenos donde se
puede observar reemergencia de la conducta, existe una falla en generalizar lo aprendido en
el contexto de extinción a otros contextos. Al pasar a extinción a una respuesta que primero
había sido asociada con reforzamiento, se le deja con dos asociaciones (reforzamiento y no-
reforzamiento) y por lo tanto se vuelve ambigua. Entonces el contexto se vuelve
fundamental, ya que señala la ocasión en la que se debe recuperar la relación respuesta-
reforzador. El ejemplo más claro de esto, es el fenómeno de renovación, en el cual el
organismo falla en recuperar la asociación de extinción fuera del contexto en que ésta se
dio (Bouton & Peck, 1989). A partir de esto, Winterbauer y Bouton (2010) han propuesto
que resurgimiento puede ser entendido como otro ejemplo de renovación. De acuerdo con

estos autores, en el procedimiento para observar resurgimiento hay un claro cambio en los
estímulos contextuales en la transición de fase a fase (considerando que la propia conducta
de los individuos, el paso del tiempo y la presencia o ausencia de reforzadores pueden
funcionar como estímulos discriminativos de un contexto). En específico, durante la
segunda fase del procedimiento de resurgimiento, la presencia del segundo comportamiento
y la recompensa asociada a él funcionan como estímulos de un contexto en donde la
primera conducta no es reforzada. Al pasar a la tercera fase de extinción, se eliminan estos
estímulos discriminativos (el segundo comportamiento y el reforzador), cambiando el
contexto en el que se extinguió la primera conducta. Como se mencionó anteriormente, al
sacar a los animales del contexto de extinción, la conducta que ya estaba extinta reaparece y
por ello se observa resurgimiento, que de acuerdo con esta perspectiva sería un caso más de
renovación. Esta explicación de resurgimiento como renovación, es compatible con la
explicación de extinción que propone que la respuesta deja de ocurrir cuando el animal no
generaliza entre condicionamiento y extinción (Capaldi, 1994). De esta manera, para el
caso de resurgimiento se puede predecir que si se generalizan los contextos entre la segunda
y la tercera fase, habrá poco resurgimiento. Winterbauer y Bouton (2010, 2012) han
encontrado evidencia de que al utilizar programas de reforzamiento con tasas de
reforzamiento bajas en la segunda fase, se observa menos resurgimiento. Este resultado
podría deberse a que los animales generalizan de la segunda fase a extinción, ya que el
cambio en el contexto no es claro en cuanto a los reforzadores entregados.
Aunque parece una explicación que podría dar cuenta de por qué sucede
resurgimiento, Winterbauer et al. (2012) realizaron un estudio en donde los datos no
apoyan completamente esta hipótesis. Estos investigadores realizaron un experimento en
donde el primer y el segundo comportamiento fueron entrenados con diferentes
reforzadores, pellets regulares y de sacarosa. Esta manipulación debió haber agregado un
estímulo discriminativo a cada contexto, haciendo los cambios de fase a fase más
diferenciables y con ello, debería observarse mayor grado de resurgimiento. Sin embargo,
se encontró que al usar diferentes tipos de reforzadores para cada fase, el grado de
resurgimiento obtenido era comparable al grado de resurgimiento que se observa si se usa
el mismo tipo de reforzador en ambas fases. Este resultado no concuerda con la idea de que
resurgimiento es un tipo de renovación.

Resurgimiento de patrones conductuales
Más allá de la evaluación general de resurgimiento en función de las contingencias
pasadas, las investigaciones sobre las variables y mecanismos mencionadas previamente se
han centrado principalmenteen el análisis de respuestas discretas. El estudio de la conducta
vista como un patrón de respuestas y no como una sola respuesta parece importante, ya que
se ha encontrado que no todos los principios que aplican a respuestas simples, también lo
hacen a patrones conductuales más complejos (Reid et al., 2001).
De acuerdo con esto, Canҫado y Lattal (2011) analizaron el resurgimiento de
patrones de respuestas temporalmente organizados. Se llevó a cabo un experimento en
donde en la primera fase se reforzaron las respuestas de palomas bajo un programa múltiple
de dos componentes (IV e intervalo fijo (IF)). En la segunda fase se reforzó otra conducta,
y en la tercera se pasó a extinción. En la primera fase, en el componente IV el patrón
conductual observado fue una tasa de respuesta constante, mientras que en el IF se observó
un patrón de festoneo. Las propiedades estructurales adquiridas en la primera fase se
mantuvieron al momento de resurgir, es decir, no sólo resurgió la respuesta entrenada, sino
también el patrón temporal de respuestas desarrollado. Si en la primera fase se adquirió un
patrón de festón, en la fase de resurgimiento se volvía a presentar. Estos resultados
concuerdan con lo propuesto por Da Silva et al. (2008), los cuales utilizando como unidad
de análisis una respuesta simple, sugirieron que las propiedades estructurales de la conducta
establecida en la primera fase -tales como tiempo entre respuestas- se ven reflejadas en
resurgimiento y no la respuesta sola.
Aunque un análisis molecular como el realizado por Canҫado y Lattal (2011)
permite un estudio más detallado de la conducta, el uso de secuencias de respuestas hace
posible estudiar situaciones en las que la estructura de la conducta es directamente
manipulable (Neuringer et al., 2001; Robles, 2012). Asimismo, el uso de secuencias de
respuestas permite observar cómo patrones conductuales complejos se conforman en
unidades conductuales (Grayson & Wasserman, 1979).
El procedimiento de resurgimiento aplicado a secuencias de respuestas ha sido
utilizado como una demostración de que el reforzamiento llevado a cabo durante la primera
fase fortalece a la secuencia de respuestas como unidad, de manera que ésta resurge en una
tercera fase de manera íntegra. Bachá-Méndez, Reid y Mendoza-Soylovna (2007) llevaron

a cabo un experimento en el que encontraron que una secuencia de dos respuestas a dos
operandos resurge como una unidad. El experimento constó de 4 fases. En la primera fase
se reforzó una secuencia heterogénea (ID o DI). En la segunda y tercera fase se reforzó una
secuencia homogénea (II o DD) diferente para cada fase. En la última fase se reforzó otra
secuencia heterogénea. En las fases 1 y 4 en las que una secuencia heterogénea estaba
siendo reforzada, se observó que el error más frecuente fue repetir la respuesta más cercana
a la entrega del reforzador (e.g. si la secuencia ID estaba siendo reforzada, una secuencia
errónea muy frecuente era DD). Esto parece haber sido controlado por procesos a nivel de
respuesta, ya que la posición ordinal de las respuestas en la secuencia afectó
diferencialmente la producción de los errores. En cuanto a resurgimiento, todos los sujetos
mostraron resurgimiento íntegro de la secuencia heterogénea entrenada en la primera fase,
lo que parece indicar que resurgimiento es un proceso que operó a nivel de la secuencia
como unidad. Estos resultados sugieren que los sujetos emitieron la secuencia reforzada
como si fuera una unidad conductual, afectada por las contingencias como un todo. No
obstante, fue posible observar tanto procesos a nivel de respuesta como a nivel de secuencia
operando simultáneamente, dentro de una unidad conductual claramente establecida.
El resurgimiento de secuencias como una unidad íntegra también ha sido encontrado
en secuencias de respuestas más largas. Sánchez-Carrasco y Nieto (2005), utilizando
secuencias de tres respuestas a dos operandos observaron que éstas resurgían de manera
íntegra en un procedimiento de resurgimiento. Asimismo, Reed y Morgan (2006) también
usando secuencias de tres respuestas a dos operandos, encontraron evidencia de un efecto
de primacía y recencia. En el estudio realizado por estos autores, seis ratas fueron
entrenadas a realizar tres secuencias heterogéneas de manera consecutiva y posteriormente,
se pasó a una condición de extinción. Los resultados mostraron que en extinción, la
secuencia de respuestas más frecuente fue la última en haber sido entrenada (efecto de
recencia). La segunda secuencia más frecuente fue la primera secuencia entrenada (efecto
de primacía). Los efectos de primacía y recencia operaron sobre las secuencias como un
todo, y no en cada uno de sus elementos por separado.
En los estudios de Sánchez-Carrasco y Nieto (2005) y Reed y Morgan (2006) no se
tomó en cuenta que en secuencias de tres respuestas a dos operandos existen cuatro
estructuras posibles (Robles, 2012). Dado que se conoce que de acuerdo a la estructura hay

un gradiente de dificultad de adquisición, esto pudo haber influido en los resultados
observados. De esta forma, un análisis en función de la estructura de las secuencias
reforzadas parece importante.

Planteamiento del problema
Un tema de interés en el análisis experimental de la conducta ha sido el estudio de
secuencias de respuestas como operantes. Varios trabajos han encontrado que al entrenar
secuencias de respuestas, éstas pueden ser integradas en unidades conductuales (Grayson &
Wasserman, 1979; Reid et al., 2001), lo que las hace una unidad de análisis válida para el
estudio de diversos fenómenos.
El uso de secuencias de respuestas hace posible estudiar situaciones en las que la
estructura de la conducta es directamente manipulable. Por ejemplo, al utilizar secuencias
de tres respuestas a dos operandos existen ocho posibles maneras de realizar una secuencia,
las cuales pueden ser agrupadas en 4 estructuras (AAA, ABB, ABA y AAB) de acuerdo al
orden temporal de las respuestas de la secuencia (véase la Figura 1). Se ha encontrado que
la estructura es una variable importante en la adquisición de una secuencia. Asimismo,
algunos estudios sugieren que existe un gradiente de dificultad según la estructura de la
secuencia reforzada, esto de acuerdo a la velocidad de adquisición y a la asíntota de
reforzamiento alcanzada en fases de estado estable (Neuringer et al., 2001; Robles, 2012).
Por otro lado, se ha observado que cuando una conducta que estaba siendo efectiva
para obtener reforzadores deja de serlo, comportamientos que fueron exitosos en el pasado
son los más probables en aparecer (Epstein, 1983). Este fenómeno recibe el nombre de
resurgimiento y se ha observado en una variedad de especies, que va de ratas a humanos
(Wilson & Hayes, (1996); Winterbauer et al., 2012). El método general para estudiar
resurgimiento consta de tres fases: 1) reforzamiento de la conducta 1, 2) extinción de la
conducta 1 y reforzamiento de la conducta 2 y 3) extinción de la conducta 2. Con este
procedimiento, la conducta aprendida en la primera fase, que generalmente es una sola
respuesta discreta, se espera resurja en la tercera fase de extinción. En la mayoría de los
estudios de resurgimiento se ha utilizado como unidad de análisis una respuesta discreta.
Existen pocos trabajos en los que se haya estudiado resurgimiento de secuencias de
respuestas. No obstante, Bachá-Méndez et al. (2007) encontraron que al reforzar una
secuencia de dos respuestas a dos operandos en una primera fase, se puede observar
resurgimiento de ésta como una unidad integrada. En el presente trabajo se realizó un
experimento con las tres fases propuestas por Epstein (1983) para observar resurgimiento,
pero como unidad conductual se utilizaronsecuencias de respuestas. Un primer propósito

fue estudiar cómo los animales distribuyen su comportamiento al reforzarse dos secuencias
de tres respuestas con la misma estructura en una primera fase. Un segundo propósito fue
analizar si se observaría resurgimiento de los patrones conductuales desarrollados en la
primera fase.
Los objetivos específicos fueron:
-Analizar cómo los animales distribuyen su conducta al reforzarse dos secuencias de tres
respuestas con la misma estructura.
-Estudiar si la estructura de las secuencias reforzadas es una variable importante en la
manera en que los animales ordenan su comportamiento.
-Analizar si al reforzar las dos secuencias correspondientes a cada estructura se encuentra
un gradiente de dificultad en función a ésta.
-Observar si en la tercera fase hay resurgimiento de los patrones conductuales establecidos
en la primera fase.
-Observar si la estructura reforzada en la primera fase es una variable importante en el
grado de resurgimiento presentado en la tercera fase.
-Analizar si la distribución de la conducta establecida al final de la primera fase se
mantiene durante la prueba de resurgimiento.

Método
Sujetos
Se utilizaron nueve ratas hembras de la cepa Wistar experimentalmente ingenuas,
con aproximadamente 4 meses de edad al inicio del experimento. Fueron mantenidas al
80% de su peso ad libitum durante el transcurso de todo el experimento y se alojaron en
cajas habitación individuales con acceso libre a agua. Las sesiones experimentales se
llevaron a cabo 5 días por semana. Dos horas después de cada sesión se alimentó a las ratas
para mantener su peso corporal.

Aparatos
Se utilizaron cuatro cámaras experimentales de condicionamiento operante (MED
Associates), cada una de ellas ubicada dentro de una caja sono-amortiguadora. Todas las
cajas estuvieron conectadas a una interfase MED Associates que controló cada sesión
experimental. El techo y las paredes laterales de las cámaras fueron de acrílico, mientras
que el panel frontal y posterior fueron de acero inoxidable. El piso fue de barras cilíndricas
de acero. En el panel posterior se encontraba una luz general de 28 v. En el panel frontal se
encontraban dos palancas: una del lado izquierdo y una del derecho, arriba de cada una se
encontraba un foco de 28 v. Entre las dos palancas había una abertura cúbica de 4 cm por
lado, con un orificio en la parte inferior a través del cual subía una copa que estaba en el
extremo de un brazo que era activado dependiendo del programa de reforzamiento. La copa
proporcionaba 0.1 ml de leche ultra-pasteurizada

Procedimiento
Moldeamiento. Para entrenar a las ratas a presionar las palancas se les expuso a un
programa de reforzamiento concurrente razón fija (RF) 1 RF 1 en las dos palancas, de tal
manera que cada respuesta dada a cualquiera de las dos palancas entregaba 0.1ml de leche
ultra-pasteurizada. Un programa concomitante (Imam & Lattal, 1992) entregaba un
reforzador independiente de las respuestas del sujeto conforme a un programa de tiempo
fijo (TF). En la primera sesión, el valor del TF fue de 20 segundos para todos los sujetos.
En las sesiones subsecuentes se incrementó el valor del TF de acuerdo a la ejecución de

cada sujeto. Se mantuvo a los sujetos en este programa hasta que en una sesión obtuvieron
al menos 20 reforzadores en el programa concurrente.

Entrenamiento. El entrenamiento constó de tres fases. Se llamó a los operandos de
acuerdo a su localización: izquierda (I) y derecha (D). En la primera fase de entrenamiento,
se reforzó cualquiera de las cuatro posibles secuencias de dos respuestas a dos operandos,
es decir, si los sujetos ejecutaban cualquiera de las siguientes combinaciones: II, ID, DI o
DD, obtenían un reforzador. Cada sesión inició con la luz general y las luces sobre las
palancas prendidas hasta que el sujeto emitía una secuencia de respuestas. Al ejecutarse
cualquiera de las secuencias de dos respuestas a dos operandos se apagaban todas las luces,
sonaba un tono durante 5 segundos y se entregaba 0.1 ml de leche. Se mantuvo a los sujetos
en esta fase hasta que se entregaron 50 reforzadores en una sesión.
La segunda fase de entrenamiento consistió en el reforzamiento únicamente de las
secuencias heterogéneas de dos respuestas a dos operandos, las cuales son: ID y DI. Al
ejecutarse cualquiera de las secuencias heterogéneas, se apagaban todas las luces, sonaba
un tono durante 5 segundos y se entregaba 0.1 ml de leche. Si ejecutaban cualquier otra
secuencia, entonces todas las luces se apagaban durante 2 segundos y las respuestas
emitidas durante este periodo no tenían ningún efecto programado. Esto se realizó para
entrenar a las ratas a alternar entre las dos palancas. Esta condición se mantuvo durante
ocho sesiones.
La última parte del entrenamiento consistió en el reforzamiento de todas las
secuencias heterogéneas de tres respuestas a dos operandos: IDD, IDI, IID, DII, DID y
DDI. Para todas las ratas esta fase duró al menos 10 sesiones, y hasta que obtuvieran 70
reforzadores por sesión, durante tres sesiones consecutivas.

Fases experimentales. En la primera fase experimental se asignó aleatoriamente a
las ratas a uno de tres grupos: ABB, ABA y AAB. Cada grupo quedó conformado por tres
sujetos. En el grupo ABB los sujetos recibieron 0.1 ml de leche al ejecutar las secuencias de
respuestas IDD o DII. Si ejecutaban cualquier otra secuencia, entonces todas las luces se
apagaban durante 2 segundos y las respuestas emitidas durante este periodo no tenían
ningún efecto programado. El grupo ABA obtuvo el reforzador al realizar la secuencia IDI

o la secuencia DID, la ejecución de cualquier otra secuencia no fue reforzada. Por último, el
grupo AAB obtuvo el reforzador al ejecutar la secuencia IID o la secuencia DDI. Cada
ensayo consistía de tres respuestas, tanto secuencias de respuestas correctas, como
incorrectas. Las sesiones duraron 150 ensayos o 30 minutos. Esta fase se terminó cuando
las ratas obtuvieron en total 2,000 reforzadores.
En la segunda fase del experimento, se reforzó una secuencia homogénea de tres
respuestas, III o DDD, durante 15 sesiones. A cada sujeto se le asignó de manera aleatoria
que secuencia era la reforzada, controlando que en todos los grupos hubiera al menos un
sujeto al que se le reforzaba III y uno al que se le reforzaba DDD.
En la última fase, todas las ratas pasaron a extinción, es decir, ninguna respuesta fue
reforzada durante 15 sesiones. El diseño completo del experimento se puede observar en la
Tabla 2.

Tabla 2
Diseño experimental
Grupo
Fases
1 2 3
ABB
n=3

IDD
DII

III o DDD

Extinción
ABA
n=3

IDI
DID

AAB
n=3
IID
DDI
2,000 reforzadores 15 sesiones 15 sesiones

Resultados
Con el propósito de conocer cómo las diferentes posibles estructuras y secuencias se
distribuyeron durante la primera fase, el análisis de resultados se inició con la frecuencia de
ocurrencia de todas las posibles estructuras y secuencias de respuestas. En la Figura 2 se
muestran los resultados de la primera fase separando por estructura para cada sujeto. En el
panel superior se encuentran los resultados del grupo ABB, en el panel intermedio los del
grupo ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques
de 5 sesiones y el eje de las ordenadas la frecuencia de cada estructura. Los rombos blancos
representan la estructura AAA, los cuadrados negros la estructura ABB, los círculos negros
la estructura ABA y los triángulos blancos la estructura AAB. Cada estructura es la suma
de la frecuencia de las dos secuencias de respuestas correspondientes.La línea roja indica
la estructura reforzada a cada sujeto.
En la Figura 2 se puede observar cómo los animales distribuyeron su conducta entre
las cuatro posibles estructuras según la estructura reforzada a lo largo de la primera fase.
Para el grupo ABB se observa que los sujetos tardaron entre 5 y 7 bloques de 5 sesiones en
completar la primera fase. La estructura reforzada (línea roja) fue la más frecuente de las
cuatro estructuras y alcanzó una asíntota de frecuencia que varió entre 68 y 100 en los
últimos dos bloques. La segunda estructura más frecuente fue AAA para los tres sujetos del
grupo y fue ejecutada con una frecuencia que varió de 26 a 46 durante las últimas sesiones
de la fase. La estructura AAB fue realizada con una frecuencia entre 20 y 30 a lo largo de la
fase. Por último, la estructura ABA fue la menos ejecutada, con una frecuencia menor a 15
durante toda la fase.
Para el grupo ABA se observa que dos de los sujetos, N1 y N6, tardaron 5 bloques
y que el sujeto N8 tardó 8 bloques de 5 sesiones en completar la primera fase. La estructura
ABA, la cual fue reforzada, fue la más frecuente de las cuatro estructuras y alcanzó una
asíntota de frecuencia entre 76 y 97 en los últimos dos bloques de 5 sesiones. Las
estructuras ABB y AAB fueron ejecutadas con frecuencias similares, entre 15 y 30. La
estructura AAA fue la menos frecuente durante toda la fase, con una frecuencia menor a 20.
En el grupo AAB se observa que los sujetos tardaron entre 9 y 11 bloques en
completar la primera fase. Este fue el grupo que tardó más en completarla. La estructura
reforzada no fue la más frecuente de las cuatro estructuras, siendo ejecutada con una

Fase 1 por estructura
F
re
cu
en
ci
a
d
e
es
tr
u
ct
u
ra

Bloques de 5 sesiones
ABB
ABA
AAB
Figura 2. Ejecución por estructura de cada sujeto de los tres grupos ABB (panel superior), ABA (panel intermedio) y AAB (panel
inferior). La línea en rojo indica la estructura reforzada a cada sujeto.
--:>-AAA
....... ABB 150 150 150
N2 N5 N7 __ AB A
120 120 120
_ AAB
90 ><=:: : 90 90 60 60 60
30 30 30
• • • • O --- O • • • O --- -
2 3 4 5 6 2 3 4 5 6 7 2 3 4 5
150 150 150
" 1 ~6 N8
120 120 120
90 / • • 90 90
~
•
60 60 60
30
~ ;:::J ~
30 :- ~ -; J 30
O O O
2 3 4 5 2 3 4 5 2 3 4 5 6 7 8
150 150 150
N3 N4 N9
120 120 120
90 90 90
(,0
?!FS;:~
60 60
~ 30 30 _lO O O O
2 3 4 5 6 7 ~ 9 2 3 4 5 6 7 ~ 9 10 II 2 3 4 5 6 7 ~ 9 10 II

28
frecuencia entre 44 y 54, la frecuencia más baja para la estructura reforzada de los tres
grupos. La estructura ABB fue efectuada con mayor frecuencia que la estructura reforzada
para el sujeto N3 y aproximadamente con la misma frecuencia que la estructura reforzada
para los sujetos N4 y N9. La estructura ABA también fue realizada con una frecuencia
similar a la estructura reforzada, con valores entre 30 y 45 para los sujetos N4 y N9. El
sujeto N3 fue el único en realizar esta estructura con una frecuencia menor a 30. La
estructura AAA fue la menos ejecutada por todos los sujetos al final de la fase, con una
frecuencia alrededor de 20.
Se realizó un ANOVA de medidas repetidas de las cuatro estructuras (AAA, ABB,
ABA y AAB) en el último bloque de la primera fase y como variable entre-sujetos se tuvo a
los tres grupos. Se encontró un efecto principal de estructura, F (3, 18)= 20.06, p < .05. No
se encontró un efecto significativo de grupo, F (2, 6)= 0.56, p > .05. No obstante, se
encontró un efecto significativo de la interacción de estructura con grupo F (6, 18) = 52.35,
p < .05. Se realizaron contrastes para la interacción entre estructura y grupo. Se encontró
que los contraste de las estructuras AAA-AAB, F (2, 6)= 52.43, p < .05., el ABB-AAB, F
(2, 6)= 29.24, p < .05, y el ABA-AAB, F (2, 6)= 94.74, p < .05., fueron significativamente
diferente entre los grupos. La comparación de las estructuras AAA, ABB y ABA con
respecto a la estructura AAB, fue diferente de acuerdo al grupo. Esto parece estar indicando
que las diferentes estructuras se distribuyeron de diferente manera según el grupo (i.e.
según la estructura reforzada).
Con el fin de analizar más detalladamente la distribución de la conducta entre las
cuatro posibles estructuras en estado estable, en la Figura 3 se muestra por grupo el
promedio de frecuencia de cada estructura en el último bloque de la primera fase. En el
grupo ABB la estructura más frecuente fue la reforzada (ABB). Después de la reforzada, la
estructura AAA fue la siguiente más frecuente, seguida por la estructura AAB y por último,
la estructura ABA que prácticamente no fue ejecutada.
En el caso del grupo ABA se observa que la estructura reforzada ABA fue la más
frecuente. Después de la estructura reforzada, la estructura AAB fue la siguiente más
frecuente, seguida de las estructuras ABB y AAA que fueron las menos ejecutadas de todas
las estructuras.

29
Por último, para el grupo AAB se puede observar que tanto la estructura reforzada
AAB como la estructura ABB tuvieron frecuencias muy cercanas y fueron las más
frecuentes. La siguiente estructura más frecuente fue ABA. Por último, la estructura AAA
fue la menos ejecutada por este grupo.
Para analizar si durante la primera fase las secuencias de respuestas reforzadas se
diferenciaron de las otras posibles secuencias en la Figura 4 se muestran las frecuencias de
las diferentes posibles secuencias a lo largo de la primera fase para cada sujeto. En el panel
superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo
ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra bloques de 5
sesiones y el eje de las ordenadas la frecuencia de cada secuencia. Los rombos blancos
representan la secuencia III, los rombos negros la secuencia DDD, los cuadrados blancos la
Estructura
F
re
cu
en
ci
a
d
e
es
tr
u
ct
u
ra

Grupo ABB Grupo ABA
Grupo AAB
Figura 3. Frecuencia promedio de cada estructura durante el último bloque de 5 sesiones de
la primera fase por grupo. La gráfica superior izquierda muestra los resultados del grupo
ABB, la inferior los del grupo AAB y la superior derecha los del grupo ABA.

30
secuencia IDD, los cuadrados negros la secuencia DII, los triángulos blancos la secuencia
IID y los triángulos negros la secuencia DDI. Las líneas rojas indican las dos secuencias de
respuestas reforzadas.
En esta figura se puede observar que la frecuencia de las ocho posibles secuencias
difirió entre grupos. Para el grupo ABB se observa que todos los sujetos realizaron sólo una
de las dos secuencias con las que podían obtener reforzamiento. Los sujetos N2 y N7
ejecutaron la secuencia DII con una frecuencia cercana a 90, la secuencia IDD que también
estaba programada para entregar reforzadores al ser ejecutada tuvo una frecuencia cercana a
cero. Para estos dos animales, la siguiente secuencia más ejecutada consistentemente fue
III, es decir, tres respuestas en el operando más contiguo temporalmente a la entrega del
reforzador. Las demás secuencias fueron efectuadas con una frecuencia menor a 30. El
sujeto N5 realizó la secuencia IDD con una frecuencia de 67 al final de la primera fase, la
otra secuencia no la emitió. Consistente con los otros dos sujetos la siguiente secuencia más
ejecutada por el sujeto N5 fue aquella que involucraba tres respuestas al operando en el que
las respuestas eran las más contiguas al reforzador, en este caso DDD. Las demás
secuencias las emitió con una frecuencia menor a 30.
Para el grupo ABA se observa que todas las ratas realizaron las dos secuencias con
las que podían obtener el reforzador, este fue el único grupo que consistentemente realizó
ambas secuencias programadas para el reforzamiento. Cada sujeto realizó las dos
secuencias reforzadas con frecuencias muy similares, entre 40 y 50 veces cada secuencia alfinal de la primera fase. Aún el sujeto N8 que tardó más tiempo que los otros sujetos en
completar la fase, muestra el mismo patrón en las secuencias reforzadas. Las demás
secuencias fueron realizadas con una frecuencia menor a 30 durante toda la fase, con
excepción del sujeto N8, el cual en los primeros cuatro bloques de la fase realizó la
secuencia IDD con una frecuencia mayor a 30.
Para el grupo AAB se observa que los tres sujetos de este grupo realizaron con
mayor frecuencia una de las dos posibles secuencias con las que podían obtener el
reforzador. Para dos sujetos la diferenciación de una de las secuencias reforzadas fue clara,
los sujetos N3 y N4 realizaron una de las secuencias de manera dominante con una
frecuencia entre 30 y 45 al final de la primera fase. Mientras que la otra secuencia reforzada

31
ABA
AAB
Fase 1 por secuencia
F
re
cu
en
ci
a
d
e
se
cu
en
ci
a

Figura 4. Ejecución de las ocho posibles secuencia de respuestas por sujeto. Se muestran los resultados del grupo ABB (panel superior),
ABA (panel intermedio) y AAB (panel inferior). La línea en rojo indica las dos posibles secuencias reforzadas a cada sujeto.
Bloques de 5 sesiones
ABB

32
fue ejecutada con frecuencias menores a 15 al final de la fase. Para el sujeto N9 la
diferenciación entre las dos secuencias reforzadas no fue tan clara, este sujeto realizó ambas
secuencias con frecuencias cercanas, aunque una de las secuencias reforzadas siempre tuvo
mayor frecuencia que la otra, consistente con el patrón de ejecución de los demás sujetos
del grupo. El error más común en este grupo fue la ejecución de las secuencias IDD y DII,
dependiendo de cuál de las dos posibles secuencias reforzadas era realizada con mayor
frecuencia por cada sujeto. Por ejemplo, el sujeto N3 realizó la secuencia reforzada DDI
con mayor frecuencia y el error que más ejecutó fue DII, es decir, una respuesta de más en
el operando en el que las respuestas eran más contiguas al reforzamiento. El sujeto N4
realizó la secuencia reforzada IID de manera dominante, y la secuencia errónea que ejecutó
con mayor frecuencia fue IDD. Estas secuencias no reforzadas (IDD y DII) fueron las más
ejecutadas por todos los sujetos, con frecuencias entre 30 y 60 al final de la primera fase,
frecuencia por arriba de las secuencias que recibían el reforzador al ser realizadas.
Dependiendo del sesgo de las respuestas de cada sujeto, las secuencias de estructura ABA
(IDI o DID) también fueron ejecutadas con frecuencias altas, entre 20 y 25 veces por sesión
a lo largo de la fase. Las secuencias de respuestas homogéneas (III y DDD) casi no fueron
ejecutadas por los sujetos de este grupo.
Con el fin de analizar si de acuerdo a los reforzadores obtenidos se encontraba algún
gradiente de dificultad, en la Figura 5 se muestra por grupo el promedio de frecuencia sólo
de las secuencias reforzadas en el último bloque de la primera fase. En el caso de los grupos
ABB y AAB, se promedió la frecuencia de la secuencia a la que se sesgaron las respuestas
de los sujetos independientemente de que fueran diferentes. Por ejemplo, en el grupo ABB,
los sujetos N2 y N7 realizaron de manera dominante la secuencia DII, mientras que el
sujeto N5 ejecutó dominantemente IDD; no obstante, se promedió la frecuencia de estas
secuencias dominantes para cada sujeto independientemente de que fueran DII o IDD. En el
grupo ABA no se tuvo que hacer esto ya que ambas secuencias reforzadas fueron
ejecutadas con frecuencias similares.
En esta figura, se puede observar que el grupo ABB realizó una de las dos posibles
secuencias reforzadas con mayor frecuencia con un promedio de 84.5 y desviación estándar
de 16.2. La otra posible secuencia reforzada casi nunca fue ejecutada. En el caso del grupo
ABA se puede observar que ambas secuencias reforzadas tuvieron frecuencias similares, 46

33
para IDI y 41 para DID en promedio, con desviación estándar de 5.4 y 2.5 respectivamente.
Cada secuencia por separado no fue ejecutada más de 50 veces.
El grupo AAB realizó una de las dos posibles secuencias reforzadas con mayor
frecuencia, con un promedio de 35 y una desviación estándar de 8.5. La otra secuencia no
la realizó más de 15 veces en promedio y desviación estándar de 8.4.

En la Figura 6 se muestran los resultados de la frecuencia de las diferentes
secuencias a lo largo de la segunda fase para cada sujeto. En la segunda fase del
experimento, se reforzó una secuencia homogénea de tres respuestas, III o DDD, durante 15
sesiones. En el panel superior se encuentran los resultados del grupo ABB, en el panel
intermedio los del grupo ABA y en el panel inferior los del grupo AAB. El eje de las
abscisas muestra bloques de 5 sesiones y el eje de las ordenadas la frecuencia de cada
secuencia. Los rombos blancos representan la secuencia III, los rombos negros la secuencia
DDD, los cuadrados blancos la secuencia IDD, los cuadrados negros la secuencia DII, los
círculos blancos la secuencia IDI, los círculos negros la secuencia DID, los triángulos
blancos la secuencia IID y los triángulos negros la secuencia DDI. La línea roja indica la
secuencia homogénea (III o DDD) que fue reforzada a cada sujeto. En esta figura se puede
observar que independientemente del grupo todos los sujetos mostraron patrones similares.
La secuencia reforzada en esta fase, fuera III o DDD, fue adquirida rápidamente y para el
Grupo
F
re
cu
en
ci
a
d
e
se
cu
en
ci
a

Figura 5. Promedio y desviación estándar de la frecuencia de las secuencias reforzadas
en el último bloque de 5 sesiones de la primera fase por grupo.

34
segundo bloque de 5 sesiones todos los sujetos realizaron la secuencia reforzada con una
frecuencia muy cercana a 150.
Durante los últimos dos bloques de 5 sesiones todos los sujetos dedicaron
prácticamente el 100% de los ensayos a realizar la secuencia reforzada. Todas las demás
secuencias dejaron de ser emitidas, independientemente de las secuencias reforzadas en la
fase anterior. En los últimos dos bloques, todas las secuencias que no estaban siendo
reforzadas no fueron emitidas o fueron realizadas con frecuencias cercanas a cero.
Para analizar cómo las secuencias reforzadas aumentaron y disminuyeron su
frecuencia a lo largo de todo el experimento, en la Figura 7 se muestran sus frecuencias por
sujeto a lo largo de las tres fases. En la gráfica de la izquierda de cada sujeto las líneas
punteadas rojas separan la ejecución de las secuencias reforzadas durante los últimos cuatro
días de la primera fase (sección izquierda), durante los primeros y últimos tres días de la
segunda fase (sección media), y durante los primeros cuatro días de la tercera fase (sección
derecha). La gráfica de la derecha muestra un acercamiento a los primeros 4 días de la
tercera fase, con el eje de las ordenadas modificado a un valor máximo de 30. En el panel
superior se encuentran los resultados del grupo ABB, en el panel intermedio los del grupo
ABA y en el panel inferior los del grupo AAB. El eje de las abscisas muestra sesiones y el
eje de las ordenadas la frecuencia de las secuencias. Los cuadrados blancos representan la
secuencia IDD, los cuadrados negros la secuencia DII, los círculos blancos la secuencia
IDI, los círculos negros la secuencia DID, los triángulos blancos la secuencia IID y los
triángulos negros la secuencia DDI.
En general, en la Figura 7 se puede observar la frecuencia de las secuencias
reforzadas al final de la primera fase, como disminuyó su frecuencia durante la segunda
fase y como en la tercera fase volvió a aumentar la frecuencia con que fueron ejecutadas.
Para el grupo ABB, los resultados muestran que sólo una de las dos secuencias reforzadas
al final de la primera fase tuvo una frecuencia muy alta, la otra secuencia casi no fue
emitida, con frecuencias muy cercanas