Logo Studenta

Efecto-de-la-entrega-de-reforzadores-cualitativamente-diferentes-sobre-el-restablecimiento-de-patrones-de-respuesta-de-feston

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO 
 
FACULTAD DE PSICOLOGÍA 
DIVISIÓN DE ESTUDIOS PROFESIONALES 
 
EFECTO DE LA ENTREGA DE REFORZADORES 
CUALITATIVAMENTE DIFERENTES SOBRE EL 
RESTABLECIMIENTO DE PATRONES DE RESPUESTA DE 
FESTÓN 
 
T E S I S 
Que para obtener el título de: 
LICENCIADA EN PSICOLOGÍA 
 
P R E S E N T A 
OLGA MARÍA DIONISIO GERVASIO 
 
 
DIRECTORA DE TESIS: 
DRA. ALICIA ROCA COGORDAN 
 
SINODALES: 
Dra. María Elena Ortiz Salinas 
Dr. Julio Espinosa Rodríguez 
Dr. Christian López Gutiérrez 
 Dr. Rogelio Escobar Hernández 
 
APOYO DEL PROYECTO PAPIIT No. IN308417, DGAPA UNAM 
Ciudad Universitaria, CD.MX, 2017 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 
 
 
 
 
 
 
 
Gracias Basilia Gervasio Abad por tu infinito apoyo y amor incondicional. Fuiste paciente 
en todo momento y lo eres hoy en día, sobre todo en aquellas instancias en las que ni yo me 
soportaba. Gracias por creer en mí y por regalarme todos estos años de tu vida, no hay 
palabras que puedan agradecer por algo tan valioso. Gracias por ser la mejor. 
Es tuyo mi respeto y admiración. 
Te amo mamá. 
 
 
 
 
 
 
1 
 
Agradecimientos 
Gracias a mi tutora, la Dra. Alicia Roca Cogordan por guiarme y apoyarme en la 
elaboración de la presente tesis. Gracias por confiar en mí y por transmitirme el amor por el 
análisis de la conducta. Ha sido un privilegio poder ser parte de tu equipo de trabajo. 
Gracias a los miembros del Comité de Sinodales: Dra. María Elena Ortiz, Dr. Julio 
Espinoza y Dr. Christian López por tomarse el tiempo de leer mi trabajo, por sus revisiones 
y sus valiosos comentarios para culminar este proyecto tan importante en mi vida. 
Gracias al Dr. Rogelio Escobar Hernández por sus revisiones, por sus valiosos 
comentarios y por enseñarme que la electrónica y los microcontroladores son 
fundamentales en el análisis de la conducta. 
Gracias a mis padres por haberme proporcionado la mejor educación, por enseñarme 
que con esfuerzo y constancia todo se consigue. Gracias por cada noche de desvelo, por 
cuidarme, por cada esfuerzo y sacrificio que han tenido que enfrentar para ayudarme a 
cumplir mis sueños. Gracias por su apoyo incondicional en cada decisión que he tomado. 
Los amo. 
Gracias a Bryan, Laura, Frida, Reyna, Alma, Emmanuel, Erika, sin su colaboración, 
su tiempo, ni sus buenos comentarios este trabajo no hubiera sido lo que es. Gracias no solo 
por ayudarme a concluir el desarrollo de esta tesis, sino por todos los momentos que 
pasamos en el proceso. Gracias mosqueteros. 
Gracias Ángel por tu compañía, apoyo, preocupación y por brindarme los mejores 
momentos en mi vida. Este logro también va por ti. Te amo hermano. 
Gracias Evelyn por darme una mano cuando más la necesitaba, por no dejarme sola 
y por regalarme momentos únicos de amistad. 
2 
 
Gracias Karina Fuentes por impulsarme a cumplir mis metas. Por compartir 
victorias y derrotas que definen nuestros caminos. 
Abuela quisiera que estuvieras presente en este momento tan importante y aunque 
no estas físicamente, te llevo en cada momento. Hoy es un día especial. Gracias por cada 
abrazo y sonrisa, siempre estarás en mi corazón. 
La presente tesis fue realizada gracias al apoyo del proyecto PAPIIT No. IN308417, 
DGAPA UNAM. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3 
 
Tabla de contenido 
Resumen …………………………………………………………………………….…….5 
Introducción ……………………………………………………………………………....6 
 Recurrencia de la conducta operante ...……………………………………………..6 
 Recuperación espontánea ………………………………………………………....6 
 Renovación ........................................................................................................…...7 
 Resurgimiento ………………………………………………………………….....8 
 Restablecimiento ……………………………………………………………..…...9 
 Efectos de la presentación de estímulos novedosos y estímulos 
condicionados sobre el restablecimiento de la conducta ....……………..................9 
Efectos de la magnitud del reforzador sobre el restablecimiento de la 
conducta …………...…...........................................................................................12 
 Efectos de la tasa de respuesta sobre el restablecimiento de la conducta 
______………………………………………………………………….…………………..14 
Procedimientos de eliminación de la respuesta empleados en los estudios 
sobre restablecimiento de la conducta ....………………..………………………..15 
Restablecimiento de respuestas previamente mantenidas mediante el 
reforzamiento negativo …..……………………………………………………….16
 Restablecimiento de conductas problema …..………………………….…17 
______Efectos de la entrega de diferentes reforzadores sobre el restablecimiento de 
la respuesta ...……………………………………………………………………..18 
Propósitos del estudio …………..………………………………………………………..19 
Método …………………………………………………………………………………...20 
 Sujetos …………………………………………………………………………....20 
 Aparatos ………………………………………….……………………………….21 
 Procedimiento …………………………………….………………………………22 
Resultados ………………………………………………………………………………..23 
Discusión ………………………………………………………………………….……...30 
Referencias ………………………………………………………………………….……36 
 
4 
 
Lista de tablas y figuras 
Tabla 1. Orden de exposición a las condiciones y reforzadores empleados en cada 
condición para cada sujeto…………………………………………………………..……..23 
Figura 1. Tasa de respuesta (presiones a la palanca / minuto) durante las Fases 1, 2 y 3 para 
cada una de las tres ratas…….………………………………………………………......... 24 
Figura 2. Proporción de respuestas en la Fase 3 (restablecimiento) relativa a la Fase 1 
(entrenamiento) para todos los sujetos en las dos condiciones del estudio………..…….....27 
Figura 3. Distribución temporal de las respuestas durante las Fases 1 y 3 para cada una de 
las tres ratas, en las dos condiciones del estudio…………………………………………...29 
 
 
 
 
 
 
 
 
 
 
 
 
 
5 
 
Resumen 
El restablecimiento ocurre cuando una respuesta extinguida recurre como 
consecuencia de entregar reforzadores independientes de la conducta. Los experimentos 
típicos constan de tres fases; en la Fase 1 se entrena una respuesta, en la Fase 2 se extingue 
y en la Fase 3 se entrega el mismo reforzador empleado en la Fase 1 de manera 
independiente a la conducta. El propósito del estudio fue comparar los efectos de la entrega 
del mismo reforzador y de reforzadores cualitativamente diferentes en la Fase 1 y Fase 3 
sobre el restablecimiento de las respuestas de palanqueo y sobre el restablecimiento de los 
patrones temporales de festón. En la Fase 1, se expuso a tres ratas a un programa de 
intervalo fijo (IF) 30 s. Las presiones a la palanca se reforzaron con leche condensada o 
pellets. Durante la Fase 2 se implementó un procedimiento de extinción. En la Fase 3 se 
entregó leche condensada o pellets conforme a un programa de tiempo fijo (TF) 30 s. En 
una condición se entregó el mismo reforzador y en otra condición se entregaron 
reforzadores cualitativamente diferentes en la Fase 1 y en la Fase 3. El restablecimiento de 
la respuesta fue mayor cuando se empleó el mismo reforzador que cuando se emplearon 
reforzadores diferentes en la Fase 1 y en la Fase 3. El restablecimiento de los patrones de 
respuesta ocurrió sólo en la condición donde se empleó el mismo reforzadoren la Fase 1 y 
Fase 3. Se concluyó que la función discriminativa del reforzador tuvo control sobre el 
restablecimiento de la respuesta. El restablecimiento de la respuesta al emplear diferentes 
reforzadores podría ser un caso de renovación de la respuesta (ABC). 
Palabras clave: restablecimiento, reforzadores cualitativamente diferentes, 
presiones a la palanca, patrones de respuesta, ratas 
 
6 
 
Recurrencia de la conducta operante 
Después de un procedimiento de eliminación o disminución de la conducta, la 
conducta puede recurrir como consecuencia de la reorganización de las condiciones en que 
fue entrenada. A dicho fenómeno se le conoce como recurrencia de la conducta (Lattal & 
Wacker, 2015). 
En situaciones cotidianas las conductas problema tienden a recurrir después de la 
implementación de procedimientos de eliminación o disminución de la conducta (i.e., 
extinción, reforzamiento diferencial de otras conductas [RDO], castigo negativo), lo que 
representa un desafío a la integridad de las intervenciones. Entender las condiciones que 
modulan la recurrencia de conductas contribuiría al diseño de intervenciones que prevengan 
o disminuyan la recurrencia de conductas problema y el aumento de la recurrencia de 
conductas socialmente importantes. A continuación, se describen los cuatro tipos de 
recurrencia de la conducta: la recuperación espontánea, la renovación, el resurgimiento y el 
restablecimiento de la conducta. 
Recuperación Espontánea 
La recuperación espontánea ocurre cuando se implementa un procedimiento de 
extinción y una vez que la conducta alcanzó un nivel pre-reforzamiento se observa un 
aumento en la conducta (Lerman & Iwata, 1996). La recuperación espontánea ocurre bajo 
contextos similares a las cuales se reforzó la conducta inicialmente y es un fenómeno 
transitorio: la conducta pronto deja de ocurrir si se continúa con el procedimiento de 
extinción (e.g., Zeiler, 1971). 
Algunas de las variables que modulan la recuperación espontánea son el número de 
sesiones en las cuales se reforzó la conducta y el número de reforzadores entregados antes 
de implementar el procedimiento de extinción. Por ejemplo, Youtz (1938) encontró que a 
7 
 
mayor número de sesiones de reforzamiento y a mayor número de pellets de comida 
entregados durante las sesiones, hubo una mayor recuperación espontánea de la respuesta 
de presionar la palanca en ratas. 
Renovación 
La renovación de la conducta ocurre cuando una conducta previamente entrenada 
recurre al cambiar el contexto asociado con un procedimiento de eliminación o disminución 
de la conducta (e.g., Bouton & Bolles, 1979; Rosas & Bouton, 1997). El contexto puede 
definirse de manera general como las claves táctiles, visuales y olfativas que constituyen el 
ambiente en el cual ocurre el aprendizaje (Trask, Schepers & Bouton, 2015). 
La renovación de la conducta se ha estudiado extensamente usando procedimientos 
de condicionamiento respondiente (ver Bouton, 2004 para una revisión). La renovación de 
la conducta también se ha observado empleando procedimientos de condicionamiento 
operante (Nakajima, Tanaka, Urushihara & Imada, 2000; Welker & McAuley, 1978). 
El procedimiento de renovación ABA es el que se ha estudiado de manera más 
extensa (ver Bouton, 2004 para una revisión) y consiste de tres fases. En la Fase 1, se 
entrena una respuesta asociada a un contexto A. En la Fase 2, se expone al sujeto a un 
procedimiento de extinción asociado a un contexto B. En la Fase 3, se expone nuevamente 
al sujeto al contexto A, en donde la respuesta previamente expuesta a un procedimiento de 
extinción recurre. Sin embargo, también se han estudiado otros tipos de renovación, como 
la renovación AAB y la ABC. 
Nakajima et al. (2000) mostraron que las respuestas operantes previamente 
extinguidas ocurrieron cuando las claves contextuales asociadas con el reforzamiento se 
presentaban nuevamente. En la Fase 1, los autores reforzaron con pellets las presiones a una 
palanca conforme a un programa de intervalo variable (IV) 30 s en un contexto A. En la 
8 
 
Fase 2, expusieron a las ratas a un procedimiento de extinción en un Contexto B. En la Fase 
3, expusieron a los sujetos a un procedimiento de extinción en el Contexto A. Nakajima et 
al. encontraron que al exponer a los sujetos al contexto de entrenamiento después de la 
extinción hubo renovación de la respuesta de presión a la palanca (i.e., renovación ABA). 
Resurgimiento 
El resurgimiento de la conducta ocurre cuando una respuesta operante se expone a 
un procedimiento de eliminación o disminución de la conducta y otras conductas 
topográficamente diferentes con funcionalidad similar reforzadas en el pasado recurren ante 
circunstancias similares (Epstein 1983, 1985). 
Se han utilizado dos procedimientos para estudiar del resurgimiento de la conducta. 
Un primer procedimiento consta de tres fases. En la Fase 1, se entrena una respuesta. En la 
Fase 2, se implementa un procedimiento de extinción y se entrena una segunda respuesta. 
En la Fase 3, se implementa un procedimiento de extinción para la segunda respuesta y 
resurge la primera respuesta entrenada (e.g., Bruzek, Thompson & Peters, 2009; Cançado, 
Abreu-Rodrigues & Aló, 2015; Lieving & Lattal, 2003). El segundo procedimiento es de 
cuatro fases. En la Fase 1, se entrena una respuesta. En la Fase 2, se implementa un 
procedimiento de extinción. En la Fase 3, se entrena una segunda respuesta. En la Fase 4, se 
implementa un procedimiento de extinción para la segunda respuesta entrenada y resurge la 
primera respuesta entrenada (e.g., Berg et al., 2015; Jarmolowicz & Lattal, 2014; 
Moriyama, Kazama, Obata, & Nakamura, 2015). 
Epstein (1983) mostró el resurgimiento de la conducta de presionar una tecla 
empleando palomas como sujetos. En la Fase 1, Epstein reforzó la respuesta de picar una 
tecla conforme a un programa de IV 1 min. En la Fase 2, expuso a las palomas a un 
procedimiento de extinción del picoteo a la tecla y reforzó una respuesta incompatible con 
9 
 
picar la tecla (e.g., girar la cabeza a la derecha o hacia abajo, o levantar un ala) conforme a 
un programa de razón fija (RF) 1. En la Fase 3, el autor expuso a las palomas a un 
procedimiento de extinción para la segunda respuesta entrenada y la respuesta de picar la 
tecla resurgió. Epstein concluyó que la respuesta de picar una tecla resurgió porque en el 
pasado esa respuesta se reforzó en circunstancias similares. 
Restablecimiento 
El restablecimiento de la conducta ocurre cuando una respuesta extinguida recurre 
como consecuencia de la entrega de reforzadores independientes de la respuesta (Lattal & 
Wacker, 2015). Los experimentos sobre restablecimiento de la conducta típicamente 
constan de tres fases. En la Fase 1, se entrena una respuesta. En la Fase 2, la respuesta 
entrenada se expone a un procedimiento de extinción. En la Fase 3, se entrega el mismo 
reforzador de la Fase 1 pero de manera independiente de la respuesta, lo cual resulta en la 
recurrencia de la respuesta previamente extinguida (Reid, 1958). El presente trabajo se 
centra en este tipo de recurrencia de la conducta, a continuación se hace una revisión de la 
literatura sobre el restablecimiento de la conducta operante. 
Efectos de la presentación de estímulos novedosos y estímulos condicionados 
sobre el restablecimiento de la conducta. 
A continuación se describen algunos estudios que han determinado el efecto de la 
presentación de estímulos novedosos, es decir, estímulos presentados por primera vez en la 
Fase 3 y de la presentación de estímulos condicionados sobre el restablecimiento de la 
respuesta. Por ejemplo, Reid (1958, Experimento 1) determinó si la presentación de 
estímulos novedosos controlaban el restablecimiento de la respuesta. El autor expuso a 
ratas a un procedimiento típico de restablecimiento. En la Fase 1, reforzó las presiones a la 
palanca con laentrega de pellets conforme a un programa de RF 1. En la Fase 2, expuso a 
10 
 
las ratas a un procedimiento de extinción. En la Fase 3, presentó tres estímulos 
aleatoriamente, los cuales no había presentado en las fases anteriores: el parpadeo de una 
luz, el sonido de un timbre, o el sonido del golpeteo de una caja, y un minuto después 
entregó pellets conforme un programa de tiempo fijo (TF) 1 min. Reid demostró que el 
restablecimiento de la respuesta al entregar pellets de manera independiente de la respuesta 
fue mayor que el restablecimiento de la respuesta al presentar los estímulos novedosos. 
En un segundo experimento, Reid (1958) investigó si estímulos asociados 
previamente con el reforzador determinaban el restablecimiento de la conducta, con 
palomas como sujetos. En la Fase 1, el autor reforzó la respuesta de picar una tecla con 
comida conforme a un programa de RF 1. En la Fase 2, expuso a los sujetos a un 
procedimiento de extinción. La Fase 3 fue de dos sesiones, en la primera sesión Reid 
presentó el sonido del dispensador de comida sin la entrega de comida y en la segunda 
sesión el autor entregó el mismo reforzador que en la Fase 1 pero independientemente de la 
respuesta (conforme a un programa de TF 10 seg). Las palomas emitieron un mayor 
número de respuestas durante la sesión en la que se entregó la comida independientemente 
de la conducta que durante la sesión en la que se presentó sólo el ruido del dispensador. 
Campbell, Phillips, Fixsen y Crumbaugh (1968, Experimento 3) compararon los 
efectos de la presentación de un estímulo novedoso, de los estímulos condicionados y de la 
entrega de reforzadores de manera independiente de la respuesta sobre el restablecimiento 
de la respuesta de presionar una palanca en ratas. En la Fase 1, los autores reforzaron la 
respuesta de presión a una palanca conforme a un programa de razón variable (RV) 20. 
Cada vez que se cumplió el requisito de respuesta, los autores entregaron pellets seguidos 
de la presentación de un click del comedero, de dos segundos de oscurecimiento de la caja 
y durante dos segundos se apagó el ruido blanco, los cuales se presentaron de manera 
11 
 
secuencial y fueron los estímulos condicionados. En la Fase 2, expusieron a las ratas a un 
procedimiento de extinción. En la Fase 3, se presentaron tres sesiones consecutivas, en la 
primera sesión los investigadores presentaron un zumbador (i.e., un estímulo novedoso) 
conforme a un programa de RDO 4 min, en la segunda sesión presentaron únicamente los 
estímulos condicionados y en la tercera sesión entregaron pellets y presentaron los 
estímulos condicionados de manera independiente de la respuesta conforme a un programa 
de RDO 4 min. Hubo mayor restablecimiento de la respuesta cuando se entregaron los 
pellets junto con los estímulos condicionados de manera independiente de la respuesta, 
seguido de la sesión en la que se presentaron los estímulos condicionados y el menor 
restablecimiento ocurrió en la sesión donde se presentó sólo el zumbador. 
Spradlin, Fixsen y Girardeau (1969) compararon los efectos de la entrega de un 
reforzador de manera independiente de la respuesta y de la presentación de un estímulo 
novedoso sobre el restablecimiento de la respuesta. Los participantes fueron niños 
diagnosticados con retraso en el desarrollo. Las sesiones fueron en una sala experimental 
donde se colocó un panel con un operando similar a una palanca. En la Fase 1, las 
respuestas en el operando se reforzaron conforme a un programa de RF 25. Se eligió un 
estímulo específico para cada niño que posteriormente se empleó como reforzador (e.g., 
M&M’s®, mentas o malvaviscos). En la Fase 2, se expuso a los participantes a un 
procedimiento de extinción. En la Fase 3, se presentaron tres tipos de sesiones de manera 
aleatoria, en el primer tipo de sesión entregaron reforzadores (e.g., M&M’s®, mentas o 
malvaviscos) de manera independiente de la conducta conforme a un RDO 2 min, en el 
segundo tipo de sesión presentaron un timbre (i.e., estímulo novedoso) durante 5 s y en el 
tercer tipo de sesión no presentaron estímulo alguno (control). Cada tipo de sesión se 
presentó cinco veces. La entrega de los reforzadores de manera independiente de la 
12 
 
respuesta generó mayor restablecimiento de la respuesta, seguido de la presentación de un 
estímulo novedoso y en la sesión de control no hubo restablecimiento de la respuesta. 
Spradlin, Girardeau y Hom (1966) determinaron los efectos de entregar reforzadores 
condicionados generalizados sobre el restablecimiento de la conducta. Las participantes 
fueron adolescentes diagnosticadas con retraso en el desarrollo. Las sesiones se llevaron a 
cabo en una habitación de un hospital que contenía un panel con un operando similar a una 
palanca. En la Fase 1, las respuestas en el operando se reforzaron conforme a un programa 
de RF 50. Una vez que se cumplía el requisito de respuesta, los autores entregaron una 
ficha a las participantes. Las fichas eran intercambiables por varios tipos de comida y 
varios tipos de bebidas. En la Fase 2, expusieron a las participantes a un procedimiento de 
extinción. En la Fase 3, los autores entregaron una ficha de manera independiente a la 
respuesta conforme a un TF 30 s. En la Fase 3, hubo restablecimiento de la respuesta en 
todos los participantes. A partir de los resultados, los investigadores concluyeron que un 
estímulo previamente utilizado como reforzador adquiría propiedades de estímulo 
discriminativo. 
Los resultados de los estudios descritos en esta sección sugieren que hay mayor 
restablecimiento de la respuesta cuando se entregan de manera independiente de la 
respuesta los reforzadores empleados para entrenar la respuesta (Fase 1), seguido del 
restablecimiento de la respuesta cuando se presentan los estímulos condicionados y un bajo 
restablecimiento de la respuesta ante la presentación de estímulos novedosos. 
Efectos de la magnitud del reforzador sobre el restablecimiento de la conducta. 
 Se han realizado algunos estudios que han determinado el efecto de la magnitud del 
reforzador sobre el restablecimiento de la respuesta. Por ejemplo, Reid (1958, Experimento 
3) investigó si la magnitud del reforzador modulaba el grado de restablecimiento de la 
13 
 
respuesta, empleando a estudiantes universitarios. Reid dividió a los participantes en dos 
grupos. En la Fase 1, el autor expuso a un primer grupo a un programa de RF1; al insertar 
una ficha la máquina le regresaba dos fichas a los participantes. Reid expuso a un segundo 
grupo a un programa múltiple RF 1 RF 1; las respuestas en el primer componente se 
reforzaron con la entrega de cuatro fichas y las respuestas en el segundo componente se 
reforzaron con una ficha. Las fichas fueron intercambiables por comida y bebidas. En la 
Fase 2, expuso a los participantes a un procedimiento de extinción. En la Fase 3, la 
máquina arrojó de manera independiente de la respuesta dos o cuatro fichas a cada 
participante dependiendo del grupo al que pertenecía conforme a un TF 1 min. Hubo 
restablecimiento de la respuesta en los dos grupos, no obstante la magnitud no tuvo efectos 
sistemáticos sobre el restablecimiento de la respuesta. Para el segundo grupo de 
participantes el número de respuestas durante la Fase 3 fue similar en ambos componentes. 
De Wit y Stewart (1981, Experimento 1) determinaron el efecto de la magnitud del 
reforzador sobre el restablecimiento de la conducta de presionar la palanca en ratas. En la 
Fase 1, los autores reforzaron las presiones a la palanca conforme a un programa de RF 1. 
Cada reforzador consistió en la administración de 1.0 mg de cocaína por medio de un 
catéter intravenoso. En la Fase 2, expusieron a las ratas a un procedimiento de extinción. En 
la Fase 3, entregaron cuatro diferentes concentraciones de cocaína (0.0, 0.5, 1.0, 2.0 mg) de 
manera independiente de la respuesta conforme aun TF 10 min a través de sesiones. De 
Wit y Stewart observaron mayor restablecimiento de la respuesta con la concentración de 
0.5 mg, seguido de 1.0 mg, de 2.0 mg y al final de 0.0 mg. Al igual que en los estudios 
sobre magnitud del reforzador empleando programas de reforzamiento simples, los 
hallazgos de los presentes estudios acerca de los efectos de la magnitud del reforzador 
sobre el restablecimiento de la respuesta son inconsistentes. 
14 
 
Efectos de la tasa de respuesta sobre el restablecimiento de la conducta. 
Se han realizado estudios que han determinado los efectos de generar tasas altas o 
bajas de respuesta durante la Fase 1 sobre el restablecimiento de la respuesta. Por ejemplo, 
Franks y Lattal (1976) compararon los efectos de generar tasas altas y tasas bajas de 
respuesta sobre el grado de restablecimiento de la respuesta de presionar la palanca en 
ratas. En la Fase 1, reforzaron las respuestas con pellets conforme a un programa de RV 20 
que generó tasas altas de respuesta. En la Fase 2, expusieron a los sujetos a un 
procedimiento de extinción. En la Fase 3, los autores entregaron pellets de manera 
independiente de la conducta, empleando un programa de TF 30 s. En una segunda 
condición, los autores expusieron a los sujetos a las mismas fases excepto porque en la Fase 
1 estuvo vigente un programa de reforzamiento diferencial de tasas bajas (RDB) 30 s. El 
restablecimiento de la respuesta fue mayor cuando se generaron tasas altas de respuesta que 
cuando se generaron tasas bajas de respuesta durante la Fase 1. 
Doughty, Reed y Lattal (2004) compararon los efectos de tasas altas y tasas bajas de 
respuesta asociadas a tasas de reforzamiento equivalentes sobre el restablecimiento de la 
respuesta, empleando a palomas como sujetos. En la Fase 1, estuvo vigente un programa 
múltiple de dos componentes. Durante el primer componente picotear una tecla verde se 
reforzó conforme a un programa tándem TV 117 s IF 3 s, el cual generó tasas altas de 
respuesta. Durante un segundo componente picotear una tecla roja se reforzó conforme a un 
programa tándem IV 117 s TF 3 s, el cual generó tasas bajas de respuesta. El número de 
reforzadores entregados en cada componente fue el mismo. En la Fase 2, expusieron a los 
sujetos a un procedimiento de extinción. En la Fase 3, los autores entregaron los mismos 
reforzadores de la Fase 1 de manera independiente de la respuesta conforme a un programa 
15 
 
múltiple de dos componentes de TV 120 s TV 120 s. Hubo mayor restablecimiento de la 
respuesta en el componente donde se generó una tasa alta de respuesta en la Fase 1. 
Doughty, Reed y Lattal (2004, Experimento 2) compararon los efectos de generar 
una tasa alta de respuesta asociada a una tasa baja de reforzamiento y de una tasa baja de 
respuesta asociada a una tasa alta de reforzamiento sobre el restablecimiento de la respuesta 
de presionar una palanca en ratas. Doughty, Reed y Lattal dividieron a los sujetos en dos 
grupos. En la Fase 1, los autores expusieron a un primer grupo a un programa de RF 1 las 
presiones a la palanca se reforzaron con pellets, generando una baja tasa de respuesta; a un 
segundo grupo las presiones a la palanca se reforzaron con pellets conforme a un RF 3, que 
generó una alta tasa de respuesta, pero una baja tasa de reforzamiento. En la Fase 2, se 
expuso a los sujetos a un procedimiento de extinción. En la Fase 3, se entregaron pellets de 
manera independiente de la respuesta conforme a un TV 30 s. El restablecimiento de la 
respuesta fue mayor cuando se generaron tasas altas de respuesta en la Fase 1 que cuando 
se generaron tasas bajas de respuesta. Los estudios descritos en esta sección muestran que 
generar tasas altas de respuesta en la Fase 1 produce un mayor restablecimiento de la 
respuesta en la Fase 3. 
Procedimientos de eliminación de la respuesta empleados en los estudios sobre 
restablecimiento de la conducta. 
Se han comparado los efectos de procedimientos de eliminación o disminución de la 
respuesta previamente entrenada sobre el restablecimiento de la respuesta. De Wit y 
Stewart (1981, Experimento 2) determinaron el efecto de la duración a la exposición a un 
procedimiento de extinción sobre el restablecimiento de la respuesta en ratas. En la Fase 1, 
los autores reforzaron las presiones a la palanca conforme a un programa de RF 1. Cada 
reforzador consistió en la administración de 1.0 mg de cocaína por medio de un catéter 
16 
 
intravenoso. En la Fase 2, expusieron a los sujetos a diferentes sesiones a un procedimiento 
de extinción de diferentes duraciones (10, 30, 60, 120 y 180 min). Al finalizar cada 
duración de la Fase 2, condujeron la Fase 3, en la cual inyectaron 1.0 mg de cocaína de 
manera independiente de la respuesta conforme a un TF 10 min. El restablecimiento de la 
respuesta después de 30 y 60 min de exposición a un procedimiento de extinción fue mayor 
que el restablecimiento de la respuesta después de 10, 120 y 180 min. 
Uhl (1973) comparó los efectos de la duración de entrenamiento en dos diferentes 
procedimientos de eliminación de la conducta sobre el restablecimiento de la respuesta de 
presionar una palanca en ratas. En la Fase 1, la respuesta de palanqueo se reforzó con 
sacarosa conforme a un programa de IV 30 s. El autor dividió a los sujetos de acuerdo a la 
duración del entrenamiento en la Fase 1 (1, 3, 9 o 27 días). En la Fase 2, expuso a sujetos 
de cada duración de entrenamiento a un procedimiento de extinción o a un procedimiento 
de omisión donde estuvo vigente un programa tándem TF 20 s DRO 40 s. En la Fase 3, el 
autor entregó sacarosa de manera independiente de la respuesta conforme a un tiempo 
variable (TV) 30 s para todos los grupos. El restablecimiento de la respuesta en los grupos 
que se expusieron a mayor duración de entrenamiento (27 días) fue mayor que el 
restablecimiento de la respuesta en los grupos que se expusieron a menor duración de 
entrenamiento (1,3 y 9 días). El restablecimiento de la respuesta en los grupos que se 
expusieron a un procedimiento de extinción fue mayor que el restablecimiento de la 
respuesta en los grupos que se expusieron a un procedimiento de omisión de la respuesta. 
Restablecimiento de respuestas previamente mantenidas mediante el 
reforzamiento negativo. 
En la mayoría de los estudios sobre restablecimiento de la respuesta se ha empleado 
una contingencia de reforzamiento positivo para entrenar una respuesta, sin embargo, 
17 
 
también se han entrenado respuestas con otras contingencias. Por ejemplo, Alessandri, 
Lattal y Canҫado (2015) investigaron si entrenar una respuesta conforme a una 
contingencia de reforzamiento negativo producía restablecimiento de la conducta de 
presionar una tecla en cuatro participantes. En la Fase 1, la respuesta de presionar una tecla 
se reforzó conforme a un programa de RF 10 para una participante y conforme a un 
programa de RV 23 para tres participantes. Presionar la tecla se reforzó con un descanso de 
3 s que fue señalado en la pantalla de una computadora. Si los participantes no cumplían el 
criterio de respuestas cada participante tenía que presionar una celda de fuerza con el 75% 
de su fuerza máxima (i.e., evento aversivo). En la Fase 2, los investigadores expusieron a 
los participantes a un procedimiento de extinción. En la Fase 3, un descanso de 3 s fue 
señalado en una pantalla conforme a un TF 60 s. Hubo restablecimiento de la respuesta de 
presionar la celda de fuerza en dos de cuatro participantes. Los autores sugirieron que una 
contingencia de reforzamiento negativo podía generar menor restablecimiento de la 
respuesta que una contingencia de reforzamiento positivo. 
Restablecimiento de conductas problema. 
Recientemente se ha estudiado la recurrencia de conductas problema. En ambientes 
aplicados al implementar algún procedimiento para disminuir la ocurrencia de conductas 
problema, la conductaproblema podría restablecerse. Por ejemplo, Falcomata et al. (2013) 
determinaron si el establecimiento de conductas problema (e.g., patadas, golpes, pellizcos) 
en la Fase 1 se restablecían al entregar reforzadores de manera independiente de la 
respuesta, empleando a niños diagnosticados con autismo. Los investigadores realizaron 
una prueba de preferencia de operante libre para seleccionar los estímulos que 
posteriormente emplearían como reforzadores y para los tres niños fue el acceso a un iPad®. 
En la Fase 1, las conductas problema se reforzaron conforme a un programa de RF 1, dando 
18 
 
acceso a un iPad® por 30 s. En la Fase 2, expusieron a los niños un procedimiento de 
extinción. En la Fase 3, dieron acceso al iPad 30 s de manera independiente de la respuesta 
conforme a un TF 2 min y si emitían una conducta problema antes de 10 s al acceso al iPad 
se retrasaba 10 s más (i.e., un programa tándem TF 2 min DRO 10 s). Los autores 
encontraron que el reforzamiento independiente de la respuesta restableció las conductas 
problema para todos los participantes. 
Efectos de la entrega de diferentes reforzadores sobre el restablecimiento de la 
respuesta. 
En la mayoría de los estudios sobre establecimiento de la respuesta se ha empleado 
el mismo reforzador en la Fase 1 y en la Fase 3. A continuación se describen algunos 
estudios que han investigado los efectos de la entrega de diferentes reforzadores sobre el 
restablecimiento. Por ejemplo, Otslund y Balleine (2007, Experimento 1) investigaron los 
efectos de la entrega de diferentes reforzadores sobre el restablecimiento de la respuesta de 
palanqueo en ratas. En la Fase 1, los autores reforzaron las presiones a dos palancas 
conforme a un programa de razón al azar 20. Las presiones en la palanca izquierda 
resultaron en la entrega de pellets y las presiones en la palanca derecha resultaron en la 
entrega de sacarosa. En la Fase 2, se expusieron a los sujetos a extinción. En la Fase 3, 
entregaron pellets o sacarosa de manera independiente de la respuesta conforme a un 
programa de RDO 5 s. El restablecimiento de la respuesta de palanqueo fue mayor en la 
palanca relacionada inicialmente con cada reforzador. 
Otslund y Balleine (2007, Experimento 2) investigaron el efecto del valor reforzante 
de diferentes reforzadores sobre el restablecimiento de la respuesta de palanqueo en ratas. 
Se privó de comida a todos los sujetos. En la Fase 1, los autores reforzaron las presiones a 
la palanca conforme a una razón al azar 20. Las presiones en la palanca izquierda resultaron 
19 
 
en la entrega de pellets y las presiones en la palanca derecha resultaron en sacarosa. Al 
finalizar la Fase 1, los autores dividieron a los sujetos en cuatro grupos; dos grupos 
siguieron privados de alimento y dos grupos fueron privados de agua. En la Fase 2, 
expusieron a los sujetos a extinción. En la Fase 3, los autores entregaron pellets de manera 
independiente de la respuesta conforme a un RDO 5 s a un grupo privado de alimento y a 
un grupo privado de agua. Los autores entregaron sacarosa de manera independiente de la 
respuesta conforme a un RDO 5 s a un grupo privado de alimento y a un grupo privado de 
agua. El restablecimiento de la respuesta cuando se entregó el reforzador del cual estaban 
privados fue mayor que el restablecimiento de la respuesta cuando se entregó un reforzador 
del cual los sujetos no estuvieron privados. 
Propósitos del estudio 
El aspecto común de la mayoría de los estudios sobre restablecimiento que se 
describieron en la introducción del presente trabajo es que el reforzador empleado para 
entrenar una conducta en la Fase 1 fue el mismo reforzador que se entregó 
independientemente de la respuesta durante la fase de restablecimiento (Fase 3). En 
conjunto, los hallazgos de los estudios sobre restablecimiento muestran que después de 
implementar un procedimiento de eliminación de la conducta, ésta tiende a recurrir si se 
reintroducen los mismos estímulos que inicialmente mantuvieron la conducta. Los 
hallazgos de estos estudios tienen implicaciones aplicadas y muestran que el 
restablecimiento es un fenómeno especialmente importante de considerar durante los 
tratamientos de conductas problema. Por ejemplo, después de emplear un procedimiento de 
extinción de una conducta problema, esta conducta tenderá a recurrir si se reintroducen los 
mismos estímulos que inicialmente mantenían la conducta problema, a pesar de que la 
presentación de dichos estímulos ya no sea contingente a la ocurrencia de una respuesta 
20 
 
particular. Surge la pregunta de si el restablecimiento de la conducta ocurre únicamente al 
entregar los mismos reforzadores que mantenían la conducta antes de implementar el 
procedimiento de extinción, o bien si el restablecimiento de la conducta también ocurre al 
presentar un reforzador diferente al que inicialmente mantenía la conducta . 
El primer propósito del estudio fue comparar los efectos de la entrega de 
reforzadores cualitativamente diferentes y del mismo reforzador en la Fase 1 y en la Fase 3 
sobre el grado de restablecimiento de la respuesta de presiones a la palanca, empleando a 
ratas como sujetos. Cançado y Lattal (2011) demostraron el resurgimiento de los patrones 
temporales de respuesta entrenados en la Fase 1 con un procedimiento de resurgimiento de 
la respuesta de picoteo en palomas. Los autores concluyeron que la respuesta que recurre es 
similar a la respuesta previamente entrenada en frecuencia, topografía y características 
temporales. Debido a que en la Fase 1 de un procedimiento típico de restablecimiento se 
entrena una respuesta empleando un programa de reforzamiento, se refuerza una respuesta 
y también los patrones de respuesta característicos del programa de reforzamiento 
empleado. El segundo propósito del estudio fue determinar si los patrones de respuesta 
obtenidos durante la Fase 1 (patrones de festón) se restablecían al usar reforzadores 
cualitativamente diferentes y al usar el mismo reforzador en la Fase 1 y en la Fase 3. 
Método 
Sujetos 
Se utilizaron tres ratas macho cepa Wistar de siete meses de edad y con historia 
experimental en programas de reforzamiento de RF 10 y de IF 10 s. Se identificó a los 
sujetos como TS1, TS2 y TS3. Durante todo el experimento se mantuvo a las ratas al 80% 
de su peso ad libitum, limitando la cantidad de comida entregada al final de las sesiones. 
Todas las ratas tuvieron acceso libre a agua. Cada rata de alojó en una caja habitación 
21 
 
individual de 13 cm x 28 cm x 38 cm manufacturada en plástico transparente, con una reja 
metálica colocada en la parte superior de cada caja. 
Aparatos 
Se utilizó una cámara experimental TAC-3D de 30 cm de largo, 23.5 cm de alto y 
20.5 cm de profundidad. El panel frontal y el panel trasero estaban fabricados con filamento 
de ácido poliláctico (PLA). Las paredes laterales y el techo eran de acrílico. El piso de la 
caja consistía de 15 barras de acero inoxidable de 1 cm de diámetro cada una. En el panel 
trasero, a 17 cm del piso de la cámara y a 9 cm de las paredes laterales había un foco, que 
proporcionó iluminación general durante las sesiones. En el panel frontal de la cámara a 2 
cm del piso había una abertura de 5 cm por 5 cm y con una profundidad de 3 cm, en la cual 
había una charola donde cayeron pellets y leche condensada. Se utilizó un dispensador de 
pellets TAC-3D fabricado con filamento de ácido poliláctico (PLA), que funcionó con un 
motor. El comedero entregaba pellets de 35 mg, elaborados remoldeando polvo de comida 
para ratas de la marca Rodent Laboratory Chow ®. Se utilizó una bomba peristáltica marca 
TAC-3D, conectada a una manguera de 5 mm de diámetro de grosor que dispensaba 0.10 
ml de una solución de leche condensada y agua en cada operación. La solución de leche 
condensada consistía de una mezcla de 60% de leche condensada marca Corina® y 40% de 
agua. Ala izquierda del panel frontal a 7.5 cm del piso de la cámara, había una palanca de 4 
cm que sobresalía 2 cm de la pared y que requirió de una fuerza mínima de 0.15 N para 
operar. A 5 cm de la palanca y a 2.5 cm de las paredes laterales había un foco de 28 V. 
La cámara experimental se colocó en un cubículo de madera sonoamortiguado de 65 
cm de largo, 42.5 cm de alto y 40 cm de profundidad. Dentro del cubículo había una bocina 
Logitech® por medio de la cual se emitía ruido blanco de 70db para enmascarar estímulos 
sonoros externos y un ventilador Steren® de 6”. Todos los eventos experimentales se 
22 
 
controlaron con una computadora portátil Sony Vaio ® por medio de la interfaz Arduino-
Visual Basic (Escobar & Pérez-Herrera, 2015). 
Procedimiento 
Fase 1: Entrenamiento. Se reforzaron las presiones a una palanca conforme a un 
programa de IF 1s que se aumentó gradualmente hasta llegar a un IF 30 s para las ratas TS1 
y TS3 y un IF 15 s para la rata TS2 debido a que se observó una tasa baja de respuesta. Las 
duraciones del programa de IF permanecieron vigentes durante el resto de la Fase 1. El 
criterio para finalizar cada sesión fue la entrega de 40 reforzadores o que transcurrieran 40 
minutos. El criterio para finalizar la Fase 1 fue que la tasa de respuesta de las últimas tres 
sesiones no variara más del 5% de las tres penúltimas sesiones. Se utilizó el programa 
Stability Check para realizar el cálculo (Costa & Cançado, 2012). 
El tipo de reforzador fue el mismo o diferente en dos condiciones sucesivas. En la 
Condición del mismo reforzador; el reforzador entregado fue el mismo (e.g., pellets) en la 
Fase 1 y en la Fase 3 y en la Condición diferentes reforzadores; el reforzador entregado en 
la Fase 1 (e.g., pellets) fue diferente al reforzador entregado de la Fase 3 (e.g., leche). Se 
contrabalanceó el orden de las condiciones entre los sujetos. En la Tabla 1, se muestra el 
orden de exposición a las condiciones, así como los reforzadores específicos empleados en 
cada condición para cada sujeto. 
Fase 2: Extinción. Se expuso a los sujetos a un procedimiento de extinción en el 
que las presiones a la palanca no tenían consecuencias programadas. El criterio para 
finalizar la fase fue que en dos sesiones consecutivas el sujeto emitiera el 5% de respuestas 
respecto a la media de las últimas seis sesiones de la Fase 1 (Podlesnik & Shahan, 2009). 
Fase 3: Restablecimiento. Se entregó un reforzador de manera independiente de la 
respuesta conforme un programa tándem tiempo fijo (TF) 30 s RDO 3 s para las ratas TS1 
23 
 
y TS3 y un TF 15 s RDO 3 s para la rata TS2. Se añadió el RDO 3 s al final del intervalo 
con la finalidad de evitar el reforzamiento accidental de las presiones a la palanca durante 
la Fase 3. La fase finalizó hasta que el sujeto emitiera el 5% de respuestas respecto a la 
media de las últimas seis sesiones de la Fase 1 (Podlesnik & Shahan, 2009). Las sesiones 
experimentales se llevaron a cabo seis días a la semana, a la misma hora. 
 
Tabla 1 
Orden de exposición a las condiciones y reforzadores empleados en cada condición para 
cada sujeto 
 
Resultados 
 Para conocer el grado de restablecimiento de la respuesta de presiones a la palanca 
se analizaron los resultados con base en las medidas sobre recurrencia que propusieron 
Cançado, Abreu-Rodrigues y Aló (2016). Cada una de estas variables dependientes se 
describe a continuación. 
 
 
Sujeto Fase 1 Fase 2 Fase 3 Fase 1 Fase 2 Fase 3 
 
Rata TS1 
 
IF 30 s 
(pellets) 
 
Extinción 
 
TF 30 s 
RDO 3 s 
(pellets) 
 
IF 30 s 
(leche 
condensada) 
 
Extinción 
 
TF 30 s 
RDO 3 s 
(pellets) 
 
Rata TS2 
 
IF 15 s 
(leche 
condensada) 
 
Extinción 
 
TF 15 s 
(leche 
condensada) 
 
IF 15 s 
(pellets) 
 
Extinción 
 
TF 15 s 
RDO 3 s 
(leche 
condensada) 
 
Rata TS3 
 
IF 30 s 
(leche 
condensada) 
 
Extinción 
 
TF 30 s 
RDO 3 s 
(pellets) 
 
IF 30 s 
(pellets) 
 
Extinción 
 
TF 30 s 
RDO 3 s 
(pellets) 
24 
 
Tasa de respuesta 
En la Figura 1 se muestra la tasa de respuesta (presiones a la palanca por minuto) 
durante las dos condiciones del estudio para cada sujeto. 
Figura 1. Tasa de respuesta (presiones a la palanca / minuto) durante las Fases 1, 2 y 3 para cada una de las 
tres ratas. En los páneles izquierdos se muestra la condición en que se entregaron reforzadores 
cualitativamente diferentes en la Fase 1 y Fase 3. En los páneles derechos se muestra la condición donde en 
que se entregó el mismo reforzador en la Fase 1 y Fase 3. 
 
0
10
20
30
40
0 10 20 30 40 50 60 70
T
a
s
a
 d
e
 r
e
s
p
u
e
s
ta
 
(p
re
s
io
n
e
s
a
 l
a
 p
a
la
n
c
a
 
/ 
m
in
u
to
)
Fase 1
TS1
0
10
20
30
40
0 10 20 30 40 50 60 70
Leche
Rata TS1
Pellets Pellets Pellets
0
5
10
15
0 10 20 30 40 50 60 70
Leche
0
10
20
30
40
0 10 20 30 40 50 60 70
Leche Pellets
Fase 1 Fase 2 Fase 3
0
5
10
15
0 10 20 30 40 50 60 70
Fase 1 Fase 2
Rata TS2
Pellets
Fase 1 Fase 2 Fase 3
Leche
0
10
20
30
40
0 10 20 30 40 50 60 70 80 90
Rata TS3
Fase 1 Fase 3Fase 2
Pellets Pellets
Sesiones
Leche
Fase 3
Condición reforzadores diferentes Condición mismo reforzador
Fase 1 Fase 2 Fase 3 Fase 1 Fase 2 Fase 3
25 
 
En la Fase 1 (entrenamiento), las tasas de respuesta más altas para todos los sujetos 
se observaron cuando se reforzó la respuesta de presionar la palanca con leche relativo a 
cuando se reforzó la respuesta con pellets. En la Fase 2 (extinción), se observó una 
disminución en la tasa de respuesta respecto a la Fase 1 durante las dos condiciones del 
estudio. En la Fase 3 (restablecimiento), hubo restablecimiento de la respuesta para todos 
los sujetos en las dos condiciones del estudio. 
Para la rata TS1, la tasa de respuesta en las últimas sesiones de la Fase 1 durante la 
condición de reforzadores diferentes fue alrededor de 30 respuestas por minuto, mientras 
que la tasa de respuesta en las últimas sesiones de la Fase 1 durante la condición del mismo 
reforzador fue alrededor de 8 respuestas por minuto. En la Fase 2, la tasa de respuesta 
disminuyó desde la primera sesión en la condición de reforzadores diferentes, mientras que 
la tasa de respuesta en la primera sesión durante la condición del mismo reforzador fue 
alrededor de 10 respuestas por minuto y posteriormente, la tasa de respuesta disminuyó a 
niveles cercanos a cero. La tasa de respuesta en la primera sesión y segunda sesión de la 
Fase 3 durante la condición de reforzadores diferentes fue de 5 y 10 respuestas por minuto, 
respectivamente, mientras que la tasa de respuesta en la primera sesión y segunda sesión de 
la Fase 3 durante la condición del mismo reforzador fue de 15 y 10 respuestas por minuto, 
respectivamente. 
 Para la rata TS2, la tasa de respuesta en las últimas sesiones de la Fase 1 durante la 
condición de reforzadores diferentes fue alrededor de 8 respuestas por minuto, mientras que 
la tasa de respuesta en las últimas sesiones de la Fase 1 durante la condición del mismo 
reforzador fue alrededor de 12 respuestas por minuto. En la Fase 2, la tasa de respuesta en 
la primera sesión fue de 4 respuestas por minuto durante la condición de reforzadores 
diferentes, mientras que en la primera sesión y segunda sesión durante la condición del 
26 
 
mismo reforzador la tasa de respuesta fue de 3 respuestas por minuto, posteriormente la 
tasa de respuesta disminuyó a niveles cercanos a cero en ambas condiciones. La tasa de 
respuesta en la segunda sesión de la Fase 3 durante la condición de reforzadores diferentes 
fue de 4 respuestas por minuto, mientras que la tasa de respuesta en la segunda sesión de la 
Fase 3 durante la condición del mismo reforzador fue alrededor de 2 respuestas por minuto. 
 Para la rata TS3, la tasa de respuesta en las últimas sesiones de la Fase 1 durante la 
condición de reforzadores diferentes fue alrededor de 30 respuestas por minuto, mientras 
que la tasade respuesta en las últimas sesiones de la Fase 1 durante la condición del mismo 
reforzador fue alrededor de 23 respuestas por minuto. En la Fase 2, la tasa de respuesta en 
la primera sesión y segunda sesión fue de 4 respuestas por minuto durante la condición de 
reforzadores diferentes, mientras que en la primera sesión y segunda sesión durante la 
condición del mismo reforzador la tasa de respuesta fue de 25 y 14 respuestas por minuto, 
respectivamente, posteriormente la tasa de respuesta disminuyó a niveles cercanos a cero en 
ambas condiciones. La tasa de respuesta en la primera sesión y segunda sesión de la Fase 3 
durante la condición de reforzadores diferentes fue de 3 y 1 respuesta por minuto, 
respectivamente, mientras que la tasa de respuesta en la primera sesión y segunda sesión de 
la Fase 3 durante la condición del mismo reforzador fue alrededor de 8 respuestas por 
minuto. 
Proporción de la tasa de respuesta en la Fase 3 relativa a la Fase 1 
Para clarificar el grado de restablecimiento de la respuesta en las dos condiciones 
del estudio, en la Figura 2, se muestra la proporción de respuestas en la Fase 3 
(restablecimiento) relativa a la Fase 1 (entrenamiento). Para realizar dicho análisis se tomó 
la media de la tasa de respuesta de las últimas dos sesiones de la Fase 1 como 100% en 
cada condición. 
27 
 
Figura 2. Proporción de respuestas en la Fase 3 (restablecimiento) relativa a la Fase 1 (entrenamiento) para 
todos los sujetos en las dos condiciones del estudio. 
Durante ambas condiciones del estudio para todos los sujetos se observó el 
restablecimiento de la respuesta de presionar la palanca en las primeras sesiones de la Fase 
3. Para la rata TS1, la proporción de respuestas durante la condición del mismo reforzador 
fue mayor que la proporción de respuestas durante la condición de reforzadores diferentes. 
Para la rata TS2, la proporción de respuestas en la primera sesión durante la condición del 
0.0
0.2
0.4
0.6
0.8
0 5 10
Pellets - Pellets
Leche - Pellets
Rata TS1
0.0
0.2
0.4
0.6
0.8
0 5 10 15 20 25 30 35
Leche - Pellets
Pellets - Pellets
Rata TS3
Sesiones
P
ro
p
o
rc
ió
n
 d
e
 r
e
s
p
u
e
s
ta
s
 e
n
la
 F
a
s
e
 3
 r
e
la
ti
v
a
a
 l
a
 F
a
s
e
 1
0.0
0.2
0.4
0.6
0 5
Leche - Leche
Pellets - Leche
Rata TS2
Pellets - Pellets
Leche - Pellets
Pellets - Pellets
Pellets - Leche
Leche - Leche
Leche - Pellets
 
28 
 
mismo reforzador fue mayor que la proporción de respuestas en la primera sesión durante la 
condición de reforzadores diferentes. En la segunda sesión hubo un aumento en la 
proporción de respuestas durante la condición de reforzadores diferentes y una disminución 
en la proporción de respuestas durante la condición del mismo reforzador. Para la rata TS3, 
la proporción de respuestas durante la condición del mismo reforzador fue mayor que la 
proporción de respuestas durante la condición de diferentes reforzadores. En la condición 
del mismo reforzador, se observó una tasa alta de respuesta la cual después de 37 sesiones 
no disminuyó, esto pudo deberse a que la conducta del sujeto fue susceptible al 
reforzamiento accidental 
Distribución temporal de las respuestas 
En la Figura 3 se muestra la distribución temporal de las respuestas en subintervalos 
de 1 s durante el IF en la última y penúltima sesión en la Fase 1, así como la distribución 
temporal de las respuestas en subintervalos de 1 s durante el TF en la primera y segunda 
sesión de la Fase 3 en las dos condiciones del estudio. 
 
 
 
 
 
 
29 
 
Figura 3. Distribución temporal de las respuestas en las Fases 1 y 3 para cada una de las tres ratas, durante las 
dos condiciones del estudio. En los páneles izquierdos se muestra la distribución temporal de las respuestas en 
subintervalos de 1 s empleando un IF durante la penúltima sesión y última sesión en la Fase 1. En los páneles 
derechos se muestra la distribución temporal de las respuestas en subintervalos de 1 s empleando un TF 
durante la primera sesión y segunda sesión en Fase 3. 
 
Para todos los sujetos, en la penúltima sesión y última sesión en la Fase 1, en las dos 
condiciones del estudio, se observó que durante el intervalo entre comidas el número de 
respuestas disminuyó después de la entrega del reforzador y aumentó gradualmente el 
número de respuestas conforme se acercaba el final de intervalo fijo, los cuales fueron 
patrones de respuesta característicos de festón. 
En la Fase 3, se entregaron reforzadores de manera independiente de la respuesta 
conforme a un TF. Para las ratas TS1 y TS3, en la primera y segunda sesión en la Fase 3 
0
30
60
90
0 5 10 15 20 25 30
0
30
60
90
0 5 10 15 20 25 30
Rata TS1
0
5
10
15
20
25
30
35
0 5 10 15 20 25 30
Pellets
Pellets
Pellets-Pellets
Leche-Pellets
0
5
10
15
20
25
30
35
0 5 10 15 20 25 30
Subintervalos de 1 s del IF
Fase 1 (Entrenamiento)
0
10
20
30
40
0 5 10 15
0
10
20
30
40
0 5 10 15
0
5
10
15
20
25
0 5 10 15 20 25 30
Pellets
Pellets
0
5
10
15
20
25
0 5 10 15 20 25 30
Pellets
Pellets
Rata TS2
0
30
60
90
0 5 10 15 20 25 30
Penúltima sesión
0
30
60
90
0 5 10 15 20 25 30
Rata TS3
Última sesión
0
3
6
9
12
0 5 10 15
Leche
Leche
0
3
6
9
12
0 5 10 15
Fase 3 (Restablecimiento)
N
ú
m
e
ro
d
e
 r
e
s
p
u
e
s
ta
s
Segunda sesiónPrimera sesión
Subintervalos de 1 s del TF
Leche-Leche
Pellets-Leche
Leche-Pellets
Pellets-Pellets
Leche - Pellets
Pellets - Pellets
Pellets - Leche
Leche - Leche
Pellets - Pellets
Leche - Pellets
 
30 
 
durante la condición del mismo reforzador se observó restablecimiento de patrones 
similares a los festones. Se observó un patrón reminiscente al de un festón en el que la tasa 
de respuesta disminuyó después de la entrega del reforzador y aumentó gradualmente 
conforme se acercaba la entrega del siguiente reforzador. 
Para todos los sujetos, durante la condición de diferentes reforzadores, no se 
observó restablecimiento de la distribución temporal de las respuestas entrenadas en la Fase 
1. Las tres ratas respondieron de manera irregular a través de los subintervalos. Excepto la 
rata TS2, en la que no se observó restablecimiento de la distribución temporal de las 
respuestas en sesión alguna de las dos condiciones del estudio, el sujeto respondió de 
manera irregular a través de los subintervalos. 
En resumen, la entrega del mismo reforzador en la Fase 1 y en la Fase 3 resultó en 
un restablecimiento de la respuesta mayor que la entrega de reforzadores diferentes en la 
Fase 1 y Fase 3. La entrega del mismo reforzador también resultó en el restablecimiento de 
la distribución temporal de las respuestas entrenadas durante la Fase 1. Este efecto ocurrió 
consistentemente para dos de los tres sujetos. 
Discusión 
En situaciones cotidianas es común que después de la implementación de un 
procedimiento de eliminación o disminución de la conducta, la conducta problema se 
restablezca como consecuencia de presentación de manera independiente del mismo 
reforzador con el que se entrenó la conducta (Falcomata et al., 2013). En el presente estudio 
se determinó si el restablecimiento de la conducta ocurría al entregar reforzadores 
diferentes en la Fase 1 y en la Fase 3. El primer propósito del presente estudio fue comparar 
los efectos de la entrega de reforzadores cualitativamente diferentes y del mismo reforzador 
31 
 
en la Fase 1 y en la Fase 3, sobre el restablecimiento de la respuesta de presiones a la 
palanca, empleando a ratas como sujetos. 
En la Fase 1, las presiones a la palanca se reforzaron con leche condensada o pellets. 
En la Fase 2, se implementó un procedimiento de extinción. En la Fase 3, se entregó leche 
condensada o pellets de manera independiente de la respuesta. En condiciones sucesivas se 
entregó el mismo reforzador o reforzadores cualitativamente diferentes en la Fase 1 y en la 
Fase 3. Para dos de los tressujetos, el restablecimiento de la respuesta en la condición de 
reforzadores diferentes fue menor que el restablecimiento de la respuesta en la condición en 
la cual se empleó el mismo reforzador. En la condición del mismo reforzador hubo 
restablecimiento de patrones de respuesta similares a los entrenados en la Fase 1, mientras 
que en la condición de reforzadores diferentes no se observó restablecimiento de los 
patrones de respuesta similares (festones) entrenados en la Fase 1. 
Los resultados de la presente investigación en la condición del mismo reforzador en 
la Fase 1 y Fase 3 son consistentes con las investigaciones que se realizaron con 
procedimientos típicos de restablecimiento de la conducta (Campbel et al., 1968; 
Falcomata, et al., 2013; Reid, 1958; Sprandlin, Girardeau & Hom, 1966). Una posible 
explicación de por qué se encontró restablecimiento de la respuesta, es porque el estímulo 
reforzador funciona como un estímulo discriminativo que controla y establece la ocasión 
para que recurra la respuesta operante previamente entrenada durante la Fase 1 (Franks & 
Lattal, 1976; Otslund & Balleine, 2007; Reid, 1958; Sprandlin, Girardeau & Hom, 1966; 
Uhl, 1973). 
Los resultados de la presente investigación son consistentes con los hallazgos de 
Reid (1958) quien determinó los efectos de la presentación de estímulos novedosos y de la 
entrega de reforzadores independientes de la respuesta. Reid encontró que el 
32 
 
restablecimiento de la respuesta al entregar el mismo reforzador de manera independiente 
de la respuesta es mayor que el restablecimiento de la respuesta al presentar estímulos 
novedosos. Los estímulos novedosos y los reforzadores cualitativamente diferentes 
presentados de manera independiente de la respuesta en la Fase 3 crean un nuevo contexto. 
El contexto definido de manera general como las claves táctiles, visuales y olfativas que 
constituyen el ambiente en el cual ocurre el aprendizaje (Trask, Schepers & Bouton, 2015). 
Al entregar un reforzador diferente al empleado en la Fase 1 hubo un cambio de 
contexto que difirió al de la Fase 1 y al de la Fase 2. Se generó un contexto diferente al de 
la Fase 1 debido a un cambio de claves auditivas como el sonido del comedero al entregar 
pellets o el sonido de la bomba peristáltica al entregar leche condensada, también un 
cambio de claves olfativas y visuales como la forma, el olor y textura al entregar pellets que 
es diferente a la entrega de leche condensada. Los resultados de la presente investigación 
sugieren que en los procedimientos de restablecimiento de la respuesta cuando se emplean 
reforzadores diferentes podrían tratarse de un caso especial de renovación de la conducta y 
específicamente de renovación ABC. Se ha sugerido que el resurgimiento de la conducta 
podría ser un caso especial de renovación de la conducta debido a que en la Fase 1 se crea 
un contexto bajo el cual se entrena una primera conducta. En la Fase 2, se crea otro 
contexto bajo el cual se expone la primera conducta previamente entrenada a un 
procedimiento de extinción y se refuerza una segunda conducta. En la Fase 3, las dos 
respuestas se exponen a un procedimiento de extinción y se genera nuevamente un cambio 
de contexto, lo que podría ser un caso de renovación ABC. (Bouton, Winterbauer & Todd, 
2012; Trask, Schepers & Bouton, 2015). Es probable que las instancias de recurrencia de la 
conducta: recuperación espontánea, resurgimiento, restablecimiento y renovación 
conformen parte de un mismo fenómeno conductual. 
33 
 
Para todos los sujetos, la tasa de respuesta cuando la respuesta de presión a una 
palanca se reforzó con leche fue más alta que cuando la respuesta de presión a una palanca 
se reforzó con pellets. No obstante, el restablecimiento de la respuesta no fue mayor cuando 
se generaron tasas altas de respuesta en la Fase 1. Los resultados sugieren que la función 
del reforzador como estímulo discriminativo se sobre-impone al efecto de las tasas de 
respuesta obtenidas en la Fase 1 sobre el grado de restablecimiento de la respuesta. 
Siguiendo con la hipótesis de que el restablecimiento de la conducta conforma parte de un 
mismo continuo de recurrencia de la conducta, los resultados descritos anteriormente son 
consistentes con que la renovación de la conducta ABA genera mayor recurrencia de la 
conducta que con la renovación de la conducta ABC. 
Un segundo propósito fue determinar si los patrones de respuesta obtenidos durante 
la Fase 1 se restablecían al usar reforzadores cualitativamente diferentes o al usar el mismo 
reforzador en la Fase 3. La presente investigación extiende sus hallazgos no sólo sobre el 
restablecimiento de respuesta sino también sobre el restablecimiento de patrones de 
respuesta similares a los entrenados en la Fase 1. Para dos de los tres sujetos en la 
condición en la cual se empleó el mismo reforzador, hubo restablecimiento de la 
distribución temporal de la respuestas observándose un patrón similar al de un festón, 
mientras que en la condición donde se emplearon reforzadores diferentes no se observó 
restablecimiento de la distribución temporal de la respuestas. 
Una posible explicación de por qué los patrones de respuesta obtenidos durante la 
Fase 1 se restablecieron sólo en la condición donde se empleó el mismo reforzador, se debe 
a que al entregar el mismo reforzador en la Fase 3, la función discriminativa del reforzador 
tiene mayor control sobre el restablecimiento de la respuesta que la entrega de un 
reforzador diferente al de la Fase 1. El mismo reforzador establece la ocasión para que la 
34 
 
respuesta previamente entrenada recurra en frecuencia, topografía y características 
temporales (Cançado & Lattal, 2011). 
Se añadió un RDO 3 s al final de intervalo para evitar en la medida de lo posible 
reforzamiento accidental de las presiones a la palanca. Para un sujeto el añadir un RDO 3 s 
al final del intervalo en la Fase 3 no impidió que se reforzada accidentalmente las presiones 
a la palanca. Se observó que la tasa de respuesta se mantuvo alta y constante después de 37 
sesiones. La conducta se vuelve susceptible al reforzamiento accidental desde el momento 
en que la conducta recurre al entregar reforzadores de manera independiente de la respuesta 
en la Fase 3 (Lattal & Wacker, 2015). 
En las intervenciones las recaídas son comunes como consecuencia de la 
reorganización de las condiciones en las que se adquirió la conducta. Los resultados de la 
presente investigación sugieren el diseño de intervenciones que modulen los contextos en 
los que se adquirió la conducta, el contexto en el cual se expuso a un procedimiento de 
eliminación o disminución de la conducta y el contexto en el cual se reorganizan las 
condiciones. Se ha encontrado que la renovación ABC resulta en menor recurrencia de la 
conducta que la renovación ABA. Se sugiere diseñar tratamientos en los que se empleé un 
contexto diferente al de adquisición y un contexto diferente al de exposición a un 
procedimiento de eliminación o disminución de la respuesta, así como tratamientos en los 
cuales se entrene la conducta conforme a componentes pobres, en los cuales los 
reforzadores se entreguen de manera dependientes de la conducta relativo a componentes 
ricos, en los cuales los reforzadores se entreguen de manera dependiente e independiente de 
la conducta, lo que permitiría implementar tratamientos con efectos más robustos que 
prevengan o disminuyan la recaída de conductas problema (Podlesnik & Shahan, 2009). 
35 
 
Debido a que el contexto es todo aquello que constituye el ambiente en el cual 
ocurre el aprendizaje, una posible variable que podría determinar el grado de recurrencia de 
la conducta podría ser la similitud de los procedimientos empleados en los cuales ocurre el 
aprendizaje. En futuras investigaciones se podrían determinar el efecto un procedimiento de 
omisión de la respuesta comoprocedimiento de eliminación o disminución de la respuesta 
y también como un procedimiento en la fase de restablecimiento empleando reforzadores 
cualitativamente diferentes o empleando el mismo reforzador. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
36 
 
Referencias 
Alessandri, J., Lattal, K. A., & Canҫado, C. R. X. (2015). The recurrence of negatively 
reinforced responding of humans. Journal of the Experimental Analysis of Behavior, 
104, 211-222. 
Berg, W. K., Ringdahl, J. E., Ryan, S. E., Ing, A. D., Lustig, N., Romani, P., Wacker, D. P., 
Andersen, J. K., & Durako, E. (2015). Resurgence of mands following functional 
communication training. Revista Mexicana del Análisis de la Conducta, 41, 166-186. 
Bouton, M. E. (2004). Context and behavioral processes in extinction. Learning & 
Memory, 11, 485-494. 
Bouton, M. E., & Bolles, R. C. (1979). Role of conditioned contextual stimuli in 
reinstatement of extinguished fear. Journal of Experimental Psychology: Animal 
Behavior Processes, 5, 368-378. 
Bouton, M. E., Winterbauer, N. E., & Todd, T. P. (2012). Relapse processes after the 
extinction of instrumental learning: Renewal, resurgence and reacquisition. Behavioral 
Processes, 90, 130-141. 
Bruzek, J. L., Thompson, R. H., & Peters, L. C. (2009). Resurgence of infant caregiving 
responses. Journal of the Experimental Analysis of Behavior, 92, 327-343. 
Cançado, C. R. X., Abreu-Rodrigues, J., & Aló, R. M. (2015). Reinforcement rate and 
resurgence: A parametric analysis. Revista Mexicana del Análisis de la Conducta, 41, 
84-115. 
Cançado, C. R. X., Abreu-Rodrigues, J., & Aló, R. M. (2016). A note on measuring 
recurrence. Revista Mexicana del Análisis de la Conducta, 42, 75-86. 
Cançado, C. R. X., & Lattal, K. A. (2011). Resurgence of temporal patterns of responding. 
Journal of the Experimental Analysis of Behavior, 95, 271-287. 
37 
 
Campbell, P. A., Phillips, E., Fixsen, D., & Crumbaugh, C. (1968). Free operant response 
reinstatement during extinction and time-contingent (DRO) reward. Psychological 
Reports, 22, 563-569. 
Costa, C. E., & Cançado, C. R. X. (2012). Stability check: A program for calculating the 
stability of behavior. Revista Mexicana del Análisis de la Conducta, 38, 61-71. 
De Wit, H., & Stewart, J. (1981). Reinstatement of cocaine-reinforced responding in the rat. 
Psychopharmacology, 75, 134-143. 
Doughty, A. H., Reed, P., & Lattal, K. A. (2004). Differential reinstatement predicted by 
pre-extinction response rate. Psychonomic Bulletin & Review, 11, 1118-1123. 
Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. 
Behavior Analysis Letters, 3, 391-397. 
Epstein, R. (1985). Extinction-induced resurgence: Preliminary investigations and possible 
applications. The Psychological Record, 35, 143-153. 
Escobar, R., & Pérez-Herrera, C. A. (2015). Low-cost USB interface for operant research 
using Arduino and Visual Basic. Journal of the Experimental Analysis of Behavior, 
103, 427-435. 
Falcomata, T. S., Hoffman, K. J., Gainey, S., & Muething, C. S. (2013). A preliminary 
evaluation of reinstatement of destructive behavior displayed by individuals with 
autism. The Psychological Record, 63, 453-466. 
Franks, G. J., & Lattal, K. A. (1976). Antecedent reinforcement schedule training and 
operant response reinstatement in rats. Animal Learning & Behavior, 4, 374-378. 
Jarmolowicz, D. P., & Lattal, K. A. (2014). Resurgence under delayed reinforcement. The 
Psychological Record, 64, 189-193. 
38 
 
Lattal, K. A., & Wacker, D. (2015). Some dimensions of recurrent operant behavior. 
Revista Mexicana del Análisis de la Conducta, 41, 1-13. 
Lerman, D. C., & Iwata, B. A. (1996). Developing a technology for the use of operant 
extinction in clinical settings: An examination of basic and applied research. Journal of 
Applied Behavior Analysis, 29, 345-382. 
Lieving, G. A., & Lattal, K. A. (2003). Recency, repeatability, and reinforcer retrenchment: 
An experimental analysis of resurgence. Journal of the Experimental Analysis of 
Behavior, 80, 217-233.___________________________________________________ 
Nakajima, S., Tanaka, S., Urushihara, K., & Imada, H. (2000). Renewal of extinguished 
lever-press responses upon return to the training context. Learning & Motivation, 31, 
416-431. 
Moriyama, T., Kazama, L., Obata, S., & Nakamura, T. (2015). Resurgence of chicks´key-
peck responding with an imprinted stimulus or food as reinforcer. Revista Mexicana 
del Análisis de la Conducta, 41, 44-62. 
Ostlund, S. B., & Balleine, B. W. (2007). Selective reinstatement of instrumental 
performance depends on the discriminative stimulus properties of the mediating 
outcome. Learning & Behavior, 35, 43-52. 
Podlesnik, C. A., & Shahan, T. A. (2009). Behavioral momentum and relapse of 
extinguished operant responding. Learning & Behavior, 37, 357-364. 
Reid, R. L. (1958). The role of the reinforcer as a stimulus. British Journal of Psychology, 
49, 202–209. 
Rosas, J. M., & Bouton, M. E. (1997). Additivity of the effects of retention interval and 
context change on latent inhibition: Toward resolution of the context forgetting 
39 
 
paradox. Journal of Experimental Psychology: Animal Behavior Processes, 23, 283-
294. 
Spradlin, J. E., Fixsen, D. L., & Girardeau, F. L. (1969). Reinstatement of an operant 
response by the delivery of reinforcement during extinction. Journal of Experimental 
Child Psychology, 7, 96–100. 
Spradlin, J. E., Girardeau, F. L., & Hom, G. L. (1966). Stimulus properties of 
reinforcement during extinction of a free operant response. Journal of Experimental 
Child Psychology, 4, 369–380. 
Trask, S., Schepers, S., & Bouton, M. E. (2015). Context change explains resurgence after 
the extinction of operant behavior. Revista Mexicana del Análisis de la Conducta, 41, 
187-210. 
Uhl, C. N. (1973). Eliminating behavior with omission and extinction after varying 
amounts of training. Animal Learning & Behavior, 1, 237-240. 
Welker, R. L., & McAuley, K. (1978). Reductions in resistance to extinction and 
spontaneous recovery as a function of changes in transportational and contextual 
stimuli. Animal Learning & Behavior, 6, 451-457. 
Youtz, R. E. P. (1938). Reinforcement, extinction, and spontaneous recovery in a non-
pavlovian reaction. Journal of Experimental Psychology, 22, 305-318. 
Zeiler, M. D. (1971). Eliminating behavior with reinforcement. Journal of the Experimental 
Analysis of Behavior, 16, 401-405. 
	Portada
	Tabla de Contenido
	Resumen
	Introducción
	Propósitos del Estudio
	Método
	Resultados
	Discusión
	Referencias

Continuar navegando