Logo Studenta

Programas de Reforzamiento

¡Estudia con miles de materiales!

Vista previa del material en texto

Programas de Reforzamiento 
LA LEY EMPÍRICA DEL EFECTO 
Contingencia de respuesta-reforzador y Organización de la 
conducta 
 
 
 
 
 
Una respuesta operante es una respuesta que controla la presentación de una 
consecuencia (contingencia positiva) o que previene o termina el estímulo al 
que controla (contingencia negativa). El reforzamiento puede crear una nueva 
respuesta, modificar una respuesta existente o producir variabilidad conductual. 
 
 
 
 
Por el tipo de contingencia entre la respuesta-consecuencia y el tipo de 
estímulo empleado, existen cuatro procedimientos de condicionamiento 
operante: a)reforzamiento positivo, la respuesta produce una consecuencia 
apetitiva, b)reforzamiento negativo, la respuesta evita una consecuencia 
aversiva, c) castigo positivo, la respuesta produce una consecuencia aversiva 
y d) castigo negativo, la respuesta evita una consecuencia apetitiva. Los 
programas de reforzamiento son las reglas que indican cuándo y cómo se 
presentará la consecuencia después de que se ejecuta la respuesta operante. 
Existen cuatro tipos de programas de reforzamiento: 
 
•Razón Fija, 
•Razón Variable, 
•Intervalo Fijo 
•Intervalo Variable. 
En los programas de razón, la entrega del reforzador depende del número de 
respuestas que hace el animal. En un programa de Razón Fija, el reforzador se 
entrega después de que se emite un número fijo de respuestas(ejemplo, en un 
RF5 el reforzador se entrega después de que el animal da 5 respuestas); en los 
programas de Razón Variable, el reforzador se entrega después de que se 
emite un número variable de respuestas que se encuentran alrededor de un 
promedio (ejemplo, en un RV5 el reforzador se entregará en promedio cada 5 
respuestas, esto es, en ocasiones después de 4 respuestas, otras veces 
después de 6, otras de 5, etc.). En los programas de intervalo, el reforzador 
está disponible hasta después de que transcurre un intervalo de tiempo y se 
entrega en el momento en que se ejecuta la respuesta operante una vez 
transcurrido el intervalo. En un programa de Intervalo Fijo el reforzador está 
disponible después de un intervalo fijo de tiempo y se entrega sólo si el animal 
da una respuesta después de transcurrido el intervalo(ejemplo, en un IF3min, 
el reforzador sólo está disponible después de que transcurren 3 min, por lo que 
la primer respuesta que da el animal después de que pasan los 3 min, será 
reforzada). En un programa de Intervalo Variable, el reforzador está disponible 
después de un tiempo promedio (ejemplo, en un IV3min el reforzador estará 
disponible en promedio cada 3 minutos, puede ser a los 2, 3 y 4 minutos). 
 
 
 
 
Es importante no confundir los programas de Intervalo con los de Tiempo. En 
los programas de Tiempo (fijo o variable), el reforzador se entrega después de 
que transcurra el intervalo establecido y no es necesario que el animal emita 
una respuesta. Mientras que en los programas de Intervalo se necesitan 2 
condiciones para recibir el reforzador: a) que transcurra el tiempo establecido y 
b) que el animal ejecute la respuesta (no importa si es justo al terminar el 
intervalo o mucho tiempo después). Si se hace una gráfica de registro 
acumulativo de las respuestas ante los 4 programas de reforzamiento, se 
obtienen distintos patrones (ver Figura 1). En los programas de RF los animales 
responden de manera rápida y constante hasta alcanzar el criterio de 
reforzamiento, sin embargo, una vez que obtienen el reforzador hacen una 
pausa post-reforzamiento. En los programas de RV los animales responden 
más rápido que en los de RF y lo hacen de manera constante sin hacer pausas 
predecibles. 
 
 
 
 
 
 
 
Fig. 1. Se muestran los patrones de respuestas que se generan bajo los 
4 diferentes programas de reforzamiento: RF, RV, IF e IV 
 
 
 
 
 
 
 
 
 
 
Bajo los programas de IF los animales no responden mientras transcurre el 
intervalo y sólo cuando el intervalo va a llegar a su final comienzan a responder 
de manera muy rápida y constante, generando una curva que se conoce como 
festón. Bajo programas de IV, los sujetos responden de manera muy lenta 
pero constante (sin pausas predecibles y es el programa en el que se responde 
más lento). 
 
 
Durante la extinción, la respuesta operante ya no es seguida de la 
consecuencia. El patrón conductual en la extinción es un incremento en la 
respuesta operante llamado “ráfaga de respuestas” seguido de la disminución 
en la tasa de la respuesta. Cuando se extingue una conducta y se vuelve a 
colocar al sujeto ante la misma situación, se vuelve a presentar la respuesta 
operante; a este fenómeno se le conoce como “recuperación espontánea”. 
 
 
 
Objetivo: 
 
El alumno entrenará al comedero a una rata virtual, le moldeará la respuesta de 
palanqueo, la reforzará bajo un programa de reforzamiento, le extinguirá la 
conducta y observará el efecto de recuperación espontánea. 
 
 
Lugar: 
Laboratorio de Cómputo. 
 
Material: 
•Programa “Sniffy The Virtual Rat” 
•Computadora 
•Memoria USB 
 
Duración: 
4 horas. 
 
 
 
Desarrollo: 
 
A) Cada alumno trabajará en una computadora. 
B) La práctica consistirá en 5 pasos que cada alumno debe realizar con Sniffy: 
1. Entrenamiento a comedero, 2. Moldeamiento a la palanca, 
3. Programa de reforzamiento, 4. Extinción y 5. Recuperación espontánea. 
 
C) Entrar al programa “Sniffy The Virtual Rat”. Te encontrarás con las 
siguientes ventanas en la pantalla: 
 
 
 
 
D) Realiza los siguientes pasos: 
 
1. ENTRENAMIENTO AL COMEDERO 
a) Graba tu archivo como “comedero”. Para guardarlo, en la barra de 
Menú entra a: File Save As comedero aprieta “OK” 
 
b) Cada vez que la rata se aproxime al comedero entrégale un pellet de comida 
(aprieta la barra espaciadora o da un “click” con el mouse sobre la palanca de 
la caja operante). 
 
c) Sniffy estará condicionada clásicamente al comedero cuando la barra 
“sound-food” de la gráfica de Asociación Operante llegue al máximo. 
 
d) Guarda el archivo (NO OLVIDAR ESTE PASO) 
 
 
2. MOLDEAMIENTO A LA PALANCA 
 
a) Abre el archivo “comedero” 
b) Guarda el archivo como “palanca” 
c) Moldea a la rata por aproximaciones sucesivas para que apriete la palanca. 
Sniffy estará condicionada operantemente a la palanca cuando la barra “bar-
sound” de la gráfica de Asociación Operante llegue al máximo. 
d) Guarda el archivo. 
 
 
3. PROGRAMA DE REFORZAMIENTO 
a) Abre el archivo “palanca” 
 
b) Se le asignará a cada persona un programa de reforzamiento. Para entrenar 
a Sniffy deberán ir incrementando la razón (si es un programa de RF o RV) o el 
tiempo (IF o IV) poco a poco. Por ejemplo, si deben entrenar a Sniffy en un 
programa RF25, háganlo con los pasos intermedios: RF2, RF5, RF10, RF15, 
RF20 para terminar con RF25, de otra manera se extinguirá la conducta de 
palanqueo (si intentan dar saltos muy grandes pues para la rata será como si 
no hubiera reforzador por apretar la palanca). 
 
c) Guarda el archivo para cada paso de tu entrenamiento con el nombre que 
corresponda al programa que vas a emplear (ejemplo, “RF2”). 
 
 
d) En la barra de Menú entra a las opciones: Experiment Design Operant 
Experiment. Saldrá una ventana, marca la opción “Fixed” si vas a emplear un 
programa fijo y “Variable” si vas a emplear un programa variable. Escribe en la 
ventana el valor de la razón o el tiempo en segundos. Marca la opción 
“Seconds” si vas a emplear un programa de intervalo y “Responses” si vas a 
emplear un programa de razón. Aprieta el botón “OK”. 
 
 
e) Sniffy estará condicionada al programa de reforzamiento cuando la barra 
“bar-sound” de la gráfica de Asociación Operante llegue al máximo y se 
mantenga ahí. 
 
 
 
f) Guarda el archivo. 
 
g) Entrena el siguiente paso (ejemplo RF5 y repite los puntos del “a” al“g” hasta 
que alcances el valor que se te pidió entrenar, por ejemplo RF25). 
 
 
 
NOTA: Al introducir los datos para programar el experimento, la caja operante 
entregaráa Sniffy los reforzadores en el momento adecuado (número y 
tiempo), tú ya no tienes que entregar los reforzadores, la computadora lo 
hace (si llegas a entregar un reforzador será como “regalarle” uno a Sniffy y 
dificultarás su entrenamiento). Tu papel en el punto 3 sólo será el de observar 
cómo aprende Sniffy e ir introduciendo los datos para cada uno de los pasos 
que se entrenarán (ej, RV2, RV5, RV10, RV15, RV20, RV25). 
 
No te asustes si al empezar a entrenar el programa de reforzamiento baja el 
nivel de la barra “bar-sound”, esto es normal pues inicia un nuevo aprendizaje 
por lo que se pierde por un tiempo la asociación entre la palanca y el 
reforzador, la barra deberá volver a su nivel máximo cuando la rata aprenda la 
nueva contingencia (ejemplo RF2). 
 
 
 
 
Truco: Al iniciar el entrenamiento de los diferentes programas de 
reforzamiento, te darás cuenta que en ocasiones Sniffy tarda mucho en 
aprender (la barra “bar-sound” sube a su máximo pero no se mantiene ahí sino 
que sube y baja constantemente). Lo que puedes hacer para “apresurar” el 
aprendizaje es cerrarle a Sniffy la puerta de la caja operante, así no se distraerá 
y aprenderá más rápido. Para hacer esto debes ir al Menú y elegir Experiment 
Isolate Sniffy. Verás cómo se cierra la puerta y cómo el registro 
acumulativo avanza rápidamente. Cuando la Sniffy aprenda a responder en el 
programa que le pediste puedes volver a verla seleccionando en el Menú: 
Experiment Show Sniffy. Puedes repetir esto para cada paso del 
entrenamiento (también para la extinción). 
 
 
 
 
 
 
 
 
4. EXTINCIÓN 
 
a) Abre el último archivo que empleaste (por ejemplo, RF25) 
b) Guarda el archivo como “extinción” 
c) En la barra de Menú entra a las opciones: Experiment Design Operant 
Experiment: 
- marca la opción “Extinction” 
- marca la opción “Mute Dispenser” 
- Aprieta el botón “OK” 
d) La conducta de Sniffy se extinguirá cuando la barra “bar-sound” de la gráfica 
de Asociación Operante llegue al mínimo. 
 
e) Guarda el archivo. 
 
5. RECUPERACIÓN ESPONTÁNEA 
 
a) Abre el archivo “extinción” 
b) Guarda el archivo como “recuperación espontánea” 
c) En la barra de Menú entra a las opciones: Experiment Remove Sniffy for 
Time-Out aprieta “OK”. Esta opción simulará que retiraste a Sniffy de la 
caja operante y que después de un tiempo, la volviste a colocar en la caja. 
d) Observa la recuperación espontánea de la conducta. 
e) Guarda el archivo. 
E) REPORTE ESCRITO 
Hacer un análisis de lo observado en cada uno de los pasos (1-5) en los que se 
entrenó Sniffy. Para los pasos del 2 al 5 se deberá copiar la gráfica de registro 
acumulativo y pegarla en un Documento de Word. Se incluirá en el reporte de 
la práctica un análisis del patrón de conducta que se observa en cada una 
de las gráficas (del paso 2 al 5). Para copiar la gráfica seleccionen la ventana 
del registro acumulativo (hacer click en cualquier parte de la gráfica de manera 
que la barra superior se vea de azul más brillante que el de las demás 
ventanas). Ir al Menú y en Edición seleccionar “copiar ventana actual”. 
Posteriormente abrir un documento nuevo en Word y pegar la imagen. Las 
conclusiones deberán incluir una breve discusión sobre lo aprendido en la 
práctica así como las dificultades encontradas para entrenar a Sniffy en relación 
a la teoría revisada en clase.

Continuar navegando