Logo Studenta

aprendizaje instrumental

¡Este material tiene más páginas!

Vista previa del material en texto

ENFOQUE DEL REFUERZO: CONDICIONAMIENTO OPERANTE 
APRENDIZAJE INSTRUMENTAL 
SKINNER, B.F 
 
 
A principio del siglo XX, un investigador norteamericano, Edward 
Thorndike trabajaba observando los intentos que hacían unos 
animales (palomas) por escapar de un laberinto o obtener alimentos 
fuera de él. Los animales del experimento invariablemente emitían 
diversas conductas por ensayo y error, sin embargo, pudo notar como 
a medida que algunas conductas obtenían resultados favorables se 
fortalecían, mientras que aquellas conductas irrelevantes iban 
debilitándose 
 En función a esto Edward Thorndike desarrollo su ley del efecto 
que afirmaba: “la fuerza de un acto depende de sus 
consecuencias”. 
 Este fue el hecho precursor a lo que décadas después el 
psicólogo americano Burrus Skinner sistematizaría como 
Condicionamiento Operante o Aprendizaje instrumental. 
 Skinner se dió cuenta que no siempre debía estar presente un 
estímulo antecedente para que el animal (palomas) en cuestión 
emitiera la respuesta (R). En este caso la respuesta (R) iba 
dirigida hacia el medio, y como éste podía sufrir consecuencias 
posteriores se dijo que este tipo de respuesta o conducta 
operaba sobre el medio (operante). De tal forma que desarrolló 
el paradigma E---R---C y esto lo conceptualizó Triple relación de 
Contingencia 
 
 
 
En líneas generales cuatro (4) hechos pueden estar presentes al emitir 
un sujeto una conducta 
 
 
Reforzamiento 
Toda aquella consecuencia ambiental contingente a una conducta que 
aumenta la probabilidad de aparición o frecuencia de la misma. 
Existen dos (2) tipos de reforzamientos: “Reforzamiento positivo” y 
“Reforzamiento negativo”. 
Los reforzadores pueden clasificarse de diferentes maneras; 
básicamente: 
 Tangibles o primarios (alimentos, bebidas o fichas). 
 Sociales o secundarios (elogios, sonrisas, abrazos y otras 
manifestación de aprobación). 
 Positivos (recompensantes, placenteros) 
 Negativos (aversivos, punitivos). 
Los reforzadores tangibles y sociales pueden ser reforzadores 
positivos, es decir, consecuencia deseables por la que se manifiesta la 
conducta. O bien negativos, es decir, consecuencias indeseables por 
la que se inhibe la conducta. 
 Reforzamiento positivo: 
Toda aquella consecuencia ambiental contingente a una conducta, 
cuya aparición aumenta la probabilidad de la misma. 
Reforzamiento negativo: 
Toda aquella consecuencia ambiental contingente a una conducta 
cuya eliminación aumenta probabilidad de aparición de la misma. A 
diferencia del reforzamiento positivo, no es la aparición del reforzador 
lo que incrementa la respuesta, sino la eliminación de una 
consecuencia aversiva, es decir, desagradable para el organismo o 
sujeto. 
No es la aparición de un evento desagradable lo que incrementa la 
respuesta sino la eliminación de ese evento. No es una conducta de 
obtención de consecuencia sino conducta de evitación y escape de la 
consecuencia. 
 
Castigo: 
Es la aparición de una consecuencia aversiva contingente a una 
conducta determinada “que conlleva a una disminución en la 
frecuencia de aparición de dicha conducta”. 
Este procedimiento ha sido ampliamente criticado por diferentes 
especialistas ya que presenta algunas limitaciones ya que el castigo 
no elimina conductas sino simplemente el sujeto las suprime delante 
del agente castigador, así mismo puede desarrollar emociones 
secundarias inadecuadas (rabia, miedo) dichas emociones puede 
sufrir posteriormente un proceso de generalización de estímulos 
 
 
 
El castigo es socialmente una técnica ampliamente utilizada, y como 
regla debe regirse por los siguientes principios: 
 Conocimiento 
 Continuidad 
 Contingencia 
 Control 
 Especificidad 
 
Regla del conocimiento 
Se debe informar cuál es la conducta y cuál es el castigo. 
Regla de la continuidad 
Una vez establecido el conocimiento, se debe mantener el castigo 
cada vez que se emita la conducta que originó el castigo. De no ser 
así la persona puede aprender conductas para evitar el castigo (por 
evitación) reforzamiento negativo. 
Regla de la contingencia 
Cuanto menor sea el tiempo transcurrido entre la emisión de la 
conducta y la aparición de la consecuencia mayor esfuerzo tendrá ésta 
última sobre la conducta. Aplicándose igualmente para los 
reforzadores. 
Regla del control 
El castigo es una técnica no un desahogo emocional del administrador 
del castigo. 
Regla de la especificidad 
Se castiga la conducta no a la persona. Se debe evitar 
descalificaciones hacía la persona. 
 
El castigo sólo se recomienda aplicar: 
1. Cuando el sujeto no tenga capacidad de abstracción. 
2. Déficit intelectual profundo (retardo mental). 
3. Alteraciones mentales severas e importantes (psicosis). 
 Salvo estas limitaciones, se recomienda el uso de costo de 
respuesta. 
 
Programas de reforzamientos 
El ambiente natural no siempre ha dispuesto las condiciones de modo 
tal que se obtenga un reforzador a la conducta. Igualmente en 
condiciones de control conductual, no siempre se ofrece 
reforzamiento. 
Por tanto, cuando se hace referencia a un programa de reforzamiento, 
se habla de “la frecuencia con que es presentado el refuerzo 
contingentemente a la conducta”. 
 
 
 
Programa de reforzamiento continuo 
El programa continuo exige la presentación del reforzador 
inmediatamente después de cada incidencia de la conducta. El 
programa de reforzamiento continuo suele aplicarse durante la etapa 
inicial del programa de modificación conductual. A menudo su 
aplicación cambiará la conducta con rapidez. Sin embargo, no es 
recomendable usarlo a largo plazo, ya que el sujeto tiende a saciarse. 
Ejemplo: El profesor Pérez perdía la concentración cada vez que 
pedro se levantaba de su lugar. Por tanto, se planeó una intervención 
para aumentar el tiempo que permanecía pedro en su lugar. Durante 
la intervención inicial se reforzó al chico cuando éste permanecía en 
su lugar. 
Programa de reforzamiento intermitente 
El programa de reforzamiento intermitente la secuencia a seguir es 
diferente ya que no se ofrecerá refuerzo siempre que se ejecute la 
conducta deseada. Por el contrario el sujeto deberá cumplir cierta 
condición para obtenerlo. 
El programa de reforzamiento intermitente se divide en: 
 a) Intermitente de razón 
 - Fija 
 - Variable 
 b) Intermitente de intervalo 
 - Fija 
 - Variable 
Intermitente de razón fija (RF) 
El sujeto necesita dar una determinada cantidad de respuesta (R) para 
obtener el refuerzo. Y la cantidad debe ser constante. 
Ejemplo: 
Cada vez que Francisco responde correctamente 15 ejercicios de 
matemáticas, se le concede 20 minutos adicionales en el recreo. 
Intermitente de razón variable (RV) 
La frecuencia de presentación del reforzador varía en función de la 
respuesta (R) promedio o media. Es decir, no sigue un patrón fijo. 
 
 
Ejemplo: 
El profesor ha logrado que Deivis levante la mano y participe en los 
debates en clase. Lo consiguió con mediante un programa de 
reforzamiento fijo (RF). Ahora, desea pasar a un programa de 
reforzamiento variable (RV) por ende, le aplica a Deivis un programa 
de reforzamiento variable presentando el reforzador cada cinco 
levantadas de mano con el fin de participar. 
Programa de reforzamiento intermitente de intervalo 
Programa de reforzamiento de intervalo, a diferencia de los programa 
intermitentes lo importante no es la cantidad de respuestas (R) que el 
sujeto debe emitir para obtener el refuerzo sino el período de tiempo 
en que deberá realizarla. 
Intermitente de intervalo fijo (IF) 
En el programa de reforzamiento de intervalo fijo debe transcurrir un 
período determinado antes de que se presente el reforzador. Este se 
presenta inmediatamente después de la primera respuesta luego de 
que ha transcurrido el lapso determinado. 
Ejemplo: 
Betina no permaneceen su lugar durante las lecciones de lenguaje. La 
maestra ha decidido reforzarla mediante un programa de IF de 10. 
Cada vez que Betina permanezca en su lugar durante 10 minutos se 
verá recompensada. 
Intermitente de intervalo variable (IV) 
En el programa de reforzamiento de intervalo variable el reforzador se 
basa en una respuesta promedio o medio. No sigue una pauta fija. 
Ejemplo: 
El profesor Almeida ha decidido implementar igualmente con Betina un 
programa de intervalo variable de 10. Es decir, a Betina se le seguirá 
reforzando por permanecer en su lugar. Puede reforzarse por primera 
vez al cabo de sólo 9 minutos, la segunda vez después de 4, la tercera 
luego de 9, la cuarta después de 15 y la quinta al cabo de 13. Se trata 
de un programa de 9,4,9,5 y 3 que se basa en un intervalo variable 
con un promedio o media de 10 minutos. 
Condicionamiento Operante Aprendizaje instrumental 
Ofrece técnicas conductuales para eliminar o disminuir conductas no 
operativas, así como incrementar o aumentar conductas operativas no 
presentes o con baja emisión en el repertorio conductual del sujeto. 
 
 
Eliminar o Disminuir conductas 
Castigo operante 
 Costo de respuesta 
 Tiempo fuera 
 Saciedad 
 Reprimendas 
 Extinción 
 Reforzamiento diferencial 
 De comportamiento opuestas (RDO) 
 De comportamiento incompatibles (RDI) 
 De tasas de comportamiento bajas (RDB) 
 Tiempo fuera 
 Sobrecorrección 
 
Incrementar o Aumentar conductas 
 Reforzamiento positivo 
 Moldeamiento 
 Modelamiento 
 Contrato de contingencia 
 Economía de fichas 
Bibliografía sugerida: Manejo Conductual. Walker y Shea (1987) 
 
CONDICIONAMIENTO OPERANTE 
 De acuerdo al condicionamiento operante las conductas son 
aprendidas como resultado de las consecuencias ambientales 
que el sujeto recibe cuando emite la conducta. 
 Si contingente a la conducta emitida sigue una consecuencia 
positiva, se incrementa la probabilidad de que la conducta se 
repita. 
 Si contingente a la conducta emitida sigue una consecuencia 
negativa, la probabilidad de que la conducta se repita disminuye. 
 El operante es una conducta que resulta de un refuerzo (positivo 
o negativo). 
 Se concibe al ambiente como la causa y el control de la 
conducta.

Continuar navegando