Logo Studenta

RDTER-y-descubrimiento-de-reglas-en-estudiantes-universitarios

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO 
 
 
FACULTAD DE PSICOLOGÍA 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
RDTER Y DESCUBRIMIENTO DE REGLAS EN ESTUDIANTES 
UNIVERSITARIOS 
 
 
 
T E S I S 
QUE PARA OBTENER EL TÍTULO DE 
LICENCIADO EN PSICOLOGÍA 
P R E S E N T A: 
 
RAFAEL CRUZ VELAZQUEZ 
 
 
DIRECTOR DE LA TESIS: 
DR. GUSTAVO BACHÁ MÉNDEZ 
REVISOR: 
DR. JULIO ESPINOSA RODRÍGUEZ 
SINODALES: 
DR. CARLOS SANTOYO VELASCO 
DR. OSCAR ZAMORA ARÉVALO 
DR. OSCAR VLADIMIR ORDUÑA TRUJILLO 
 
 
 
Ciudad Universitaria, D.F. OCTUBRE DE 2010 
 
 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 
 
 
 
 
 
 
A MIS PADRES… 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
AGRADECIMIENTOS 
 
 
A mis padres y mi hermano, por apoyarme incondicionalmente en todo lo que me he 
propuesto, por ser tan amorosos y pacientes conmigo desde siempre y por enseñarme 
siempre que hay que buscar más de lo que uno pueda imaginar… ¡GRACIAS! Y a mi 
abuelita porque la quiero mucho y porque sé que le dará mucho gusto verse aquí… 
 
Al Dr. Gustavo Bachá por ser un excelente maestro, por haberme enseñado que la 
Psicología puede ser tan interesante como divertida y sobre todo por ser un gran amigo… 
 
A Angie por ser esa persona tan especial en mi vida desde… siempre… ¡TACNTI! 
 
A mis amigos Carlos, Toño y Gonzo por su amistad, la diversión y enseñarme que se puede 
ser mejor persona siempre… 
 
A mis amigos Ive, Aldo, Sebas, Vale, Bélgica, Lalo, Erikita, Hammu, Pollo y Saúl por los 
momentos de diversión, por su amistad, su ayuda y consejo siempre que fue necesario… 
 
A Sara por su amistad, por haber creado la primera versión del programa computacional 
utilizado en esta tesis y por haber colaborado con muy buenas ideas en las primeras etapas 
del experimento. 
 
A Ixel por su amistad y por haber revisado esta tesis. 
 
Al Dr. Julio por las largas, interesantes y divertidas pláticas que sostuvimos sobre esta tesis y 
muchos temas más. 
 
Al Dr. Carlos, al Dr. Oscar y al Dr. Vladimir por haber enriquecido esta tesis con sus 
interesantes comentarios. 
 
A los participantes del experimento. 
 
Gracias… Totales … 
 
 
 
 
 
 
 
“Living is easy with eyes closed, 
misunderstanding all you see. 
It's getting hard to be someone, 
but it all works out; 
it doesn't matter much to me.” 
 (Lennon) 
 
 
 
 
 
 
 
 
 
 
 
 
 
“Boy, you're gonna carry that weight, 
carry that weight a long time. 
Boy, you're gonna carry that weight, 
carry that weight a long time.” 
 (McCartney) 
 
 
 
 
1 
 
Contenido 
Resumen ........................................................................................................................................2 
Introducción..................................................................................................................................3 
Algunos Antecedentes ..............................................................................................................5 
Estimación y percepción temporal ..........................................................................................9 
El estudio del tiempo en Psicología......................................................................................11 
Reforzamiento Diferencial de Tiempos Entre Respuestas (RDTER’s) ..........................14 
RDTER’s y humanos...............................................................................................................16 
Análisis de los TER's en programas de reforzamiento diferencial ..................................20 
Planteamiento del problema...................................................................................................25 
Método..........................................................................................................................................26 
Participantes.............................................................................................................................26 
Escenario ..................................................................................................................................26 
Grupos.......................................................................................................................................26 
Programa computacional .......................................................................................................26 
Procedimiento ..........................................................................................................................28 
Diseño .......................................................................................................................................29 
Resultados ..................................................................................................................................30 
Reforzador por reforzador ......................................................................................................30 
Análisis de la Distribución de Frecuencias........................................................................43 
Análisis de desviación de Pico ..............................................................................................46 
Descubrimiento de reglas y percepción de tiempo ............................................................51 
Discusión.....................................................................................................................................57 
Análisis Reforzador por reforzador .......................................................................................58 
Distribución de frecuencias y Análisis de desviación de Pico (PkDA) ............................62 
Reporte verbal..........................................................................................................................65 
Discusión general ....................................................................................................................69 
Conclusiones generales .........................................................................................................71 
Consideraciones finales .........................................................................................................73 
Referencias .................................................................................................................................75 
Apéndice ......................................................................................................................................79 
 
2 
 
Resumen 
 
La capacidad que los organismos tenemos para detectar contingencias del 
ambiente es importante para la supervivencia. Algunas de estas contingencias se 
basan en cualidades específicas de los estímulos internos o externos. Los 
programas de reforzamiento diferencial de tiempos entre respuestas (RDTER’s) 
requieren que el organismo genere una respuesta después de haber dejado pasar 
un tiempo determinado para poder obtener un reforzador. Algunos investigadoresrelacionan el desempeño de los organismos bajo este programa, con su capacidad 
de estimar tiempo, autocontrol e hiperactividad. En los humanos, este desempeño 
ha sido poco estudiado. Algunos trabajos utilizan procedimientos como éste 
principalmente para realizar modificación de conductas no deseadas con grupos 
poblacionales muy reducidos (personas con algún tipo de déficit por ejemplo). El 
objetivo de la presente tesis fue analizar el comportamiento de un conjunto de 
participantes cuando fueron sometidos a un programa de RDTER’s en el que el 
tiempo entre respuestas (TER) reforzado era modificado de sesión a sesión; así 
como observar si eran capaces de detectar la regla para obtener el reforzamiento 
aún cuando ésta no era indicada antes de las sesiones. Los TER reforzados iban 
de los 3 a los 10 segundos y los participantes únicamente realizaron dos o tres 
sesiones dependiendo del grupo. Se analizaron los resultados de aquellos 
participantes que obtuvieron todo los reforzadores disponibles en sus tres sesiones 
y se observó que los TER en que ellos ajustaron su conducta fueron muy cercanos 
al reforzado, además la mayoría dijo poder identificar la contingencia por lo que una 
de las estrategias mayormente empleada fue la de contar “segundos”. No obstante, 
el tiempo percibido y el ejecutado muestran diferencias interesantes. Se encontró 
también, que la historia del reforzamiento tiene un papel importante dentro de la 
manera en que los participantes resolvieron las sesiones después de haber tenido 
experiencia en el programa. 
 
 
 
 
3 
 
Introducción 
 
La conducta de los organismos se ve determinada por dos elementos que actúan de 
manera conjunta a lo largo de su historia filogenética y ontogenética: 
El primero de estos elementos se refiere a todo aquello que un organismo puede 
realizar dependiendo de la carga genotípica y fenotípica con que nace. Esto se ve 
determinado por la especie, o mejor dicho, la información genética propia de ésta. Este 
tipo de características o determinantes conductuales se irán modelando a lo largo de la 
historia filogenética de los organismos y serán comunes en la gran mayoría de los 
individuos de la especie. Entre ellas tenemos por ejemplo: circuitos neuronales que se 
desarrollarán para generar determinado tipo de conductas, la propia conformación física 
de los individuos o la capacidad de los mismos para adaptarse distintas situaciones que 
se le puedan presentar a lo largo de su vida, por mencionar algunos. 
El segundo elemento que modela la conducta de los organismos se refiere a las 
presiones medio ambientales. Aquí encontramos a las características propias del medio 
en el cual la especie se desarrolla; como por ejemplo: su situación geográfica, la 
disponibilidad de recursos o el nicho ecológico que la propia especie ocupa en el 
ecosistema en el cual se debe desarrollar. 
Es importante notar que ambas características funcionan de manera conjunta en los 
organismos como factores causales de sus conductas típicas o potenciales a lo largo de 
su vida. Es decir, las acciones que forman parte del repertorio conductual de los 
organismos son el resultado de una selección gradual, la cual permite a los distintos 
organismos sobrevivir a las presiones medio ambientales en las que se desarrollaron. 
Sin embargo, este repertorio, está íntimamente ligado con la estructura física de cada 
especie, de manera tal que los organismos no son capaces de generar conductas que 
su estructura física no permita, y por el contrario son más propensos a generar 
conductas más “apropiadas” para la misma. Esto deja claro que, si este fue el 
mecanismo a partir del cual se desarrolló la conducta de los organismos, entonces 
deberíamos encontrar procesos conductuales y estructurales semejantes entre distintas 
especies; lo cual, como sabemos, ocurre. Algunos procesos implican la facilidad de 
adaptación de los organismos a los distintos ambientes a partir de la realización de 
4 
 
alguna conducta específica o de la capacidad de generar nuevas. Un ejemplo de ello 
podría ser el Aprendizaje. De manera muy general aquellos organismos que se 
encuentran en un entorno extremadamente estable se beneficiarían menos de la 
capacidad de aprendizaje que aquellos animales en medios más variables. Sería por 
ello que los animales marinos muestran una capacidad de aprendizaje “menos 
compleja” que los que viven en el exterior, con excepción de los mamíferos cuya línea 
evolutiva los llevó a un desarrollo en tierra firme antes de convertirse en animales 
totalmente marinos (Maier, 2001). 
El proceso de aprendizaje también es diferente entre especies dependiendo de su ciclo 
vital, es decir, si una mariposa, por ejemplo, vive únicamente una semana, un 
mecanismo en el cual el sistema nervioso tenga que generar cambios graduales en un 
mediano o largo plazo para la adquisición de conocimientos vitales como la 
alimentación, el desplazamiento o la reproducción no sería del todo eficiente. Procesos 
que impliquen una mejor eficiencia en relación al gasto energético y temporal en 
situaciones como el forrajeo son más útiles para organismos de este tipo. 
Lo anterior busca dejar en claro la gran importancia que tiene entonces el estudio de los 
procesos psicológicos que permiten a los organismos manejarse de manera eficiente en 
su ambiente, sin embargo también deja clara la gran complejidad del estudio de los 
mismos a partir de procedimientos científicos. Los seres vivos estamos en contacto con 
una gran cantidad de elementos o variables que en su conjunto generan las respuestas 
que forman parte de nuestro repertorio conductual. Un camino para obtener este 
conocimiento es a partir de procedimientos científicos. 
En la siguiente sección se buscará mostrar de manera resumida el camino por medio 
del cual la Psicología ha llegado al estudio de los procesos psicológicos, así como el 
porqué de algunos procedimientos empleados para su estudio. Esto, con el fin de 
justificar la vigencia que aún guarda el estudio de procesos cognitivos a partir de 
procedimientos relativamente “simples” como lo son los programas de reforzamiento. 
 
 
 
 
5 
 
Algunos Antecedentes 
 
En el año de 1859, con la publicación de “El origen de las especies” de Charles Darwin, 
la visión que entonces se tenía del mundo habría de cambiar de manera radical. En 
primera instancia, el mundo ya no se veía como un ente estático, sino como uno que 
evoluciona y que junto con sus especies cambia de manera gradual y continua. Por otro 
lado también propuso que las especies semejantes estaban emparentadas y que 
podrían descender de un antepasado común. Estos cambios que se generan en los 
organismos están relacionados al menos a dos etapas que resultan en la evolución de 
los organismos. La primera es la producción de variabilidad, fundamentada en la 
recombinación genética y mutaciones de cada generación de organismos. La segunda 
etapa se relaciona con el proceso de selección natural, el cual se encuentra ligado a las 
presiones medioambientales y a la competencia entre los individuos de la propia o de 
diferentes especies (Mayr, 1978). 
A pesar de que en su momento histórico la propuesta no fue aceptada por un amplio 
campo del sector científico, hubo también mucha gente que se interesó por las 
propuestas dada la gran cantidad de pruebas que la respaldaban. Un sector en el cual 
esta nueva perspectiva tuvo un gran impacto fue en el de la Biología del 
comportamiento. Ya que si bien es cierto que los principales cambios se llevan a cabo a 
nivel genético, las estructuras conformadas y las conductas que de ellas se derivan son 
uno de los principales marcapasos del proceso evolutivo (Mayr, 1978). De esta forma, 
la conducta y los procesos a partir de los cuáles ésta se deriva son el resultado de los 
mismos procesos de variación y selección. Es decir, procesos como el aprendizaje,la 
memoria, el lenguaje o la atención serían el resultado de los cambios y presiones 
ambientales a los cuales se encuentra sujeto el organismo que los posee. 
A partir de afirmaciones como la anterior, las investigaciones sobre procesos 
psicológicos realizadas con modelos animales cobraron mayor relevancia. La etología 
adquirió un nuevo rumbo y la Psicología experimental encontró nuevos modelos para 
poder estudiar procesos que antes eran considerados propios de los humanos. Como 
pioneros en el estudio de la Psicología y la Fisiología comparada podemos encontrar a 
E. L. Thorndike y a I. P. Pavlov; quienes a finales del siglo XIX y comienzos del XX 
6 
 
plantearon por primera vez, la gran importancia del estudio de los procesos 
Psicológicos a partir de modelos animales. Impulsando así, aunque no de manera 
directa, el argumento de que una visión evolucionista es más que necesaria cuando se 
busca conocer mejor los procesos psicológicos. 
E.L. Thorndike pensaba que a pesar de la complejidad del comportamiento humano, 
éste podía ser explicado, en el fondo por algunos principios básicos. Particularmente 
consideraba que su “Ley del efecto” podía cumplir con esta función. (Donahoe, 1999). 
Thorndike se alió a una visión evolucionista para poder mostrar características del 
aprendizaje tanto humano como de otros animales. Por un lado decía que “el principal 
propósito del estudio de la mente animal es aprender el desarrollo de la vida mental en 
los niveles bajos del philum, de manera tal que se pueda rastrear el origen particular de 
las facultades humanas” (Thorndike, 1898). Por el otro, la manera por medio de la cual 
la selección se ejecuta en el proceso evolutivo le sirvió para explicar de manera más 
adecuada el proceso asociativo de los animales. Es decir, la Ley del efecto tienen como 
base las tres fases del proceso de selección propuestas por la visión evolutiva de 
Darwin: Variación, selección y retención, no obstante, estas fases están aplicadas a la 
propia conducta de los organismos. 
Para principios del siglo XX, Iván Petrovich Pavlov, desde una perspectiva meramente 
fisiológica (y quizá por ello más abierta) realizaba estudios sobre el funcionamiento de 
los hemisferios cerebrales. Sin embargo, y después de una serie de afortunados 
accidentes, estos estudios desembocaron en el descubrimiento de lo que ahora se 
conoce como “reflejos condicionados”. Al igual que Thorndike, Pavlov no cuestiona la 
utilidad de realizar estudios con animales, esto debido quizá, a su conocimiento sobre 
las similitudes que guardan algunos sistemas nerviosos de otros animales con el 
nuestro (Pavlov, 1978). 
Los afortunados accidentes mencionados con anterioridad fueron la clave de uno de los 
principales avances en el estudio de procesos como el aprendizaje, ya que al descubrir 
que sus perros eran capaces de discriminar el momento en que les iban a traer 
comida, también estaba confirmando la gran importancia que tiene la información del 
ambiente que rodea a los organismos en todo momento. A partir de la modificación de 
distintas variables en sus procedimientos experimentales como el tiempo, la intensidad 
7 
 
o el orden de los estímulos que se les presentaba a los sujetos, descubrió una serie de 
reglas que son de gran importancia para el proceso por medio del cual los organismos 
obtienen y retienen información del mundo que los rodea. Además encontró que esto 
ocurre incluso desde el momento de su nacimiento, ayudados por reflejos generados a 
partir de los procesos evolutivos de cada especie. 
Sus estudios sobre aprendizaje dejan en claro que el comportamiento de los 
organismos depende en gran medida del ambiente y que para controlar el 
comportamiento hay que controlar su medio (Caparrós, 1990). Es decir, remarca el 
impacto que tienen todas las variables ambientales en el comportamiento y la 
necesidad de generar procedimientos en los cuales se controlara la mayor cantidad de 
ellos, para poder descubrir así, las relaciones que hay entre las distintas variables, tanto 
del propio organismo, como del ambiente, ya que sólo de esta manera podemos llegar 
a conocer las características de los procesos psicológicos. 
También al principio del siglo XX, B. F. Skinner se encontraba trabajando en algunos 
de los problemas fundamentales de la Psicología y la posibilidad de que ésta fuera 
considerada una ciencia natural. Claramente inspirado en los trabajos de Pavlov y 
Thorndike (Hothersall, 2004), tampoco tenía problema en trabajar con animales no 
humanos para conocer las características de los procesos psicológicos, en su caso del 
aprendizaje. Aunque es reconocido que su trabajo de investigación es un parteaguas 
del estudio de la Psicología; hay dos avances que son de gran importancia para la 
comprensión del uso de los programas de reforzamiento aún en la actualidad. El 
primero tiene que ver con un nuevo planteamiento en los procedimientos para estudiar 
la conducta y los procesos que la generan. La creación de la caja de Skinner dejaba en 
claro la importancia que tiene el control de las distintas variables tanto ambientales 
como internas en la conducta. De esta manera, se podían estudiar respuestas 
claramente definidas y los cambios en su probabilidad de ocurrencia durante las 
sesiones como resultado de la manipulación de las variables que se tienen controladas 
(Skinner, 1966). Esto permitiría ver de manera más clara qué variables son las que 
parecen ocasionar determinadas conductas. (Reynolds y McLeod, 1970) 
El segundo avance, tiene que ver con las reglas necesarias para la entrega del 
reforzamiento en un procedimiento operante; es decir: Los programas de 
8 
 
reforzamiento. Skinner empezó a estudiar estos programas a partir de 1930 y cobraron 
mayor importancia en el año de 1938 con la publicación de “La conducta de los 
organismos” en el cual ya describían algunos de ellos. Para 1957, Ferster y Skinner, 
publican “Programas de Reforzamiento” que posteriormente sería reconocido como 
una “Enciclopedia de programas”. En él se probaron una infinidad de reglas y sus 
combinaciones; acompañadas, claro, de una serie de datos experimentales (Ferster y 
Skinner, 1957). Es a partir de esta publicación que los programas de reforzamiento 
comienzan a llamar la atención en un sector que iba más allá de los llamados 
“Conductistas radicales“. Esto debido a la estabilidad y predictibilidad en las 
respuestas ejecutadas por los organismos que eran sometidos a dichos programas. 
Uno de los sectores que se beneficiaron con el planteamiento descubierto por Skinner 
fue el de la investigación en la fisiología del cerebro. Para 1955; Dews aprovechaba ya 
la estabilidad en la conducta que generaban algunos programas de reforzamiento para 
ver los efectos de algunas drogas en procesos como el aprendizaje o la memoria 
(Dews, 1955). A partir de entonces el estudio de los programas de reforzamiento 
tomaba nuevos rumbos. Por un lado se seguía haciendo investigación acerca de la 
descripción de una gran cantidad de programas con la finalidad de tener un catalogo 
confiable de “líneas base” a partir de la prueba de nuevos programas, sus 
combinaciones y desde luego con diferentes especies relevantes para la investigación. 
Por el otro, algunos investigadores (por ejemplo: Herrnstein, 1970 y Shimp, 1984) 
veían a los programas de reforzamiento como variables independientes complejas que 
permiten describir las variables operativas que los programas generan y que modifican 
la conducta de una manera predecible (Zeiler, 1984). Es decir, se enfocaban en las 
variables implicadas en la generación de la conducta específica de cada uno de ellos, 
más que en la conducta misma. El principal fin de una visión de este tipo es la 
generación de modelos que a la vez se puedan conjuntar en reglas de alto nivel (como 
por ejemplo, la ley de igualación) que sirvan para explicarpatrones conductuales tanto 
a un nivel molar como a uno molecular. Y que además, sean compatibles con otras 
teorías biológicas comprobadas como la teoría evolutiva, de manera que se puedan 
rastrear los verdaderos orígenes de la conducta (Zeiler, 1984). 
9 
 
Para el presente trabajo, uno de los procesos que generan especial interés es la 
capacidad que tienen los organismos para estimar tiempo, así como la forma en la cual 
llegan a conformar algunas reglas para adaptarse a un ambiente cuyas presiones se 
basan en esta dimensión. Sin embargo, es importante mencionar antes algunos datos 
que nos indican que los organismos estamos hechos para estimar tiempo, así como lo 
que se entiende por estimación temporal desde un punto de vista psicológico-evolutivo. 
 
Estimación y percepción temporal 
 
La capacidad de detectar estímulos ya sean internos o externos, es de suma 
importancia para los organismos de cualquier clase cuando hablamos de los procesos 
de adaptación. Dependiendo de las presiones ambientales a las cuales cada uno de 
ellos es sometido, los organismos que son capaces de detectar y responder hacia los 
estímulos trascendentales que su ambiente les presenta, tienen una probabilidad mayor 
de supervivencia que aquellos que no son capaces de detectarlos o que los detectan de 
manera insuficientemente precisa. 
Es a partir de ello que en los organismos se moldearon sistemas de detección de 
estímulos, y se generaron procesos que les permiten responder de manera eficiente a 
ellos. Así, vemos especies que detectan de manera efectiva cambios de luz, 
modificaciones en la vibración o presión del aire, las texturas e incluso a cambios 
magnéticos o de radiación a escalas muy variadas. Por ejemplo, los ojos son 
estructuras que han evolucionado a lo largo de distintas especies animales para ser 
capaces de capturar la luz a diferentes escalas del espectro luminoso, y en él hay 
células especializadas en la detección de energía luminosa, información que al ser 
transmitida por los centros nerviosos, permite al organismo determinar si hay o no que 
responder de determinada manera. Hay sin embargo, una cualidad de los estímulos 
externos para la cual los organismos no gozan (aparentemente) de una clase específica 
de célula receptora: El tiempo. 
La capacidad de comportarse eficientemente en un ambiente cuyas presiones están 
ligadas al factor temporal; puede depender básicamente de dos tipos de mecanismos. 
El primero de ellos referente a lo que se ha llamado relojes biológicos; y en el cual 
10 
 
podemos ver la facultad para comportarse a partir de patrones que obedecen a ciclos, 
como por ejemplo: los circadianos, como el sueño o el hambre o ciclos circanuales 
como la hibernación dependiendo de la especie. Algunos otros animales pueden tener 
ciclos más largos y a partir de ello regular patrones como la reproducción. Aunque 
aparentemente este tipo de ciclos pudiera depender en su mayoría de claves 
ambientales para su mantenimiento. Algunos experimentos (Tychsen y Fletcher, 1971) 
con Dacus Tyroni o mosca de la fruta han demostrado que incluso cuando se eliminan 
las pistas externas indicativas de la hora del día los organismos siguen presentando 
patrones reproductivos de manera circadiana. Esto permite entre otras cosas, mejorar 
la precisión de las acciones sincronizadas ya que si dependieran en su totalidad de 
estímulos externos estarían más sujetos a cometer errores debido a la naturaleza de 
cambio constante de algunos ambientes. 
Patrones conductuales cíclicos como el de la alimentación pueden permitir que 
animales que utilizan recursos semejantes dentro de un ambiente específico, convivan 
dentro de un mismo ecosistema a partir de la distribución temporal de sus patrones en 
distintos momentos del día. De esta manera, si distintas especies son activas en 
distintos momentos del día- o del año- pueden ocupar la misma área geográfica incluso 
aunque exploten los mismos recursos (Maier, 2001). 
Otras ventajas de este tipo de relojes biológicos son que los animales pudieran tener 
ciclos que les permitan buscar alimento cuando la probabilidad de encontrarlo es 
mayor, cuando la probabilidad de que los encuentre un depredador es menor, que la 
reproducción o alimentación de las crías se lleve a cabo, de igual manera, en un 
momento del día más seguro. Y dependiendo del nicho que ocupa alguna especie los 
ciclos de sueño pueden ser más largos, como en el caso de los depredadores, o muy 
cortos si son presas. 
El otro mecanismo que permite a los organismos adaptarse a su ambiente es la 
capacidad que tienen para percibir duraciones de los eventos propios del organismo o 
del ambiente pues a partir de esto son capaces de detectar las relaciones existentes 
entre los eventos que ocurren en su ambiente, el momento en el que ocurren o la 
duración de éstos. Lo cual puede funcionar como modelador de la conducta del 
organismo. A diferencia de los relojes biológicos, este tipo de mecanismo se refiere 
11 
 
principalmente a la capacidad de aprender duraciones relativamente cortas de tiempo; 
ya sea en forma de intervalo entre eventos o de la propia duración del mismo. Es 
además un mecanismo que permite al organismo adaptarse a los cambios que puede 
haber en un medio específico durante su desarrollo. 
A pesar de que ésta es una capacidad que se expresa durante el desarrollo 
ontogenético del individuo, parece haber surgido a partir del desarrollo filogenético de 
las especies en la forma de un proceso común. Es por lo anterior que la capacidad de 
estimación temporal está presente en una gama muy amplia de organismos animales, y 
sin embargo también encontramos constancias en cuanto al límite y la capacidad de 
percibir y aprender estímulos temporales entre los individuos de una misma especie. 
Las ratas, por ejemplo, aunque son capaces de aprender intervalos temporales tan 
largos como 24 horas, la dificultad de aprenderlos se incrementa conforme el tiempo va 
aumentando (Bouton y Bolles, 1979). De igual forma hay una gran variedad de estudios 
que indican que las ratas son capaces de aprender relaciones temporales más 
pequeñas que 24 horas, y que pueden ser incluso de segundos. 
Con todo lo anterior se busca dejar en claro la importancia del estudio de la capacidad 
de los organismos para percibir duraciones y ajustar su conducta a demandas del 
medio que requieren atender a la dimensión temporal. 
 
El estudio del tiempo en Psicología 
 
Parece bastante obvio que la capacidad de percibir y ajustar nuestra conducta a esa 
variable que denominamos tiempo resulta crucial en el proceso adaptativo de los 
organismos; no obstante, para poder estudiar la manera en la cual lo percibimos hay 
una serie de situaciones que aún hoy no están muy claras. La noción de la existencia 
del tiempo lleva en la humanidad miles de años. Algunos filósofos occidentales se han 
enfrascado en la discusión de su existencia independientemente de si hay una mente 
que junte los hechos ocurridos antes o después. O bien si es una dimensión que existe 
independientemente de que haya quién lo perciba (Fraisse, 1975). Al final, discusiones 
como la anterior, aunque no logran definirlo de manera clara y tampoco describen todas 
sus cualidades (y quizá nunca lo hagan); sí han cambiado la manera como lo 
12 
 
percibimos. Por un lado, algunos filósofos como René Descartes nos enfrentaron con la 
posibilidad de comprender el tiempo no sólo por sus cualidades o su mera existencia, 
sino que también planteó la posibilidad de comprender la forma en que éste podía 
interactuar y modificar nuestras experiencias inmediatas (Fraisse, 1975). 
Discusiones como ésta promovían una visión empirista del tiempo, en la cual éste surge 
del pensamiento o de sensaciones a partir de eventos externos al organismo que lo 
percibe. No obstante lo anterior, en otros ámbitos como la Física, la existencia deltiempo es un hecho el cual, dado de que se podía medir (por la comparación de las 
diferentes duraciones con una estandarizada) y a partir de ello definirla, se asumía su 
existencia independientemente de si hay quien lo mida o no, es decir, el tiempo forma 
parte de la realidad en que habitamos. Este tipo de pensamiento se inclina más por 
una visión determinista de la existencia del tiempo. 
La Psicología, en un principio centró su interés en la manera en la cual los humanos 
somos capaces de percibir duraciones (visión empirista). Sin embargo, no fue sino 
hasta el desarrollo de la Psicofísica durante el siglo XIX que se pudieron estudiar de 
forma estructurada algunas de estas capacidades. La Psicofísica es la rama de la 
Psicología que estudia las relaciones entre las propiedades físicas de un estímulo y las 
propiedades mentales de la sensación evocada (Fechner, 1966). 
El principal problema de estudiar el tiempo a partir de métodos Psicofísicos radica en 
definirlo precisamente como un estímulo físico. Esto es debido a que el tiempo no es un 
estímulo el cual podamos percibir con algún receptor especializado (hasta donde 
sabemos), como se mencionó al principio de esta introducción, El tiempo únicamente se 
puede percibir a partir de relacionarlo con distintos eventos o estímulos físicos (tanto 
internos como externos), como por ejemplo algún sonido de determinada frecuencia, 
timbre o altura, o bien de las características de su presentación, si es periódico o 
constante, etc. Además de ello, la dimensión temporal puede ser estudiada al menos de 
tres maneras distintas: a) De manera ordinal, o sea, el orden en que los eventos 
ocurren, b) por la duración de los tiempos entre los eventos, o c) por la duración propia 
de los eventos (McAuley, 1995). Es decir, al hacer psicofísica relacionada con la 
percepción y estimación temporal necesariamente tenemos que i) asumir que 
podemos medir el tiempo como si lo percibiéramos al igual que otros estímulos físicos y 
13 
 
ii) definir claramente cuál es la característica temporal que pretendemos medir a partir 
de los procedimientos empleados. Algunos incluso han propuesto realizar una 
taxonomía de “las experiencias temporales elementales” con el fin de evitar la confusión 
de si el tiempo debe o no ser considerado algo que, como una manzana, puede ser 
percibido. 
Para el estudio del tiempo, la Psicofísica ha propuesto distintos procedimientos por 
medio de los cuales se pueden estudiar la manera en que los organismos podemos 
estimar características temporales. Algunos de ellos son: i) Los métodos de estimación 
verbal; en los cuales se le presenta al sujeto un estímulo de determinada duración y 
luego se le pide que dé a partir de unidades estándar o establecidas la duración del 
estímulo presentado. ii) Los métodos de producción; en los cuales se le da la 
instrucción al sujeto de que genera una duración de determinado tamaño. iii) El método 
de comparación en el cual a partir de una duración presentada el sujeto debe 
determinar si es igual o diferente que un estímulo presentado con anterioridad, y iv) 
Los procedimientos de reproducción en los que al sujeto se le presenta un estímulo de 
duración determinada y posteriormente debe de generar un estímulo de igual duración 
(Zamora, 2007). 
 Cabe destacar que en un principio la investigación sobre estimación temporal estaba 
ligada en su totalidad a participantes humanos. Si bien es cierto que para 1927, Pavlov 
ya había generado una gran cantidad de evidencia sobre el control que la dimensión 
temporal podía tener sobre el proceso de aprendizaje de respuestas (Lejune et al., 
2006), no fue sino hasta la introducción de los procedimientos operantes de Skinner 
que se amplió la posibilidad del estudio de procesos de estimación temporal en 
animales. Esto debido a que muchos de los programas propuestos por Skinner 
parecían tener claramente una dimensión temporal que el organismo debía discriminar 
para poder adaptarse a él, además de que su caja tenía los niveles de control 
necesarios para identificar los efectos de esta variable en la conducta. A partir de los 
años 50's se comenzaron a utilizar dichos procedimientos en la llamada psicofísica 
animal. 
Algunos de los procedimientos más empleados en el estudio del tiempo con animales 
son los de bisección temporal en donde a un organismo se le entrena a discriminar 
14 
 
duraciones cortas y largas a partir de la presión de una palanca para cada una de ellas; 
posteriormente se le presentan estímulos de diferentes tamaños con el fin de 
determinar el llamado punto de bisección que es la duración a la cual el sujeto responde 
el 50% de las veces como si fuera un estímulo corto y el otro 50% como si fuera un 
estímulo largo. 
Otro procedimiento es el llamado Procedimiento de Pico en el cual el sujeto es 
entrenado en un programa de intervalo fijo (IF) de determinado valor con ensayos 
discretos. Posteriormente se ponen a prueba con ensayos más largos y en los cuales el 
reforzador no se entregará. La estimación de los sujetos se mide a partir de los cambios 
en las tasas de respuestas en los diferentes momentos del ensayo, también se puede 
observar el momento en el cual los sujetos estiman la aparición del reforzador a partir 
del momento en el que se logra el pico más alto de respuestas del sujeto. 
Algunos otros programas como los de tiempo, intervalos fijos o variables y los de 
reforzamiento diferencial de tiempos entre respuestas o RDTER's, nos permiten 
observar la manera en la cual los organismos se adaptan a condiciones en las que el 
tiempo es la variable relacionada directamente con el reforzamiento. En la presente 
Tesis se ha optado por el uso de un programa de RDTER's. En la siguiente sección se 
mostrarán algunos detalles importantes relacionados con esta clase de procedimientos. 
 
Reforzamiento Diferencial de Tiempos Entre Respuestas (RDTER’s) 
 
El reforzamiento se refiere al incremento de una respuesta en función de un evento-
estímulo que sigue a las respuestas. De esta manera, a un estímulo que tiene estos 
efectos se le llama estímulo reforzante o reforzador. Un programa de reforzamiento se 
refiere a las reglas usadas para presentar ese estímulo reforzante (Zeiler, 1977). Es 
importante señalar que estas relaciones de control se encuentran funcionando todo el 
tiempo sobre los organismos. Las presiones ambientales y la manera en que se ajustan 
los organismos para sobrevivir tiene como fundamento la discriminación de 
contingencias a partir de elementos reforzantes o de extinción. 
En los programas de reforzamiento diferencial, el reforzador es entregado cuando la 
respuesta o un grupo de respuestas muestran una característica determinada (por 
15 
 
ejemplo, fuerza, duración o topografía). En el presente trabajo experimental, hacemos 
uso de una clase de estos programas: el de Reforzamiento Diferencial de Tiempos 
Entre Respuestas (RDTER’s), también conocido como -R > t. En esta clase de 
programas, el reforzador únicamente es entregado cuando una respuesta determinada 
R se genera después de que ha pasado un lapso t de tiempo desde la respuesta 
anterior (Zeiler, 1977) 
Si bien es cierto que los tiempos entre respuestas (TER's) son el recíproco de la tasa 
de respuestas, el interés de esta tesis radicó esencialmente en el estudio de los TER's 
que los sujetos “emitían” incluso si muchos de ellos no era reforzados; es por ello que 
se prefirió no usar los términos “Tasa baja” o “Tasa Alta” de respuestas para referirnos a 
los programas y las ejecuciones de los participantes. Aunque existen discrepancias 
sobre cuáles son los estímulos ambientales que toman el control de la conducta en 
programas en los que la regla se relaciona con una dimensión temporal (Reynolds y 
McLeod, 1970); también hay evidencia que el desempeño en programas de RDTER’s 
depende tanto de la capacidad del organismopara estimar tiempo, como de procesos 
de inhibición relacionados con la impulsividad (Anger, 1956; Gordon, 1979; Church, 
2002; Lejeune, Richelle, y Wearden, 2006). 
En algunos de estos estudios los resultados se analizan mediante histogramas de 
frecuencias relativas o de distribución de frecuencias (Anger, 1956). A partir de estos 
análisis se han podido describir algunas características del desempeño de organismos 
como ratas y palomas cuando se encuentran bajo programas de RDTER’s. Un 
resultado consistente en organismos como los mencionados es que, en estado estable, 
los TER’s emitidos tienen un valor promedio igual o menor al TER reforzado y que el 
promedio tiende a alejarse de éste conforme se incrementa el valor del TER 
programado (Richards, Sabol y Seiden, 1993; Staddon, 1965). Otro fenómeno 
observado es que los organismos generan distribuciones de frecuencias bimodales 
cuando se encuentran bajo el control de un programa de este tipo. Una de esas modas 
se relaciona con la gran cantidad de TER’s cortos, llamados bursts, que emiten (y cuyo 
valor suele ser muy variado dependiendo de la preparación, el organismo o el TER 
programado) y una segunda moda se manifiesta en valores de TER’s cercanos al 
reforzado (Church, 2002). El estado estable que se alcanza con este tipo de programas 
16 
 
permite que se puedan realizar estudios con distintas sustancias como la imipramina, el 
metilfenidato o el etanol (Denoble y Begleiter, 1978; Maguire y Seiden, 1980; Orduña, 
Valencia-Torres y Bouzas, 2009), con el fin de determinar tanto características 
fisiológicas de la estimación temporal u otros procesos. 
 
RDTER’s y humanos 
 
El estudio de procedimientos operantes con humanos tiene algunas diferencias 
importantes con respecto a los estudios realizados con animales. Si bien es cierto que 
la mayoría de los procesos estudiados son parte del continuo evolutivo y por tanto están 
presentes en diferentes especies, también se ha encontrado que cuando se 
experimenta con participantes humanos hay algunas características importantes de la 
ejecución en procedimientos operantes. Shull y Lawrence (1998) destacan al menos 
tres características que resultan en la sensibilidad de los participantes humanos a las 
contingencias impuestas por el ambiente: a) Las consecuencias de las conductas 
pueden resultar en el debilitamiento o reforzamiento de las conductas a las que siguen, 
es decir, hay un verdadero efecto de reforzamiento o de castigo; b) las consecuencias 
de la conducta puede actuar por sí mismas como pistas o como estímulos 
discriminativos y c) la sensibilidad a las contingencias puede ser mediada por reglas 
verbales, instrucciones, estrategias, hipótesis, etc. Esta última característica parece ser 
la más distintiva de los humanos (quizá porque es relativamente más sencilla de 
detectar que con otras especies). 
Cuando una contingencia se basa en relaciones de tipo temporal entre sus elementos, 
es difícil determinar si la conducta está siendo mediada por la variable temporal de la 
relación, o por alguna otra sobre la cual el organismo ha posado su atención. Si bien es 
una pregunta difícil de responder con cualquier especie, la capacidad que los humanos 
tienen para comunicar las reglas que dirigen su conducta, generan nuevas líneas de 
investigación y abren muchas más preguntas de las que se responden. 
Algunos estudios han encontrado que la capacidad que los humanos tienen para 
responder de manera eficiente a un programa de reforzamiento diferencial de tasas 
bajas (DRL) depende de la edad de los participantes y de su capacidad para 
17 
 
representar contingencias de reforzamiento, pues se ha visto que participantes de 7 
años son más eficientes en un programa DRL que sus pares de 4 años y medio 
(Pouthas y Jacquet, 1987). También, Getty (1977) reportó que cuando una serie de 
participantes eran sometidos a tareas en las que la variable temporal es la 
determinante, el conteo era una de las estrategias más recurridas, una hipótesis 
propuesta por el autor sugiere que pudiera tratarse de una estrategia que disminuye la 
variabilidad en la estimación de tiempos más largos. 
Por otro lado, se ha encontrado que las conductas sobre las cuales los participantes 
parecen posar su atención no son únicamente de tipo verbal, En 1961, Bruner y 
Revusky pusieron a cuatro participantes ante un programa DRL 8.2-s con disposición 
limitada a 10.25-s. Los participantes debían de encontrar la contingencia de entrega de 
los reforzadores, que en este caso eran puntos en un contador, sin embargo se 
encontraban frente a 4 palancas de las cuales únicamente una era funcional. Al cabo de 
tres sesiones de 2 horas, en las cuales únicamente la segunda fue reforzada, se 
encontró que los participantes respondían de manera ordenada sobre las cuatro 
palancas y cuando fueron entrevistados, estaban convencidos de que la secuencia de 
respuesta sobre las palancas era la responsable de la entrega de los reforzadores. 
Weisberg y Tragakis (1967) encontraron que era posible mantener frecuencias de 
respuestas bajas y estables en niños de 15 a 41 meses que se encontraban en un 
programa DRL-10 s. Un último ejemplo es el de Santoyo y Espinosa (1978); ellos 
estudiaron el comportamiento en niños ante programas múltiples y concurrentes RF-
RDB. Entre otros datos interesantes, ellos encontraron que dentro de las conductas 
registradas más frecuentemente cuando los niños se encontraban bajo el programa de 
RDB estaban: chupar, contar, apilar y manipular las fichas que se les daban como 
reforzadores, abrir y cerrar la puerta del cuarto experimental. Es decir, observaron que 
los niños probablemente utilizaban esas conductas para dejar pasar el tiempo 
programado y así obtener los reforzadores. 
Además de los estudios que abordan algunas características de los procesos 
implicados en la adaptación a este tipo de contingencias, como los mencionados 
anteriormente, el procedimiento ha sido usado ampliamente en casos de modificación 
conductual (por ejemplo: Burns, 1974). Otros, tienen como propósito comparar la 
18 
 
capacidad de pacientes con algún tipo de padecimiento psicológico (como TDAH, falta 
de autocontrol, impulsividad e incluso se han observado algunas características del 
desempeño en personas que han cometido actos delictivos) para determinar si son 
capaces o no de realizar esta tarea (Gordon, 1979). Lo anterior, debido a que algunos 
datos han mostrado que la adaptación a este tipo de contingencias implica procesos 
tanto de estimación temporal como de impulsividad y atención. El resultado más 
reportado ha sido que los pacientes diagnosticados con alguno de estos padecimientos 
tienden a realizar la tarea obteniendo menor número de reforzadores que sus pares sin 
la enfermedad o alguno de los rasgos mencionados. 
Un ejemplo de lo anterior es el trabajo de Michael Gordon (1970) quien investigó el 
desempeño de 20 niños entre los 6 y 8 años que habían sido diagnosticados con 
déficit de atención e hiperactividad a partir de la misma sección del Test de 
Clasificación conductual de Conners (Conners, 1969). El grupo fue comparado con el 
desempeño de un grupo control que no tenía el padecimiento. Ambos grupos fueron 
sometidos a un programa de reforzamiento diferencial de tasas bajas (RDTB) de 6 
segundos y se les reforzaba con chocolates M&M’s. Los resultados indicaron que los 
niños con el padecimiento tuvieron un desempeño estadísticamente más pobre que los 
niños “normales” y que el número de conductas colaterales es mayor para los niños 
hiperactivos. A partir de lo anterior el autor sugiere que los procedimientos de RDTB 
son unos buenos estimadores para la detección de este padecimiento en niños. Esto ha 
trascendido de tal manera que actualmente es parte de una serie de tests empleados 
para detectar esta enfermedad (Gordon Systems Inc., 2009). 
Otro ejemplo es elde van Den Broek et al. (1992) quienes realizaron un experimento en 
el que comparaban sujetos impulsivos y no impulsivos a partir de un programa de 
RDTER 10 s (o -R >10-s). La primera fase del experimento constaba de la realización 
de la tarea sin la información de la contingencia que debían encontrar los participantes. 
En posteriores fases se les indicaba el valor de tiempo que tenían que esperar para 
obtener el reforzador y en otra fase se utilizaron luces para indicar la disponibilidad del 
reforzador. Los resultados mostraron que en la primera fase los sujetos impulsivos 
fueron menos eficientes que el grupo control, no obstante en las posteriores fases, el 
desempeño fue semejante para ambos grupos (van den Broek. Bradshaw y Szabadi, 
19 
 
1992).Incluso se ha reportado que alumnos universitarios son capaces de realizar una 
tarea de RDTB con valores que alcanzan los 18 segundos (Randolph, 1964). 
Otros estudios se enfocan principalmente en el cambio conductual que un 
procedimiento así puede generar. Por ejemplo Singh, Dawson y Manning (1981) 
probaron la efectividad de un programa de RDTB con el fin de disminuir la tasa de 
conductas estereotípicas en personas con retraso mental profundo y aumentar la tasa 
de conductas socialmente aceptadas en distintas situaciones. Los TER's reforzados 
para las conductas estereotípicas fue incrementado en bloques de 5 días de 12 hasta 
180 segundos. Los resultados indicaron que las conductas estereotípicas comunes en 
personas con retraso mental severo podían ser controladas a partir de un tratamiento 
bajo un programa de RDTB y que la disminución de las conductas no deseadas tenía 
además como resultado colateral el incremento de conductas sociales aceptables. No 
obstante proponen que se debe realizar más investigación, sobre todo en ambientes 
más naturales con el fin de determinar la validez de su trabajo (Singh, Dawson y 
Manning,1981). 
Lennox, Miltenberger y Donnelly (1987) trataron la conducta de “comer muy rápido” en 
niños con retraso mental severo, con un procedimiento de RDTB. Ellos usaron como 
conducta a reforzar, el que la mano del paciente tocara el utensilio para comer. A partir 
de ello implementaron un TER de 15 segundos para reforzar. Los resultados mostraron 
una gran efectividad en el tratamiento del problema a partir de un procedimiento de este 
tipo, obteniendo TER's que iban de los 15 a los 21 segundos después de la aplicación 
del programa 
A pesar de la gran cantidad de estudios que utilizan estos programas, poco se ha hecho 
por analizar el comportamiento de los participantes cuando un estímulo reforzante 
depende de una contingencia de este tipo. También, se han hecho pocas 
investigaciones que busquen conocer si los participantes son capaces de detectar la 
contingencia con la facilidad que parece suponer la tarea. 
 
 
 
20 
 
Análisis de los TER's en programas de reforzamiento diferencial 
 
Como se mencionó anteriormente, en algunas investigaciones se han empleado 
programas de RDTB con el fin de modificar conducta en grupos poblacionales con 
características muy específicas. En todos ellos el principal interés fue la disminución de 
una respuesta que anteriormente se había definido como indeseable. Es por ello que en 
este tipo de estudios, el principal interés al analizar los resultados se centra en la tasa a 
la cuál responden los participantes, y el tipo de diseño utilizado con tal fin, además de 
los reforzadores empleados. En todos ellos, se muestran indicios de la capacidad que 
tiene el programa para modificar conductas poco deseadas en pacientes con 
determinados problemas, siempre y cuando sea aplicado correctamente. 
En otro tipo de estudios en los que el interés se centra en las características de la 
ejecución de los participantes, se han empleado histogramas de frecuencias relativas 
(Anger, 1956) para mostrar el desempeño general de los organismos probados; en 
ellos, los TER's se agrupan en intervalos de clase (o bins) de determinado tamaño con 
el fin de mostrar con qué frecuencia o probabilidad ocurren a lo largo de una sesión o 
al final de un experimento. Este tipo de análisis tiene muchas ventajas, entre ellas, ha 
mostrado que la probabilidad de ocurrencia de TER's cortos es muy grande si el 
organismo responde de manera aleatoria. Otra ventaja que tiene este tipo de análisis es 
su capacidad de mostrar si es que los participantes han caído bajo el control del 
programa en el cual son probados. Es decir, se ha visto que la distribución de TER's se 
ve afectada por la magnitud del TER que es reforzado (Anger, 1956). A pesar de estas 
ventajas, la comparación del comportamiento temporal de los organismos se debía 
hacer a partir de los histogramas, por lo que la precisión de los resultados se veía 
afectada. 
Richards, y Seiden (1991) propusieron un procedimiento que permitía hacer un análisis 
cuantitativo de las características de los TER's emitidos por los organismos cuando se 
encuentran bajo un programa de RDTER's. Éste se basa en la premisa de que si un 
organismo emite respuestas aleatoriamente en tiempo y a una tasa constante, la 
distribución resultante puede ser descrita a través de una función exponencial negativa. 
Ellos propusieron también comparar las distribuciones de TER's obtenidas de cada 
21 
 
sujeto, con su distribución exponencial negativa correspondiente (o CNE por sus siglas 
en inglés), la cual resulta de predecir la distribución de TER's que se obtendría si el 
sujeto, en su caso la rata, emite el mismo número de respuestas de manera aleatoria, y 
en el mismo intervalo de tiempo. Esta distribución CNE tiene la misma media que la 
distribución de TER's generada por cada sujeto. Esto permite que las desviaciones de 
la CNE sean equivalentes para distribuciones con diferentes promedios de TER. 
En otro trabajo Richards, Sabol y Seiden (1993) propusieron realizar estas mismas 
comparaciones a partir de un procedimiento al que llamaron Análisis de Desviación de 
Pico (o Peak Deviation Analysis). Además de obtener la comparación antes 
mencionada entre la distribución de TER's emitida por el sujeto y la CNE predicha para 
cada uno de ellos, también se obtienen tres medidas que permiten cuantificar de 
manera más precisa ambas distribuciones. 
En este análisis la distribución se ha dividido en el componente burst y el componente 
pausa. En el primero, se clasifican aquellas presiones con TER’s cortos y en el 
segundo se clasifican aquellos que son más largos. 
Dos de las medidas de este análisis describen el componente Pausa: El Área del pico 
(PkA) y la Localización del Pico (PkL). Una tercera medida describe el componente 
burst: La razón Burst (BR) (ver Figura 1.1) 
 
 
 
 
 
 
 
 
 
 
 
 
Componente pausa 
 
Componente burst 
Figura 1.1.- Histograma de distribución de frecuencias de un organismo bajo un programa de RDTER’s, la línea 
continua representa la CNE predicha si el participante hubiera realizado la misma cantidad de respuestas en el 
mismo tiempo y de manera aleatoria. La barra más oscura sobre el 0 representa la categoría Burst mientras que las 
barras más claras pertenecen a la categoría pausa. 
22 
 
La Razón Burst (BR) es el número de TER's que caen dentro de la categoría burst 
divididos entre el número de TER's que la función CNE predice que ocurrirán en esa 
categoría. Este número se obtiene a partir de la extrapolación de la función CNE 
predicha para el componente Pausa, al componente burst. El hecho de que ésta 
medida se obtenga a partir de esta función toma en cuenta que mientras el promedio 
del total de los TER's disminuye, la probabilidad de que un TER caiga en la categoría 
Burst se incrementa exponencialmente. El área de pico (PkA) es el área resultante de la 
sustracción de los valores generados por la CNE de los valores obtenidos en el 
componente pausa del individuo. El área resultante es la que sedenomina Área del 
pico. La localización del pico (PkL) es la duración del TER que se encuentra en la 
mediana del área del pico (Figura 1.2). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 1.2.- Histograma obtenido a partir de las diferencias entre el las frecuencias 
obtenidas por un organismo y su CNE predicha, la línea punteada representa el valor 
reforzado por el programa. 
23 
 
Si bien un histograma de distribución de frecuencias es una buena forma de ilustrar los 
componentes obtenidos, éste análisis se realiza a partir de los valores TER generados, 
sin la necesidad de clasificarlos en intervalos de clase, pues se obtienen a partir de la 
generación de la curva de supervivencia tanto de los valores generados por el sujeto, 
como de la función CNE (Figura 1.3) 
Para realizar el cálculo del PkA y de PkL en primer lugar se necesita que la distribución 
TER del componente pausa sea convertido a una curva de supervivencia, Para ello los 
TER's son ordenados ascendentemente, posteriormente, a cada uno (t) se le asigna 
un valor en el eje Y a partir del cálculo de la fracción de todos los TER's obtenidos y que 
son mayores a t , es decir, este eje indica la frecuencia relativa de los TER's con 
duraciones mayores o iguales a la duración del TER indicado en el eje de las X. Es 
importante señalar que el valor absoluto de la pendiente en cualquier punto a lo largo 
de las curvas de supervivencia indica la frecuencia relativa de las duraciones TER. De 
manera tal que una región plana indicaría una baja probabilidad de la ocurrencia de un 
TER, mientras que una pendiente más grande indica una probabilidad relativamente 
más alta de ocurrencia (Ver Figura 1.3). Este procedimiento se aplica tanto para la 
curva CNE como para la distribución TER generada por el sujeto, de manera tal que se 
puedan comparar.. A partir de ello, se localiza el segmento donde la pendiente de la 
curva obtenida se precipita más que la pendiente de la CNE, o mejor dicho, en donde 
los valores TER ocurren con mayor frecuencia que lo predicho por esta función. Esta 
parte se delimita a partir de la máxima desviación positiva entre la curva de 
supervivencia obtenida y la CNE (t pos) y la máxima desviación negativa entre las 
mismas (t neg). Este segmento representa entonces la proporción de duraciones TER 
que ocurren dentro de esos límites y que no son predichos por la CNE. El máximo valor 
posible es 1 lo cual ocurriría si todas las duraciones tuvieran el mismo valor. El mínimo 
valor es 0, lo que indicaría que la distribución TER es idéntica a la distribución CNE. De 
manera tal que un valor pequeño de PkA se relaciona con un desempeño más bien 
aleatorio. Por el otro lado, la PkL es la duración TER localizada entre el área delimitada 
por tpos y tneg que más se aproxima a ! de PkA (Ver figura 1.3). 
 
 
24 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 1.3.- Curva de supervivencia de un organismo bajo un programa de RDTER's, la línea 
punteada sobre el 500 representa el valor TER reforzado en centésimas de segundos. 
25 
 
Planteamiento del problema 
 
La mayoría de los experimentos realizados con el fin de describir el comportamiento de 
los organismos cuando se encuentran bajo el control de un programa en el que la 
variable que determina la entrega del reforzador es el tiempo, se han hecho con 
animales no humanos. Algunos de estos experimentos comúnmente describen la 
manera de responder de organismos como palomas o ratas con tal precisión, que es 
posible determinar los efectos de distintas variables (como fármacos, o modificaciones 
genéticas) a partir de las variaciones observadas en el desempeño de grupos control. 
En humanos, la forma en que responden a esta clase de programas se ha relacionado 
con fenómenos como el de autocontrol, estimación de tiempo, déficit de atención e 
incluso hiperactividad. En otros casos la investigación realizada se limita a la utilización 
de esta clase de programas con fines de modificación conductual en sectores 
poblacionales específicos como niños con retraso mental profundo o hiperactividad; por 
ejemplo: modificar la conducta de comer muy rápido o conductas repetitivas. No 
obstante lo anterior, es poca la investigación que se ha realizado con el fin de mostrar 
las características del desempeño de participantes humanos cuando se encuentran 
bajo un programa de RDTER’s. 
El presente trabajo de tesis tuvo como objetivo analizar el desempeño de un conjunto 
de participantes cuando fueron sometidos a un procedimiento de RDTER’s en el cual el 
valor reforzado del programa fue cambiado de sesión a sesión. También se buscó 
describir la manera en la cual ellos percibieron la contingencia que permitió la entrega 
de los reforzadores a pesar de que no fueron informados de la misma antes del 
experimento. 
 
 
 
 
 
 
 
26 
 
Método 
Participantes 
 
En el experimento participaron 70 estudiantes universitarios con edades entre los 18 y 
los 22 años. Todos inscritos a la Facultad de Psicología de la UNAM, en las materias de 
Introducción a la Psicología Científica o en Aprendizaje y Conducta Adaptativa I. A 
todos se les dieron puntos extra en sus clases por la participación en el experimento, 
además de la entrega de dulces al terminar el mismo. 
Escenario 
 
Todas las sesiones se llevaron a cabo en un cuarto de 2.45 m. de largo por 2.25 m. de 
ancho y 2.1 m. de altura, de material aislante situado dentro del laboratorio. 
Grupos 
 
A todos los participantes se les sometió a un programa de RDTER’s el cual fue 
presentado mediante un software diseñado especialmente para este experimento. 
Programa computacional 
 
El programa fue diseñado a partir de Microsoft Visual Basic 6 y consta de 3 pantallas 
(Figura 2.1). 
Primera pantalla.- En esta se capturó información del participante y los valores de las 
variables que operaron al ejecutar el programa. Entre ellos estuvo el tiempo máximo de 
la sesión, el valor del TER reforzado, el número de reforzadores máximos a obtener 
durante la sesión; así como la fecha. En la parte de abajo había un botón que daba 
acceso a la segunda pantalla. 
Segunda pantalla.- Contenía las instrucciones a seguir por el participante durante la 
sesión. Estas fueron: 
“Instrucciones. A continuación se presentará una pantalla con un botón al centro de la 
misma. Este botón lo puedes accionar presionando la barra espaciadora del teclado. 
27 
 
Haciendo esto, podrás obtener dulces que se te presentarán en forma de imágenes. Tu 
tarea es descubrir la relación entre oprimir la barra y obtener los caramelos. Si estás 
listo(a) presiona el botón de continuar que está abajo.” 
 
En la parte inferior hay un botón con la palabra “Continuar” que permitía ir a la tercera 
pantalla. 
Tercera pantalla: Era una pantalla de “ejecución” en la cual aparece un “Botón” de color 
azul en la parte superior central sobre un fondo negro. Éste se accionaba cuando la 
barra espaciadora del teclado era presionada. Cuando esto ocurría, el programa 
comparaba si es que el tiempo transcurrido entre la última presión del botón y la nueva 
era mayor, igual o menor que el valor TER programado en la primera pantalla. Cuando 
era mayor o igual; en la parte inferior aparecía la Figura de un dulce que indicaba que lo 
había hecho de manera correcta. De no ser éste el caso, el reloj contador del programa 
se ponía en ceros y no se entregaba el reforzador. 
Cuando se obtenía el máximo de reforzadores o había transcurrido el tiempo máximo 
de la sesión el botón desaparecía de la pantalla y en su lugar se hacía visible un 
cuadro de texto que le indicaba al participante que la sesión había terminado y que 
debe avisar a los experimentadores. 
Además de registrar los datos generales del participante y las variables de cada una de 
las sesiones, el programa registrabaen tiempo real las presiones de la barra 
espaciadora, los TER’s, la entrega o no entrega de reforzador para cada par de 
respuestas, el total de reforzadores obtenidos en cada sesión y el tiempo de la misma. 
La sesión concluía con la obtención de 30 reforzadores o al haber transcurrido 15 
minutos. 
 
 
 
 
 
 
 
28 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Procedimiento 
 
Las sesiones se llevaron a cabo de manera individual. Antes de invitar a pasar al 
participante a la habitación destinada para el experimento, se le preguntaron sus datos 
y se llenó la primera pantalla del programa. Posteriormente se invitó a los participantes 
a pasar al cuarto y se les sentó frente a la computadora. En el monitor se mostró la 
segunda pantalla con las instrucciones. Se pidió a los participantes que las leyeran y 
que si no entendían alguna parte podían preguntar al experimentador. Cuando 
terminaban la lectura, el experimentador señaló que el fin del programa era 
simplemente encontrar la relación que existía entre la presión de la barra espaciadora y 
la aparición de las imágenes de dulces. Se indicó a los participantes que no debían 
presionar nada más que la barra espaciadora en el teclado. Al momento de pasar a la 
pantalla de Ejecución, fueron dejados solos con la indicación de avisar en el momento 
en que la prueba hubiera concluido. Posterior a cada una de las sesiones se les 
presentaba un cuestionario y se les indicaba que lo debían llenar de la manera más 
detallada posible y de acuerdo a lo que ellos creyeran con respecto al experimento. El 
fin principal de este cuestionario era conocer si los participantes habían detectado la 
Figura 2.1.- Las diferentes pantallas que conforman el programa computacional 
29 
 
Tabla 1.- Diseño experimental 
contingencia de la entrega del reforzador, y que explicaran cuál era. Este cuestionario 
variaba dependiendo de la sesión que hubieran ejecutado. 
Diseño 
 
Tres de los grupos fueron sometidos a 3 sesiones experimentales mientras que cuatro 
grupos fueron sometidos únicamente a 2 sesiones. En cada una de éstas el valor del 
TER reforzado era cambiado de manera tal que los grupos que presentaban tres 
sesiones comenzaban con un valor, para la segunda sesión éste se veía incrementado 
y para la tercera sesión éste valor volvía a ser igual al de la primera sesión. Los grupos 
que presentaron dos sesiones iniciaban con un valor reforzado y para la segunda éste 
podía ser mayor o menor dependiendo del grupo al que perteneciera. A continuación se 
muestra una tabla que indica los diferentes grupos, así como el valor reforzado en cada 
una de las sesiones (Tabla 1). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Tabla 1.- Diseño experimental 
30 
 
Resultados 
 
Se analizaron los datos de aquellos participantes que fueron capaces de obtener los 30 
reforzadores en todas sus sesiones. De los 70 participantes que iniciaron el 
experimento 13 de ellos no cumplieron con este criterio, por lo que el grupo final 
analizado fue de 57 personas. Es importante mencionar que los grupos en que se 
analizaron menos participantes fueron el grupo 6-9-6, que se quedo únicamente con 5 
de los 10 participantes y el grupo 9-3 que se quedó con 6 de los 10 iniciales. 
Reforzador por reforzador 
 
En cada sesión, fue registrada en el ordenador cada una de las respuestas que emitían 
los participantes, así como el momento en que ocurrían, lo que permitió registrar los 
TER’s emitidos y si ganaban o no el reforzador en cada ensayo. A partir de ello se 
midieron tres variables que permitieron observar el desempeño de los participantes 
durante cada una de sus sesiones: 
El Total de Ensayos por reforzador: Se registró el número de ensayos que el 
participante emitía para obtener cada uno de los 30 reforzadores, siendo un ensayo las 
dos respuestas que se necesitan para generar un TER. 
Tiempo por reforzador: Se registró el tiempo que tardaban los participantes para 
obtener cada uno de los reforzadores. Este incluye el TER reforzado y todos los que no 
lo fueron. 
El TER por reforzador: Que es el TER que le permitió a los participantes obtener cada 
uno de los reforzadores. 
Este tipo de análisis permitió observar el desempeño durante la sesión de cada uno de 
los participantes, así como la dinámica de las respuestas dentro de la misma. A 
continuación se mostrarán las gráficas que representan el desempeño de tres 
participantes del experimento analizando los tres aspectos mencionados anteriormente. 
En ellas se ve reflejado un comportamiento típico de los participantes que han logrado 
obtener el total de los reforzadores. En todas las gráficas, en el eje de las X se grafican 
cada uno de los reforzadores entregados durante una sesión. 
31 
 
Las gráficas de “Ensayos por reforzador” representan el número de ensayos 
necesarios para que los participantes obtuvieran los reforzadores, lo que se grafica en 
el eje Y. Las gráficas de “Tiempo por Reforzador” representan el total del tiempo que el 
participante necesitó para obtener cada uno de los reforzadores. Por último, las 
graficas de “TER por reforzador” representan el tamaño del TER que permitió la entrega 
del reforzador en cada uno de los casos. 
Los resultados mostraron una gran semejanza en el comportamiento de los 
participantes dependiendo de la sesión en que se encontraban. Es por ello que a 
continuación se mostrarán ejemplos de los resultados obtenidos por tres participantes 
(uno de cada sesión), así como el desempeño del grupo al que pertenecieron esos 
participantes. Posteriormente se mencionan aquellas características del desempeño 
compartidas por los distintos grupos en cada una de las sesiones. 
En cuanto a la primera sesión experimental, se muestra, el desempeño de un 
participante del grupo 9-6 (Figura 3.1, columna izquierda). En esta sesión, el valor del 
TER reforzado fue de 9 segundos, por lo que los TER’s reforzados debían tener al 
menos esa duración. Como se observa en la gráfica de “Ensayos por reforzador 
(individual)”, es claro que antes de la obtención del primer reforzador el participante 
desconoce la regla debido a los criterios impuestos por situación experimental; es por 
ello que ha alcanzado un total de 118 respuestas (el cual no se muestra en la gráfica 
para mantener la escala) para obtener el primer reforzador. En su gráfica de “Tiempo 
por reforzador (Individual)”, podemos observar que aunque un gran número de 
respuestas fueron generadas durante ese ensayo, han sido TER’s muy cortos debido a 
que el tiempo total que el participante ocupó para llevarse el reforzador fue de 57.3 
segundos; también, en su gráfica de “TER por reforzador (Individual)” se puede 
observar que el TER que lo llevó a ganarse el primero de los reforzadores fue uno de 
19.83 segundos. Todos estos datos en conjunto nos indican que el participante realizó 
una serie de TER’s menores a 9 segundos, que era el intervalo reforzado, durante al 
menos 36 segundos (debido a la duración del último TER) y que luego dejó de 
presionar la barra espaciadora de la computadora durante más de 19 segundos, lo que 
lo llevó a ganarse el primer reforzador. Posteriormente, existe una disminución de las 
tres variables aquí analizadas. En este caso particular, es a partir del cuarto o quinto 
32 
 
reforzador cuando parece haber una disminución más radical en las tres variables. En 
el caso de la gráfica de “Ensayos por reforzador (Individual)”, vemos que la tendencia 
conforme se obtienen más reforzadores es la de generar un solo ensayo por cada uno 
de ellos. Por otro lado, en las gráficas de Tiempo por reforzador y TER por reforzador 
la tendencia por lo general es acercarse cada vez más al valor del TER reforzado. 
En las gráficas de la columna izquierda se muestra el desempeño promedio para el 
grupo al que perteneció el participante. Aunque no se muestra en la figura (explicaciónal pie) la cantidad promedio de respuestas (en “Promedio grupal Ensayos por 
Reforzador”) para obtener el primero de los reforzadores, ésta fue de 36.2, sin embargo 
la variabilidad fue relativamente grande, pues la desviación estándar alcanzó un valor 
de 47.3. No obstante, al tercer reforzador hay una disminución notable en cuanto a la 
cantidad de respuestas que los participantes necesitaron para obtener los reforzadores, 
así como también se alcanza una variabilidad pequeña en comparación con los 
primeros tres reforzadores. Esta estabilidad se mantiene en el grupo hasta el final de la 
sesión y se puede observar una tendencia a alcanzar el criterio mínimo necesario para 
la obtención de reforzadores. 
El tiempo promedio que los participantes del grupo necesitaron para obtener cada uno 
de los reforzadores (en “Promedio grupal Tiempo por reforzador”) fue más grande 
durante los primeros dos ensayos, en comparación con el resto de la sesión. Incluso 
hay una tendencia a utilizar tiempos semejantes al valor del TER reforzado como se 
puede ver en la parte final de la sesión (del reforzador 15 al 30). 
Los TER’s (en “Promedio grupal TER por reforzador”) que permitieron la entrega de los 
primeros dos reforzadores fue relativamente grande en comparación con el resto de la 
sesión, generándose TER’s cercanos a los 20 segundos. Sin embargo, a partir del 
tercer reforzador y hasta el noveno hubo una disminución gradual en el tamaño de los 
TER’s acercándose al valor del TER reforzado. A partir de este punto y hasta el final de 
la sesión parece haber una estabilización en cuanto al tamaño de los TER’s que 
permitieron el reforzamiento observándose valores muy cercanos al criterio mínimo 
programado (9 segundos) y una variabilidad grupal pequeña en comparación con el 
inicio de la sesión. 
 
33 
 
 
34 
 
Con respecto a la segunda sesión experimental (sesión B) en donde los participantes ya 
tienen la experiencia de haber participado en una primera sesión, se muestran los 
resultados individuales de un participante del grupo 3-6-3, en donde el valor del TER 
reforzado fue de 6 segundos por lo que los participantes debían tener TER’s de al 
menos 6 s para obtener los reforzadores. 
La gráfica “Ensayos por Reforzador (individual)”, muestra que la cantidad de respuestas 
que necesitó el participante para obtener el primero de los reforzadores fue mucho 
menor que el participante mostrado anteriormente. En este caso, sólo necesitó de 12 
respuestas para obtener el primero de los reforzadores. Posteriormente, disminuye de 
manera drástica el número de respuestas, ya que para obtener el segundo reforzador, 
únicamente necesitó de 2 respuestas. Para los siguientes reforzadores hay una 
tendencia muy marcada a obtenerlos en un solo ensayo, salvo contadas excepciones. 
En el caso de la gráfica de Tiempo por reforzador (individual) se puede observar que el 
participante tardó más en obtener el primero de los reforzadores (41.7 segundos), lo 
que claramente se relaciona con el número de respuestas que emitió para obtenerlo. 
Esto nos indica que hubo 11 respuestas correspondientes a TER’s menores a 6 
segundos que era el intervalo reforzado, posteriormente se observa una variabilidad en 
cuanto a este tiempo desde el segundo reforzador y hasta el número 14. Esta 
variabilidad muestra un rango que va desde los 7 hasta los 20 segundos, no obstante, 
es importante destacar que dado que la gráfica anteriormente explicada muestra que 
durante estos reforzadores se emitieron de una a tres respuestas, la variación en el 
tiempo no es el resultado de la generación de varias respuestas por parte participante, 
sino que la obtención del reforzador se daba a partir de la generación de TER’s de 
diferentes tamaños, pero mayores a 6 segundos. En la gráfica “TER por reforzador 
(individual)”, es muy importante destacar la tendencia, conforme se obtienen 
reforzadores, a generar TER’s cada vez más cercanos al valor reforzado, es decir, en 
un principio existe variabilidad en cuanto a los TER’s generados para obtener el 
reforzador, y sin embargo la tendencia siempre fue a acercarse cada vez más al valor 
TER reforzado, como se puede observar desde el reforzador 12 hasta el 30. 
Las gráficas de la columna de la derecha muestran el desempeño grupal de los 
participantes en esta sesión. La gráfica “Promedio grupal Ensayos por reforzador” se 
35 
 
muestra que hubo una diferencia notable en cuanto a la cantidad de respuestas que los 
participantes generaron para obtener los primeros dos reforzadores y que a partir del 
tercero, existió una disminución notable y consistente entre los participantes del grupo. 
De manera semejante al participante mostrado, es a partir del reforzador 15 en donde 
los promedios grupales se estabilizan alrededor de 1 respuesta y la desviación estándar 
fue menor a 2 en todos los casos hasta el final de la sesión. En algunos casos como en 
los reforzadores 15, 17, 19, 21, 24, 29 y 30, el promedio fue de 1 y la desviación 
estándar de 0. En el caso del “Promedio grupal Tiempo por reforzador”, se observa que 
tanto los tiempos promedio como la variabilidad, fueron mayores para la obtención de 
los primeros tres reforzadores, posteriormente, hay una disminución notable en cuanto 
a los promedios y a la variabilidad. Es a partir del reforzador número 10 que se 
estabiliza el tiempo promedio alrededor de 8 segundos. Este comportamiento se 
mantiene hasta el final de la sesión. El “Promedio grupal TER’s por reforzador” mostró 
que para los primeros tres reforzadores hubo un valor promedio alrededor de los 9 
segundos, es a partir del cuarto reforzador que los promedios se estabilizan teniendo 
valores entre 6 y 8 segundos, lo que ocurre hasta el final de la sesión. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
36 
 
 
37 
 
Para mostrar el desempeño en la tercera sesión experimental (sesión C) se muestra el 
desempeño de un participante, así como los promedios del grupo 5-10-5 en donde el 
valor del TER reforzado fue de 5 s. Es importante destacar que en los grupos en los 
que se ha realizado una tercera sesión el valor TER reforzado de ésta es siempre 
menor que el de la segunda sesión e igual al valor reforzado en la primera. Es 
importante señalar esto, ya que de seguir con la estrategia adoptada en la segunda 
sesión, lograría obtener reforzadores desde el primer ensayo. 
La gráfica de “Ensayos por Reforzador (Individual)” muestra una disminución notable en 
cuanto al número de intentos que necesitó el participante para obtener el primero de los 
reforzadores (3 respuestas en este caso) con respecto a las sesiones anteriores, así 
como el incremento en la cantidad de reforzadores que pudo obtener con la generación 
de un solo TER. Por otro lado, en la gráfica “Tiempo por reforzador (individual)”, se 
observa que aunque para el primer ensayo utiliza un tiempo de 11.4 segundos, a partir 
del segundo reforzador este tiempo va disminuyendo y es muy claro que los TER’s 
generados son muy cercanos al mínimo solicitado por el programa, que en este caso 
fueron 5 segundos. En cuanto a la gráfica de “TER por reforzador (individual)” se 
observa que, como es de esperarse, tiende a parecerse cada vez más a la gráfica 
anterior, esto debido al uso de un solo ensayo por reforzador. No obstante, el 
participante dejaba pasar el tiempo mínimo necesario para obtener los reforzadores, 
esto queda muy claro en los ensayos en que el participante necesitó usar más de un 
ensayo por reforzador (ver “Ensayos por reforzador (individual)”, reforzadores 15, 17 y 
26. Figura 3.3). Ya que, cuando realizó dos intentos, el tiempo para obtener el 
reforzador es de alrededor de 10 segundos (“Tiempo por reforzador (individual)”), poco 
más del doble del valor reforzado, mientras que en el caso en que utilizó 3 ensayos, 
ésta gráfica muestra que tardó poco menos de 15 segundos (14.84 segundos) en 
obtener

Continuar navegando