Logo Studenta

Relacion-funcional-entre-metodos-de-autocontrol--costo-de-la-inversion-eleccion-y-demora-de-la-gratificacion

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL 
AUTÓNOMA DE MÉXICO 
 
 
FACULTAD DE PSICOLOGÍA 
 
RELACIÓN FUNCIONAL ENTRE MÉTODOS 
DE AUTOCONTROL: COSTO DE LA 
INVERSIÓN, ELECCIÓN Y DEMORA DE LA 
GRATIFICACIÓN 
 
T E S I S 
QUE PARA OBTENER EL GRADO DE LICENCIADA EN 
PSICOLOGÍA 
PRESENTA: 
VIOLETA IXCHEL OLGUÍN RUIZ 
 
DIRECTOR DE TESIS: 
DR. RAÚL ÁVILA SANTIBAÑEZ 
REVISOR METODOLÓGICO: 
DR. CARLOS SANTOYO VELAZCO 
 
COMITÉ: 
DRA. SILVIA MORALES CHAINÉ 
DR. VLADIMIR ORDUÑA TRUJILLO 
DR. ROGELIO ESCOBAR HERNÁNDEZ 
 
Ciudad Universitaria, Ciudad de México, 2018 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
I 
 
 
 
 
 
RELACIÓN FUNCIONAL ENTRE MÉTODOS DE AUTOCONTROL: COSTO DE LA 
INVERSIÓN, ELECCIÓN Y DEMORA DE LA GRATIFICACIÓN 
II 
 
La presente tesis se realizó con el apoyo y financiamiento del proyecto PAPIIT 
IN302916 Integración de los procedimientos de autocontrol conforme a sus variables 
comunes, usando humanos como sujetos autorizado por la Dirección General de 
Asunto del Personal Académico (DGAPA) de la Universidad Nacional Autónoma de 
México (UNAM), otorgado al director de esta tesis, el Dr. Raúl Ávila Santibáñez. 
 
III 
 
 
 
 
 
 
 
 
 
Para Elizabeth Villanueva. 
Porque siempre encontraste la manera para que 
yo pudiera ver claramente el camino. Lo logré 
gracias a ti. 
 
 
IV 
 
Agradecimientos 
 
Al Dr. Raúl Ávila, por los años que me ha permitido aprender de usted para crecer 
académicamente. 
A mi revisor metodológico, el Dr. Carlos Santoyo, por sus observaciones y comentarios 
tan importantes para complementar este trabajo. 
A mis sinodales, la Dra. Silvia Morales, por su apoyo en esta tesis. Al Dr. Vladimir 
Orduña, por sus sugerencias que me ayudaron a aprender más y mejorar mi trabajo. Al 
Dr. Rogelio Escobar, por sus sugerencias, aportaciones e interés a este trabajo. 
A toda mi familia, por su apoyo, paciencia y comprensión. Porque, aunque cada vez los 
veo menos, siempre me apoyan y me recuerdan que estar lejos de ellos es una 
inversión y que yo tengo que hacer que valga la pena. 
A mi hermano y a César por ayudarme en los momentos más complicados y que, a su 
manera, siempre me animaron a seguir con la tesis. 
A todos mis amigos y amigas que, aunque casi no los veo, me han ayudado mucho 
para llegar hasta este punto de mi vida. 
A todos los integrantes de LAEC. Los quiero mucho y los admiro por sus cualidades tan 
particulares de cada uno, nunca dejan de sorprenderme. Porque aunque las cosas se 
vuelvan complicadas ustedes siempre persisten y continúan en el laboratorio. 
A la Sra. Soledad, que también es parte del laboratorio, que nos ha apoyado y cuidado 
mucho a los alumnos del Dr. Ávila. 
Un agradecimiento especial a Brasil y Moisés que me ayudaron en los detalles finales 
de esta tesis. 
A todos mis participantes por su apoyo e interés en este estudio, que se mostró en 
largas pláticas posteriores al estudio. 
De nuevo, gracias por todo, César, porque estás enamorado de la vida y por eso hay 
tanta pasión en lo que haces, y por permitirme vivir enamorada de ti. 
V 
 
ÍNDICE 
Resumen........................................................................................................................................ 1 
Introducción ................................................................................................................................... 2 
Conducta autocontrolada e impulsiva ................................................................................... 2 
Elección con compromiso........................................................................................................ 3 
Demora de la gratificación....................................................................................................... 8 
Efecto del costo de la inversión............................................................................................11 
Propósito del estudio..............................................................................................................14 
Estudio 1 ......................................................................................................................................16 
Método ......................................................................................................................................17 
Participantes. .......................................................................................................................17 
Materiales. ............................................................................................................................17 
Procedimiento. .....................................................................................................................18 
Resultados ...............................................................................................................................26 
Discusión ..................................................................................................................................33 
Estudio 2 ......................................................................................................................................39 
Método ......................................................................................................................................40 
Participantes. .......................................................................................................................40 
Materiales. ............................................................................................................................40 
Procedimiento. .....................................................................................................................40 
Resultados ...............................................................................................................................49 
Discusión ..................................................................................................................................54 
Discusión general .......................................................................................................................58 
Referencias..................................................................................................................................65 
Anexo 1 ........................................................................................................................................70 
VI 
 
Anexo 2 ........................................................................................................................................71 
Anexo 3 ........................................................................................................................................73 
Anexo 4 ........................................................................................................................................73 
Anexo 5 ........................................................................................................................................77 
 
 
VII 
 
ÍNDICE DE FIGURAS Y TABLAS 
Figura 1. Opciones de respuestas en la tarea del efecto del costo de la inversión.. ......22 
Figura 2. Tarea de descuento temporal y tarea de descuento probabilístico...................25Figura 3. Porcentaje de ensayos con persistencia ...............................................................27 
Figura 4. Tasas de respuestas y porcentaje de ensayos con persistencia ......................29 
Figura 5. Tasa de respuestas distribuidas según el porcentaje de ensayos con 
persistencia. ................................................................................................................................30 
Tabla 1 Tasas de descuento temporal y probabilístico individuales.....…………………31 
Figura 6. Áreas bajo la curva distribuidas de acuerdo al porcentaje de ensayos con 
persistencia..................................................................................................................................33 
Figura 7. Tarea del efecto del costo de la inversión con leyenda modificada ..................42 
Figura 8. Esquema de un ensayo de elección libre en la tarea de demora de la 
gratificación. ................................................................................................................................46 
Figura 9. Esquema de un ensayo de elección libre en la tarea de elección con 
compromiso. ................................................................................................................................48 
Figura 10. Tasas de respuestas y porcentaje de ensayos con persistencia en la tarea 
del efecto del costo de la inversión .........................................................................................50 
Figura 11. Tasa de respuestas distribuidas según el porcentaje de ensayos con 
persistencia..................................................................................................................................51 
Figura 12. Porcentaje de ensayos con reforzadores grandes demorados obtenidos y de 
escapes ........................................................................................................................................52 
Figura 13. Porcentaje de ensayos con escapes en la tarea del efecto del costo y 
porcentaje de ensayos con reversión en la tarea de demora de la gratificación .............54
1 
 
Resumen 
En la presente tesis, en dos estudios se determinó la viabilidad de la conducta de 
persistir en los procedimientos de autocontrol como el componente fundamental en la 
maximización de las recompensas en tres tareas de autocontrol: efecto del costo de la 
inversión, elección con compromiso y demora de la gratificación. En el primer estudio se 
expusieron a 30 participantes a una tarea del efecto del costo de la inversión, dos tareas 
de descuento, temporal y probabilístico con ajuste de la magnitud. Se encontró que la 
mayoría de los participantes persistieron en la tarea del efecto del costo de la inversión, 
así como obtuvieron un área bajo la curva pequeña en las tareas de descuento temporal y 
probabilístico. Por lo que los participantes maximizaron las ganancias solo en la tarea de 
descuento probabilístico. En el Estudio 2 se expusieron a cinco participantes a los 
procedimientos de elección con compromiso, demora de la gratificación y de costo de la 
inversión. Todos los participantes maximizaron las ganancias en la tarea de elección con 
compromiso pero, solo tres participantes maximizaron en la tarea de demora de la 
gratificación y solo un participante maximizó las ganancias en la tarea del efecto del costo 
de la inversión. Los resultados de ambos estudios sugieren que puede haber una relación 
entre el procedimiento de descuento temporal con ajuste de la magnitud y efecto del costo 
de la inversión. Por otro lado, parece haber una relación entre el patrón de persistir en las 
tareas del costo de la inversión y de demora de la gratificación. 
Palabras clave: efecto del costo de la inversión, demora de la gratificación, descuento 
temporal, descuento probabilístico.2 
 
Introducción 
En los últimos 40 años, ha habido un incremento en la investigación sobre el 
autocontrol en el área del análisis experimental de la conducta. Este interés general 
resultó en la proliferación de una amplia variedad de procedimientos que, aunque 
permiten estudiar y entender aspectos específicos de la conducta autocontrolada, pueden 
dificultar la comprensión del fenómeno en sí mismo. 
Esta tesis se concentró en tres procedimientos para estudiar la conducta 
autocontrolada, específicamente, elección con compromiso, demora de la gratificación y el 
efecto del costo de la inversión. De la literatura que se presenta en esta introducción, se 
deduce que un proceso común de estos procedimientos es la maximización de las 
recompensas; la manera de maximizar es persistir o no en un curso de acción, 
dependiendo de cada procedimiento. Este proceso común podría mejorar la comprensión 
de los tres procedimientos previamente mencionados. 
Para facilitar la lectura del presente trabajo, la introducción se estructuró de la 
siguiente forma: en la primera parte, se presenta el concepto de conducta autocontrolada; 
en la segunda parte se describen los procedimientos de elección con compromiso, 
demora de la gratificación y efecto del costo de la inversión; finalmente, en la tercera 
parte, se presenta el propósito de la presente tesis. 
Conducta autocontrolada e impulsiva 
La conducta autocontrolada ha sido definida como la elección de una opción que 
maximiza las ganancias y disminuye las pérdidas; mientras que su antónimo, la conducta 
impulsiva no aumenta o disminuye las ganancias (véase Green & Myerson, 2010). Sin 
embargo, dada la variedad de procedimientos sobre conducta autocontrolada existen 
3 
 
otras definiciones. Por ejemplo, en un procedimiento de elección entre pares de 
recompensas que difieren en magnitud y demora de entrega, la conducta autocontrolada 
es definida como elegir una recompensa grande demorada en lugar de una recompensa 
pequeña de menor magnitud que podría ser obtenida inmediatamente (Logue, 1988; 
Rachlin & Green, 1972). Por otro lado, en un procedimiento de demora de la gratificación, 
esperar por una recompensa grande en lugar de consumir una recompensa pequeña 
presente es ejemplo de conducta autocotrolada (e.g., Mischel & Ebbesen, 1976). No 
obstante, en ambos procedimientos la conducta autocontrolada implica el proceso de 
maximización global de las ganancias, por lo que se incluyen en la primera definición 
descrita. 
Un caso especial de la conducta impulsiva es el efecto del costo de la inversión. Esta 
conducta implica mantenerse en un curso de acción poco redituable solo por las 
inversiones previas. En este ejemplo, desistir del curso de acción maximiza las ganancias, 
por lo que podría considerarse como conducta autocontrolada. 
En las siguientes secciones se describe cada procedimiento, así como algunas de 
las principales variables estudiadas, destacando el proceso de la maximización. 
Elección con compromiso 
El procedimiento de elección con compromiso, consiste en exponer a sujetos a pares 
de recompensas, una grande demorada y una chica inmediata. Usualmente, en este 
procedimiento se mantiene constante la duración del ensayo, por lo que si un sujeto se 
mantiene eligiendo la opción grande, obtiene la mayor cantidad de recompensa disponible 
en la sesión experimental; esta conducta se considera una conducta autocontrolada 
(Logue, 1988). En este procedimiento, una vez que los sujetos eligen la recompensa 
4 
 
grande no pueden cambiar de elección durante el periodo de demora, por lo que este 
procedimiento es conocido como elección con compromiso (Rachlin & Green, 1972; 
Rachlin, 2000). 
El estudio pionero de elección con compromiso consistió en exponer a palomas a un 
programa concurrente encadenado. En el primer eslabón se activaron dos teclas (A y B), 
si la paloma picaba la tecla A resultaba en una demora seguida por la activación de dos 
teclas de respuesta. En este eslabón, cada tecla estaba asociada a una recompensa, una 
grande con una demora de entrega y una chica inmediata con un tiempo fuera para 
igualar el tiempo de las dos opciones. Por otro lado, si la paloma picaba la tecla B, se 
presentaba una demora seguida de la activación de la tecla asociada a la recompensa 
grande, pero demorada (Rachlin & Green, 1972). 
El procedimiento previamente mencionado ha sido adaptado de diferentes formas 
para estudiarse con humanos. Asímismo, con la finalidad de hacer los estudios entre 
humanos y animales lo más comparables posible, se han explorado las elecciones con 
recompensas consumibles. Por ejemplo, Forzano, Michels, Sorama, Etopio y English 
(2014) compararon la ejecución de participantes con diferentes recompensas (jugo o 
fragmentos de videos). Los autores reportaron que todos los participantes eligieron la 
opción grande demorada alrededor del 60% de las veces con videos como recompensa y 
alrededor de 50% en el caso del jugo como recompensa; sin embargo, encontraron un 
efecto de saciedad con el jugo y no con la reproducción de videos. 
En otro estudio, Campos (2016) utilizó el acceso a videos como recompensa. La 
autora expuso a 60 participantes a una sesión en el que se le presentaban al participante 
dos cuadros en el centro de la pantalla, uno azul y el otro verde. El cuadro azul estaba 
5 
 
asociado a una demora de 1 s seguida de la reproducción durante 6 s de un video; al 
finalizar la reproducción del video, comenzaba un periodo de tiempo fuera donde no había 
ningún estímulo en la pantalla, hasta que se completara el tiempo del ensayo. El otro 
cuadro estaba asociado a una demora de 30 s, seguida de la reproducción durante 18 s 
del mismo video. Al igual que en el estudio anterior, los participantes eligieron la opción 
grande demorada alrededor del 70% de los ensayos. 
Tanto con las variaciones como con el procedimiento pionero se ha probado la 
demora de entrega de la recompensa grande, manteniendo la duración de los ensayos 
constante tanto en animales no humanos (e.g., Chelonis & Logue, 1997; Rachlin & Green, 
1972; Reynolds, De Wit, & Richards, 2002) como en humanos (Green & Myerson, 2004; 
Holt, Green, & Myerson, 2012). En general, se ha reportado que las elecciones a la 
recompensa grande demorada disminuyen conforme aumenta la demora para obtener 
esa recompensa. 
Un proceso relacionado a las elecciones por una recompensa grande demorada es 
el descuento del valor subjetivo a través del tiempo. Esto es, que el valor que el sujeto le 
atribuye a una recompensa (i.e., el valor subjetivo) disminuye conforme aumenta la 
demora de entrega de la misma, por lo tanto, las elecciones por la recompensa grande 
demorada también disminuyen (Green & Myerson, 2004). 
Comúnmente, el descuento del valor subjetivo se ha estudiado con el ajuste de la 
magnitud de la demora de la recompensa grande (Mazur, 1988) y con el ajuste de la 
magnitud de la recompensa chica (e.g. Green & Myerson, 2004). Ambos son una 
variación de la situación de elección mencionada anteriormente. Específicamente, en la 
segunda variación, la recompensa grande se mantiene fija, mientras que la magnitud de la 
6 
 
recompensa chica se ajusta en cada elección dependiendo de la ejecución del sujeto. Así, 
la recompensa pequeña aumenta si previamente el sujeto eligió la recompensa grande o 
disminuye si eligió la recompensa pequeña. En esta tesis referiremos a este 
procedimiento como descuento temporal con ajuste de la magnitud. 
Por medio del ajuste de la magnitud se puede obtener un punto de indiferencia por 
cada demora probada. Esto es, el valor de la recompensa chica cuando la elección del 
participante es indiferente entre las dos recompensas. Este punto de indiferencia es 
considerado el valor subjetivo atribuido a la recompensa grande en una demora dada. 
Mazur (1987) sugirió la función hiperbólica como un modelo que describe el 
descuentodel valor subjetivo de una recompensa en función de una variable como el 
tiempo o la probabilidad, por medio de los puntos de indiferencia. La ecuación es la 
siguiente: 
𝑉 =
𝐴
1+ 𝑘𝐷
 
 
Donde V es el valor subjetivo, A es la magnitud real de la recompensa, D es la 
variable de la que el descuento está en función (demora o probabilidad de entrega de la 
recompensa), y k es la tasa de descuento, es decir, la relación del decremento del valor 
subjetivo de la recompensa conforme aumenta D. 
Una tasa de descuento baja indica que el valor subjetivo de la recompensa se 
mantiene relativamente constante a través de las demoras probadas. Un sujeto con una 
tasa de descuento baja elige consistentemente las elecciones por la recompensa grande 
demorada. Por otro lado, una tasa de descuento alta indica que el valor subjetivo de la 
recompensa es descontado rápidamente; los sujetos con una tasa de descuento alta 
7 
 
eligen la recompensa inmediata de menor magnitud (Rachlin, 2000). De esta forma, la 
tasa de descuento es considerada un indicador de conducta autocontrolada (Green & 
Myerson, 2004). 
Un análisis alterno al ajuste hiperbólico es obtener el área bajo la curva (AbC), es 
decir, el área generada por los puntos de indiferencia en las diferentes demoras. El AbC 
es una medida ateórica por lo que no depende del ajuste de los puntos de indiferencia a 
alguna función de descuento (Myerson, Green, & Warusawitharana, 2001). Para obtener 
el AbC se deben de normalizar los valores de los puntos de indiferencia y las demoras, 
esta variable dependiente oscila entre cero y uno. Un AbC con un valor cercano a uno se 
relaciona con elecciones a la recompensa grande, lo que a su vez maximizaría las 
ganancias globales. 
El procedimiento previamente descrito también se ha utilizado como un indicador 
para estudiar la conducta de propensión al riesgo (Green & Myerson, 2004; Green & 
Myerson, 2010). El procedimiento de descuento probabilístico con ajuste de la magnitud 
consiste en exponer a sujetos a elecciones entre pares de recompensas que difieren en 
magnitud y probabilidad de entrega. Al igual que el descuento temporal con ajuste de la 
magnitud, en este procedimiento se calculan las tasas de descuento así como las AbC. 
Una tasa de descuento baja y una AbC alta se relaciona con una conducta de propensión 
al riesgo, debido a que el valor subjetivo de la recompensa se mantiene estable a pesar 
de que aumenten las probabilidades en contra de obtener la recompensa (Green & 
Myerson, 2010). 
Como se mencionó al inicio de la sección, en este procedimiento no se puede 
cambiar la opción elegida. En este sentido, maximizar las recompensas resulta de elegir 
8 
 
la recompensa grande demorada. Un procedimiento que permite el cambio de opción 
después de la elección inicial es el de demora de la gratificación. 
Demora de la gratificación 
Típicamente, en este procedimiento se expone a un participante a una sola elección 
entre una recompensa pequeña o menos preferida que podría obtener en ese instante, y 
una recompensa de mayor magnitud o más preferida que podría obtener después de un 
tiempo de espera. Sin embargo, si el sujeto elige la segunda opción, durante el periodo de 
espera puede revertir la elección, es decir, emitir una respuesta para obtener la 
recompensa de menor magnitud. En este sentido, la conducta autocontrolada implica que 
el sujeto elija la recompensa grande demorada y persista en esta hasta obtenerla. 
El primer estudio de demora de la gratificación en un ambiente experimental fue el 
de Mischel y Ebbesen (1970) con niños de aproximadamente 4 años de edad. Los niños 
podían esperar 15 min para obtener la recompensa preferida o revertir su elección 
durante la espera de la recompensa grande. El estudio consistía en cuatro grupos 
experimentales, cada uno podía tener presente una, las dos o ninguna recompensa. Los 
autores encontraron que los niños esperaban en promedio 11 minutos cuando ninguna de 
las recompensas estaba presente y 1 minuto cuando ambas estaban presentes. En los 
grupos donde estaba presente la recompensa demorada esperaron 5 minutos en 
promedio, cuando estaba presente la inmediata esperaron en promedio 6 minutos. Los 
autores concluyeron que cuando las recompensas están presentes hay menos conducta 
autocontrolada en comparación con las condiciones donde solo se muestra una de las 
recompensas o ninguna. 
Grosch y Neuringer (1981) adaptaron el paradigma de demora de la gratificación a 
9 
 
un procedimiento con palomas. En su estudio, los autores expusieron a palomas entre 10 
y 20 sesiones consecutivas. Cada sesión estaba conformada por 30 elecciones entre 
reforzadores de diferente calidad y demora de entrega. Los autores reportaron resultados 
similares que en el estudio de Mischel y Ebbesen. Sin embargo registraron que la 
conducta de reversión disminuyó cerca de la mitad en los últimos ensayos en 
comparación con los primeros. 
Este procedimiento también se ha probado en ratas privadas de agua, haciendo 
comparables los procedimientos de elección con compromiso y demora de la gratificación 
(Reynolds, de Wit, & Richards, 2002). Cada rata fue expuesta a elecciones entre una 
cantidad de agua pequeña inmediata y una cantidad de agua grande, pero demorada. 
Todas las ratas fueron expuestas a 25 sesiones de 50 ensayos cada una. Un grupo de 
ratas fue expuesto al procedimiento de elección con compromiso y otro grupo de ratas al 
procedimiento de demora de la gratificación. La única diferencia fue que las ratas 
expuestas al procedimiento de demora de la gratificación podían revertir sus respuestas. 
En este estudio, se varió la demora de entrega de la recompensa grande de cero a 32 s. 
Encontraron que conforme aumenta la demora aumentan las respuestas de reversión, de 
virtualmente 0% de los ensayos en la demora de 4 s a casi 20% en la demora de 32 s 
para las ratas expuestas al procedimiento de demora de la gratificación y de 0% a 50% en 
las ratas expuestas al procedimiento de elección con compromiso. 
Debido a que en los estudios de demora de la gratificación en humanos utilizan un 
solo un ensayo, Ávila, Ortega y Jardines (2018) averiguaron el efecto de aumentar el 
número de ensayos de exposición a este procedimiento, con el propósito de hacer más 
comparable los resultados entre especies. En un primer experimento, los autores 
10 
 
expusieron a 15 participantes de un rango de edad de 18 a 30 años a una tarea por 
computadora con videos como recompensa en una sesión experimental conformada por 
30 ensayos. Cada ensayo iniciaba con dos cuadros, uno rojo y uno verde, ubicados en el 
centro de la pantalla de la computadora con fondo gris. El cuadro rojo estaba asociado a 
una demora de 2 s seguida por la reproducción de un video durante 8 s, una vez que 
terminaba la reproducción del video, la pantalla de la computadora permanecía en negro 
por el tiempo restante del ensayo. El cuadro verde estaba asociado a una demora de 32 s 
seguida de la reproducción de un video durante 32 s, el periodo de demora se señaló con 
el cambio de color del fondo de la pantalla a verde y la presencia de un cuadro rojo. Si el 
participante hacía clic con el cursor del mouse sobre el cuadro rojo durante el tiempo de 
espera por el video de mayor magnitud, se cancelaba la entrega del video con mayor 
duración y entraba en efecto la contingencia programada para el cuadro rojo. Ávila y 
colaboradores reportaron que los participantes emitieron pocas respuestas de reversión 
que ocurrieron en los primeros 15 ensayos de la tarea. Sugirieron que el decremento de 
respuestas de reversión podía deberse a los ensayos de exposición a la tarea. 
En el Experimento 2 del estudio de Ávila et al. expusieron a cinco participantes a 
diez sesiones a la tarea demora de la gratificación para explorar la ejecución de los 
participantes en esta tarea con más de una sesión de exposición. Adicionalmente,variaron las demoras de entrega de la recompensa grande. Los autores encontraron una 
tendencia decreciente de las recompensas grandes demoradas obtenidas conforme 
incrementó la demora de entrega por la recompensa grande, así como un nivel 
relativamente bajo de reversiones que ocurrieron al inicio de cada sesión. En resumen, 
parece que el tiempo de exposición a la tarea disminuye las respuestas de reversión; este 
11 
 
hallazgo es similar a los resultados reportados con otras especies (e.g. Grosch & 
Neuringer, 1981). 
Al mantener constante la duración y el número de ensayos, independientemente de 
las elecciones de los sujetos, la manera de obtener la mayor cantidad de recompensas es 
elegir consistentemente la opción grande demorada y persistir en esta elección. Otro 
procedimiento en el que también se puede maximizar las ganancias globales que 
involucra el mantenimiento de una respuesta es el efecto del costo de la inversión. 
Efecto del costo de la inversión 
El efecto del costo de la inversión es definido como la tendencia a continuar en un 
curso de acción poco o nada redituable en el que ya se ha hecho una inversión previa 
(Arkes & Blumer, 1985; Navarro & Fantino, 2005). Es considerado un caso especial del 
autocontrol porque continuar en un curso de acción no maximiza las ganancias, por el 
contrario, aumenta el esfuerzo e incluso puede implicar pérdidas (ejemplo de conducta 
impulsiva). Debido a lo anterior se ha considerado una conducta irracional y se ha 
mencionado que puede estar relacionada con la conducta autocontrolada (Fantino & 
Fantino, 2013; Rachlin, 1995). 
Por lo general, el efecto del costo de la inversión se estudiaba en humanos 
utilizando viñetas. Es decir, descripciones breves de situaciones de inversión hipotéticas 
en las que el participante debía escoger entre continuar con la inversión descrita o desistir 
de la misma. Así, se exploraron variables como la implicación del participante en una 
inversión (Arkes & Blumer, 1985), la estimación del éxito del resultado de la inversión 
(Arkes & Blumer, 1985; Garland, 1990; Garland & Newport,1991) y la relación del efecto 
del costo de la inversión con la aversión al riesgo (Zeelenberg & Dijk, 1997). 
12 
 
Navarro & Fantino (2005) propusieron un procedimiento conductual para estudiar 
este fenómeno en palomas y humanos. Brevemente, en su estudio el sujeto experimental 
tenía la opción de responder a una de dos teclas: responder repetidamente en una de las 
teclas (tecla de respuestas) resultaba en la entrega de un reforzador conforme a un 
programa de reforzamiento mixto con cuatro programas de razón fija -RF- (pequeño, 
mediano, grande y muy grande). Cada RF podía estar vigente en cada ensayo de acuerdo 
a una probabilidad de ocurrencia en 0.5, 0.25, 0.125 y 0.125 para cada RF 
respectivamente. Responder en la otra tecla (tecla de escape) cancelaba el ensayo en 
curso e iniciaba uno nuevo en el que los programas podían estar vigentes de acuerdo a 
su probabilidad de ocurrencia. De esta manera, si en un ensayo el sujeto respondía hasta 
obtener el reforzador con cualquiera de los programas de reforzamiento diferentes al más 
pequeño programado, se consideraba que había persistido. Es decir que había incurrido 
en el efecto del costo de la inversión. Por otro lado, si el sujeto cancelaba el ensayo 
después de completar el requisito de respuestas más pequeño sin obtener el reforzador, 
el sujeto no incurría en el efecto del costo de la inversión y maximizaba sus ganancias 
globales por el arreglo probabilístico programado. 
De manera general, Navarro y Fantino (2005) en cuatro experimentos con palomas y 
uno con humanos como sujetos experimentales encontraron que el porcentaje de ensayos 
con persistencia en la tarea disminuye del 100 a 0% al señalar el incremento del requisito 
de respuestas con cambios de iluminación en un operando. También encontraron que el 
porcentaje de ensayos con persistencia decrementa de cerca del 100% a alrededor del 
10% conforme la diferencia entre los requisitos de respuestas incrementa. Con esta última 
variable encontraron una tendencia similar en humanos, sin embargo, hubo mayor 
13 
 
variabilidad que en los experimentos con palomas, donde se observó que el porcentaje de 
ensayos con persistencia decremento de alrededor del 67.9% a 25.2% en promedio. 
En estudios posteriores, se reprodujo el procedimiento reportado por Navarro y 
Fantino con palomas (Avila, Gonzalez, Miranda & Guzman, 2010; Macaskill & Hackenberg 
2012a; 2012b), ratas (Magalhãnes, White, Stewart, Beeby, & Van Der Vielt, 2012) y 
humanos (Navarro & Fantino, 2007; Avila, Yankelevitz, Gonzalez, & Hackenberg, 2013; 
Macaskill & Hackenberg, 2013). 
Específicamente, en estudios con palomas se encontró que variar la frecuencia 
relativa de los requisitos de respuesta modula el porcentaje de ensayos con persistencia 
(Avila et al., 2010; Macaskill & Hackenberg, 2012b). En otro estudio se reportó que 
exponer a palomas a diferentes secuencias de condiciones, donde es óptimo persistir y 
donde es óptimo escapar genera un efecto de historia en los niveles del porcentaje de 
ensayos con persistencia (Macaskill & Hackenberg, 2012a). 
Particularmente, en estudios con humanos se han replicado los hallazgos reportados 
en estudios de animales no humanos como variar la frecuencia relativa del requisito de 
respuestas (Avila, et al., 2013) y el efecto de historia (Macaskill & Hackenberg, 2013). Por 
otra parte, no se han encontrado efectos claros al añadir un estímulo al incremento del 
requisito de respuestas en humanos (Macaskill & Hackenberg, 2013; Navarro & Fantino, 
2007). Además, en un estudio encontraron que el fenómeno del efecto del costo de la 
inversión es un continuo conductual con cuatro diferentes patrones conductuales: 
persistencia no óptima, escape óptimo, persistencia óptima y escape no óptimo mas no un 
fenómeno de todo o nada como se caracterizaba en estudios con viñetas (Avila et al., 
2013). 
14 
 
Cabe destacar que en los estudios con humanos hay mayor variabilidad que en los 
de animales. Algunos de los autores mencionaron que la mayoría de los participantes 
tienden a persistir en condiciones de escape óptimo (Macaskill & Hackenberg, 2013; 
Navarro & Fantino, 2005; 2007). Por ejemplo, en el estudio de Macaskill y Hackenberg 
(2013) el 86.7% del total de los participantes persistieron bajo las mismas condiciones que 
las descritas por Navarro y Fantino con palomas (2005); sin embargo, en este estudio los 
participantes solamente fueron expuestos a una o tres sesiones de exposición. En 
contraparte, en otro estudio con humanos, Avila, et al. (2013) expusieron a tres 
participantes a al menos a cinco sesiones de exposición bajo las mismas condiciones que 
las descritas en el estudio de Navarro y Fantino (2007) y encontraron que los tres 
participantes escaparon consistentemente. Es decir, que el porcentaje de ensayos con 
persistencia fue cercano a cero. 
Propósito del estudio 
La conducta autocontrolada puede ser definida como la elección de la opción que 
maximiza las ganancias globales y reduce las pérdidas (Green & Myerson, 2004). Los 
principales procedimientos que se han empleado en esta área son el de elección con 
compromiso y el de demora de la gratificación. Un caso especial de conducta 
autocontrolada se observa en el procedimiento del efecto del costo de la inversión, en el 
que desistir de un curso de acción maximiza las ganancias. 
Desde el punto de vista de la autora de esta tesis, es posible que los procedimientos 
previamente mencionados capturen dimensiones diferentes de la conducta 
autocontrolada; sin embargo, en los tres procedimientos se puede maximizar las 
ganancias globales, que depende de persistir o no en un curso de acción. Por ejemplo, en 
15 
 
el procedimiento del efecto del costo de la inversión mantenerse respondiendo en un 
curso de acción no necesariamente maximizalas ganancias globales. Por el contrario, 
abandonar el curso de acción permite aumentar la tasa de reforzamiento; esto es, el 
sujeto maximiza las ganancias que puede obtener. En los procedimientos de descuento 
temporal con ajuste de la magnitud y el procedimiento de elección con compromiso el 
sujeto maximiza las ganancias eligiendo consistentemente la recompensa grande 
demorada. En el caso del procedimiento de demora de la gratificación, el sujeto maximiza 
las ganancias absteniéndose de revertir su elección inicial por la recompensa grande 
demorada. 
Cada procedimiento ha permitido estudiar aspectos particulares de la conducta de 
autocontrol. Sin embargo, la proliferación de los procedimientos también ha dificultado la 
apreciación de los aspectos esenciales de la conducta autocontrolada porque se 
desconoce qué procedimiento está definiendo uno, otro o el mismo aspecto de conducta 
autocontrolada. De la revisión de la literatura que se presentó en esta introducción se 
deduce que un proceso fundamental entre elección con compromiso, demora de la 
gratificación y efecto del costo de la inversión es la maximización de las ganancias. Un 
aspecto común y necesario para que los sujetos maximicen las recompensas entre los 
tres tipos de procedimientos es la persistencia o no persistencia de la ejecución en una 
opción, esto no hace diferente la variable, simplemente son ambas direcciones de una 
variable dependiente común. Así, esta variable dependiente, la persistencia, podría ser de 
utilidad para trazar la relación entre los procedimientos revisados en esta introducción y 
este es el propósito del presente estudio: a saber, determinar la viabilidad de la conducta 
de persistir en los procedimientos de autocontrol como el componente fundamental en la 
16 
 
maximización de las recompensas. 
Algunos autores compararon procedimientos de autocontrol con la intención de 
averiguar si miden la misma dimensión de la conducta autocontrolada. Estas 
comparaciones han sido con niños menores de cinco años (Delgado, 2014; Forzano, 
Michels, Carapella, Conway, & Chelonis, 2011) o con ratas como sujetos experimentales 
(Reynolds, et al., 2002). En estos estudios relacionaron las recompensas obtenidas o las 
elecciones iniciales de los sujetos. Principalmente en los procedimientos de elección con 
compromiso y de demora de la gratificación, donde han encontrado correlación entre las 
elecciones iniciales (Delgado, 2014, Reynolds et al., 2002) y correlación entre las 
recompensas grandes obtenidas y el tiempo de espera antes de revertir en el 
procedimiento de demora de la gratificación (Forzano Michels, Carapella, Conway, & 
Chelonis, 2011). No obstante, en la presente tesis se incluye la comparación del 
procedimiento del efecto del costo de la inversión. El cual puede considerarse como un 
procedimiento que permite estudiar la conducta controlada, donde el factor fundamental 
es persistir o no de un curso de acción. 
Esta tesis se dividió en dos estudios. El Estudio 1 se comparó la ejecución en el 
efecto del costo de la inversión y la ejecución en una tarea de descuento temporal y una 
de descuento probabilístico con ajuste de la magnitud. En el Estudio 2 se comparan las 
ejecuciones de participantes expuestos a una tarea de elección con compromiso, una 
tarea de demora de la gratificación y una tarea del efecto del costo de la inversión. 
Estudio 1 
En el Estudio 1 se comparó la ejecución en situaciones de persistir no óptimo (tarea 
del costo de la inversión) con recompensas demoradas y probabilísticas (tarea de 
17 
 
descuento temporal y probabilístico con ajuste de la magnitud). 
Particularmente, la tarea de descuento probabilístico se utilizó dado que en estudios 
con viñetas reportan una relación entre la propensión al riesgo y el procedimiento del 
efecto del costo de la inversión (Zeelenberg & Dijk, 1997). 
Debido a que en la literatura del efecto del costo de la inversión con humanos se ha 
observado variabilidad entre los participantes, en este estudio, también, se averiguó si el 
número de sesiones de exposición a una tarea del efecto del costo de la inversión modula 
la conducta de persistir por una recompensa poco redituable. 
Método 
Participantes 
Se contactó con 98 estudiantes universitarios por medio de las redes sociales. 
Inicialmente asistieron 53 participantes de los cuales 30 completaron todas las tareas de 
este estudio. Los 30 participantes estaban en un rango de edad de entre 18 a 25 años 
(M= 21.5, DE=2.8) y ninguno había asistido anteriormente a un estudio sobre toma de 
decisiones. 
Materiales 
El estudio se llevó a cabo en un cubículo de 4x2 m, acondicionado con cinco 
escritorios, cada uno con una computadora de escritorio y una silla. Cada computadora 
estaba equipada con un monitor de 16 pulgadas, un teclado tipo QWERTY y un mouse 
óptico. Los escritorios estaban separados, entre sí, por muros de tablaroca y cortinas que 
evitaban el contacto entre participantes. Se trabajó con un máximo de tres personas al 
mismo tiempo. La tarea del efecto del costo de la inversión fue programada en Visual 
Basic ® 6.0, mientras que las tareas de descuento temporal y probabilístico fueron 
18 
 
programados con Java ® 7. Todos los programas fueron utilizados en estudios anteriores 
en el Laboratorio de Análisis Experimental de la Conducta. Cada computadora era de 
marca HP ® con sistema operativo Windows ® XP por los requisitos de sistema del 
programa del efecto del costo de la inversión. 
Procedimiento 
La investigadora publicó una invitación al estudio por medio de las redes sociales. 
Para homogeneizar la muestra se invitó únicamente a estudiantes universitarios entre 18 
y 25 años que nunca hubieran participado en un estudio sobre toma de decisiones. A los 
estudiantes interesados se les envió un correo electrónico en el que se especificó el tema 
y la duración del estudio. También se mencionó que al final de su participación se les 
entregaría una recompensa. Finalmente, se acordaron los horarios de participación con 
los interesados. 
El diseño de este estudio fue mixto, dado que cada sujeto respondió las tareas de 
descuento temporal con ajuste de la magnitud, descuento probabilístico con ajuste de la 
magnitud y la tarea del efecto del costo de la inversión. Asímismo, se expuso a los 
participantes a una, tres o cinco sesiones a esta tarea para probar si existía un efecto de 
exposición a la tarea del efecto del costo de la inversión. El número de sesiones 
experimentales fue asignado de manera aleatoria, de tal manera que hubiera diez 
participantes en cada condición. 
En la primera sesión, todos los participantes leyeron y firmaron un consentimiento 
informado (Anexo 1) seguido por contestar una de las siguientes tres tareas: la tarea del 
efecto del costo de la inversión, la tarea de descuento temporal y la tarea de descuento 
probabilístico. Los participantes fueron expuestos a las tareas de manera 
19 
 
contrabalanceada, una sesión por día. Las sesiones tuvieron una duración máxima de 25 
minutos y se realizaron de lunes a viernes a la misma hora aproximadamente. 
En cada sesión se le pidió al participante que se sentara en la silla que se 
encontraba frente a la computadora. Al inicio de cada tarea, se les pidió a los participantes 
que leyeran las instrucciones que se encontraban en la pantalla (Anexo 2) y que 
únicamente utilizaran el mouse para interactuar con los programas en la computadora. 
Al terminar todas las tareas del estudio, los participantes recibieron un número de 
oportunidades para obtener una cantidad de dinero (un dulce, $15, $20 o $50 por 
oportunidad) que obtuvieron de acuerdo al puntaje acumulado en la tarea del efecto del 
costo de la inversión. 
Tarea del efecto del costo de la inversión 
Todos los participantes fueron expuestos a una sesión de entrenamiento seguido por 
la o las sesiones de prueba. 
Sesión de entrenamiento.Al inicio de la sesión, la pantalla del monitor de la computadora era de color gris, en 
el centro de se encontraba un recuadro blanco con el folio del participante 
correspondiente; debajo del cuadro estaba un rectángulo naranja con la leyenda Iniciar. 
Una vez que el participante oprimía el botón Iniciar, comenzó la sesión. Cada sesión 
estaba compuesta por ensayos discretos que comenzaban con el fondo de la pantalla de 
color gris y la leyenda Haga clic con el mouse repetidamente en el cuadro derecho para 
ganar dinero, ubicada en la parte superior de la pantalla, debajo de esta leyenda se 
encontraba un recuadro de aproximadamente 5 centímetros color blanco ubicado al 
centro de la pantalla. En la esquina inferior derecha se encontraba la leyenda Total: y un 
20 
 
contador visible para el participante. Si el participante hacía clic con el cursor sobre el 
cuadrado blanco, este cambiaba su posición aleatoriamente sin invadir el espacio de las 
leyendas. El participante podía obtener una recompensa después de hacer clic sobre el 
cuadro blanco repetidamente que consistió en la entrega de cinco puntos señalado con la 
leyenda ¡Ganó 5 puntos!, esta leyenda desapareció después de dos segundos, seguida 
por la leyenda En un momento iniciará un nuevo ensayo, presente durante dos segundos, 
que indicó el final del ensayo, comenzando uno nuevo. Los puntos ganados se sumaban 
al contador visible para el participante. 
En cada ensayo, el cuadro blanco estaba programado con uno de cuatro programas 
de reforzamiento de razón fija (RF) 10, 40, 80 o 160. Cada RF podía estar vigente con 
una probabilidad de 0.25. Cumplir con el requisito de respuestas vigente resultaba en la 
entrega de 5 puntos como recompensa. 
Sesiones experimentales. 
Se empleó un procedimiento de ensayo por ensayo. Cada ensayo comenzó con el 
fondo gris de la pantalla de la computadora. En la parte superior de la pantalla se 
encontraban las leyendas Haga clic con el mouse en el cuadro izquierdo para reiniciar el 
ensayo y Haga clic con el mouse repetidamente en el cuadro derecho para ganar dinero. 
Estas leyendas permanecieron en la pantalla durante todo el ensayo. Debajo de las 
instrucciones se encontraban un cuadro amarillo del lado izquierdo (i. e., cuadro de 
escape) y uno blanco del lado derecho (i. e., cuadro de respuesta). El participante podía 
ganar puntos haciendo clics con el puntero del mouse sobre el cuadro de respuesta hasta 
cumplir el requisito de respuestas vigente. La recompensa se entregó conforme a uno de 
cuatro programas de razón fija (RF 10, RF 40, RF 80, RF 160). Cada RF podía estar 
21 
 
vigente en cada ensayo de acuerdo a una probabilidad previamente asignada (0.5, 0.25, 
0.125, 0.125, respectivamente). Después de que el participante cumplía con el RF 
vigente, en la pantalla aparecía la leyenda Ganaste 5 puntos seguido por la oración En un 
momento iniciará un nuevo ensayo. Por el contrario, si el participante daba un clic sobre el 
cuadro de escape (RF 1), se terminaba el ensayo en curso, aparecía la leyenda En un 
momento iniciará un nuevo ensayo y dos segundos después iniciaba un nuevo ensayo. 
En la parte inferior de la pantalla se mostró el total de puntos obtenidos en los ensayos 
sucesivos con la leyenda Total:”, seguida de la cantidad de puntos ganada (Figura 1). 
Cada sesión tuvo una duración de 25 minutos. 
Las variables dependientes registradas fueron el porcentaje de ensayos con 
persistencia. Esto es, el total de veces que el participante obtuvo una recompensa 
correspondiente a un RF diferente del pequeño (Avila, et al., 2013) y la tasa de respuestas 
dividiendo el total de respuestas en el cuadro de respuestas entre la duración de la 
sesión. 
 
22 
 
 
 
 
Figura 1. Opciones de respuestas en la tarea del efecto del costo de la inversión. En la opción 
A) se presenta la contingencia programada al hacer clic en el cuadro de escape, cuadro amarillo. 
En la opción B) se presenta la contingencia al hacer clic repetidamente en cuadro de respuestas, 
cuadro blanco. 
Total: 0 
Haga clic con el mouse izquierdo para reiniciar el 
ensayo 
Haga clic con el mouse repetidamente en el 
cuadro derecho para ganar puntos 
Total: 0 
Haga clic con el mouse izquierdo para reiniciar el 
ensayo 
Haga clic con el mouse repetidamente en el 
cuadro derecho para ganar puntos 
Ganaste 5 puntos 
A) B) 
En un momento empezará 
un nuevo ensayo 
En un momento empezará 
un nuevo ensayo 
Total: 5 puntos 
Haga clic con el mouse izquierdo para reiniciar el 
ensayo 
Haga clic con el mouse repetidamente en el 
cuadro derecho para ganar puntos 
Total: 0 
Haga clic con el mouse izquierdo para reiniciar el 
ensayo 
Haga clic con el mouse repetidamente en el 
cuadro derecho para ganar puntos 
23 
 
Tarea de descuento temporal con ajuste de la magnitud 
En esta tarea no fue necesario un entrenamiento preliminar. Al inicio de la tarea, la 
pantalla de la computadora estaba en color negro. En el centro se encontraba un cuadro 
gris con un rectángulo con la etiqueta Iniciar. Una vez que el participante hacía clic sobre 
el botón Iniciar con el cursor del mouse, la pantalla cambiaba a color verde. En la parte 
superior de la pantalla de la computadora se presentó la leyenda Elige qué prefieres. 
Debajo de esta leyenda se encontraban dos cuadros blancos; en cada cuadro se 
encontraba escrita una cantidad de dinero hipotético, en una una recompensa grande con 
una demora de entrega y en otro una recompensa pequeña que se entregaba en ese 
momento. Debajo de cada cuadro se encontraba un botón rectangular que decía 
Seleccione esta opción. Las recompensas, grande y pequeña, se presentaban en el 
cuadro derecho o izquierdo aleatoriamente en cada elección. Los participantes tenían que 
hacer una serie de elecciones entre las dos recompensas mostradas y oprimir el botón 
correspondiente. 
Durante toda la sesión, la recompensa grande se mantuvo fija en $1000, mientras 
que la recompensa pequeña fue de $500 en la primera elección y varió en elecciones 
consecutivas por medio de un procedimiento de ajuste de la magnitud. Esto es, la 
magnitud de la recompensa pequeña se ajustó dependiendo de la ejecución previa del 
participante. Si el participante elegía la recompensa grande, en la siguiente elección la 
recompensa pequeña aumentaba en su magnitud. Por el contrario, si el participante 
elegía la recompensa pequeña en la siguiente elección esta disminuía. En cada ensayo la 
magnitud de la recompensa pequeña aumentaba o disminuía en la mitad del ajuste de la 
elección anterior, $250 en la segunda elección, $125 en la tercera, $62.50 en la cuarta y 
24 
 
así sucesivamente. 
Esta tarea estaba compuesta de seis elecciones por cada una de las siguientes 
demoras probadas: un día, una semana, un mes, seis meses, un año, seis años y 12 
años. Cada recompensa se presentó acompañada de la demora correspondiente como se 
muestra en la Figura 2 A. 
Tarea de descuento probabilístico con ajuste de la magnitud 
Esta tarea fue igual que la tarea de descuento temporal, la única diferencia fue que 
las cantidades de dinero estaban acompañadas por probabilidades de obtenerlas. Esta 
tarea estaba compuesta de seis elecciones por cada una de las siguientes probabilidades 
probadas: 0.95, 0.90, 0.75, 0.5, 0.25, 0.1, 0.05 (Figura 2 B). 
25 
 
 
Selecciones esta opción Seleccione esta opción 
Elige que prefieres 
$ 1000 en 12 años $ 750 en este momento 
Selecciones esta opción Seleccione esta opción 
Elige que prefieres 
$ 1000 con 95% de probabilidad 
de obtenerlos 
$ 750 seguros 
A) Tarea de descuento 
temporal 
B) Tarea de descuento 
probabilístico 
Figura 2. A) Pantalla que se presentan en cada elección en la tarea de descuento 
temporal. B) Pantalla que se presenta en cada elección para la tarea de descuento 
probabilístico. 
26 
 
Resultados 
Los resultados de este estudio se dividieron en dos secciones;en la primera se 
analizó únicamente la ejecución de los sujetos en la tarea del efecto del costo de la 
inversión, mientras que en la segunda se compararon las ejecuciones entre las tareas de 
descuento temporal y probabilístico con ajuste de la magnitud y la tarea del efecto del 
costo de la inversión. 
Para la tarea del efecto del costo de la inversión se registró el porcentaje de ensayos 
con persistencia y la tasa de respuestas como se definieron en el método. 
En la Figura 3 se muestran los datos de los participantes expuestos a una, tres o 
cinco sesiones de la terea del efecto del costo de la inversión (columnas). Como se 
observa en la figura, hubo mucha variabilidad entre participantes en el porcentaje de 
ensayos con persistencia. Los participantes expuestos solo a una sesión mostraron un 
porcentaje de ensayos con persistencia cercano al 100%. La mayoría de los participantes 
expuestos a tres sesiones persistieron consistentemente en las sesiones de exposición. 
Sin embargo, los participantes 12, 14 y 15 mostraron un decremento en la variable 
dependiente de la primera a la tercera sesión. Mientras que casi todos los participantes 
expuestos a cinco sesiones mostraron un porcentaje de ensayos con persistencia estable 
en las sesiones consecutivas. Para los participantes 3, 5, 6 y 9 el porcentaje de ensayos 
con persistencia disminuyó conforme aumentó el número de sesiones de exposición. 
 
27 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0
50
100
21 22 23 24 25 26 27 28 29 30 M
0
50
100
11 12 13 14 15 16 17 18 19 20 M
0
50
100
11 12 13 14 15 16 17 18 19 20 M
0
50
100
11 12 13 14 15 16 17 18 19 20
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
1 2 3 4 5 6 7 8 9 10 M
P
o
rc
en
ta
je
 d
e 
en
sa
yo
s 
co
n
 p
er
si
st
e
n
ci
a 
Participantes 
Primera 
sesión 
Segunda 
sesión 
Tercera 
sesión 
Cuarta 
sesión 
Quinta 
sesión 
Figura 3. Porcentaje de ensayos con persistencia por participante (barras rayadas). 
Promedio del porcentaje de ensayos con persistencia de todos los participantes en cada 
sesión (barras negras). 
28 
 
Independiente del número de sesiones de exposición al procedimiento, la mayoría 
de los participantes mostró un porcentaje de ensayos con persistencia estable entre 
sesiones. Debido a que no se encontró normalidad en los datos (D(90) = 0.31, p < 0.05), 
se realizó una comparación entre el porcentaje de ensayos con persistencia en cada 
sesión con una prueba estadística de Friedman y no se encontraron diferencias 
significativas en los participantes expuestos a tres sesiones (x2(2)= 0.09, p > 0.05) ni en 
los participantes expuestos a cinco sesiones (x2(4)=4.02, p >0.05). 
Por lo tanto, es posible que la ejecución en el procedimiento del efecto del costo de 
la inversión sea independiente del número de sesiones de exposición al mismo. Por esta 
razón, en los siguientes resultados se tomará el promedio de todas las sesiones de 
ensayos con persistencia para cada participante. 
En algunos estudios piloto previos a esta investigación se observó que el porcentaje 
de ensayos con persistencia tuvo una correlación con la tasa de respuestas al operando 
en el cual está vigente el programa de reforzamiento mixto. Específicamente, se encontró 
que las personas que persistían más en la tarea del efecto del costo de la inversión 
obtuvieron una tasa de respuestas más alta que las personas que persistían menos en la 
misma. En este trabajo también se averiguó la relación entre la tasa de respuestas y el 
porcentaje de ensayos con persistencia. 
En la Figura 4 se muestra la distribución de la tasa de respuestas de cada 
participante en relación con el porcentaje de ensayos con persistencia. Se observó que 
conforme aumentó el porcentaje de ensayos con persistencia la tasa de respuestas fue 
más alta; sin embargo, la correlación entre las variables dependientes no fue significativa 
(r = 0.230 p > 0.05). Esta falta de correlación pudo deberse al número relativamente 
29 
 
pequeño de sujetos y de sesiones de exposición al procedimiento. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
En el análisis previamente descrito se correlacionaron los promedios de las variables 
dependientes de los participantes. Es decir, se compararon datos de una sesión con 
promedios de tres o cinco sesiones. Por lo tanto, se hizo una correlacionaron de 
Spearman de las mismas variables dependientes, pero para cada sesión de cada 
participante. La correlación fue significativa (r = 0.44, p < 0.01) y los datos se observan en 
la Figura 5. 
0
20
40
60
80
100
120
140
0 20 40 60 80 100
Participantes 
Grupo 3 (n=10) 60
70
80
90
100
110
120
0 20 40 60 80 100
G1
G2
G3
T
a
s
a
 d
e
 r
e
s
p
u
e
s
ta
s
0
Porcentaje de ensayos con persistencia
T
a
s
a
 d
e
 r
e
s
p
u
e
s
ta
s
 (
r/
m
in
) 
Porcentaje de ensayos con persistencia 
Cinco sesiones 
Tres sesiones 
Una sesión 
Figura 4. Tasas de respuestas y porcentaje de ensayos con persistencia en la tarea del 
efecto del costo de la inversión. Se observan los datos individuales de los participantes 
expuestos a una (equis), tres (cuadros vacíos) o cinco sesiones experimentales (círculos 
vacíos). 
30 
 
 
 
 
 
 
 
 
 
 
 
 
 
Al igual que el porcentaje de ensayos con persistencia, se comparó las ejecuciones 
en las diferentes sesiones de exposición y no se encontraron diferencias significativas en 
el grupo expuesto a tres sesiones (x2(2)= 3.80, p > 0.05), ni en el grupo expuesto a cinco 
sesiones (x2(4)= 2.60, p > 0.05). Para las tareas de descuento temporal y descuento 
probabilístico con ajuste de la magnitud, se calcularon las tasas de descuento individuales 
(k). Los valores k oscilaron entre 0.0001 y 0.0721 para la tarea de descuento temporal y 
entre 0.0003 y 13.6259 para la tarea de descuento probabilístico (Tabla 1). 
 
Porcentaje de ensayos con 
persistencia 
0 
T
a
s
a
 d
e
 r
e
s
p
u
e
s
ta
s
 
(r
/m
in
) 
0 100 40 20 60 80 
Figura 5. Tasa de respuestas distribuidas según el porcentaje de ensayos con persistencia. 
Cada rombo representa una sesión de un participante. 
31 
 
Tabla 1 
Tasas de descuento temporal y probabilístico individuales 
 
Participante 
Descuento temporal Descuento probabilístico 
k R2 k R2 
1 0.0684** 0.9537 0.0194 0.1752 
2 0.0023* 0.7559 0.5305* 0.8945 
3 <0.0001* 0.9720 0.0855 0.3793 
4 0.0222** 0.9727 13.6259** 0.9232 
5 0.0029** 0.9822 0.6082* 0.8599 
6 0.0095* 0.6961 0.0003** 0.7561 
7 0.0134* 0.8666 13.7700** 0.9892 
8 0.0053** 0.9922 1.5692** 0.9658 
9 0.0014* 0.8572 0.2321** 0.9312 
10 0.0055** 0.9297 0.3156* 0.9004 
11 0.0004* 0.8681 1.0351** 0.996 
12 0.0032** 0.9293 2.6741* 0.8424 
13 0.0011** 0.9767 0.4937** 0.9428 
14 0.0097 0.5239 3.6207** 0.9855 
15 0.0034* 0.6179 1.1450** 0.9652 
16 0.0028** 0.0280 0.9899** 0.9661 
17 0.0016** 0.9567 1.2919** 0.9822 
18 0.0169** 0.962 2.6747** 0.9609 
19 0.0721* 0.5805 0.1068* 0.719 
20 0.0108** 0.9773 2.238* 0.5799 
21 0.0009** 0.8301 0.5077* 0.8989 
22 0.0048** 0.9942 0 1 
23 0.0002 0.3544 1.2644** 0.9622 
24 0.1213* 0.6035 0.5117** 0.9555 
25 <0.0001* 0.5467 12.7485* 0.595 
26 0.0247** 0.9674 0.3646* 0.8643 
32 
 
27 0.0002 0.3098 0.1892* 0.7404 
28 0.00025 0.4454 3.6489* 0.7951 
29 0.0002 0.2155 0.9835** 0.9952 
30 0.0028* 0.7237 1.0951** 0.996 
Promedio 0.0021 0.7463 0.0349 0.8505 
*p<0.05 
**p<0.01 
 
Como se observa en la Tabla 1, los valores k en la tarea de descuento temporal con 
ajuste de la magnitud fueron muy pequeños en comparación a la curva de ajuste 
mostrada en las gráficas individuales (Anexo 3). No se encontró una correlación 
significativa entre el porcentaje de ensayos con persistencia y el valor k de la tarea de 
descuento temporal (r = -0.07 p > 0.7) ni con la de la tarea de descuentoprobabilístico (r = 
0.245 p > 0.19). 
Debido a que las tasas de descuento variaron y que no todas tuvieron un buen 
ajuste a la curva hiperbólica se obtuvieron las áreas bajo la curva (AbC) de los puntos de 
indiferencia obtenidos en las dos tareas de descuento. 
El AbC es una variable dependiente ateórica dado que no es necesario que los 
datos muestren un ajuste hiperbólico. El AbC varía entre cero y uno, a diferencia de la 
tasa de descuento, cuyos valores pueden ser extremadamente chicos o muy grandes y, 
por lo tanto, perder sentido teórico. 
En la Figura 6 se muestran los valores del AbC distribuidos de acuerdo al porcentaje 
de ensayos con persistencia para cada participante. Para facilitar la descripción de los 
datos, los paneles se dividieron en cuadrantes. 
La mayoría de los participantes obtuvo un porcentaje de ensayos con persistencia 
33 
 
mayor al 50% y un AbC menor a 0.5. Cuatro participantes en la tarea de descuento 
temporal y dos participantes en la tarea de descuento probabilístico obtuvieron un AbC 
mayor a 0.5 y un porcentaje de ensayos con persistencia superior al 50% (cuadrantes 
superiores derechos). Tres participantes mostraron un porcentaje de ensayos con 
persistencia menor al 50% tanto en la tarea de descuento probabilístico como en la tarea 
de descuento temporal. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Discusión 
En este estudio se analizó la ejecución de 30 participantes expuestos a una, tres o 
0
0.25
0.5
0.75
1
0 25 50 75 100
G1
G2
G3
0
0.25
0.5
0.75
1
0 25 50 75 100
 DESCUENTO TEMPORAL DESCUENTO PROBABILÌSTICO 
Á
re
a
 b
a
jo
 la
 C
u
rv
a
 
Porcentaje de ensayos con persistencia 
Descuento temporal Descuento probabilístico 
A
b
C
 
Cinco sesiones 
Tres sesiones 
Una sesión 
0
20
40
60
80
100
120
140
0 20 40 60 80 100
Participantes 
Grupo 3 (n=10) 60
70
80
90
100
110
120
0 20 40 60 80 100
G1
G2
G3
T
a
s
a
 d
e
 r
e
s
p
u
e
s
ta
s
0
Porcentaje de ensayos con persistencia
Figura 6. Áreas bajo la curva (AbC) en la tarea de descuento temporal (panel izquierdo) y en 
la tarea de descuento probabilístico (panel derecho) distribuidas de acuerdo al porcentaje de 
ensayos con persistencia. Se observan los datos individuales de los participantes expuestos 
a una (equis), tres (cuadros vacíos) o cinco sesiones experimentales (círculos vacíos). Se 
encontró que; para los dos tipos de descuento, la mayoría de los participantes obtuvo un AbC 
menor a 0.5 y un porcentaje de ensayos con persistencia mayor al 50 % (cuadrantes 
inferiores derechos). 
34 
 
cinco sesiones de la tarea del efecto del costo de la inversión, a una tarea de descuento 
temporal y una de descuento probabilístico. La presente discusión se dividirá en dos 
secciones; en la primera sección se discutirán los resultados obtenidos por el efecto del 
número de sesiones de exposición a la tarea del efecto del costo de la inversión. En la 
segunda parte, se discutirá la comparación de la ejecución de los participantes en los tres 
procedimientos. 
En la ejecución de la tarea del efecto del costo de la inversión, globalmente, no hubo 
diferencias entre los participantes expuestos a diferentes números de sesiones a la tarea. 
Sólo tres participantes tienen una tendencia a disminuir el porcentaje de ensayos con 
persistencia con tres sesiones de exposición. Mientras que cuatro de diez participantes 
expuestos a cinco sesiones, redujeron su porcentaje de ensayos con persistencia. Estos 
resultados son congruentes a los reportados en otros estudios con humanos como sujetos 
experimentales (Macaskill & Hackenberg, 2013; Navarro & Fantino 2005; 2007). 
Particularmente, en el estudio de Macaskill y Hackenberg (2013) con el propósito de 
extender y generalizar los hallazgos encontrados en estudios con animales expusieron a 
55 participantes a una sesión de exposición a la tarea del efecto del costo de la inversión 
con los mismos parámetros establecidos en el presente estudio. Esto es, un programa 
con dos opciones de respuesta, una asociada a un requisito de respuestas seguido por la 
entrega de una recompensa y otra opción que terminaba el ensayo en curso, empezando 
con uno nuevo. La entrega del reforzador fue de acuerdo a un programa de reforzamiento 
mixto con cuatro requisitos de respuestas (RF10, RF40, RF80, RF160). El requisito de 
respuestas pequeño tenía la mayor probabilidad de estar vigente en cada ensayo. De esta 
forma, los sujetos obtendrían la mayor cantidad de reforzador si escapaban después de 
35 
 
cumplir el requisito de respuestas más chico programado sin haber sido reforzado. Del 
total de participantes expuestos a esta tarea, sólo ocho escaparon consistentemente al 
final de la primera sesión. En una condición consecutiva expusieron a los participantes 
que no escaparon en la primera sesión a una tarea similar con el requisito de respuesta 
más chico programado igual mientras que los otros requisitos de respuesta aumentaron al 
doble que la condición anterior. Otros participantes fueron expuestos a una condición 
donde señalaron el incremento a los requisitos de respuestas, haciendo saliente el 
momento donde los participantes debían de terminar el ensayo en curso para comenzar 
uno nuevo para obtener la mayor cantidad de recompensas con menos esfuerzo. En las 
condiciones descritas, el 80% de los participantes redujo su porcentaje de ensayos con 
persistencia en comparación a la condición inicial. Aunque los resultados con humanos 
fueron similares a los obtenidos con los animales, hubo mucha variabilidad en los 
resultados desde la primera sesión. 
Los autores sugirieron que la diferencia en los resultados obtenidos en su estudio 
con los reportados con animales, podía deberse a la diferencia en el número de sesiones 
de exposición. No obstante, en el Estudio 1 de la presente tesis se observó la misma 
variabilidad en el porcentaje de ensayos con persistencia exponiendo a los participantes a 
una, tres o cinco sesiones, donde la mayoría de los participantes persiste. Esto sugiere 
que las sesiones de exposición a la tarea del efecto del costo de la inversión no influyen 
en la persistencia de los participantes. 
Una explicación propuesta por Macaskill y Hackenberg fue que la variabilidad se 
debe a las diferencias en la historia de reforzamiento de cada participante. Esta idea es 
apoyada por el efecto de historia encontrada en su estudio y en estudios con animales 
36 
 
(Macaskill & Hackenberg, 2012a). 
Otra posible explicación al alto porcentaje de ensayos con persistencia observados 
en este estudio es que los participantes no comprendieran las instrucciones. Por medio de 
reportes verbales no registrados, algunos participantes mencionaron que no entendían la 
función del cuadro amarillo (cuadro de escape), por lo que no lo oprimían. Aparentemente, 
variar las instrucciones para que los participantes entren en contacto con las dos opciones 
de respuestas no varía la ejecución de los participantes (e.g. Macaskill y Hackenberg; 
2013); sin embargo, la posibilidad de la comprensión de las leyendas presentadas en esta 
tarea pudieron haber influido en la ejecución de los participantes. Esta posibilidad se 
probó en el Estudio 2. 
Durante el análisis de las ejecuciones de los participantes se observó una tendencia 
creciente en la tasa de respuestas en relación al porcentaje de ensayos con persistencia. 
Los participantes con porcentaje de ensayos con persistencia superiores al 50% muestran 
una tasa de respuestas más alta que los participantes que no persisten. Aunque esta 
tendencia no fue significativa puede ser una pista en relación a la sensibilidad a las 
contingencias programadas. Esta idea es apoyada por resultados reportados por 
Darcheville, Rivière y Wearden (1992). En su estudio expusieron a niños de seis años a 
un procedimiento de autocontrol y a un programa de reforzamiento de intervalo fijo. Se 
observóque los niños que se comportaban de manera autocontrolada, mostraban una 
tasa de respuestas baja en el programa de intervalo fijo, mientras que los participantes 
que tenían una tasa de respuestas alta elegían la recompensa pequeña menos 
demorada. Los autores sugirieron que los participantes impulsivos eran poco sensibles a 
las variables que modulan la estimación temporal. En este sentido, es posible que la tasa 
37 
 
de respuestas influya en la sensibilidad a los requisitos de respuesta del arreglo probado 
en el procedimiento del costo de la inversión, que decrementa la maximización de las 
recompensas. Se sugiere explorar las tasas de respuestas en un programa del efecto del 
costo de la inversión de manera detallada, por ejemplo cambiar los programas de razón 
fija por programas de intervalo fijo para observar el patrón de respuestas en el intervalo 
entre reforzadores. 
En la ejecución de los participantes en las tareas de descuento temporal y 
probabilístico con ajuste de la magnitud, se calcularon las tasas de descuento 
individuales. Se observó variabilidad entre los participantes y en las dos tareas de 
descuento. La diferencia en las tasas de descuento son congruentes con las reportadas 
en la literatura (véase Green & Myerson, 2010). Aunque en ambas tareas se ha 
considerado como conducta autocontrolada la maximización de ganancias y reducción de 
pérdidas, algunos autores han referido que las diferencias en estas tareas en los mismos 
participantes, se deben a diferentes procesos (Green & Myerson, 2010). 
Adicionalmente, la tasa de descuento en la tarea de descuento temporal observada 
fue muy chica, a pesar de que la curva fue pronunciada (ver Anexo 3), esta observación 
se retomará en la discusión general. Debido a lo anterior en este estudio se calcularon las 
áreas bajo la curva (AbC), que es un análisis que no depende del ajuste a la función de 
descuento y normaliza los valores haciendo posible la comparación entre participantes y 
entre procedimientos. La mayoría de los participantes obtuvo un AbC menor a 0.5 en 
ambas tareas, de los cuales la mayoría de participantes obtuvo un porcentaje de ensayos 
con persistencia superior al 50 %. Por otro lado, se observaron algunos participantes que 
obtuvieron AbC superiores a 0.5 y que persistieron en la mayoría de los ensayos, así 
38 
 
como participantes que obtuvieron un AbC menor a 0.5 y un porcentaje de ensayos con 
persistencia bajo. 
Particularmente las bajas AbC observadas en la tarea de descuento probabilístico 
coinciden con los participantes que incurren en el efecto del costo de la inversión. Estos 
resultados, son similares a los reportados en estudios con viñetas. Zeelenberg y Dijk 
(1997) en cuestionarios de lápiz y papel plantearon situaciones con o sin inversión física 
hipotéticas, seguidas por una elección entre obtener una recompensa grande con una 
probabilidad de 0.5 de obtenerla o una recompensa pequeña pero segura. Los autores 
reportaron que los participantes que fueron expuestos al escenario con inversión elegían 
la recompensa segura, a diferencia de los participantes sin una inversión previa a la 
elección quienes fueron indiferentes a las opciones. Los resultados previamente descritos 
y los obtenidos en la presente tesis sugieren que los participantes que incurren en el costo 
de la inversión muestran conducta de aversión al riesgo. 
Por otra parte, en los datos obtenidos con la tarea de descuento temporal con ajuste 
de la magnitud se observó que la mayoría de los participantes que obtuvieron un AbC 
menor al 0.5 son los que persistieron más de la mitad de los ensayos en la tarea del costo 
de la inversión. En un sentido estricto estos resultados sugieren que los participantes no 
maximizaron las ganancias con recompensas demoradas ni en tareas con esfuerzo como 
inversión implicada. Estos datos parecen indicar que persistir o no persistir no varía 
independientemente de las contingencias programadas para maximizar las ganancias. 
La idea anterior tiene sentido si consideramos que la tarea de descuento temporal 
permite estudiar el descuento del valor subjetivo de una recompensa en función del 
tiempo. Asimismo, el valor subjetivo de una recompensa está asociado en el 
39 
 
mantenimiento en un curso de acción que puede incrementar las ganancias globales 
(Logue, 1988; Rachlin, 2000). En este sentido, una AbC baja indica que el participante no 
mantenga una elección por una recompensa grande demorada lo que no maximizaría las 
recompensas globales. 
No obstante, las demoras probadas en la tarea de descuento temporal son mayores 
a las demoras de la ejecución de un participante, desde que inicia un ensayo hasta que 
obtiene la recompensa en la tarea del efecto del costo de la inversión. En un 
procedimiento de elección con compromiso con demoras reales, podrían probarse 
demoras similares en la tarea del efecto del costo de la inversión. 
Otro procedimiento en el que las demoras pueden ser similares y que permite el 
estudio del mantenimiento de una elección por la recompensa grande demorada es el de 
demora de la gratificación. Este procedimiento es parecido al empleado en el de costo de 
la inversión en donde puede elegir continuar con un curso de acción o desistir en 
cualquier momento antes de obtener la recompensa. En el Estudio 2 se comparan las 
ejecuciones de participantes expuestos a la tarea del efecto del costo de la inversión, a la 
tarea de elección con compromiso y a la tarea de demora de la gratificación. 
Estudio 2 
El Estudio 2 tiene dos objetivos; el primero fue averiguar si las instrucciones en la 
tarea del efecto del costo de la inversión afectaron la ejecución de los participantes del 
Estudio 1; el segundo propósito fue determinar la viabilidad la conducta de persistir o no 
persistir como componente fundamental en la maximización de las recompensas, que 
facilita la relación entre las tareas de elección con compromiso, demora de la gratificación 
y efecto del costo de la inversión 
40 
 
Método 
Participantes 
Participaron cinco estudiantes de universidad en un rango de edad de 18 a 22 años 
(M = 19.6, DE = 1.5). Se invitó a estudiantes de un curso de licenciatura de psicología de 
segundo semestre a participar en un estudio sobre toma de decisiones. Los interesados 
acordaron los horarios por correo electrónico con la experimentadora. 
Materiales 
El presente estudio se llevó a cabo en un cubículo de 2x3 m, acondicionado con tres 
escritorios, cada uno con una computadora de escritorio y una silla. Los escritorios 
estaban separados uno del otro por una cortina. Se trabajó con un máximo de dos 
personas al mismo tiempo. Las computadoras fueron marca Dell ®, equipadas con un 
monitor de 16 pulgadas y un mouse óptico. La tarea del efecto del costo de la inversión 
fue programada en Visual Basic ® 6.0, mientras que las tareas de elección y demora de la 
gratificación se programaron con Java ® 7. 
Procedimiento 
Para mejorar la comprensión de la tarea del efecto del costo de la inversión, diez 
estudiantes de segundo y cuarto semestre de licenciatura de la Facultad de Psicología 
contestaron voluntariamente un cuestionario sobre la comprensión de las instrucciones. 
Esto fue para tener los registros precisos de qué parte de la tarea quedaba poco clara. A 
cada participante se le presentó una serie de hojas que incluía esquemas de la tarea 
experimental con las leyendas correspondientes y se les pidió que contestaran las 
preguntas correspondientes (Anexo 2). 
Posteriormente, la leyenda “Haga clic con el mouse en el cuadro izquierdo para 
41 
 
reiniciar el ensayo” fue reemplazada por la leyenda “Haga clic con el mouse en el cuadro 
izquierdo para comenzar un nuevo ensayo” (Figura 7). Esta nueva leyenda fue evaluada 
por siete jueces, seis mujeres y un hombre. 
Debido a la muerte experimental observada en el Estudio 1 se invitó a alumnos de 
segundo semestre

Continuar navegando