Relacion-funcional-entre-metodos-de-autocontrol--costo-de-la-inversion-eleccion-y-demora-de-la-gratificacion

•

Biológicas / Saúde

Medicina Fácil

9/8/2022

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Medicina

246.824 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

UNIVERSIDAD NACIONAL
AUTÓNOMA DE MÉXICO

FACULTAD DE PSICOLOGÍA

RELACIÓN FUNCIONAL ENTRE MÉTODOS
DE AUTOCONTROL: COSTO DE LA
INVERSIÓN, ELECCIÓN Y DEMORA DE LA
GRATIFICACIÓN

T E S I S
QUE PARA OBTENER EL GRADO DE LICENCIADA EN
PSICOLOGÍA
PRESENTA:
VIOLETA IXCHEL OLGUÍN RUIZ

DIRECTOR DE TESIS:
DR. RAÚL ÁVILA SANTIBAÑEZ
REVISOR METODOLÓGICO:
DR. CARLOS SANTOYO VELAZCO

COMITÉ:
DRA. SILVIA MORALES CHAINÉ
DR. VLADIMIR ORDUÑA TRUJILLO
DR. ROGELIO ESCOBAR HERNÁNDEZ

Ciudad Universitaria, Ciudad de México, 2018

UNAM – Dirección General de Bibliotecas
Tesis Digitales
Restricciones de uso

DERECHOS RESERVADOS ©
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL

Todo el material contenido en esta tesis esta protegido por la Ley Federal
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México).
El uso de imágenes, fragmentos de videos, y demás material que sea
objeto de protección de los derechos de autor, será exclusivamente para
fines educativos e informativos y deberá citar la fuente donde la obtuvo
mencionando el autor o autores. Cualquier uso distinto como el lucro,
reproducción, edición o modificación, será perseguido y sancionado por el
respectivo titular de los Derechos de Autor.

RELACIÓN FUNCIONAL ENTRE MÉTODOS DE AUTOCONTROL: COSTO DE LA
INVERSIÓN, ELECCIÓN Y DEMORA DE LA GRATIFICACIÓN
II

La presente tesis se realizó con el apoyo y financiamiento del proyecto PAPIIT
IN302916 Integración de los procedimientos de autocontrol conforme a sus variables
comunes, usando humanos como sujetos autorizado por la Dirección General de
Asunto del Personal Académico (DGAPA) de la Universidad Nacional Autónoma de
México (UNAM), otorgado al director de esta tesis, el Dr. Raúl Ávila Santibáñez.

III

Para Elizabeth Villanueva.
Porque siempre encontraste la manera para que
yo pudiera ver claramente el camino. Lo logré
gracias a ti.

Agradecimientos

Al Dr. Raúl Ávila, por los años que me ha permitido aprender de usted para crecer
académicamente.
A mi revisor metodológico, el Dr. Carlos Santoyo, por sus observaciones y comentarios
tan importantes para complementar este trabajo.
A mis sinodales, la Dra. Silvia Morales, por su apoyo en esta tesis. Al Dr. Vladimir
Orduña, por sus sugerencias que me ayudaron a aprender más y mejorar mi trabajo. Al
Dr. Rogelio Escobar, por sus sugerencias, aportaciones e interés a este trabajo.
A toda mi familia, por su apoyo, paciencia y comprensión. Porque, aunque cada vez los
veo menos, siempre me apoyan y me recuerdan que estar lejos de ellos es una
inversión y que yo tengo que hacer que valga la pena.
A mi hermano y a César por ayudarme en los momentos más complicados y que, a su
manera, siempre me animaron a seguir con la tesis.
A todos mis amigos y amigas que, aunque casi no los veo, me han ayudado mucho
para llegar hasta este punto de mi vida.
A todos los integrantes de LAEC. Los quiero mucho y los admiro por sus cualidades tan
particulares de cada uno, nunca dejan de sorprenderme. Porque aunque las cosas se
vuelvan complicadas ustedes siempre persisten y continúan en el laboratorio.
A la Sra. Soledad, que también es parte del laboratorio, que nos ha apoyado y cuidado
mucho a los alumnos del Dr. Ávila.
Un agradecimiento especial a Brasil y Moisés que me ayudaron en los detalles finales
de esta tesis.
A todos mis participantes por su apoyo e interés en este estudio, que se mostró en
largas pláticas posteriores al estudio.
De nuevo, gracias por todo, César, porque estás enamorado de la vida y por eso hay
tanta pasión en lo que haces, y por permitirme vivir enamorada de ti.
V

ÍNDICE
Resumen........................................................................................................................................ 1
Introducción ................................................................................................................................... 2
Conducta autocontrolada e impulsiva ................................................................................... 2
Elección con compromiso........................................................................................................ 3
Demora de la gratificación....................................................................................................... 8
Efecto del costo de la inversión............................................................................................11
Propósito del estudio..............................................................................................................14
Estudio 1 ......................................................................................................................................16
Método ......................................................................................................................................17
Participantes. .......................................................................................................................17
Materiales. ............................................................................................................................17
Procedimiento. .....................................................................................................................18
Resultados ...............................................................................................................................26
Discusión ..................................................................................................................................33
Estudio 2 ......................................................................................................................................39
Método ......................................................................................................................................40
Participantes. .......................................................................................................................40
Materiales. ............................................................................................................................40
Procedimiento. .....................................................................................................................40
Resultados ...............................................................................................................................49
Discusión ..................................................................................................................................54
Discusión general .......................................................................................................................58
Referencias..................................................................................................................................65
Anexo 1 ........................................................................................................................................70
VI

Anexo 2 ........................................................................................................................................71
Anexo 3 ........................................................................................................................................73
Anexo 4 ........................................................................................................................................73
Anexo 5 ........................................................................................................................................77

VII

ÍNDICE DE FIGURAS Y TABLAS
Figura 1. Opciones de respuestas en la tarea del efecto del costo de la inversión.. ......22
Figura 2. Tarea de descuento temporal y tarea de descuento probabilístico...................25Figura 3. Porcentaje de ensayos con persistencia ...............................................................27
Figura 4. Tasas de respuestas y porcentaje de ensayos con persistencia ......................29
Figura 5. Tasa de respuestas distribuidas según el porcentaje de ensayos con
persistencia. ................................................................................................................................30
Tabla 1 Tasas de descuento temporal y probabilístico individuales.....…………………31
Figura 6. Áreas bajo la curva distribuidas de acuerdo al porcentaje de ensayos con
persistencia..................................................................................................................................33
Figura 7. Tarea del efecto del costo de la inversión con leyenda modificada ..................42
Figura 8. Esquema de un ensayo de elección libre en la tarea de demora de la
gratificación. ................................................................................................................................46
Figura 9. Esquema de un ensayo de elección libre en la tarea de elección con
compromiso. ................................................................................................................................48
Figura 10. Tasas de respuestas y porcentaje de ensayos con persistencia en la tarea
del efecto del costo de la inversión .........................................................................................50
Figura 11. Tasa de respuestas distribuidas según el porcentaje de ensayos con
persistencia..................................................................................................................................51
Figura 12. Porcentaje de ensayos con reforzadores grandes demorados obtenidos y de
escapes ........................................................................................................................................52
Figura 13. Porcentaje de ensayos con escapes en la tarea del efecto del costo y
porcentaje de ensayos con reversión en la tarea de demora de la gratificación .............54
1

Resumen
En la presente tesis, en dos estudios se determinó la viabilidad de la conducta de
persistir en los procedimientos de autocontrol como el componente fundamental en la
maximización de las recompensas en tres tareas de autocontrol: efecto del costo de la
inversión, elección con compromiso y demora de la gratificación. En el primer estudio se
expusieron a 30 participantes a una tarea del efecto del costo de la inversión, dos tareas
de descuento, temporal y probabilístico con ajuste de la magnitud. Se encontró que la
mayoría de los participantes persistieron en la tarea del efecto del costo de la inversión,
así como obtuvieron un área bajo la curva pequeña en las tareas de descuento temporal y
probabilístico. Por lo que los participantes maximizaron las ganancias solo en la tarea de
descuento probabilístico. En el Estudio 2 se expusieron a cinco participantes a los
procedimientos de elección con compromiso, demora de la gratificación y de costo de la
inversión. Todos los participantes maximizaron las ganancias en la tarea de elección con
compromiso pero, solo tres participantes maximizaron en la tarea de demora de la
gratificación y solo un participante maximizó las ganancias en la tarea del efecto del costo
de la inversión. Los resultados de ambos estudios sugieren que puede haber una relación
entre el procedimiento de descuento temporal con ajuste de la magnitud y efecto del costo
de la inversión. Por otro lado, parece haber una relación entre el patrón de persistir en las
tareas del costo de la inversión y de demora de la gratificación.
Palabras clave: efecto del costo de la inversión, demora de la gratificación, descuento
temporal, descuento probabilístico.2

Introducción
En los últimos 40 años, ha habido un incremento en la investigación sobre el
autocontrol en el área del análisis experimental de la conducta. Este interés general
resultó en la proliferación de una amplia variedad de procedimientos que, aunque
permiten estudiar y entender aspectos específicos de la conducta autocontrolada, pueden
dificultar la comprensión del fenómeno en sí mismo.
Esta tesis se concentró en tres procedimientos para estudiar la conducta
autocontrolada, específicamente, elección con compromiso, demora de la gratificación y el
efecto del costo de la inversión. De la literatura que se presenta en esta introducción, se
deduce que un proceso común de estos procedimientos es la maximización de las
recompensas; la manera de maximizar es persistir o no en un curso de acción,
dependiendo de cada procedimiento. Este proceso común podría mejorar la comprensión
de los tres procedimientos previamente mencionados.
Para facilitar la lectura del presente trabajo, la introducción se estructuró de la
siguiente forma: en la primera parte, se presenta el concepto de conducta autocontrolada;
en la segunda parte se describen los procedimientos de elección con compromiso,
demora de la gratificación y efecto del costo de la inversión; finalmente, en la tercera
parte, se presenta el propósito de la presente tesis.
Conducta autocontrolada e impulsiva
La conducta autocontrolada ha sido definida como la elección de una opción que
maximiza las ganancias y disminuye las pérdidas; mientras que su antónimo, la conducta
impulsiva no aumenta o disminuye las ganancias (véase Green & Myerson, 2010). Sin
embargo, dada la variedad de procedimientos sobre conducta autocontrolada existen
3

otras definiciones. Por ejemplo, en un procedimiento de elección entre pares de
recompensas que difieren en magnitud y demora de entrega, la conducta autocontrolada
es definida como elegir una recompensa grande demorada en lugar de una recompensa
pequeña de menor magnitud que podría ser obtenida inmediatamente (Logue, 1988;
Rachlin & Green, 1972). Por otro lado, en un procedimiento de demora de la gratificación,
esperar por una recompensa grande en lugar de consumir una recompensa pequeña
presente es ejemplo de conducta autocotrolada (e.g., Mischel & Ebbesen, 1976). No
obstante, en ambos procedimientos la conducta autocontrolada implica el proceso de
maximización global de las ganancias, por lo que se incluyen en la primera definición
descrita.
Un caso especial de la conducta impulsiva es el efecto del costo de la inversión. Esta
conducta implica mantenerse en un curso de acción poco redituable solo por las
inversiones previas. En este ejemplo, desistir del curso de acción maximiza las ganancias,
por lo que podría considerarse como conducta autocontrolada.
En las siguientes secciones se describe cada procedimiento, así como algunas de
las principales variables estudiadas, destacando el proceso de la maximización.
Elección con compromiso
El procedimiento de elección con compromiso, consiste en exponer a sujetos a pares
de recompensas, una grande demorada y una chica inmediata. Usualmente, en este
procedimiento se mantiene constante la duración del ensayo, por lo que si un sujeto se
mantiene eligiendo la opción grande, obtiene la mayor cantidad de recompensa disponible
en la sesión experimental; esta conducta se considera una conducta autocontrolada
(Logue, 1988). En este procedimiento, una vez que los sujetos eligen la recompensa
4

grande no pueden cambiar de elección durante el periodo de demora, por lo que este
procedimiento es conocido como elección con compromiso (Rachlin & Green, 1972;
Rachlin, 2000).
El estudio pionero de elección con compromiso consistió en exponer a palomas a un
programa concurrente encadenado. En el primer eslabón se activaron dos teclas (A y B),
si la paloma picaba la tecla A resultaba en una demora seguida por la activación de dos
teclas de respuesta. En este eslabón, cada tecla estaba asociada a una recompensa, una
grande con una demora de entrega y una chica inmediata con un tiempo fuera para
igualar el tiempo de las dos opciones. Por otro lado, si la paloma picaba la tecla B, se
presentaba una demora seguida de la activación de la tecla asociada a la recompensa
grande, pero demorada (Rachlin & Green, 1972).
El procedimiento previamente mencionado ha sido adaptado de diferentes formas
para estudiarse con humanos. Asímismo, con la finalidad de hacer los estudios entre
humanos y animales lo más comparables posible, se han explorado las elecciones con
recompensas consumibles. Por ejemplo, Forzano, Michels, Sorama, Etopio y English
(2014) compararon la ejecución de participantes con diferentes recompensas (jugo o
fragmentos de videos). Los autores reportaron que todos los participantes eligieron la
opción grande demorada alrededor del 60% de las veces con videos como recompensa y
alrededor de 50% en el caso del jugo como recompensa; sin embargo, encontraron un
efecto de saciedad con el jugo y no con la reproducción de videos.
En otro estudio, Campos (2016) utilizó el acceso a videos como recompensa. La
autora expuso a 60 participantes a una sesión en el que se le presentaban al participante
dos cuadros en el centro de la pantalla, uno azul y el otro verde. El cuadro azul estaba
5

asociado a una demora de 1 s seguida de la reproducción durante 6 s de un video; al
finalizar la reproducción del video, comenzaba un periodo de tiempo fuera donde no había
ningún estímulo en la pantalla, hasta que se completara el tiempo del ensayo. El otro
cuadro estaba asociado a una demora de 30 s, seguida de la reproducción durante 18 s
del mismo video. Al igual que en el estudio anterior, los participantes eligieron la opción
grande demorada alrededor del 70% de los ensayos.
Tanto con las variaciones como con el procedimiento pionero se ha probado la
demora de entrega de la recompensa grande, manteniendo la duración de los ensayos
constante tanto en animales no humanos (e.g., Chelonis & Logue, 1997; Rachlin & Green,
1972; Reynolds, De Wit, & Richards, 2002) como en humanos (Green & Myerson, 2004;
Holt, Green, & Myerson, 2012). En general, se ha reportado que las elecciones a la
recompensa grande demorada disminuyen conforme aumenta la demora para obtener
esa recompensa.
Un proceso relacionado a las elecciones por una recompensa grande demorada es
el descuento del valor subjetivo a través del tiempo. Esto es, que el valor que el sujeto le
atribuye a una recompensa (i.e., el valor subjetivo) disminuye conforme aumenta la
demora de entrega de la misma, por lo tanto, las elecciones por la recompensa grande
demorada también disminuyen (Green & Myerson, 2004).
Comúnmente, el descuento del valor subjetivo se ha estudiado con el ajuste de la
magnitud de la demora de la recompensa grande (Mazur, 1988) y con el ajuste de la
magnitud de la recompensa chica (e.g. Green & Myerson, 2004). Ambos son una
variación de la situación de elección mencionada anteriormente. Específicamente, en la
segunda variación, la recompensa grande se mantiene fija, mientras que la magnitud de la
6

recompensa chica se ajusta en cada elección dependiendo de la ejecución del sujeto. Así,
la recompensa pequeña aumenta si previamente el sujeto eligió la recompensa grande o
disminuye si eligió la recompensa pequeña. En esta tesis referiremos a este
procedimiento como descuento temporal con ajuste de la magnitud.
Por medio del ajuste de la magnitud se puede obtener un punto de indiferencia por
cada demora probada. Esto es, el valor de la recompensa chica cuando la elección del
participante es indiferente entre las dos recompensas. Este punto de indiferencia es
considerado el valor subjetivo atribuido a la recompensa grande en una demora dada.
Mazur (1987) sugirió la función hiperbólica como un modelo que describe el
descuentodel valor subjetivo de una recompensa en función de una variable como el
tiempo o la probabilidad, por medio de los puntos de indiferencia. La ecuación es la
siguiente:
𝑉 =
𝐴
1+ 𝑘𝐷

Donde V es el valor subjetivo, A es la magnitud real de la recompensa, D es la
variable de la que el descuento está en función (demora o probabilidad de entrega de la
recompensa), y k es la tasa de descuento, es decir, la relación del decremento del valor
subjetivo de la recompensa conforme aumenta D.
Una tasa de descuento baja indica que el valor subjetivo de la recompensa se
mantiene relativamente constante a través de las demoras probadas. Un sujeto con una
tasa de descuento baja elige consistentemente las elecciones por la recompensa grande
demorada. Por otro lado, una tasa de descuento alta indica que el valor subjetivo de la
recompensa es descontado rápidamente; los sujetos con una tasa de descuento alta
7

eligen la recompensa inmediata de menor magnitud (Rachlin, 2000). De esta forma, la
tasa de descuento es considerada un indicador de conducta autocontrolada (Green &
Myerson, 2004).
Un análisis alterno al ajuste hiperbólico es obtener el área bajo la curva (AbC), es
decir, el área generada por los puntos de indiferencia en las diferentes demoras. El AbC
es una medida ateórica por lo que no depende del ajuste de los puntos de indiferencia a
alguna función de descuento (Myerson, Green, & Warusawitharana, 2001). Para obtener
el AbC se deben de normalizar los valores de los puntos de indiferencia y las demoras,
esta variable dependiente oscila entre cero y uno. Un AbC con un valor cercano a uno se
relaciona con elecciones a la recompensa grande, lo que a su vez maximizaría las
ganancias globales.
El procedimiento previamente descrito también se ha utilizado como un indicador
para estudiar la conducta de propensión al riesgo (Green & Myerson, 2004; Green &
Myerson, 2010). El procedimiento de descuento probabilístico con ajuste de la magnitud
consiste en exponer a sujetos a elecciones entre pares de recompensas que difieren en
magnitud y probabilidad de entrega. Al igual que el descuento temporal con ajuste de la
magnitud, en este procedimiento se calculan las tasas de descuento así como las AbC.
Una tasa de descuento baja y una AbC alta se relaciona con una conducta de propensión
al riesgo, debido a que el valor subjetivo de la recompensa se mantiene estable a pesar
de que aumenten las probabilidades en contra de obtener la recompensa (Green &
Myerson, 2010).
Como se mencionó al inicio de la sección, en este procedimiento no se puede
cambiar la opción elegida. En este sentido, maximizar las recompensas resulta de elegir
8

la recompensa grande demorada. Un procedimiento que permite el cambio de opción
después de la elección inicial es el de demora de la gratificación.
Demora de la gratificación
Típicamente, en este procedimiento se expone a un participante a una sola elección
entre una recompensa pequeña o menos preferida que podría obtener en ese instante, y
una recompensa de mayor magnitud o más preferida que podría obtener después de un
tiempo de espera. Sin embargo, si el sujeto elige la segunda opción, durante el periodo de
espera puede revertir la elección, es decir, emitir una respuesta para obtener la
recompensa de menor magnitud. En este sentido, la conducta autocontrolada implica que
el sujeto elija la recompensa grande demorada y persista en esta hasta obtenerla.
El primer estudio de demora de la gratificación en un ambiente experimental fue el
de Mischel y Ebbesen (1970) con niños de aproximadamente 4 años de edad. Los niños
podían esperar 15 min para obtener la recompensa preferida o revertir su elección
durante la espera de la recompensa grande. El estudio consistía en cuatro grupos
experimentales, cada uno podía tener presente una, las dos o ninguna recompensa. Los
autores encontraron que los niños esperaban en promedio 11 minutos cuando ninguna de
las recompensas estaba presente y 1 minuto cuando ambas estaban presentes. En los
grupos donde estaba presente la recompensa demorada esperaron 5 minutos en
promedio, cuando estaba presente la inmediata esperaron en promedio 6 minutos. Los
autores concluyeron que cuando las recompensas están presentes hay menos conducta
autocontrolada en comparación con las condiciones donde solo se muestra una de las
recompensas o ninguna.
Grosch y Neuringer (1981) adaptaron el paradigma de demora de la gratificación a
9

un procedimiento con palomas. En su estudio, los autores expusieron a palomas entre 10
y 20 sesiones consecutivas. Cada sesión estaba conformada por 30 elecciones entre
reforzadores de diferente calidad y demora de entrega. Los autores reportaron resultados
similares que en el estudio de Mischel y Ebbesen. Sin embargo registraron que la
conducta de reversión disminuyó cerca de la mitad en los últimos ensayos en
comparación con los primeros.
Este procedimiento también se ha probado en ratas privadas de agua, haciendo
comparables los procedimientos de elección con compromiso y demora de la gratificación
(Reynolds, de Wit, & Richards, 2002). Cada rata fue expuesta a elecciones entre una
cantidad de agua pequeña inmediata y una cantidad de agua grande, pero demorada.
Todas las ratas fueron expuestas a 25 sesiones de 50 ensayos cada una. Un grupo de
ratas fue expuesto al procedimiento de elección con compromiso y otro grupo de ratas al
procedimiento de demora de la gratificación. La única diferencia fue que las ratas
expuestas al procedimiento de demora de la gratificación podían revertir sus respuestas.
En este estudio, se varió la demora de entrega de la recompensa grande de cero a 32 s.
Encontraron que conforme aumenta la demora aumentan las respuestas de reversión, de
virtualmente 0% de los ensayos en la demora de 4 s a casi 20% en la demora de 32 s
para las ratas expuestas al procedimiento de demora de la gratificación y de 0% a 50% en
las ratas expuestas al procedimiento de elección con compromiso.
Debido a que en los estudios de demora de la gratificación en humanos utilizan un
solo un ensayo, Ávila, Ortega y Jardines (2018) averiguaron el efecto de aumentar el
número de ensayos de exposición a este procedimiento, con el propósito de hacer más
comparable los resultados entre especies. En un primer experimento, los autores
10

expusieron a 15 participantes de un rango de edad de 18 a 30 años a una tarea por
computadora con videos como recompensa en una sesión experimental conformada por
30 ensayos. Cada ensayo iniciaba con dos cuadros, uno rojo y uno verde, ubicados en el
centro de la pantalla de la computadora con fondo gris. El cuadro rojo estaba asociado a
una demora de 2 s seguida por la reproducción de un video durante 8 s, una vez que
terminaba la reproducción del video, la pantalla de la computadora permanecía en negro
por el tiempo restante del ensayo. El cuadro verde estaba asociado a una demora de 32 s
seguida de la reproducción de un video durante 32 s, el periodo de demora se señaló con
el cambio de color del fondo de la pantalla a verde y la presencia de un cuadro rojo. Si el
participante hacía clic con el cursor del mouse sobre el cuadro rojo durante el tiempo de
espera por el video de mayor magnitud, se cancelaba la entrega del video con mayor
duración y entraba en efecto la contingencia programada para el cuadro rojo. Ávila y
colaboradores reportaron que los participantes emitieron pocas respuestas de reversión
que ocurrieron en los primeros 15 ensayos de la tarea. Sugirieron que el decremento de
respuestas de reversión podía deberse a los ensayos de exposición a la tarea.
En el Experimento 2 del estudio de Ávila et al. expusieron a cinco participantes a
diez sesiones a la tarea demora de la gratificación para explorar la ejecución de los
participantes en esta tarea con más de una sesión de exposición. Adicionalmente,variaron las demoras de entrega de la recompensa grande. Los autores encontraron una
tendencia decreciente de las recompensas grandes demoradas obtenidas conforme
incrementó la demora de entrega por la recompensa grande, así como un nivel
relativamente bajo de reversiones que ocurrieron al inicio de cada sesión. En resumen,
parece que el tiempo de exposición a la tarea disminuye las respuestas de reversión; este
11

hallazgo es similar a los resultados reportados con otras especies (e.g. Grosch &
Neuringer, 1981).
Al mantener constante la duración y el número de ensayos, independientemente de
las elecciones de los sujetos, la manera de obtener la mayor cantidad de recompensas es
elegir consistentemente la opción grande demorada y persistir en esta elección. Otro
procedimiento en el que también se puede maximizar las ganancias globales que
involucra el mantenimiento de una respuesta es el efecto del costo de la inversión.
Efecto del costo de la inversión
El efecto del costo de la inversión es definido como la tendencia a continuar en un
curso de acción poco o nada redituable en el que ya se ha hecho una inversión previa
(Arkes & Blumer, 1985; Navarro & Fantino, 2005). Es considerado un caso especial del
autocontrol porque continuar en un curso de acción no maximiza las ganancias, por el
contrario, aumenta el esfuerzo e incluso puede implicar pérdidas (ejemplo de conducta
impulsiva). Debido a lo anterior se ha considerado una conducta irracional y se ha
mencionado que puede estar relacionada con la conducta autocontrolada (Fantino &
Fantino, 2013; Rachlin, 1995).
Por lo general, el efecto del costo de la inversión se estudiaba en humanos
utilizando viñetas. Es decir, descripciones breves de situaciones de inversión hipotéticas
en las que el participante debía escoger entre continuar con la inversión descrita o desistir
de la misma. Así, se exploraron variables como la implicación del participante en una
inversión (Arkes & Blumer, 1985), la estimación del éxito del resultado de la inversión
(Arkes & Blumer, 1985; Garland, 1990; Garland & Newport,1991) y la relación del efecto
del costo de la inversión con la aversión al riesgo (Zeelenberg & Dijk, 1997).
12

Navarro & Fantino (2005) propusieron un procedimiento conductual para estudiar
este fenómeno en palomas y humanos. Brevemente, en su estudio el sujeto experimental
tenía la opción de responder a una de dos teclas: responder repetidamente en una de las
teclas (tecla de respuestas) resultaba en la entrega de un reforzador conforme a un
programa de reforzamiento mixto con cuatro programas de razón fija -RF- (pequeño,
mediano, grande y muy grande). Cada RF podía estar vigente en cada ensayo de acuerdo
a una probabilidad de ocurrencia en 0.5, 0.25, 0.125 y 0.125 para cada RF
respectivamente. Responder en la otra tecla (tecla de escape) cancelaba el ensayo en
curso e iniciaba uno nuevo en el que los programas podían estar vigentes de acuerdo a
su probabilidad de ocurrencia. De esta manera, si en un ensayo el sujeto respondía hasta
obtener el reforzador con cualquiera de los programas de reforzamiento diferentes al más
pequeño programado, se consideraba que había persistido. Es decir que había incurrido
en el efecto del costo de la inversión. Por otro lado, si el sujeto cancelaba el ensayo
después de completar el requisito de respuestas más pequeño sin obtener el reforzador,
el sujeto no incurría en el efecto del costo de la inversión y maximizaba sus ganancias
globales por el arreglo probabilístico programado.
De manera general, Navarro y Fantino (2005) en cuatro experimentos con palomas y
uno con humanos como sujetos experimentales encontraron que el porcentaje de ensayos
con persistencia en la tarea disminuye del 100 a 0% al señalar el incremento del requisito
de respuestas con cambios de iluminación en un operando. También encontraron que el
porcentaje de ensayos con persistencia decrementa de cerca del 100% a alrededor del
10% conforme la diferencia entre los requisitos de respuestas incrementa. Con esta última
variable encontraron una tendencia similar en humanos, sin embargo, hubo mayor
13

variabilidad que en los experimentos con palomas, donde se observó que el porcentaje de
ensayos con persistencia decremento de alrededor del 67.9% a 25.2% en promedio.
En estudios posteriores, se reprodujo el procedimiento reportado por Navarro y
Fantino con palomas (Avila, Gonzalez, Miranda & Guzman, 2010; Macaskill & Hackenberg
2012a; 2012b), ratas (Magalhãnes, White, Stewart, Beeby, & Van Der Vielt, 2012) y
humanos (Navarro & Fantino, 2007; Avila, Yankelevitz, Gonzalez, & Hackenberg, 2013;
Macaskill & Hackenberg, 2013).
Específicamente, en estudios con palomas se encontró que variar la frecuencia
relativa de los requisitos de respuesta modula el porcentaje de ensayos con persistencia
(Avila et al., 2010; Macaskill & Hackenberg, 2012b). En otro estudio se reportó que
exponer a palomas a diferentes secuencias de condiciones, donde es óptimo persistir y
donde es óptimo escapar genera un efecto de historia en los niveles del porcentaje de
ensayos con persistencia (Macaskill & Hackenberg, 2012a).
Particularmente, en estudios con humanos se han replicado los hallazgos reportados
en estudios de animales no humanos como variar la frecuencia relativa del requisito de
respuestas (Avila, et al., 2013) y el efecto de historia (Macaskill & Hackenberg, 2013). Por
otra parte, no se han encontrado efectos claros al añadir un estímulo al incremento del
requisito de respuestas en humanos (Macaskill & Hackenberg, 2013; Navarro & Fantino,
2007). Además, en un estudio encontraron que el fenómeno del efecto del costo de la
inversión es un continuo conductual con cuatro diferentes patrones conductuales:
persistencia no óptima, escape óptimo, persistencia óptima y escape no óptimo mas no un
fenómeno de todo o nada como se caracterizaba en estudios con viñetas (Avila et al.,
2013).
14

Cabe destacar que en los estudios con humanos hay mayor variabilidad que en los
de animales. Algunos de los autores mencionaron que la mayoría de los participantes
tienden a persistir en condiciones de escape óptimo (Macaskill & Hackenberg, 2013;
Navarro & Fantino, 2005; 2007). Por ejemplo, en el estudio de Macaskill y Hackenberg
(2013) el 86.7% del total de los participantes persistieron bajo las mismas condiciones que
las descritas por Navarro y Fantino con palomas (2005); sin embargo, en este estudio los
participantes solamente fueron expuestos a una o tres sesiones de exposición. En
contraparte, en otro estudio con humanos, Avila, et al. (2013) expusieron a tres
participantes a al menos a cinco sesiones de exposición bajo las mismas condiciones que
las descritas en el estudio de Navarro y Fantino (2007) y encontraron que los tres
participantes escaparon consistentemente. Es decir, que el porcentaje de ensayos con
persistencia fue cercano a cero.
Propósito del estudio
La conducta autocontrolada puede ser definida como la elección de la opción que
maximiza las ganancias globales y reduce las pérdidas (Green & Myerson, 2004). Los
principales procedimientos que se han empleado en esta área son el de elección con
compromiso y el de demora de la gratificación. Un caso especial de conducta
autocontrolada se observa en el procedimiento del efecto del costo de la inversión, en el
que desistir de un curso de acción maximiza las ganancias.
Desde el punto de vista de la autora de esta tesis, es posible que los procedimientos
previamente mencionados capturen dimensiones diferentes de la conducta
autocontrolada; sin embargo, en los tres procedimientos se puede maximizar las
ganancias globales, que depende de persistir o no en un curso de acción. Por ejemplo, en
15

el procedimiento del efecto del costo de la inversión mantenerse respondiendo en un
curso de acción no necesariamente maximizalas ganancias globales. Por el contrario,
abandonar el curso de acción permite aumentar la tasa de reforzamiento; esto es, el
sujeto maximiza las ganancias que puede obtener. En los procedimientos de descuento
temporal con ajuste de la magnitud y el procedimiento de elección con compromiso el
sujeto maximiza las ganancias eligiendo consistentemente la recompensa grande
demorada. En el caso del procedimiento de demora de la gratificación, el sujeto maximiza
las ganancias absteniéndose de revertir su elección inicial por la recompensa grande
demorada.
Cada procedimiento ha permitido estudiar aspectos particulares de la conducta de
autocontrol. Sin embargo, la proliferación de los procedimientos también ha dificultado la
apreciación de los aspectos esenciales de la conducta autocontrolada porque se
desconoce qué procedimiento está definiendo uno, otro o el mismo aspecto de conducta
autocontrolada. De la revisión de la literatura que se presentó en esta introducción se
deduce que un proceso fundamental entre elección con compromiso, demora de la
gratificación y efecto del costo de la inversión es la maximización de las ganancias. Un
aspecto común y necesario para que los sujetos maximicen las recompensas entre los
tres tipos de procedimientos es la persistencia o no persistencia de la ejecución en una
opción, esto no hace diferente la variable, simplemente son ambas direcciones de una
variable dependiente común. Así, esta variable dependiente, la persistencia, podría ser de
utilidad para trazar la relación entre los procedimientos revisados en esta introducción y
este es el propósito del presente estudio: a saber, determinar la viabilidad de la conducta
de persistir en los procedimientos de autocontrol como el componente fundamental en la
16

maximización de las recompensas.
Algunos autores compararon procedimientos de autocontrol con la intención de
averiguar si miden la misma dimensión de la conducta autocontrolada. Estas
comparaciones han sido con niños menores de cinco años (Delgado, 2014; Forzano,
Michels, Carapella, Conway, & Chelonis, 2011) o con ratas como sujetos experimentales
(Reynolds, et al., 2002). En estos estudios relacionaron las recompensas obtenidas o las
elecciones iniciales de los sujetos. Principalmente en los procedimientos de elección con
compromiso y de demora de la gratificación, donde han encontrado correlación entre las
elecciones iniciales (Delgado, 2014, Reynolds et al., 2002) y correlación entre las
recompensas grandes obtenidas y el tiempo de espera antes de revertir en el
procedimiento de demora de la gratificación (Forzano Michels, Carapella, Conway, &
Chelonis, 2011). No obstante, en la presente tesis se incluye la comparación del
procedimiento del efecto del costo de la inversión. El cual puede considerarse como un
procedimiento que permite estudiar la conducta controlada, donde el factor fundamental
es persistir o no de un curso de acción.
Esta tesis se dividió en dos estudios. El Estudio 1 se comparó la ejecución en el
efecto del costo de la inversión y la ejecución en una tarea de descuento temporal y una
de descuento probabilístico con ajuste de la magnitud. En el Estudio 2 se comparan las
ejecuciones de participantes expuestos a una tarea de elección con compromiso, una
tarea de demora de la gratificación y una tarea del efecto del costo de la inversión.
Estudio 1
En el Estudio 1 se comparó la ejecución en situaciones de persistir no óptimo (tarea
del costo de la inversión) con recompensas demoradas y probabilísticas (tarea de
17

descuento temporal y probabilístico con ajuste de la magnitud).
Particularmente, la tarea de descuento probabilístico se utilizó dado que en estudios
con viñetas reportan una relación entre la propensión al riesgo y el procedimiento del
efecto del costo de la inversión (Zeelenberg & Dijk, 1997).
Debido a que en la literatura del efecto del costo de la inversión con humanos se ha
observado variabilidad entre los participantes, en este estudio, también, se averiguó si el
número de sesiones de exposición a una tarea del efecto del costo de la inversión modula
la conducta de persistir por una recompensa poco redituable.
Método
Participantes
Se contactó con 98 estudiantes universitarios por medio de las redes sociales.
Inicialmente asistieron 53 participantes de los cuales 30 completaron todas las tareas de
este estudio. Los 30 participantes estaban en un rango de edad de entre 18 a 25 años
(M= 21.5, DE=2.8) y ninguno había asistido anteriormente a un estudio sobre toma de
decisiones.
Materiales
El estudio se llevó a cabo en un cubículo de 4x2 m, acondicionado con cinco
escritorios, cada uno con una computadora de escritorio y una silla. Cada computadora
estaba equipada con un monitor de 16 pulgadas, un teclado tipo QWERTY y un mouse
óptico. Los escritorios estaban separados, entre sí, por muros de tablaroca y cortinas que
evitaban el contacto entre participantes. Se trabajó con un máximo de tres personas al
mismo tiempo. La tarea del efecto del costo de la inversión fue programada en Visual
Basic ® 6.0, mientras que las tareas de descuento temporal y probabilístico fueron
18

programados con Java ® 7. Todos los programas fueron utilizados en estudios anteriores
en el Laboratorio de Análisis Experimental de la Conducta. Cada computadora era de
marca HP ® con sistema operativo Windows ® XP por los requisitos de sistema del
programa del efecto del costo de la inversión.
Procedimiento
La investigadora publicó una invitación al estudio por medio de las redes sociales.
Para homogeneizar la muestra se invitó únicamente a estudiantes universitarios entre 18
y 25 años que nunca hubieran participado en un estudio sobre toma de decisiones. A los
estudiantes interesados se les envió un correo electrónico en el que se especificó el tema
y la duración del estudio. También se mencionó que al final de su participación se les
entregaría una recompensa. Finalmente, se acordaron los horarios de participación con
los interesados.
El diseño de este estudio fue mixto, dado que cada sujeto respondió las tareas de
descuento temporal con ajuste de la magnitud, descuento probabilístico con ajuste de la
magnitud y la tarea del efecto del costo de la inversión. Asímismo, se expuso a los
participantes a una, tres o cinco sesiones a esta tarea para probar si existía un efecto de
exposición a la tarea del efecto del costo de la inversión. El número de sesiones
experimentales fue asignado de manera aleatoria, de tal manera que hubiera diez
participantes en cada condición.
En la primera sesión, todos los participantes leyeron y firmaron un consentimiento
informado (Anexo 1) seguido por contestar una de las siguientes tres tareas: la tarea del
efecto del costo de la inversión, la tarea de descuento temporal y la tarea de descuento
probabilístico. Los participantes fueron expuestos a las tareas de manera
19

contrabalanceada, una sesión por día. Las sesiones tuvieron una duración máxima de 25
minutos y se realizaron de lunes a viernes a la misma hora aproximadamente.
En cada sesión se le pidió al participante que se sentara en la silla que se
encontraba frente a la computadora. Al inicio de cada tarea, se les pidió a los participantes
que leyeran las instrucciones que se encontraban en la pantalla (Anexo 2) y que
únicamente utilizaran el mouse para interactuar con los programas en la computadora.
Al terminar todas las tareas del estudio, los participantes recibieron un número de
oportunidades para obtener una cantidad de dinero (un dulce, $15, $20 o $50 por
oportunidad) que obtuvieron de acuerdo al puntaje acumulado en la tarea del efecto del
costo de la inversión.
Tarea del efecto del costo de la inversión
Todos los participantes fueron expuestos a una sesión de entrenamiento seguido por
la o las sesiones de prueba.
Sesión de entrenamiento.Al inicio de la sesión, la pantalla del monitor de la computadora era de color gris, en
el centro de se encontraba un recuadro blanco con el folio del participante
correspondiente; debajo del cuadro estaba un rectángulo naranja con la leyenda Iniciar.
Una vez que el participante oprimía el botón Iniciar, comenzó la sesión. Cada sesión
estaba compuesta por ensayos discretos que comenzaban con el fondo de la pantalla de
color gris y la leyenda Haga clic con el mouse repetidamente en el cuadro derecho para
ganar dinero, ubicada en la parte superior de la pantalla, debajo de esta leyenda se
encontraba un recuadro de aproximadamente 5 centímetros color blanco ubicado al
centro de la pantalla. En la esquina inferior derecha se encontraba la leyenda Total: y un
20

contador visible para el participante. Si el participante hacía clic con el cursor sobre el
cuadrado blanco, este cambiaba su posición aleatoriamente sin invadir el espacio de las
leyendas. El participante podía obtener una recompensa después de hacer clic sobre el
cuadro blanco repetidamente que consistió en la entrega de cinco puntos señalado con la
leyenda ¡Ganó 5 puntos!, esta leyenda desapareció después de dos segundos, seguida
por la leyenda En un momento iniciará un nuevo ensayo, presente durante dos segundos,
que indicó el final del ensayo, comenzando uno nuevo. Los puntos ganados se sumaban
al contador visible para el participante.
En cada ensayo, el cuadro blanco estaba programado con uno de cuatro programas
de reforzamiento de razón fija (RF) 10, 40, 80 o 160. Cada RF podía estar vigente con
una probabilidad de 0.25. Cumplir con el requisito de respuestas vigente resultaba en la
entrega de 5 puntos como recompensa.
Sesiones experimentales.
Se empleó un procedimiento de ensayo por ensayo. Cada ensayo comenzó con el
fondo gris de la pantalla de la computadora. En la parte superior de la pantalla se
encontraban las leyendas Haga clic con el mouse en el cuadro izquierdo para reiniciar el
ensayo y Haga clic con el mouse repetidamente en el cuadro derecho para ganar dinero.
Estas leyendas permanecieron en la pantalla durante todo el ensayo. Debajo de las
instrucciones se encontraban un cuadro amarillo del lado izquierdo (i. e., cuadro de
escape) y uno blanco del lado derecho (i. e., cuadro de respuesta). El participante podía
ganar puntos haciendo clics con el puntero del mouse sobre el cuadro de respuesta hasta
cumplir el requisito de respuestas vigente. La recompensa se entregó conforme a uno de
cuatro programas de razón fija (RF 10, RF 40, RF 80, RF 160). Cada RF podía estar
21

vigente en cada ensayo de acuerdo a una probabilidad previamente asignada (0.5, 0.25,
0.125, 0.125, respectivamente). Después de que el participante cumplía con el RF
vigente, en la pantalla aparecía la leyenda Ganaste 5 puntos seguido por la oración En un
momento iniciará un nuevo ensayo. Por el contrario, si el participante daba un clic sobre el
cuadro de escape (RF 1), se terminaba el ensayo en curso, aparecía la leyenda En un
momento iniciará un nuevo ensayo y dos segundos después iniciaba un nuevo ensayo.
En la parte inferior de la pantalla se mostró el total de puntos obtenidos en los ensayos
sucesivos con la leyenda Total:”, seguida de la cantidad de puntos ganada (Figura 1).
Cada sesión tuvo una duración de 25 minutos.
Las variables dependientes registradas fueron el porcentaje de ensayos con
persistencia. Esto es, el total de veces que el participante obtuvo una recompensa
correspondiente a un RF diferente del pequeño (Avila, et al., 2013) y la tasa de respuestas
dividiendo el total de respuestas en el cuadro de respuestas entre la duración de la
sesión.

Figura 1. Opciones de respuestas en la tarea del efecto del costo de la inversión. En la opción
A) se presenta la contingencia programada al hacer clic en el cuadro de escape, cuadro amarillo.
En la opción B) se presenta la contingencia al hacer clic repetidamente en cuadro de respuestas,
cuadro blanco.
Total: 0
Haga clic con el mouse izquierdo para reiniciar el
ensayo
Haga clic con el mouse repetidamente en el
cuadro derecho para ganar puntos
Total: 0
Haga clic con el mouse izquierdo para reiniciar el
ensayo
Haga clic con el mouse repetidamente en el
cuadro derecho para ganar puntos
Ganaste 5 puntos
A) B)
En un momento empezará
un nuevo ensayo
En un momento empezará
un nuevo ensayo
Total: 5 puntos
Haga clic con el mouse izquierdo para reiniciar el
ensayo
Haga clic con el mouse repetidamente en el
cuadro derecho para ganar puntos
Total: 0
Haga clic con el mouse izquierdo para reiniciar el
ensayo
Haga clic con el mouse repetidamente en el
cuadro derecho para ganar puntos
23

Tarea de descuento temporal con ajuste de la magnitud
En esta tarea no fue necesario un entrenamiento preliminar. Al inicio de la tarea, la
pantalla de la computadora estaba en color negro. En el centro se encontraba un cuadro
gris con un rectángulo con la etiqueta Iniciar. Una vez que el participante hacía clic sobre
el botón Iniciar con el cursor del mouse, la pantalla cambiaba a color verde. En la parte
superior de la pantalla de la computadora se presentó la leyenda Elige qué prefieres.
Debajo de esta leyenda se encontraban dos cuadros blancos; en cada cuadro se
encontraba escrita una cantidad de dinero hipotético, en una una recompensa grande con
una demora de entrega y en otro una recompensa pequeña que se entregaba en ese
momento. Debajo de cada cuadro se encontraba un botón rectangular que decía
Seleccione esta opción. Las recompensas, grande y pequeña, se presentaban en el
cuadro derecho o izquierdo aleatoriamente en cada elección. Los participantes tenían que
hacer una serie de elecciones entre las dos recompensas mostradas y oprimir el botón
correspondiente.
Durante toda la sesión, la recompensa grande se mantuvo fija en $1000, mientras
que la recompensa pequeña fue de $500 en la primera elección y varió en elecciones
consecutivas por medio de un procedimiento de ajuste de la magnitud. Esto es, la
magnitud de la recompensa pequeña se ajustó dependiendo de la ejecución previa del
participante. Si el participante elegía la recompensa grande, en la siguiente elección la
recompensa pequeña aumentaba en su magnitud. Por el contrario, si el participante
elegía la recompensa pequeña en la siguiente elección esta disminuía. En cada ensayo la
magnitud de la recompensa pequeña aumentaba o disminuía en la mitad del ajuste de la
elección anterior, $250 en la segunda elección, $125 en la tercera, $62.50 en la cuarta y
24

así sucesivamente.
Esta tarea estaba compuesta de seis elecciones por cada una de las siguientes
demoras probadas: un día, una semana, un mes, seis meses, un año, seis años y 12
años. Cada recompensa se presentó acompañada de la demora correspondiente como se
muestra en la Figura 2 A.
Tarea de descuento probabilístico con ajuste de la magnitud
Esta tarea fue igual que la tarea de descuento temporal, la única diferencia fue que
las cantidades de dinero estaban acompañadas por probabilidades de obtenerlas. Esta
tarea estaba compuesta de seis elecciones por cada una de las siguientes probabilidades
probadas: 0.95, 0.90, 0.75, 0.5, 0.25, 0.1, 0.05 (Figura 2 B).
25

Selecciones esta opción Seleccione esta opción
Elige que prefieres
$ 1000 en 12 años $ 750 en este momento
Selecciones esta opción Seleccione esta opción
Elige que prefieres
$ 1000 con 95% de probabilidad
de obtenerlos
$ 750 seguros
A) Tarea de descuento
temporal
B) Tarea de descuento
probabilístico
Figura 2. A) Pantalla que se presentan en cada elección en la tarea de descuento
temporal. B) Pantalla que se presenta en cada elección para la tarea de descuento
probabilístico.
26

Resultados
Los resultados de este estudio se dividieron en dos secciones;en la primera se
analizó únicamente la ejecución de los sujetos en la tarea del efecto del costo de la
inversión, mientras que en la segunda se compararon las ejecuciones entre las tareas de
descuento temporal y probabilístico con ajuste de la magnitud y la tarea del efecto del
costo de la inversión.
Para la tarea del efecto del costo de la inversión se registró el porcentaje de ensayos
con persistencia y la tasa de respuestas como se definieron en el método.
En la Figura 3 se muestran los datos de los participantes expuestos a una, tres o
cinco sesiones de la terea del efecto del costo de la inversión (columnas). Como se
observa en la figura, hubo mucha variabilidad entre participantes en el porcentaje de
ensayos con persistencia. Los participantes expuestos solo a una sesión mostraron un
porcentaje de ensayos con persistencia cercano al 100%. La mayoría de los participantes
expuestos a tres sesiones persistieron consistentemente en las sesiones de exposición.
Sin embargo, los participantes 12, 14 y 15 mostraron un decremento en la variable
dependiente de la primera a la tercera sesión. Mientras que casi todos los participantes
expuestos a cinco sesiones mostraron un porcentaje de ensayos con persistencia estable
en las sesiones consecutivas. Para los participantes 3, 5, 6 y 9 el porcentaje de ensayos
con persistencia disminuyó conforme aumentó el número de sesiones de exposición.

0
50
100
21 22 23 24 25 26 27 28 29 30 M
0
50
100
11 12 13 14 15 16 17 18 19 20 M
0
50
100
11 12 13 14 15 16 17 18 19 20 M
0
50
100
11 12 13 14 15 16 17 18 19 20
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
21 22 23 24 25 26 27 28 29 30
0
50
100
1 2 3 4 5 6 7 8 9 10 M
P
o
rc
en
ta
je
d
e
en
sa
yo
s
co
n
p
er
si
st
e
n
ci
a
Participantes
Primera
sesión
Segunda
sesión
Tercera
sesión
Cuarta
sesión
Quinta
sesión
Figura 3. Porcentaje de ensayos con persistencia por participante (barras rayadas).
Promedio del porcentaje de ensayos con persistencia de todos los participantes en cada
sesión (barras negras).
28

Independiente del número de sesiones de exposición al procedimiento, la mayoría
de los participantes mostró un porcentaje de ensayos con persistencia estable entre
sesiones. Debido a que no se encontró normalidad en los datos (D(90) = 0.31, p < 0.05),
se realizó una comparación entre el porcentaje de ensayos con persistencia en cada
sesión con una prueba estadística de Friedman y no se encontraron diferencias
significativas en los participantes expuestos a tres sesiones (x2(2)= 0.09, p > 0.05) ni en
los participantes expuestos a cinco sesiones (x2(4)=4.02, p >0.05).
Por lo tanto, es posible que la ejecución en el procedimiento del efecto del costo de
la inversión sea independiente del número de sesiones de exposición al mismo. Por esta
razón, en los siguientes resultados se tomará el promedio de todas las sesiones de
ensayos con persistencia para cada participante.
En algunos estudios piloto previos a esta investigación se observó que el porcentaje
de ensayos con persistencia tuvo una correlación con la tasa de respuestas al operando
en el cual está vigente el programa de reforzamiento mixto. Específicamente, se encontró
que las personas que persistían más en la tarea del efecto del costo de la inversión
obtuvieron una tasa de respuestas más alta que las personas que persistían menos en la
misma. En este trabajo también se averiguó la relación entre la tasa de respuestas y el
porcentaje de ensayos con persistencia.
En la Figura 4 se muestra la distribución de la tasa de respuestas de cada
participante en relación con el porcentaje de ensayos con persistencia. Se observó que
conforme aumentó el porcentaje de ensayos con persistencia la tasa de respuestas fue
más alta; sin embargo, la correlación entre las variables dependientes no fue significativa
(r = 0.230 p > 0.05). Esta falta de correlación pudo deberse al número relativamente
29

pequeño de sujetos y de sesiones de exposición al procedimiento.

En el análisis previamente descrito se correlacionaron los promedios de las variables
dependientes de los participantes. Es decir, se compararon datos de una sesión con
promedios de tres o cinco sesiones. Por lo tanto, se hizo una correlacionaron de
Spearman de las mismas variables dependientes, pero para cada sesión de cada
participante. La correlación fue significativa (r = 0.44, p < 0.01) y los datos se observan en
la Figura 5.
0
20
40
60
80
100
120
140
0 20 40 60 80 100
Participantes
Grupo 3 (n=10) 60
70
80
90
100
110
120
0 20 40 60 80 100
G1
G2
G3
T
a
s
a
d
e
r
e
s
p
u
e
s
ta
s
0
Porcentaje de ensayos con persistencia
T
a
s
a
d
e
r
e
s
p
u
e
s
ta
s
(
r/
m
in
)
Porcentaje de ensayos con persistencia
Cinco sesiones
Tres sesiones
Una sesión
Figura 4. Tasas de respuestas y porcentaje de ensayos con persistencia en la tarea del
efecto del costo de la inversión. Se observan los datos individuales de los participantes
expuestos a una (equis), tres (cuadros vacíos) o cinco sesiones experimentales (círculos
vacíos).
30

Al igual que el porcentaje de ensayos con persistencia, se comparó las ejecuciones
en las diferentes sesiones de exposición y no se encontraron diferencias significativas en
el grupo expuesto a tres sesiones (x2(2)= 3.80, p > 0.05), ni en el grupo expuesto a cinco
sesiones (x2(4)= 2.60, p > 0.05). Para las tareas de descuento temporal y descuento
probabilístico con ajuste de la magnitud, se calcularon las tasas de descuento individuales
(k). Los valores k oscilaron entre 0.0001 y 0.0721 para la tarea de descuento temporal y
entre 0.0003 y 13.6259 para la tarea de descuento probabilístico (Tabla 1).

Porcentaje de ensayos con
persistencia
0
T
a
s
a
d
e
r
e
s
p
u
e
s
ta
s

(r
/m
in
)
0 100 40 20 60 80
Figura 5. Tasa de respuestas distribuidas según el porcentaje de ensayos con persistencia.
Cada rombo representa una sesión de un participante.
31

Tabla 1
Tasas de descuento temporal y probabilístico individuales

Participante
Descuento temporal Descuento probabilístico
k R2 k R2
1 0.0684** 0.9537 0.0194 0.1752
2 0.0023* 0.7559 0.5305* 0.8945
3 <0.0001* 0.9720 0.0855 0.3793
4 0.0222** 0.9727 13.6259** 0.9232
5 0.0029** 0.9822 0.6082* 0.8599
6 0.0095* 0.6961 0.0003** 0.7561
7 0.0134* 0.8666 13.7700** 0.9892
8 0.0053** 0.9922 1.5692** 0.9658
9 0.0014* 0.8572 0.2321** 0.9312
10 0.0055** 0.9297 0.3156* 0.9004
11 0.0004* 0.8681 1.0351** 0.996
12 0.0032** 0.9293 2.6741* 0.8424
13 0.0011** 0.9767 0.4937** 0.9428
14 0.0097 0.5239 3.6207** 0.9855
15 0.0034* 0.6179 1.1450** 0.9652
16 0.0028** 0.0280 0.9899** 0.9661
17 0.0016** 0.9567 1.2919** 0.9822
18 0.0169** 0.962 2.6747** 0.9609
19 0.0721* 0.5805 0.1068* 0.719
20 0.0108** 0.9773 2.238* 0.5799
21 0.0009** 0.8301 0.5077* 0.8989
22 0.0048** 0.9942 0 1
23 0.0002 0.3544 1.2644** 0.9622
24 0.1213* 0.6035 0.5117** 0.9555
25 <0.0001* 0.5467 12.7485* 0.595
26 0.0247** 0.9674 0.3646* 0.8643
32

27 0.0002 0.3098 0.1892* 0.7404
28 0.00025 0.4454 3.6489* 0.7951
29 0.0002 0.2155 0.9835** 0.9952
30 0.0028* 0.7237 1.0951** 0.996
Promedio 0.0021 0.7463 0.0349 0.8505
*p<0.05
**p<0.01

Como se observa en la Tabla 1, los valores k en la tarea de descuento temporal con
ajuste de la magnitud fueron muy pequeños en comparación a la curva de ajuste
mostrada en las gráficas individuales (Anexo 3). No se encontró una correlación
significativa entre el porcentaje de ensayos con persistencia y el valor k de la tarea de
descuento temporal (r = -0.07 p > 0.7) ni con la de la tarea de descuentoprobabilístico (r =
0.245 p > 0.19).
Debido a que las tasas de descuento variaron y que no todas tuvieron un buen
ajuste a la curva hiperbólica se obtuvieron las áreas bajo la curva (AbC) de los puntos de
indiferencia obtenidos en las dos tareas de descuento.
El AbC es una variable dependiente ateórica dado que no es necesario que los
datos muestren un ajuste hiperbólico. El AbC varía entre cero y uno, a diferencia de la
tasa de descuento, cuyos valores pueden ser extremadamente chicos o muy grandes y,
por lo tanto, perder sentido teórico.
En la Figura 6 se muestran los valores del AbC distribuidos de acuerdo al porcentaje
de ensayos con persistencia para cada participante. Para facilitar la descripción de los
datos, los paneles se dividieron en cuadrantes.
La mayoría de los participantes obtuvo un porcentaje de ensayos con persistencia
33

mayor al 50% y un AbC menor a 0.5. Cuatro participantes en la tarea de descuento
temporal y dos participantes en la tarea de descuento probabilístico obtuvieron un AbC
mayor a 0.5 y un porcentaje de ensayos con persistencia superior al 50% (cuadrantes
superiores derechos). Tres participantes mostraron un porcentaje de ensayos con
persistencia menor al 50% tanto en la tarea de descuento probabilístico como en la tarea
de descuento temporal.

Discusión
En este estudio se analizó la ejecución de 30 participantes expuestos a una, tres o
0
0.25
0.5
0.75
1
0 25 50 75 100
G1
G2
G3
0
0.25
0.5
0.75
1
0 25 50 75 100
DESCUENTO TEMPORAL DESCUENTO PROBABILÌSTICO
Á
re
a
b
a
jo
la
C
u
rv
a

Porcentaje de ensayos con persistencia
Descuento temporal Descuento probabilístico
A
b
C

Cinco sesiones
Tres sesiones
Una sesión
0
20
40
60
80
100
120
140
0 20 40 60 80 100
Participantes
Grupo 3 (n=10) 60
70
80
90
100
110
120
0 20 40 60 80 100
G1
G2
G3
T
a
s
a
d
e
r
e
s
p
u
e
s
ta
s
0
Porcentaje de ensayos con persistencia
Figura 6. Áreas bajo la curva (AbC) en la tarea de descuento temporal (panel izquierdo) y en
la tarea de descuento probabilístico (panel derecho) distribuidas de acuerdo al porcentaje de
ensayos con persistencia. Se observan los datos individuales de los participantes expuestos
a una (equis), tres (cuadros vacíos) o cinco sesiones experimentales (círculos vacíos). Se
encontró que; para los dos tipos de descuento, la mayoría de los participantes obtuvo un AbC
menor a 0.5 y un porcentaje de ensayos con persistencia mayor al 50 % (cuadrantes
inferiores derechos).
34

cinco sesiones de la tarea del efecto del costo de la inversión, a una tarea de descuento
temporal y una de descuento probabilístico. La presente discusión se dividirá en dos
secciones; en la primera sección se discutirán los resultados obtenidos por el efecto del
número de sesiones de exposición a la tarea del efecto del costo de la inversión. En la
segunda parte, se discutirá la comparación de la ejecución de los participantes en los tres
procedimientos.
En la ejecución de la tarea del efecto del costo de la inversión, globalmente, no hubo
diferencias entre los participantes expuestos a diferentes números de sesiones a la tarea.
Sólo tres participantes tienen una tendencia a disminuir el porcentaje de ensayos con
persistencia con tres sesiones de exposición. Mientras que cuatro de diez participantes
expuestos a cinco sesiones, redujeron su porcentaje de ensayos con persistencia. Estos
resultados son congruentes a los reportados en otros estudios con humanos como sujetos
experimentales (Macaskill & Hackenberg, 2013; Navarro & Fantino 2005; 2007).
Particularmente, en el estudio de Macaskill y Hackenberg (2013) con el propósito de
extender y generalizar los hallazgos encontrados en estudios con animales expusieron a
55 participantes a una sesión de exposición a la tarea del efecto del costo de la inversión
con los mismos parámetros establecidos en el presente estudio. Esto es, un programa
con dos opciones de respuesta, una asociada a un requisito de respuestas seguido por la
entrega de una recompensa y otra opción que terminaba el ensayo en curso, empezando
con uno nuevo. La entrega del reforzador fue de acuerdo a un programa de reforzamiento
mixto con cuatro requisitos de respuestas (RF10, RF40, RF80, RF160). El requisito de
respuestas pequeño tenía la mayor probabilidad de estar vigente en cada ensayo. De esta
forma, los sujetos obtendrían la mayor cantidad de reforzador si escapaban después de
35

cumplir el requisito de respuestas más chico programado sin haber sido reforzado. Del
total de participantes expuestos a esta tarea, sólo ocho escaparon consistentemente al
final de la primera sesión. En una condición consecutiva expusieron a los participantes
que no escaparon en la primera sesión a una tarea similar con el requisito de respuesta
más chico programado igual mientras que los otros requisitos de respuesta aumentaron al
doble que la condición anterior. Otros participantes fueron expuestos a una condición
donde señalaron el incremento a los requisitos de respuestas, haciendo saliente el
momento donde los participantes debían de terminar el ensayo en curso para comenzar
uno nuevo para obtener la mayor cantidad de recompensas con menos esfuerzo. En las
condiciones descritas, el 80% de los participantes redujo su porcentaje de ensayos con
persistencia en comparación a la condición inicial. Aunque los resultados con humanos
fueron similares a los obtenidos con los animales, hubo mucha variabilidad en los
resultados desde la primera sesión.
Los autores sugirieron que la diferencia en los resultados obtenidos en su estudio
con los reportados con animales, podía deberse a la diferencia en el número de sesiones
de exposición. No obstante, en el Estudio 1 de la presente tesis se observó la misma
variabilidad en el porcentaje de ensayos con persistencia exponiendo a los participantes a
una, tres o cinco sesiones, donde la mayoría de los participantes persiste. Esto sugiere
que las sesiones de exposición a la tarea del efecto del costo de la inversión no influyen
en la persistencia de los participantes.
Una explicación propuesta por Macaskill y Hackenberg fue que la variabilidad se
debe a las diferencias en la historia de reforzamiento de cada participante. Esta idea es
apoyada por el efecto de historia encontrada en su estudio y en estudios con animales
36

(Macaskill & Hackenberg, 2012a).
Otra posible explicación al alto porcentaje de ensayos con persistencia observados
en este estudio es que los participantes no comprendieran las instrucciones. Por medio de
reportes verbales no registrados, algunos participantes mencionaron que no entendían la
función del cuadro amarillo (cuadro de escape), por lo que no lo oprimían. Aparentemente,
variar las instrucciones para que los participantes entren en contacto con las dos opciones
de respuestas no varía la ejecución de los participantes (e.g. Macaskill y Hackenberg;
2013); sin embargo, la posibilidad de la comprensión de las leyendas presentadas en esta
tarea pudieron haber influido en la ejecución de los participantes. Esta posibilidad se
probó en el Estudio 2.
Durante el análisis de las ejecuciones de los participantes se observó una tendencia
creciente en la tasa de respuestas en relación al porcentaje de ensayos con persistencia.
Los participantes con porcentaje de ensayos con persistencia superiores al 50% muestran
una tasa de respuestas más alta que los participantes que no persisten. Aunque esta
tendencia no fue significativa puede ser una pista en relación a la sensibilidad a las
contingencias programadas. Esta idea es apoyada por resultados reportados por
Darcheville, Rivière y Wearden (1992). En su estudio expusieron a niños de seis años a
un procedimiento de autocontrol y a un programa de reforzamiento de intervalo fijo. Se
observóque los niños que se comportaban de manera autocontrolada, mostraban una
tasa de respuestas baja en el programa de intervalo fijo, mientras que los participantes
que tenían una tasa de respuestas alta elegían la recompensa pequeña menos
demorada. Los autores sugirieron que los participantes impulsivos eran poco sensibles a
las variables que modulan la estimación temporal. En este sentido, es posible que la tasa
37

de respuestas influya en la sensibilidad a los requisitos de respuesta del arreglo probado
en el procedimiento del costo de la inversión, que decrementa la maximización de las
recompensas. Se sugiere explorar las tasas de respuestas en un programa del efecto del
costo de la inversión de manera detallada, por ejemplo cambiar los programas de razón
fija por programas de intervalo fijo para observar el patrón de respuestas en el intervalo
entre reforzadores.
En la ejecución de los participantes en las tareas de descuento temporal y
probabilístico con ajuste de la magnitud, se calcularon las tasas de descuento
individuales. Se observó variabilidad entre los participantes y en las dos tareas de
descuento. La diferencia en las tasas de descuento son congruentes con las reportadas
en la literatura (véase Green & Myerson, 2010). Aunque en ambas tareas se ha
considerado como conducta autocontrolada la maximización de ganancias y reducción de
pérdidas, algunos autores han referido que las diferencias en estas tareas en los mismos
participantes, se deben a diferentes procesos (Green & Myerson, 2010).
Adicionalmente, la tasa de descuento en la tarea de descuento temporal observada
fue muy chica, a pesar de que la curva fue pronunciada (ver Anexo 3), esta observación
se retomará en la discusión general. Debido a lo anterior en este estudio se calcularon las
áreas bajo la curva (AbC), que es un análisis que no depende del ajuste a la función de
descuento y normaliza los valores haciendo posible la comparación entre participantes y
entre procedimientos. La mayoría de los participantes obtuvo un AbC menor a 0.5 en
ambas tareas, de los cuales la mayoría de participantes obtuvo un porcentaje de ensayos
con persistencia superior al 50 %. Por otro lado, se observaron algunos participantes que
obtuvieron AbC superiores a 0.5 y que persistieron en la mayoría de los ensayos, así
38

como participantes que obtuvieron un AbC menor a 0.5 y un porcentaje de ensayos con
persistencia bajo.
Particularmente las bajas AbC observadas en la tarea de descuento probabilístico
coinciden con los participantes que incurren en el efecto del costo de la inversión. Estos
resultados, son similares a los reportados en estudios con viñetas. Zeelenberg y Dijk
(1997) en cuestionarios de lápiz y papel plantearon situaciones con o sin inversión física
hipotéticas, seguidas por una elección entre obtener una recompensa grande con una
probabilidad de 0.5 de obtenerla o una recompensa pequeña pero segura. Los autores
reportaron que los participantes que fueron expuestos al escenario con inversión elegían
la recompensa segura, a diferencia de los participantes sin una inversión previa a la
elección quienes fueron indiferentes a las opciones. Los resultados previamente descritos
y los obtenidos en la presente tesis sugieren que los participantes que incurren en el costo
de la inversión muestran conducta de aversión al riesgo.
Por otra parte, en los datos obtenidos con la tarea de descuento temporal con ajuste
de la magnitud se observó que la mayoría de los participantes que obtuvieron un AbC
menor al 0.5 son los que persistieron más de la mitad de los ensayos en la tarea del costo
de la inversión. En un sentido estricto estos resultados sugieren que los participantes no
maximizaron las ganancias con recompensas demoradas ni en tareas con esfuerzo como
inversión implicada. Estos datos parecen indicar que persistir o no persistir no varía
independientemente de las contingencias programadas para maximizar las ganancias.
La idea anterior tiene sentido si consideramos que la tarea de descuento temporal
permite estudiar el descuento del valor subjetivo de una recompensa en función del
tiempo. Asimismo, el valor subjetivo de una recompensa está asociado en el
39

mantenimiento en un curso de acción que puede incrementar las ganancias globales
(Logue, 1988; Rachlin, 2000). En este sentido, una AbC baja indica que el participante no
mantenga una elección por una recompensa grande demorada lo que no maximizaría las
recompensas globales.
No obstante, las demoras probadas en la tarea de descuento temporal son mayores
a las demoras de la ejecución de un participante, desde que inicia un ensayo hasta que
obtiene la recompensa en la tarea del efecto del costo de la inversión. En un
procedimiento de elección con compromiso con demoras reales, podrían probarse
demoras similares en la tarea del efecto del costo de la inversión.
Otro procedimiento en el que las demoras pueden ser similares y que permite el
estudio del mantenimiento de una elección por la recompensa grande demorada es el de
demora de la gratificación. Este procedimiento es parecido al empleado en el de costo de
la inversión en donde puede elegir continuar con un curso de acción o desistir en
cualquier momento antes de obtener la recompensa. En el Estudio 2 se comparan las
ejecuciones de participantes expuestos a la tarea del efecto del costo de la inversión, a la
tarea de elección con compromiso y a la tarea de demora de la gratificación.
Estudio 2
El Estudio 2 tiene dos objetivos; el primero fue averiguar si las instrucciones en la
tarea del efecto del costo de la inversión afectaron la ejecución de los participantes del
Estudio 1; el segundo propósito fue determinar la viabilidad la conducta de persistir o no
persistir como componente fundamental en la maximización de las recompensas, que
facilita la relación entre las tareas de elección con compromiso, demora de la gratificación
y efecto del costo de la inversión
40

Método
Participantes
Participaron cinco estudiantes de universidad en un rango de edad de 18 a 22 años
(M = 19.6, DE = 1.5). Se invitó a estudiantes de un curso de licenciatura de psicología de
segundo semestre a participar en un estudio sobre toma de decisiones. Los interesados
acordaron los horarios por correo electrónico con la experimentadora.
Materiales
El presente estudio se llevó a cabo en un cubículo de 2x3 m, acondicionado con tres
escritorios, cada uno con una computadora de escritorio y una silla. Los escritorios
estaban separados uno del otro por una cortina. Se trabajó con un máximo de dos
personas al mismo tiempo. Las computadoras fueron marca Dell ®, equipadas con un
monitor de 16 pulgadas y un mouse óptico. La tarea del efecto del costo de la inversión
fue programada en Visual Basic ® 6.0, mientras que las tareas de elección y demora de la
gratificación se programaron con Java ® 7.
Procedimiento
Para mejorar la comprensión de la tarea del efecto del costo de la inversión, diez
estudiantes de segundo y cuarto semestre de licenciatura de la Facultad de Psicología
contestaron voluntariamente un cuestionario sobre la comprensión de las instrucciones.
Esto fue para tener los registros precisos de qué parte de la tarea quedaba poco clara. A
cada participante se le presentó una serie de hojas que incluía esquemas de la tarea
experimental con las leyendas correspondientes y se les pidió que contestaran las
preguntas correspondientes (Anexo 2).
Posteriormente, la leyenda “Haga clic con el mouse en el cuadro izquierdo para
41

reiniciar el ensayo” fue reemplazada por la leyenda “Haga clic con el mouse en el cuadro
izquierdo para comenzar un nuevo ensayo” (Figura 7). Esta nueva leyenda fue evaluada
por siete jueces, seis mujeres y un hombre.
Debido a la muerte experimental observada en el Estudio 1 se invitó a alumnos de
segundo semestre