Cap 11 - Pardo y San Martin - Analisis de datos en psicologia II

Psicología

•
SIN SIGLA

uriel
19/9/2023
¡Este material tiene más páginas!
Vista previa del material en texto
Contrastes de hipótesis 
sobre proporciones 
11 
11.1. Contraste de hipótesis sobre una proporc1on. 
11.2. Contrastes de hipótesis sobre dos proporciones. 
11.2.1. Dos proporciones independientes. 
11.2.2. Dos proporciones relacionadas. 
11.3. Contrastes de hipótesis sobre más de dos proporciones. 
11.3.1. Más de dos proporciones independientes. 
11.3.2. Más de dos proporciones relacionadas. 
a) Comparaciones múltiples. 
Ap~ndice 11. 
Indices de riesgo. 
Ejercicios. 
11.1. Contraste de hipótesis sobre una proporción 
En psicología es relativamente frecuente encontrarse con variables dicotómicas 
o dicotomizadas, es decir, con variables que sólo pueden tomar dos valores: acierto-
error, verdadero-falso, tratados-no tratados, recuperados-no recuperados, a favor-en 
contra, aprobados-suspensos, etc. Podemos llamar, de forma genérica, éxito y fraca-
so a los dos niveles de una variable de este tipo. 
En el capítulo 1, apartado 1.3.4, hemos estudiado ya la distribución muestra) 
de los estadísticos X = «número de éxitos» y P = «proporción de éxitos». Hemos 
visto allí que ambos estadísticos se distribuyen según el modelo binomial con pa-
rámetros n (número de ensayos) y n (proporción de éxitos). El modelo binomial, 
en consecuencia, nos proporciona las probabilidades asociadas a los estadísticos X 
y P, y eso significa que podemos utilizar la distribución binomial para diseñar 
contrastes de hipótesis sobre proporciones. 
Además, sabemos que a medida que n va aumentando, las distribuciones de X y 
P se aproximan a la distribución normal con parámetros: 
E(X) = nn <Tx = Jnn(l - n) (11.l) 
y 
E(P) = n <Tp = Jn(l - n)/n (11.2) 
En consecuencia, la variable: 
X - nn p -1t z =--;:::=== 
Jnn(l -n) Jn(l -n)/n 
(11.3) 
se distribuirá N(O, 1). Podemos, también, por tanto, utilizar la distribución normal 
para diseñar contrastes de hipótesis sobre proporciones. El cuadro 11.1 ofrece, 
siguiendo la lógica ya conocida, los pasos resumidos del contraste de hipótesis 
sobre una proporción. 
© Ediciones Pirámide 
494 / Análisis de datos en psicología 11 
CUADRO 11.1 
Contraste de hipótesis sobre una proporción. Resumen del procedimiento 
1. Hipótesis: 
a) Contraste bilateral: H 0 : 7t = n0; H 1: 7t # n0 • 
b) Contraste unilateral derecho: H 0 : 7t :::; n 0 ; H 1: n > n0 . 
e) Contraste unilateral izquierdo: H 0 : 7t ~ n0; H 1: n < n0 . 
2. Supuestos: la variable estudiada es dicotómica o dicotomizada y n es la verdadera 
proporción de éxitos en la población (éxito hace referencia a uno cualquiera de los 
dos niveles de la variable). De esa población extraemos una muestra aleatoria de n 
observaciones con probabilidad de éxito n constante en cada extracción. 
3. Estadísticos de contraste 1: 
3.1. X = número de éxitos en los n ensayos. 
P = X /n = proporción de éxitos en los n ensayos. 
3.2. 
X - nn0 
Z=-;:::=== J nno(I - 7t0 ) 
4. Distribuciones muestrales: 
p - 7to 
4.1. X y P se distribuyen según el modelo binomial con parámetros n y n0 . 
4.2. Z se aproxima a la distribución N(O, 1) a medida que 11 va aumentando 2• 
5. Reglas de decisión: 
a) Contraste bilateral: 
a. I. Se rechaza H 0 si X o P toman un valor tan alejado de su valor esperado 
bajo H 0 que la probabilidad de obtener un valor tan alejado o más que 
ése es menor que -x./2. 
a.2. Se rechaza H0 si Z:;;;z,12 o Z~z 1 -,12 • 
1 Tenemos tres estadístícos. Dos de ellos (X y P) son en realidad el mismo y poseen una distribu-
ción muestra! exacta (la distribución binomial con parámetros n y rr). El otro (Z) posee una distri-
bución muestra! aproximada (la distribución normal estandarizada). Los dos primeros son preferibles 
con muestras pequeñas (por ejemplo, con 11 ,,¡;; 25, que es el tope de la tabla binomial del apéndice final). 
L será preferiblemente utilizado con muestras grandes (por ejemplo. con 11 > 25, que es justo hasta donde 
llega la tabulación de la distribución binomial en el apéndice final). 
1 Si 11 no es muy grande. la aproximación es un poco más exacta utilizando la corrección por 
cominuidad, que consiste en sumar (si X es menor que nrr) o restar (si X es mayor que nrr) 0,5 puntos a X, 
o, de forma equivalente, 0,5/11 puntos a P para hacer el contraste algo más conservador (no faltan 
autores que desaconsejen esta corrección por continuídad; por ejemplo, Richardson, 1990): 
X± 0,5 -11rr0 
Z=----
0.5 
P ±- - rro 
11 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 495 
CUADRO 11.1 (continuación) 
h) Contraste unilateral derecho: 
h. l. Se rechaza H 0 si X o P toman un valor tan grande que la probabilidad 
de obtener un valor como ése o mayor es menor que :x. 
h.2. Se rechaza H 0 si Z ~ z 1 _,. 
e) Contraste unilateral izquierdo: 
c.I. Se rechaza H0 si X o P toman un valor tan pequeño que la probabilidad 
de obtener un valor como ése o más pequeño es menor que :x. 
c.2. Se rechaza H 0 si Z ~ z,. 
6. Nivel critico: 
a) Contraste bilateral: 
a. I. Si utilizamos X o P. el nivel crítico p es el doble de la probabilidad de 
obtener un valor X o P tan alejado de su valor esperado bajo H 0 como 
el obtenido. 
a.2. Si utilizamos Z. p = 2[P(Z ;:;, l=kl)J, siendo zk el valor concreto tomado 
por el estadístico Z. 
h) Contraste unilateral derecho: 
h. I. Si utilizamos X o P. el nivel crítico p es la probabilidad de obtener un 
valor X o P tan grande como el obtenido o más grande. 
h.2. Si utilizamos Z. p = P(Z ~ =d· 
e) Contraste unilateral izquierdo: 
c. I. Si utilizamos X o P. el nivel critico p es la probabilidad de obtener un 
valor X o P tan pequeño como el obtenido o más pequeño. 
c.2. Si utilizamos Z. p = P(Z ~ =d· 
7. Intervalo de confianza: 
11 ( ;: 2 JP( 1 - Pl :2 ) 
p + + = -- + ~--
11 + : 2 211 - 11 411 2 
( 11.4) 
donde: se refiere a lz,; 21 o 1= 1 - •. iJ. 
Conforme 11 va aumentando, 11/(11 + z2) va tendiendo a l. y z2/(211) y z2/(411 2) van 
tendiendo a cero, de modo que, con 11 grande. la ecuación (11.4) para los límites 
de confianza de la proporción puede reducirse a: 
P ± I:, 2 lv P(I - P)/11 ( 11.5) 
«) Ediciones Pirámide 
496 / Análisis de datos en psicología 11 
EJEMPLO 11.1. Al parecer, la sintomatología del 30 por ciento de los pacientes 
neuróticos remite espontáneamente durante los tres primeros meses del trastorno. 
Según esto, parece lógico pensar que una terapia eficaz con este tipo de trastornos 
deberá conseguir a lo largo de los tres primeros meses un número de recuperaciones 
significativamente mayor de las que se producen de forma espontánea. Los resultados 
obtenidos con 25 sujetos a los que se les ha aplicado una determinada terapia indican 
que, en los tres primeros meses, ha habido 11 recuperaciones. ¿Podemos afirmar que el 
número de mejoras obtenidas con la terapia difiere significativamente del esperable 
por simple recuperación espontánea? (ex = 0,05). 
Tenemos una variable dicotómica (pacientes recuperados-pacientes no recuperados) 
y una muestra de n = 25 observaciones. Llamaremos 7t a la proporción poblacional de 
la categoría pacientes recuperados. Hemos observado X = 11 recuperaciones y, por 
tanto, la proporción observada de recuperaciones es P = 11/25 = 0,44. 
Vamos a efectuar un contraste sobre 7t para determinar si la verdadera proporción 
de pacientes recuperados con la aplicación de la terapia es superior a la que cabe 
esperar por simple recuperación espontánea (es decir, superior a 0,30). 
l. Hipótesis: H0 : 7t ~ 0,30; H 1: 7t > 0,30 (contraste unilateral derecho). 
2. Supuestos: tenemos una muestra aleatoria de 25 observaciones con probabili-
dad constante 0,30 de que una observación cualquiera pertenezca a la catego-
ría de pacientes recuperados. 
3. Estadísticos de contraste 3: 
3.1. X= 11. 
p = 0,44. 
11 - 25(0,30) 
3.2. z = --;::::===== 
J25(0,30)(1 - 0,30) 
4. Distribuciones muestrales: 
0,44 - 0,30 
----;:::===== = 1,53 
Jo,30(1 - 0,30)/25 
4.1. X y P se distribuyen binomialmente con parámetros n = 25 y 7t = 0,30. 
4.2. Z se aproxima a N(O, 1 ). 
5. Regla de decisión: 
5.1. Se rechazaH 0 si la probabilidad de obtener valores X;::-; 11 o P ;::-; 0,44 
es menor que ex= 0,05. Es decir, se rechaza H 0 si se verifica: 
P(X ;::-; 11) < 0,05, o, equivalentemente, P(P ;::-; 0,44) < 0,05. En la tabla 
de la distribución binomial, con n = 25 y 7t = 0,30, vemos que 
P(X ;::-; 11) = P(P ;::-; 0,44) = 0,098. 
5.2. Se rechaza H 0 si Z ;::-; z0 .95 = 1,64. 
6. Decisión: 
6.1. Como P(X ;::-; 11) = P(P ;::-; 0,44) = 0,098 es mayor que ex= 0,05, mantene-
mos H 0 . 
3 En un contraste concreto sólo es necesario utilizar uno de los varios estadísticos de contraste 
propuestos. Nosotros aquí, en el ejemplo, utilizamos los tres estadísticos con el único objetivo de 
ejemplificar su uso. 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 497 
6.2. Como Z = 1,53 es menor que z0 .95 = 1,64, mantenemos H 0 • 
Tanto con los estadísticos X y P como con el estadístico Z se llega a la misma 
decisión 4 . La conclusión es que la proporción de mejoras que se obtiene con la 
terapia en cuestión no es significativamente más alta que la proporción de 
mejoras que se producen por simple recuperación espontánea. 
11 .2. Contrastes de hipótesis sobre dos proporciones 
11.2.1. Dos proporciones independientes 
Ahora, en lugar de medir una variable dicotómica o dicotomizada (con dos 
niveles a los que seguiremos llamando éxito y fracaso) en una sola población, lo 
hacemos en dos. Tenemos, pues, dos poblaciones de las que extraemos sendas 
muestras aleatorias de tamaños n1 y n2 y en las que definimos los estadísticos 
X 1 = «número de éxitos en los n1 ensayos de la muestra 1» y X 2 = «número de 
éxitos en los n2 ensayos de la muestra 2». Tendremos: 
n 1 =proporción de éxitos en la población l. 
P 1 = X i/n1 = proporción de éxitos en la muestra l. 
E(P1)=n1 
u~ = n1(1 - ni)/n1 
1 
(11.6) 
n2 = proporción de éxitos en la población 2. 
P 2 = X 2/n 2 = proporción de éxitos en la muestra 2. 
E(P2) = n2 
u~ = n2(1 - 7t2)/n2 
2 
Teniendo en cuenta que una proporción no es más que una media, podemos 
seguir la lógica expuesta en el capítulo 4 acerca de los contrastes de hipótesis sobre 
dos medias independientes para diseñar contrastes de hipótesis referidos a dos 
proporciones independientes. En el cuadro 11.2 están resumimos los pasos del 
contraste. 
4 La probabilidad asociada al estadístico Z (el nivel crítico p) es más parecida a la probabilidad 
exacta proporcionada por la distribución binomial si se utiliza la corrección por continuidad. En el 
ejemplo, el nivel crítico con los estadísticos X y P vale p = P(X ~ 11) = 0,098, mientras que el nivel 
crítico en el estadístico Z vale p = P(Z ~ 1,53) = 0,063. Si utilizamos la corrección por continuidad 
obtenemos: 
11 - 0,5 - 25(0,30) 
z = = 1,31 
J25(0,30)(1 - 0,30) 
en cuyo caso el nivel crítico con el estadístico Z vale p = P(Z ~ 1,31) = 0,0951, valor muy parecido al 
nivel crítico proporcionado por la distribución exacta (0,098). 
© Ediciones Pirámide 
498 / Análisis de datos en psicología 11 
CUADRO 11.2 
Contraste de hipótesis sobre dos proporciones independientes. 
Resumen del procedimiento 
l. Hipótesis 
a) Contraste bilateral: H 0 : rr1 - rr2 = k; H 1: rr 1 - rr2 # k. 
h) Contraste unilateral derecho: H 0 : rr 1 - rr2 :::;; k: H 1: rr 1 - rr2 > k. 
e) Contraste unilateral izquierdo: H 0 : rr 1 - rr2 ;>, k; H 1: rr 1 - rr2 < k. 
2. Supuestos: la variable estudiada es dicotómica o dicotomizada en las dos pobla-
ciones. De esas dos poblaciones extraemos independientemente dos muestras 
aleatorias de tamaños 11 1 y 112 con probabilidades de éxito (rr1 y rr2, respectivamen-
te) constantes en cada extracción. 
3. Estadísticos de contraste: 
3.1. Si, en H0 , k =O, 
donde: 
3.2. Si, en H0 , k #O, 
P 1 - P2 
Z=----;::======= 
jP(I - P)(l/11 1 + l/112) 
11 1P 1 +11 2P 2 
P=-----
111+112 
(11.7) 
(11.8) 
(11.9) 
4. Distribución muestra): Z (tanto [11.7] como [11.9]) se aproxima, conforme los 
tamaños muestrales van aumentando, a N(O, 1 ). 
5. Zona critica: 
a) Contraste bilateral: Z :::;; z,12 y Z ;>, z 1 _ ,12 . 
h) Contraste unilateral derecho: Z ;>, z 1 -·· 
e) Contraste unilateral izquierdo: Z :::;; z,. 
6. Regla de decisión: se rechaza H 0 si el estadístico de contraste Z cae en la zona 
crítica; en caso contrario, se mantiene. 
lCJ Edic10111!s Pirc'.:.m1de 
Contrastes de hipótesis sobre proporciones / 499 
CUADRO 11.2 (continuación) 
7. Nivel crítico: 
a) Contraste bilateral: p = 2[P(Z ;;:,: lzkJ)], siendo zk el valor concreto tomado por 
el estadístico Z. 
b) Contraste unilateral derecho: p = P(Z ;;:,: zk). 
e) Contraste unilateral izquierdo: p = P(Z ~ zk). 
8. Intervalo de confianza: 
(11.10) 
EJEMPLO 11.2. El grado de dificultad de las preguntas de un test se suele medir 
por el número de sujetos que los aciertan, o más exactamente, por la proporción de 
aciertos. Para averiguar si dos preguntas de un determinado test de aptitud general 
difieren en dificultad hemos seleccionado 200 sujetos y los hemos repartido aleatoria-
mente en dos grupos de 100. Un grupo de sujetos ha respondido a la pregunta 1 y el 
otro a la pregunta 2. La pregunta 1 la han acertado 70 sujetos y la 2 la han acertado 
60. ¿Podemos afirmar, con un nivel de significación de 0,05, que las dos preguntas 
estudiadas difieren en dificultad? 
l. Hipótesis: H0 : n 1 - n2 =O; H 1: n1 - n2 #O (contraste bilateral). 
2. Supuestos: la variable estudiada es dicotómica (acierto-error) en las dos 
poblaciones: la población de respuestas a la pregunta 1 y la población de 
respuestas a la pregunta 2; de esas dos poblaciones extraemos independiente-
mente dos muestras aleatorias de tamaño 100 con probabilidades de acierto 
(n 1 y n2, respectivamente) constantes en cada extracción. 
3. Estadístico de contraste (para el caso en el que k = O): 
70 
P1 =-=0,70 
100 
60 
P2 = -=0,60 
100 
100(0,70) + 100(0,60) 
p = = 065 
100 + 100 ' 
0,70 - 0,60 
z = = 1,48 
J0,65(1 - 0,65)(1/100 + 1/100) 
4. Distribución muestra(: Z se distribuye N(O, 1). 
5. Zona crítica: Z ~ z0 •025 = -1,96 y Z;;:,: z0 .975 = 1,96. 
6. Decisión: puesto que 1,48 está comprendido entre -1,96 y 1,96, mantenemos 
H0 • No podemos afirmar que las proporciones de acierto n 1 y n2 difieran y, 
por tanto, no podemos afirmar que las preguntas 1 y 2 difieran en dificultad. 
© Ediciones Pirámide 
500 / Análisis de datos en psicología 11 
7. Nivel crítico: p = 2[P(Z ~ 11,481)] = 2(0,0694) = 0,1388. Este valor nos indica 
que la hipótesis nula podría ser rechazada con un nivel de riesgo de 0,1388. Es 
decir, podríamos rechazar H 0 , pero con una probabilidad de equivocarnos de 
0,1388. 
8. Intervalo de confianza: 
(0, 70 - 0,60) ± 1,96 
O, 70(0,30) 0,60(0,40) 
---+ = (-0,03;0,23) 
100 100 
Los límites de confianza indican que la verdadera diferencia entre n1 y n2 se 
encuentra entre -0,03 y 0,23. Esto significa que la verdadera diferencia puede 
ser cero y, por tanto, las dos preguntas pueden ser igualmente dificiles, lo cual 
es coherente con la decisión tomada. 
11 .2.2. Dos proporciones relacionadas 
Seguimos trabajando con una variable que sólo puede tomar dos valores 
(variable dicotómica o dicotomizada), pero ahora no disponemos de dos muestras 
independientes de tamaños n1 y n2 , sino una sola muestra de tamaño m en la que 
efectuamos dos medidas de una misma variable (se trata de un diseño longitudinal). 
La situación es similar a la presentada a propósito del contraste de hipótesis sobre 
dos medias relacionadas (apartado 4.4). 
Si en una muestra de m sujetos medimos, en dos momentos temporales diferen-
tes (a los que llamaremos A = antes, y D = después), una variable dicotómica 
cualquiera (con valores 1 y 2), los datos obtenidos pueden representarse según 
muestra la tabla 11.1. 
TABLA 11.1 
Disposición de los datos y notación en una tabla de contingencia bidimensional 
referida a dos medidas (A y D) en una variable dicotómica (con valores 
1 = éxito y 2 =fracaso). Frecuencias absolutas 
D =Después 
2 
A= Antes 
1 n11 n12 n1+ 
2 n11 n12 nz+n+1 n+2 
n 11 = Número de sujetos que puntúan 1 en las dos medidas. 
n12 =Número de sujetos que puntúan 1 en la medida antes y 2 en la medida 
después. 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 501 
ni 1 = Número de sujetos que puntúan 2 en la medida antes y 1 en la medida 
después. 
n22 =Número de sujetos que puntúan 2 en las dos medidas. 
m = n 11 + n1i + ni 1 + n22 . 
Bajo la hipótesis nula de que la proporción de éxitos antes (n1+ = nA) y la pro-
porción de éxitos después (n+ 1 = nD) son iguales, cabe esperar que en las dos 
medidas efectuadas (A y D) se produzcan tantos cambios de 1 a 2 como de 2 a 1 
(n 12 :::::: n21 ). Es decir, cabe esperar que los cambios observados sean sólo resultado 
del proceso de muestreo. Pero si, por el contrario, H0 es falsa y nA difiere de nD, 
los cambios en una dirección serán más numerosos que en la otra (n 12 =/= n21). 
Haciendo: 
y 
podemos utilizar la distribución binomial para conocer la probabilidad asociada a 
un número concreto de cambios (en cualquier dirección) bajo la hipótesis nula de 
que la proporción de éxitos antes es la misma que la proporción de éxitos después: 
1tA = 1to. 
Y con tamaños muestrales grandes, podemos contrastar la hipótesis nula 
nA = n0 mediante una versión del estadístico X 2 de Pearson propuesta por McNe-
mar (1947): 
nf 2 + ni 1 - 2n 12n21 + ni 1 + nf2 - 2n 12n21 
2(n 12 + n21 ) 
(n12 - n1¡)2 
n12 + n21 
(n12 - n21)2 + (n21 - n12)2 
2(n 12 + n2¡) 
2nf 2 + 2ni 1 - 4n 12n21 
2(n12 + n21) 
(11.11) 
que se distribuye según x2 con 1 grado de libertad. 
Así pues, el contraste sobre dos proporciones relacionadas nos permite evaluar, 
a partir de los cambios que se producen en una y otra dirección, si la proporción de 
éxitos en la medida antes (nA) difiere o no de la proporción de éxitos en la medida 
después (n0 ). En el cuadro 11.3 aparece resumido el contraste sobre dos proporcio-
nes relacionadas. Recordemos una vez más que llamamos éxito a uno cualquiera de 
los dos niveles de la variable dicotómica estudiada. 
© Ediciones Pirámide 
502 / Análisis de datos en psicología 11 
CUADRO 11.3 
Contraste de hipótesis sobre dos proporciones relacionadas. 
Resumen del procedimiento 
l. Hipótesis: 
a) Contraste bilateral: H0 : n:A = n:D; H 1: n:A # n:D. 
b) Contraste unilateral derecho: H0 : n:A ~ n:D; H 1: n:A > n:D. 
e) Contraste unilateral izquierdo: H0 : n:A ~ n:D; H 1: n:A < n:D. 
2. Supuestos: muestra aleatoria de m pares de puntuaciones, independientes entre sí, 
obtenidos al medir una variable dicotómica o dicotomizada. 
3. Estadísticos de contraste: 
3.1. T = 1112· 
3.2. 5 
' (111 i - 1121 l2 
X-=·-----
1112 + 1121 
4. Distribuciones muestrales: 
4.1. T se distribuye según el modelo de probabilidad binomial con parámetros 
11 = 1112 + 1121 y 71: = 0,5. 
4.2. xi se aproxima a la distribución ;.i:i con 1 grado de libertad a medida que 11 
va aumentando 6 • 
5. Reglas de decisión: 
a) Contraste bilateral: 
a.I. Se rechaza Ho T toma un valor tk tal que { P(T ~ td < :xi2 SI P(T ~ tkl < :x/2 
a.2. Se rechaza H 0 si X 2 ~ i - .;.i:f. 
b) Contraste unilateral derecho: 
b.I. Se rechaza H0 st T toma un valor tk tal que P(T ~ tkl < :x. 
h.2. Se rechaza H 0 si Xi ~ 1 - 2.xf. 
e) Contraste unilateral izquierdo: 
c. l. Se rechaza H 0 si T toma un valor tk tal que P( T ~ tk) < :x. 
c.2. Se rechaza H0 si xi ~ 1 _ i.xf. 
' Este estadístíco fue ídeado por McNemar en 1947. de ahí que. en muchos contextos, el contraste 
sobre dos proporciones relacionadas sea denominado prueha de McNemar. 
6 Si n no es muy grande. la aproximación es un poco más exacta utilizando la corrección por 
continuidad. que consiste en restar 1 punto al valor absoluto de la diferencia n 12 - n21 para hacer el 
contraste algo más conservador: 
(11112 - 11211 - !)' 
xi=------
1112 + n11 
~) Ediciones Pirámide 
6. 
7. 
Contrastes de hipótesis sobre proporciones / 503 
CUADRO 11.3 (continuación) 
Nivel crítico: 
a) Contraste bilateral: 
a.I. p = 2[P(r ~ tt)J, siendo r el menor de n 12 y n21· 
a.2. p = P(X 2 ;;;?: xf), siendo xf el valor concreto tomado por X 2• 
b) Contraste unilateral derecho: 
b.1. p = P(T;;;?: lt). 
b.2. p = 2[P(X 2 ;;;?: xf)]. 
e) Contraste unilateral izquierdo: 
c.l. p = P(T ~ lt). 
c.2. p = 2[P(X 2 ;;;?: xf)]. 
Intervalo de confianza: 
Siendo PA = n12/m la proporción de éxitos en la medida antes, y P0 = n21 /m la 
proporción de éxitos en la medida después, el intervalo de confianza para nA - n" 
viene dado por: 
(11.12) 
EJEMPLO 11.3. Existe la hipótesis de que los procesos de psicosis esquizofrénica 
van acompañados de un incremento del nivel de cobre en sangre. Esto significa que los 
pacientes con cuadros de psicosis esquizofrénica graves presentan un nivel de cobre en 
sangre más alto que los pacientes con cuadros leves. Un psicólogo clínico cree haber 
descubierto un tratamiento mixto (droga-terapia) capaz de reducir el nivel de cobre en 
sangre. Para comprobar si esto es cierto elige una muestra aleatoria de 50 pacientes 
esquizofrénicos y mide en cada uno de ellos el nivel de cobre en sangre antes y después 
de ser sometidos al nuevo tratamiento. Los resultados obtenidos aparecen en la tabla 
11.2. ¿Podemos concluir que la proporción de pacientes con nivel alto de cobre en 
sangre ha disminuido con la aplicación del nuevo tratamiento? (!X = 0,05). 
Nivel de cobre 
antes del tratamiento 
© Ediciones Pirámide 
TABLA 11.2 
Alto (1) 
Bajo (2) 
Nivel de cobre 
después del tratamiento 
Alto (1) Bajo (2) 
3 28 
10 9 
504 / Análisis de datos en psicología 11 
Tenemos una muestra aleatoria de m = 50 sujetos a los cuales se les toman dos 
medidas en una variable dicotomizada: nivel de cobre en sangre (1 =alto, 2 =bajo). 
Para saber si la proporción de sujetos con nivel de cobre alto ha disminuido tras la 
aplicación del tratamiento debemos averiguar si n,.. > n0 (siendo n,.. y n0 la proporción 
de sujetos con nivel de cobre alto antes y después del tratamiento, respectivamente). 
l. Hipótesis: H0 : n,.. ~ n0 ; H 1: n,.. > n0 (contraste unilateral derecho). 
2. Supuestos: muestra aleatoria de m = 50 pares de puntuaciones, independientes 
entre sí, obtenidos al medir una variable dicotomizada. 
3. Estadístico de contraste: 
xi= (n12 - ni1)i 
n1i + ni1 
(28 - 10¡i 
----=8,53 
28 + 10 
4. Distribución muestra!: xi se aproxima a xi con 1 grado de libertad. 
5. Regla de decisión: se rechaza H 0 si Xi ~ 1 _ i.X~, es decir, si 
xi ~ 0.9o'l.~ = 2,71. 
Como el valor tomado por el estadístico de contraste (8,53) es mayor que el 
punto crítico (2,71) rechazamos H 0 y concluimos que la proporción de pacien-
tes esquizofrénicos con nivel de cobre en sangre alto ha disminuido significati-
vamente tras la aplicación del nuevo tratamiento. 
6. Intervalo de confianza: 
(0,56 - 0,20) ± 1,96j(28 + 10)/50i = (0,12;0,60) 
Vemos que el intervalo de confianza no incluye el cero, indicando esto que la 
verdadera diferencia entre n,.. y n0 es distinta de cero (lo cual podemos afirmar con 
una confianza del 95 por 100). 
EJEMPLO 11.4. En un grupo de terapia de pareja al que asisten 25 matrimonios se 
han efectuado dos controles con una diferencia de tres meses. Una cuestión básica 
para valorar la marcha de la terapia se refiere al grado de compenetración (buena o 
mala) entre los miembros de la pareja. Sabiendo que los matrimonios que manifesta-
ron tener buena compenetración fueron 10 en el primer control y 18 en el segundo, y 
que 4 matrimonios de los que manifestaron buena compenetración en el primer 
control pasaron a manifestar mala compenetración en el segundo, ¿podemos concluir 
que la proporción de matrimonios con buena compenetración se ha incrementado 
durante los tres meses de terapia considerados? (ex = 0,05). 
Tenemos una muestra aleatoria de m = 25 matrimonios a los cuales se les toman 
dos medidas en una variable dicotomizada: grado de compenetración ( 1 = bueno, 
2 =malo). Consideraremos que la proporción de matrimonios con buena compenetra-
ción se haincrementado si n,.. < n0 (siendo n,.. y n0 la proporción de matrimonios con 
buena compenetración antes -primer control- y después -segundo control-, 
respectivamente). Con la información disponible formamos la tabla de frecuencias 11.3. 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 505 
TABLA 11.3 
Grado de compenetración 
en el segundo control 
Buena (1) Mala (2) 
Buena (!) 
Mala (2) 
6 
12 
4 
3 
Grado de compenetración 1 
en el primer control 
'--~~~~.__~~~~~~~~---1 
l. Hipótesis: H0 : nA ~ nv; H 1: nA < nv (contraste unilateral izquierdo). 
2. Supuestos: muestra aleatoria de m = 25 pares de puntuaciones, independientes 
entre sí, obtenidos al medir una variable dicotomizada. 
3. Estadístico de contraste: T = n 12 = 4. 
4. Regla de decisión: se rechaza H 0 si P(T :E; 4) < IX. En la tabla de la distribución 
binomial, con n = n 12 + n 21 = 16 y ir= 0,5, obtenemos P(T :E; 4) = 0,038. 
Como esa probabilidad es menor que IX= 0,05, rechazamos H 0 y concluimos 
que la proporción de matrimonios con buena compenetración ha aumentado 
significativamente. 
5. Nivel crítico: p = P(T :E; 4) = 0,038. 
11.3. Contrastes de hipótesis sobre más de dos 
proporciones 
11.3.1. Más de dos proporciones independientes 
El estudio de J > 2 proporciones independientes ha merecido especial atención 
por parte de estadísticos y metodólogos durante muchas décadas, y todavía sigue 
siendo objeto de atención especial. La frecuencia con la que un profesional de 
cualquier área de conocimiento (y en especial en las ciencias sociales y del compor-
tamiento) se ve en la necesidad de trabajar con más de dos proporciones indepen-
dientes justifica sobradamente esta atención. 
Pero no vamos a tratar aquí, en este apartado, los contrastes sobre más de dos 
proporciones independientes. Lo haremos en el próximo capítulo (en el apartado 
10.3), el cual está dedicado enteramente a la prueba X 2 de Pearson. 
11.3.2. Más de dos proporciones relacionadas 
Al estudiar más de dos proporciones relacionadas nos encontramos en una 
situación similar a la expuesta para el caso de dos proporciones relacionadas. 
Seguimos trabajando con variables que sólo pueden tomar dos valores (variables 
dicotómicas o dicotomizadas). 
© Ediciones Pirámide 
506 / Análisis de datos en psicología 11 
A cada sujeto se le toman J medidas de la variable dicotómica estudiada (o se 
miden J variables dicotómicas en una muestra de n sujetos). Estamos, por tanto, 
ante un diseño idéntico al presentado a propósito del ANOVA A-EF-MR (medidas 
repetidas o bloques con un sujeto por nivel y bloque), pero con la diferencia de 
que, aquí, la variable medida (es decir, la variable dependiente) es una variable que 
sólo puede tomar dos valores. 
Los datos pueden organizarse en un tabla de doble entrada, tal como muestra la 
tabla 11.4, con los J niveles de la variable independiente (muestras, tratamientos, 
etcétera) en las filas y los n sujetos o bloques en las columnas. 
TABLA 11.4 
Estructura de los datos y notación en un diseño con J 
tratamientos o muestras y n sujetos o bloques 
Sujetos o bloques 
Tratamientos 
1 2 i T+; p +j n o muestras 
1 Y11 Y21 Y¡, Y,, 1 T+1 P+1 
2 Y12 Y22 Y¡z Y.2 T+2 p +2 
... ... ... ... ... ... ... 
j Y,; Y2; Y;; Y,,; T+; p +j 
... ... ... ... ... ... ... 
J Yu Y21 Y¡J Y,,J T+J p +J 
7;+ T,+ Ti+ 7;+ T,, + T 
La notación es exactamente la misma que la utilizada para el modelo de 
ANOVA A-EF-MR. Pero hay que tener presente que Yú ahora es una variable 
dicotómica o dicotomizada, con valores: 1 = éxito y O =fracaso. Las proporciones 
marginales P + i representan las proporciones de éxito observadas en cada tratamien-
to o muestra: P + i = T+ /n. 
Cochran (1950) ha diseñado un procedimiento 7 para contrastar la hipótesis de 
que las J proporciones poblacionales de éxito n + i son iguales. El cuadro 11.4 
recoge, resumidos, los pasos del contraste. 
7 Este procedimiento es generalización del de McNemar para dos proporciones relacionadas. De 
hecho, si J = 2, el estadístico de McNemar y el de Cochran son exactamente el mismo (ver, por ejemplo, 
Conover, 1980, pág. 204). 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 507 
CUADRO 11.4 
Contraste de hipótesis sobre más de dos proporciones relacionadas. 
Resumen del procedimiento 
1. Hipótesis: 
Ho: 1C + 1 = 1C + 2 = · · · = 1C + 1· 
Es decir, la proporción de éxitos no es la misma en cada uno de los J tratamientos. 
H1: 1C, .i :f:. 1C +;-para algún valor dej. 
Es decir, la proporción de éxitos es la misma en los J tratamientos. 
2. Supuestos: la variable estudiada es dicotómica; de ella se toman J medidas en 
una muestra aleatoria de n sujetos o bloques, con probabilidad de éxito 1C + j 
constante en cada medida. 
3. Estadístico de contraste: 
J(J- 1) r. T2 .- (J - l)T2 Q = +1 
JT-'I.TT, 
(11.13) 
4. Distribución muestral: Q se distribuye según X2 con J - l grados de libertad. 
5. Zona crítica: Q;:: i -aXJ- i· 
6. Regla de decisión: se rechaza H0 si el estadístico de contraste Q cae en la zona 
crítica; en caso contrario, se mantiene. 
Si se rechaza H0, podemos afirmar que la proporción de éxitos no es la misma 
en los J tratamientos o poblaciones. 
EJEMPLO 11.5. Un psicólogo quiere averiguar si 4 preguntas de un test que ha 
construido poseen o no la misma dificultad. Para ello, una muestra de 10 sujetos 
aleatoriamente seleccionados responde a las 4 preguntas. La tabla 11.5 recoge las 
respuestas (1 = aciertos, O = errores) dadas por los 10 sujetos a cada una de las 
preguntas. Basándonos en la proporción de aciertos de cada pregunta y utilizando 
:x = 0,05, ¿podemos afirmar que las preguntas difieren en dificultad? 
La variable es dicotómica y ha sido medida J = 4 veces en una muestra aleatoria 
de 10 sujetos. La prueba de Cochran es apropiada para analizar estos datos. 
l. Hipótesis: 
H o: rr + t = rr + 2 = rr + 3 = rr + 4 
Es decir, la proporción de aciertos es la misma en las 4 pregur.tas. 
H 1: rr + i # rr + i' para algún valor de j. 
Es decir, la proporción de aciertos no es la misma en las 4 preguntas. 
© Ediciones Pirámide 
508 / Análisis de datos en psicología 11 
TABLA 11.5 
Sujetos 
Preguntas 1 2 3 4 5 6 7 8 9 10 T+i T~i 
1 1 1 1 1 o o 1 o 1 o 6 36 
~ 1 o o 1 o 1 o o 1 1 5 25 
3 1 o 1 1 1 1 1 1 1 1 9 81 
4 1 o o o o o 1 o o o 2 4 
T¡ + 4 1 2 3 1 2 3 1 3 2 22 146 
T!+ 16 1 4 9 1 4 9 1 9 4 58 
2. Supuestos: la variable estudiada es dicotómica; de ella se toman J = 4 medidas 
en una muestra aleatoria de n = 10 sujetos con probabilidad de acierto 
constante en cada medida. 
3. Estadístico de contraste: 
4(4 - 1)(146) - (4 - 1)222 
Q = 4(22) - 58 = 10 
4. Distribución muestra(: Q se distribuye según ·¡_2 con 3 grados de libertad. 
5. Zona crítica: Q ~ 0 . 95,d = 7,81. 
6. Decisión: como el valor tomado por el estadístico de contraste Q es mayor que 
el punto crítico (10 > 7,81), rechazamos H 0 . Podemos concluir que la propor-
ción de acierto no es la misma en las 4 preguntas, por lo que no todas poseen 
la misma dificultad. 
a) Comparaciones múltiples 
Si rechazamos la hipótesis general referida a la igualdad entre las J proporcio-
nes, podemos estar interesados en concretar qué poblaciones (tratamientos) difieren 
de qué otras. Para ello, podemos utilizar cualquiera de los procedimientos de 
comparaciones múltiples ya conocidos, con la única salvedad de que ahora estamos 
trabajando con proporciones. 
Llamemos Lh a una comparación cualquiera y chi a los coeficientes asignados a 
cada proporción poblacional para definir esa comparación Lh: 
Lh = chln+ 1 + ch2n+ 2 + ··· + chJn+J = "'f.chin+i 
j 
Podemos estimar Lh mediante: 
Lh =chip +1 + ch2P +i + ··· + chJP +J ="'f. chip +i 
j 
(11.14) 
( 11.15) 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 509 
y obtener: 
at =-----
L, nJ(J - ]) 
(11.16) 
n 
A partir de aquí podemos diseñar procedimientos para comparaciones múltiples 
entre proporciones aplicando la lógica ya estudiada en el capítulo 6.En todos los 
casos, la hipótesis sometida a contraste es: 
Para efectuar comparaciones planeadas ortogonales o comparaciones de tenden-
cia podemos utilizar el estadístico: 
(11.17) 
que se distribuye según x2 con 1 grado de libertad. Rechazaremos la hipótesis Hoch1: 
Lh =O si el estadístico Z~ es mayor que el cuantil 100(1 - ix) de la distribución x2 
con 1 grado de libertad. 
Cada término Z~ es un componente del estadístico Q. de modo que, para un 
conjunto cualquiera de J - 1 comparaciones ortogonales se verifica: 
J-1 
¿ z~ = Q (11.18) 
j= 1 
Para comparaciones planeadas no ortogonales podemos utilizar el procedimiento 
de Dunn-Bonferroni: 
(11.19) 
siendo p = 1 - ix/(2k) y k el número de comparaciones que se ha planeado efectuar. 
Rechazaremos la hipótesis Hoch1: Lh =O si el valor absoluto de Lh es mayor que 
DMSoe· 
Para comparaciones a posteriori podemos utilizar el procedimiento de Tukey o 
el de Scheffé, dependiendo del tipo de contraste que estemos interesados en 
plantear: Tukey para efectuar las J(J - 1)/2 comparaciones por pares y Scheffé para 
efectuar todas las posibles comparaciones de cualquier tipo. Rechazaremos la 
hipótesis Hoch1: Lh =O si el valor absoluto de Lh es mayor que la DMS correspon-
diente: 
DMS 1 -aqJ,oo • 
Tukey = ~ <f[ (11.20) 
DMSScherré = J1-aX;-1 ªL, (11.21) 
© Ediciones Pirámide 
51 O / Análisis de datos en psicología 11 
EJEMPLO 11.6. En el ejemplo 11.5 hemos rechazado la hipótesis referida a la 
igualdad entre las proporciones de acierto correspondientes a cada pregunta. Vamos a 
ilustrar ahora los procedimientos para comparaciones múltiples estudiados en el 
último apartado utilizando comparaciones referidas a los datos de ese ejemplo. 
Comencemos con las comparaciones planeadas ortogonales. Supongamos que 
deseamos efectuar las siguientes dos comparaciones: 
L 1 =(O):n:+ 1 + (l):n:+ 2 + (- l):n:+ 3 + (O):n:+ 4 
L2 = (l):n:+ • + (l):n:+2 + (l):n:+J + (-3):n:+4 
Las hipótesis que tendremos que contrastar serán: H0 (1 1: L1 =O y H0(2): L 2 =O. 
En consecuencia: 
L1 = (0)0,6 + (1)0,5 + (-1)0,9 + (0)0,2 = -0,4 
L2 = (1)0,6 + (1)0,5 + (1)0,9 + (-3)0,2 = 1,4 
<J- = =005 
•2 4(22) - 58 (º2 + 12 + (-1)2 + 02) 
L, 10(4)(3) 10 ' 
u! = 4(22) - 58 (1 2 + 12 + 1 2 + ( - 3)2) = o,3 
L, 10(4)(3) 10 
Zi = -0,42/0,05 = 3,20 
z~ = 1,42/0,3 = 6,53 
Con un nivel de confianza de 0,95 obtenemos 0 ,95xf = 3,84. Por tanto, mantene-
mos H o(I, y rechazamos H o(2)· 
Utilizando ahora el procedimiento de Dunn-Bonferroni para efectuar las mismas 
dos comparaciones obtenemos: 
DMS081L,> = z0 ,9875 j{i¡, = 2,24 JQ,05 = 0,50 
DMSoe(Lil = z0 , 9875 Ft, = 2,24J'0,3 = 1,23 
Comparando estos valores con los de L1 y l 2 llegamos, al igual que antes, a la 
decisión de mantener H O(I, y a la de rechazar H 0121• 
Por último, si utilizamos los procedimientos de Tukey y de Scheffé para efectuar 
las 4(4 - 1)/2 = 6 posibles comparaciones por pares, obtenemos las siguientes diferen-
cias mínimas significativas: 
(J- = =o 05 
•2 4(22) - 58 (1 2 + ( -1)2) 
L 10(4)(3) 10 ' 
q 3 63 DMS = 0.95 4,oo • = -'- foOs =O 57 
Tukey j2 <1[ j2 V V,VJ • 
DMSscheffé = ~<Ji= fijl JQ,05 = 0,63 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 511 
APÉNDICE 11 
Índices de riesgo 
El estadístico Z utilizado para contrastar dos proporciones independientes (ver apartado 
11.2.1) puede utilizarse tanto en diseños transversales como en longitudinales. No obstante, 
cuando queremos comparar dos proporciones independientes en un diseño longitudinal, po-
demos obtener información adicional recurriendo a los índices de riesgo. Los índices de 
riesgo son muy utilizados en la investigación biomédica y epidemiológica para evaluar el 
impacto de supuestos factores desencadenantes sobre la aparición de un determinado desen-
lace. Resultan especialmente útiles para analizar diseños longitudinales en los que medimos 
dos variables dicotómicas. 
El seguimiento de los estudios longitudinales puede hacerse hacia adelante o hacia atrás. 
En los diseños longitudinales hacia adelante, llamados diseños prospectivos o de cohortes, los 
sujetos son clasificados en dos grupos con arreglo a la presencia o ausencia de algún factor 
desencadenante (por ejemplo, el hábito de fumar -fumadores y no fumadores-) y se les 
hace seguimiento durante un determinado período de tiempo para establecer la proporción 
de sujetos de cada grupo en los que se da un determinado desenlace objeto de estudio (por 
ejemplo, problemas cardiovasculares). 
En los diseños longitudinales hacia atrás, también llamados retrospectivos o de caso-
control, se forman dos grupos de sujetos a partir de la presencia o ausencia de una deter-
minada condición objeto de estudio (por ejemplo, sujetos sanos y pacientes con problemas 
vasculares) y se hace seguimiento hacia atrás intentando encontrar información sobre la 
proporción en la que se encuentra presente en cada grupo un determinado factor desenca-
denante (por ejemplo, el hábito de fumar). 
Los datos recogidos tanto con un diseño de cohortes como con un diseño de caso-control 
pueden representarse de forma genérica en una tabla de contingencia 2 x 2 como la que 
muestra la figura 11.6. En ambos casos utilizaremos la misma notación. No obstante, cada 
diseño de recogida de datos requiere la utilización de unos estadísticos particulares. 
TABLA 11.6 
Forma yenérica de representar las frecuencias obtenidas mediante 
un diseño de cohortes o un diseño de caso-control 
Desenlace ( lj) 
Sí U= 1) No U= 2) Total 
Desencadenante (X¡) 
1 
Sí (i = 1) nu n12 n1+ 
1 No (i= 2) ni1 ni1 ni+ 
Total n+I n+2 n 
Diseños prospectivos o de cohortes 
En los diseños de cohortes se establecen dos grupos de sujetos a partir de la presencia 
o ausencia de una condición que se considera desencadenante y se hace seguimiento hacia 
© Ediciones Pirámide 
512 / Análisis de datos en psicologla 11 
adelante para determinar qué proporción de sujetos de cada grupo alcanza un determinado 
desenlace. La medida de interés en este tipo de diseños suele ser el riesgo relativo (R,), el 
cual expresa el grado en que la proporción de desenlaces es más alta en un grupo que en 
el otro: 
R = n11fn1 + 
r nz1fn2+ 
(l l.22) 
El valor del índice de riesgo relativo se interpreta de la siguiente manera: el riesgo de 
encontrar un determinado desenlace entre los sujetos expuestos al factor desencadenante es 
R, veces más alto que entre los sujetos no expuestos al factor desencadenante. De otra 
manera, por cada desenlace observado entre los sujetos no expuestos, cabe esperar que 
aparezcan R, desenlaces entre los sujetos expuestos. Un riesgo relativo de 1 indica que la 
probabilidad de encontrarnos con el desenlace es la misma en el grupo de sujetos expuestos 
y en el grupo de sujetos no expuestos. 
Por supuesto, encontrar un riesgo relativo mayor que 1 no es suficiente para poder 
concluir que el factor desencadenante es la causa del desenlace estudiado. Para poder esta-
blecer relaciones de causalidad entre variables es necesario utilizar diseños experimentales 
(con asignación aleatoria imposible de llevar a cabo en los diseños de cohortes y de caso 
control), o basar nuestras conclusiones en teorías bien estructuradas. 
Consideremos los datos de la tabla 11. 7 referidos a un estudio sobre la relación entre el 
hábito de fumar, tabaquismo, y la presencia de problemas vasculares en una muestra de 240 
sujetos. 
TABLA 11.7 
Tabla de contingencia de tabaquismo por problemas vasculares 
Problemas vasculares 
Sí No Total 
Tabaquismo 
1 
Fumadores 23 81 104 
1 No fumadores 9 127 136 
Total 32 208 240 
Entre los fumadores, la proporción de sujetos con problemas vasculares vale 
n11 /n 1 + = 23/104 = 0,221. Entre los no fumadores, n2 ¡/nz+ = 9/136 = 0,066. El riesgo rela-
tivo se obtiene dividiendo ambas proporciones: 
R = n1¡/n1+ = 0,221= 334 
r nz ¡/nz + 0,066 ' 
Este valor indica que el riesgo de encontrar problemas de tipo vascular entre los fuma-
dores es 3,34 veces más alto que entre losno fumadores. O, de otra manera: por cada no 
fumador con problemas vasculares, cabe esperar que encontremos 3,34 fumadores. 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 513 
Para valorar si el índice de riesgo obtenido es significativamente distinto de 1, podemos 
obtener el intervalo de confianza para R, mediante: 
(11.23) 
Si el intervalo de confianza contiene el valor 1, concluiremos que el riesgo de encontrar 
un desenlace es el mismo en el grupo de expuestos y en el de no expuestos. Si el intervalo 
de confianza no incluye el valor 1, concluiremos que los grupos estudiados poseen un riesgo 
significativamente distinto. Utilizando un nivel de confianza de 0,95 para construir un inter-
valo de confianza con los datos de nuestro ejemplo (tabla 11.7), obtenemos: 
L; = 3,34exp(-1,96J81/[23(104)] + 127/[9(136)]) = 1,61 
L.,= 3,34exp(+ 1,96J81/[23(104)] + 127/[9(136)]) = 6,91 
Puesto que el intervalo de confianza no incluye el valor 1, podemos estimar, con una con-
fianza del 95 por 100, que el riesgo de padecer problemas vasculares es significativamente 
más alto en el grupo de fumadores que en el de no fumadores. 
Diseños retrospectivos o de caso-control 
En los diseños de caso-control, tras formar dos grupos de sujetos a partir de alguna 
condición de interés, se va hacia atrás buscando la presencia de algún factor desencadenante. 
El mismo estudio sobre tabaquismo y problemas vasculares podría diseñarse seleccionando 
dos grupos de sujetos diferenciados por la presencia de problemas vasculares y buscando 
en la historia clínica la presencia o no del hábito de fumar. Puesto que el tamaño de los 
grupos se fija a partir de la presencia o ausencia de un determinado desenlace, no tiene 
sentido calcular un índice de riesgo basado en las proporciones de desenlaces observados 
(incidencias) en los fumadores y en los no fumadores (pues el número de fumadores y no 
fumadores no ha sido previamente establecido sino que es producto del muestreo). Pero 
podemos calcular la proporción o ventaja (odds) de tener problemas vasculares respecto de 
no tenerlos tanto en el grupo de fumadores como en el de no fumadores, y utilizar el 
cociente entre esas ventajas (odds) como una estimación del riesgo relativo: 
(11.24) 
Este cociente se conoce como odds ratio y suele utilizarse como una estimación del ries-
go relativo en los diseños de caso-control (justamente por la imposibilidad de estimar las 
incidencias). La calidad de O, como estimador del riesgo relativo es tanto mayor cuanto más 
pequeñas son las proporciones de desencadenantes en cada grupo, pues cuanto más pequeñas 
son esas proporciones, más pequeña es también la diferencia entre R, y O,. 
© Ediciones Pirámide 
514 / Análisis de datos en psicología 11 
Basándonos en Jos datos de la tabla 11.7, Ja odds «tener problemas/no tener problemas» 
en el grupo de fumadores vale: 23/81 = 0,284; y en el grupo de no fumadores: 9/127 = 0,071. 
El índice de riesgo en un diseño de caso-control se obtiene dividiendo ambas odds: 
Este valor se interpreta del mismo modo que el índice de riesgo relativo R, (pues no es 
más que una estimación del mismo): el riesgo de encontrar sujetos con problemas vasculares 
entre los fumadores es 4 veces más alto que entre los no fumadores. 
Para determinar si este índice de riesgo es significativamente distinto de 1, podemos 
obtener un intervalo de confianza mediante: 
L; = O,exp(z.,2J-1- + - 1- + - 1- + - 1-) 
n11 n12 n21 n22 
(11.25) 
L, = O,exp(z1 -.12 J-1- + - 1- + - 1- + - 1-) 
n11 n12 ni1 ni2 
Con los datos de la tabla 11.7 y utilizando un nivel de confianza de 0,95, obtenemos: 
L; = 4.00exp(-1.96 
L, = 4,00exp( + 1,96 
_!._ + _!._ + ~ + - 1-) = 1 76 
23 81 9 127 ' 
-+-+-+- =908 1 1 1 1 ) 
23 81 9 127 ' 
De nuevo. puesto que el intervalo de confianza no incluye el valor 1, podemos estimar, 
con una confianza del 95 por 100, que el riesgo verdadero es mayor que 1 y, en conse-
cuencia, que el riesgo de padecer problemas de tipo vascular es significativamente más alto 
en el grupo de fumadores que en el de no fumadores. 
EJERCICIOS 
11.1. Queremos evaluar si 4 tipos de alucinaciones diferentes (A, B, C, y D) se dan o no con 
la misma frecuencia entre pacientes con psicosis paranoica. La tabla 11.8 presenta los datos 
obtenidos con 10 pacientes (1 =se da la alucinación; O= no se da). ¿A qué conclusión 
llegaremos, con (X = 0,05? 
TABLA 11.8 
Pacientes 
1 2 3 4 5 6 7 8 9 10 
A 1 1 1 1 o 1 1 1 o 1 
Síntomas B 1 o 1 o o 1 1 o 1 1 e 1 1 o o o 1 1 1 1 1 
D o o o 1 1 1 o o o o 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 515 
11.2. El ayuntamiento de Madrid encarga a un equipo de psicólogos el diseño de una 
campaña de persuasión que intente modificar la creciente actitud negativa de la población 
madrileña hacia los enfermos de sida. Al comenzar el trabajo, el equipo de psicólogos 
decide obtener evidencia sobre si una técnica persuasiva basada sólo en imágenes será o no 
lo bastante eficaz. Para ello, selecciona una muestra aleatoria de 15 personas y registra sus 
actitudes antes y después de una sesión de persuación. La tabla 11.9 recoge los resultados 
obtenidos (el signo « - » indica actitud negativa y el « + » actitud positiva). A la vista de estos 
resultados, ¿podemos afirmar que la técnica persuasiva consigue disminuir la proporción de 
sujetos que manifiestan actitud negativa? (r.< = 0,05). 
TABLA 11.9 
Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
Antes - - + + - - - + + - + + + - + 
Después - + + + - - + + + + + + + + -
11.3. El equipo de psicólogos del ejercicio 11.2. considera conveniente averiguar si combi-
nando las imágenes con lemas informativos se obtiene un nivel de eficacia mayor que el 
alcanzado utilizando sólo las imágenes. Para ello, seleccionan una muestra de 2.000 personas 
con actitudes negativas hacia los enfermos de sida y, de estas 2.000 personas, seleccionan 
aleatoriamente a 30. A 15 de ellas les aplican la técnica persuasiva consistente en sólo 
imágenes; a las otras 15 les aplican la técnica que combina las imágenes con los lemas 
informativos. Tras esto, registran la actitud de las 30 personas ( 11.10: el signo « - » 
indica actitud negativa y el « + » actitud positiva). ¿A qué conclusión llegará el equipo de 
psicólogos? (r.< = 0,05). 
Sólo imágenes 
Imág. y lemas + 
TABLA 11.10 
+ + 
+ + + + + 
+ 
+ 
+ 
+ + + 
11.4. Un psicólogo está intentando decidir cuál de dos preguntas introducir en una prueba 
de orientación espacial que él mismo está construyendo. La pregunta 2 posee ciertas 
propiedades psicométricas que la hacen más aceptable, pero sería preferible la pregunta 1 si 
ésta resultara ser más dificil que la 2. Para decidir con cuál de las dos quedarse, plantea 
ambas preguntas a una muestra de 12 sujetos y registra cada respuesta como acierto (A) o 
error (E). Los resultados obtenidos aparecen en la tabla 11.11. Sin olvidar qué es lo que 
nuestro psicólogo desea conocer y considerando que la pregunta más fácil será aquella en la 
que más aciertos se produzcan, ¿a qué conclusión llegaremos utilizando r.< = 0,05? 
TABLA 11.11 
Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 
Pregunta 1 A E E E E E A A E E E A 
Pregunta 2 A E E A A A A A E A A A 
© Ediciones Pirámide 
516 / Análisis de datos en psicología 11 
11.5. Antes de dar comienzo los Juegos Olímpicos de Barcelona-92, se preguntó a 300 
personas si pensaban que la calidad de la ceremonia inaugural sería alta o baja. 200 de ellas 
opinaron que la calidad de la ceremonia inaugural sería alta. El día siguiente a la inaugura-
ción se volvió a hacer a esas 300 personas la misma pregunta. Se encontró que 280 personas 
pensaban que la calidad de la ceremonia había sido alta y que 10 de las que al principio 
pensaban que sería alta, ahora pensaban que había sido baja. Con los datos de que 
disponemos, ¿podemos afirmar que la ceremonia inaugural de los juegos olímpicos de 
Barcelona-92 ha hecho mejorar la expectativa de calidad que se tenía sobre ella? (oi =0,01). 
11.6. Un psicólogo ha diseñado una prueba de aptitud con 17 ítems dicotómicos. ¿Cuántos 
aciertos, como mínimo, debe obtener un sujeto para poder afirmar, con ai = 0,05, que no ha 
respondido al azar? 
11.7. Un investigador cree que el porcentaje de varones autoritarios supera en más de 20 
puntos al porcentaje de mujeres autoritarias. Para comprobarlo, pasa una escala de autorita-
rismo a 50 varones y a 40 mujeres y, dicotomizando por la mediana las puntuaciones de la 
escala, obtiene los resultados que aparecen en la tabla 11.12. ¿Podemos concluir que el 
investigador tiene razón? (oi = 0,05). 
1 
Varones 
Mujeres 
TABLA 11.12 
Autoritarios No autoritarios 
35 
18 
15 
22 
11.8. En un estudio sobre la relación entre diferencias sexuales y memoria a corto plazo. un 
psicólogo elaboró una lista de 10 palabras sin sentido, cada una de ellas formada por tres 
letras (consonante-vocal-consonante). Seleccionó al azar una muestra de 50 varones y otra de 
50 mujeres y presentó a cada sujeto la lista durante un periodo de 45 segundos. Tras este 
periodo de tiempo los sujetos tenían que reproducir la lista completa por escrito. El 
psicólogo contabilizó el número de sujetos que efectuaron una reproducción correcta y 
obtuvo los siguientes resultados: varones = 30; mujeres = 25. ¿Puede el psicólogo, a partir de 
estos datos, concluir que los varones y las mujeres difieren en su capacidad de retención a 
corto plazo? (oi = 0,05). 
11.9. Para estudiar la actitud de los terapeutas hacia la evaluación de la eficacia de sus 
tratamientos, un investigador seleccionó una muestra aleatoria de 100 terapeutas y les 
preguntó si estaban o no de acuerdo con tal evaluación. Encontró que 30 sí lo estaban y 70 
no. Tras explicarles los motivos y propósitos de tal evaluación volvió a hacerles la misma 
pregunta, resultando que ahora eran 60 los que sí estaban de acuerdo y que 10 de los que 
estaban de acuerdo al principio pasaron a estar en desacuerdo tras la explicación. ¿Se puede 
concluir de estos datos que la explicación utilizada por el investigador ha hecho mejorar 
significativamente la opinión que los terapeutas tienen de la evaluación de la eficacia de sus 
tratamientos? (oi = 0,01). 
11.10. Queremos contrastar la hipótesis de que la población de estudiantes de psicología 
está compuesta por un 60 por 100 de mujeres y un 40 por 100 de varones. Si extraemos 
aleatoriamente de esa población una muestra de 50 sujetos y utilizamos un nivel de 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 517 
significación de 0,05, ¿con qué número de varones en la muestra comenzaríamos a rechazar 
nuestra hipótesis? 
11.11. Dos psiquiatras han evaluado a 10 enfermos hospitalizados para determinar cuáles 
de ellos tienen pseudoalucinaciones y cuáles no. El informe de los psiquiatras incluye un sí 
cuando consideran que el enfermo tiene pseudoalucinaciones y un no cuando consideran que 
no las tiene. Los datos de los informes de ambos psiquiatras están recogidos en la tabla 11.13. 
¿Podemos afirmar que entre los dos psiquiatras existe un acuerdo significativamente mayor 
que el que cabría esperar que se produjera por azar? (tx = 0,05). 
TABLA 11.13 
Sujetos 1 2 3 4 5 6 7 8 9 10 
Psiquiatra 1 sí sí no sí no no sí sí no sí 
Psiquiatra 2 sí no sí sí no no sí sí no no 
11.12. Un partido político está interesado en conocer la evolución de la opinión pública 
respecto a los acontecimientos del 23-F. Tras encuestar a una serie de sujetos, se clasificó en 
la categoría de opinión blanda a los que estaban en la línea de la permisividad o aceptación 
de los hechos, y en la categoría de opinión dura a los que mantenían una actitud de repulsa y 
condena de los mismos. El día 25 de febrero de 1981 (2 días después de la intentona golpista) 
se entrevistó a una muestra aleatoria de 2.000 personas de la población española. Cinco años 
después, en 1986, se volvió a entrevistar a las mismas 2.000 personas. La tabla 11.14 muestra 
los resultados obtenidos. ¿Qué podemos concluir acerca del efecto ejercido por el paso del 
tiempo sobre la opinión de los sujetos? (tx = 0,01). 
TABLA 11.14 
1981 1 Op~ni~n blanda 
Opm1on dura 
1986 
Opinión Opinión 
blanda dura 
300 
400 
100 
1.200 
11.13. Un psicólogo sospecha que las preguntas de los cuestionarios de personalidad poseen 
un significado especial en función del contexto general del cuestionario del que forman parte. 
Esto haría que preguntas similares fueran respondidas de forma distinta por los mismos 
sujetos cuando esas preguntas forman parte de cuestionarios diferentes. Para confirmar su 
sospecha, el psicólogo pasó a 12 sujetos 3 cuestionarios de personalidad que poseían una 
pregunta idéntica (tanto en la forma como en el contenido). La predicción del psicólogo era 
que los sujetos responderían de forma distinta a esa pregunta dependiendo del cuestionario 
en el que se encontrara. La tabla 11.15 recoge las respuestas dadas por cada sujeto en cada 
uno de los 3 cuestionarios a la pregunta repetida (A significa que el sujeto está de acuerdo 
con el contenido de la pregunta; D significa que el sujeto está en desacuerdo). ¿A qué 
conclusión llegará el psicólogo utilizando tx = 0,05? 
© Ediciones Pirámide 
518 / Análisis de datos en psicología 11 
TABLA 11.15 
Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 
Cuestionario 1 A A D D A D A D A A A D 
Cuestionario 2 A A D A A D A D A A A A 
Cuestionario 3 D A A A A D D A A A D D 
11.14. En una muestra aleatoria de 10 sujetos con problemas de enuresis se ha aplicado un 
tratamiento cognitivo-conductual y se han obtenido resultados positivos en 7 casos. ¿Es 
compatible este resultado con la hipótesis de que al menos el 90 por 100 de los sujetos 
en uréticos podrá tener curación con este tratamiento? (oc = 0,01 ). 
11.15. En la teoría clásica de Skiner sobre el condicionamiento operante un refuerzo se 
define como un estímulo cuya presencia contingente con una respuesta hace que aumente la 
prohahilidad de aparición de esa respuesta. Según esto, no es posible saber a priori si un 
estímulo actúa o no como refuerzo de una respuesta; sólo podemos decir que un estímulo es 
reforzante después de haber comprobado que hace aumentar la probabilidad de aparición de 
la respuesta a la que sigue. Un psicólogo desea comprobar cuál de 3 estímulos seleccionados 
por él será más apropiado para ser utilizado con varios sujetos cuya conducta asertiva se 
desea modificar. Para ello. selecciona una respuesta asertiva concreta en cada uno de los 
sujetos y hace coincidir con esas respuestas cada uno de sus 3 estímulos por separado. 
Después de la presentación de cada uno de sus estímulos deja transcurrir un determinado 
período de tiempo (siempre el mismo) para registrar si la respuesta asociada al estímulo se 
repite ( 1) o no (O). La tabla 11.16 recoge los resultados obtenidos. ¿Podemos afirmar, con 
oc = 0,05, que los estímulos difieren significativamente en su utilidad como reforzadores de la 
respuesta asertiva seleccionada? 
TABLA 11.16 
Sujetos 1 2 3 4 5 6 7 8 9 ID 11 12 
Estímulo 1 1 1 o o 1 1 o o 1 o 1 1 
Estímulo 2 o 1 o o o 1 1 1 o 1 o o 
Estímulo 3 1 1 o 1 1 o 1 1 1 1 o 1 
SOLUCIONES 
11.1. J proporciones relacionadas (prueba de Cochran). 
Q = 5,25; 0 , 95X~ = 7,81; mantenemos H 0 . 
Concluimos que no hay razón para pensar que los 4 tipos de alucinaciones se den con 
diferente frecuencia. 
11.2. Dos proporciones relacionadas (prueba de McNemar). 
T = 1; P(T~ 1) = 0,188; mantenemos H 0 . 
© Ediciones Pirámide 
Contrastes de hipótesis sobre proporciones / 519 
Concluimos que la campaña no ha conseguido cambiar la actitud de la población 
hacia los enfermos de SIDA. 
11.3. Dos proporciones independientes (con k = O). 
Z = -2,196; z0 •05 = -1,645; rechazamos H0 . 
Concluimos que la campaña basada en imágenes y lemas informativos obtiene mejores 
resultados que la basada en sólo imágenes. 
11.4. Dos proporciones relacionadas (prueba de McNemar). 
T =O; P(T= O)= 0,031; rechazamos H 0 . 
Esta decisión nos llevaráa seleccionar la pregunta 1 para la prueba de orientación 
espacial. 
11.S. Dos proporciones relacionadas (prueba de McNemar). 
xi = 64; o.9sXI = 5,41; rechazamos H0 • 
La proporción de personas con expectativa de calidad alta se ha incrementado 
significativamente tras la ceremonia inaugural. 
11.6. 12 aciertos. 
11.7. Dos proporciones independientes (con k = 0,20). 
Z = 0,49; z0 •95 = 1,645; mantenemos H0 . 
Concluimos que no podemos afirmar que la proporción de varones autoritarios 
supere en más de 20 puntos a la de mujeres autoritarias. 
11.8. Dos proporciones independientes (con k = O). 
Z = 1; z0 •975 = 1,96; mantenemos H0 • 
No podemos afirmar que los varones y las mujeres difieran en su capacidad de 
retención a corto plazo. 
11.9. Dos proporciones relacionadas (prueba de McNemar). 
xi= 18; 0.9sXI = 5,41; rechazamos Ho. 
La proporción de terapeutas con opinión favorable hacia la evaluación de sus 
tratamientos se ha incrementado significativamente tras la explicación. 
11.10. Con menos de 14 o más de 26. 
11.11. Una proporción. 
X= 7; P(X;;:: 7) = 0,172; mantenemos H0 • 
El acuerdo alcanzado por los psiquiatras no supera el esperable por azar. 
11.12. Dos proporciones relacionada.s (prueba de McNemar). 
xi= 180; o.99xi = 6,63; rechazamos H0 • 
La proporción de personas con opinión dura ha disminuido significativamente. 
© Ediciones Pirámide 
520 / Análisis de datos en psicología 11 
11.13. J proporciones relacionadas (prueba de Cochran). 
Q = 1,14; 0 , 9 sX~ = 5,99; mantenemos H 0 • 
Concluimos que no hay razón para pensar que la pregunta posea un significado 
diferente en los 3 cuestionarios. 
11.14. Una proporción. 
X = 7; P(X .;:; 7) = 0,070; mantenemos H 0 . 
El resultado obtenido es compatible con la hipótesis de que al menos el 90 por 100 
de los sujetos enuréticos podrá tener curación con ese tratamiento. 
11.IS. J proporciones relacionadas (prueba de Cochran). 
Q = 2,4; 0 , 95x~ = 5,99; mantenemos H 0 . 
Concluimos que los estímulos no difieren en su capacidad para hacer que se repita la 
respuesta asertiva seleccionada. 
© Ediciones Pirámide 
	img488
	img489
	img490
	img491
	img492
	img493
	img494
	img495
	img496
	img497
	img498
	img499
	img500
	img501
	img502
	img503
	img504
	img505
	img506
	img507
	img508
	img509
	img510
	img511
	img512
	img513
	img514
	img515
	img516
	img517