Vista previa del material en texto
Contrastes de hipótesis sobre proporciones 11 11.1. Contraste de hipótesis sobre una proporc1on. 11.2. Contrastes de hipótesis sobre dos proporciones. 11.2.1. Dos proporciones independientes. 11.2.2. Dos proporciones relacionadas. 11.3. Contrastes de hipótesis sobre más de dos proporciones. 11.3.1. Más de dos proporciones independientes. 11.3.2. Más de dos proporciones relacionadas. a) Comparaciones múltiples. Ap~ndice 11. Indices de riesgo. Ejercicios. 11.1. Contraste de hipótesis sobre una proporción En psicología es relativamente frecuente encontrarse con variables dicotómicas o dicotomizadas, es decir, con variables que sólo pueden tomar dos valores: acierto- error, verdadero-falso, tratados-no tratados, recuperados-no recuperados, a favor-en contra, aprobados-suspensos, etc. Podemos llamar, de forma genérica, éxito y fraca- so a los dos niveles de una variable de este tipo. En el capítulo 1, apartado 1.3.4, hemos estudiado ya la distribución muestra) de los estadísticos X = «número de éxitos» y P = «proporción de éxitos». Hemos visto allí que ambos estadísticos se distribuyen según el modelo binomial con pa- rámetros n (número de ensayos) y n (proporción de éxitos). El modelo binomial, en consecuencia, nos proporciona las probabilidades asociadas a los estadísticos X y P, y eso significa que podemos utilizar la distribución binomial para diseñar contrastes de hipótesis sobre proporciones. Además, sabemos que a medida que n va aumentando, las distribuciones de X y P se aproximan a la distribución normal con parámetros: E(X) = nn <Tx = Jnn(l - n) (11.l) y E(P) = n <Tp = Jn(l - n)/n (11.2) En consecuencia, la variable: X - nn p -1t z =--;:::=== Jnn(l -n) Jn(l -n)/n (11.3) se distribuirá N(O, 1). Podemos, también, por tanto, utilizar la distribución normal para diseñar contrastes de hipótesis sobre proporciones. El cuadro 11.1 ofrece, siguiendo la lógica ya conocida, los pasos resumidos del contraste de hipótesis sobre una proporción. © Ediciones Pirámide 494 / Análisis de datos en psicología 11 CUADRO 11.1 Contraste de hipótesis sobre una proporción. Resumen del procedimiento 1. Hipótesis: a) Contraste bilateral: H 0 : 7t = n0; H 1: 7t # n0 • b) Contraste unilateral derecho: H 0 : 7t :::; n 0 ; H 1: n > n0 . e) Contraste unilateral izquierdo: H 0 : 7t ~ n0; H 1: n < n0 . 2. Supuestos: la variable estudiada es dicotómica o dicotomizada y n es la verdadera proporción de éxitos en la población (éxito hace referencia a uno cualquiera de los dos niveles de la variable). De esa población extraemos una muestra aleatoria de n observaciones con probabilidad de éxito n constante en cada extracción. 3. Estadísticos de contraste 1: 3.1. X = número de éxitos en los n ensayos. P = X /n = proporción de éxitos en los n ensayos. 3.2. X - nn0 Z=-;:::=== J nno(I - 7t0 ) 4. Distribuciones muestrales: p - 7to 4.1. X y P se distribuyen según el modelo binomial con parámetros n y n0 . 4.2. Z se aproxima a la distribución N(O, 1) a medida que 11 va aumentando 2• 5. Reglas de decisión: a) Contraste bilateral: a. I. Se rechaza H 0 si X o P toman un valor tan alejado de su valor esperado bajo H 0 que la probabilidad de obtener un valor tan alejado o más que ése es menor que -x./2. a.2. Se rechaza H0 si Z:;;;z,12 o Z~z 1 -,12 • 1 Tenemos tres estadístícos. Dos de ellos (X y P) son en realidad el mismo y poseen una distribu- ción muestra! exacta (la distribución binomial con parámetros n y rr). El otro (Z) posee una distri- bución muestra! aproximada (la distribución normal estandarizada). Los dos primeros son preferibles con muestras pequeñas (por ejemplo, con 11 ,,¡;; 25, que es el tope de la tabla binomial del apéndice final). L será preferiblemente utilizado con muestras grandes (por ejemplo. con 11 > 25, que es justo hasta donde llega la tabulación de la distribución binomial en el apéndice final). 1 Si 11 no es muy grande. la aproximación es un poco más exacta utilizando la corrección por cominuidad, que consiste en sumar (si X es menor que nrr) o restar (si X es mayor que nrr) 0,5 puntos a X, o, de forma equivalente, 0,5/11 puntos a P para hacer el contraste algo más conservador (no faltan autores que desaconsejen esta corrección por continuídad; por ejemplo, Richardson, 1990): X± 0,5 -11rr0 Z=---- 0.5 P ±- - rro 11 © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 495 CUADRO 11.1 (continuación) h) Contraste unilateral derecho: h. l. Se rechaza H 0 si X o P toman un valor tan grande que la probabilidad de obtener un valor como ése o mayor es menor que :x. h.2. Se rechaza H 0 si Z ~ z 1 _,. e) Contraste unilateral izquierdo: c.I. Se rechaza H0 si X o P toman un valor tan pequeño que la probabilidad de obtener un valor como ése o más pequeño es menor que :x. c.2. Se rechaza H 0 si Z ~ z,. 6. Nivel critico: a) Contraste bilateral: a. I. Si utilizamos X o P. el nivel crítico p es el doble de la probabilidad de obtener un valor X o P tan alejado de su valor esperado bajo H 0 como el obtenido. a.2. Si utilizamos Z. p = 2[P(Z ;:;, l=kl)J, siendo zk el valor concreto tomado por el estadístico Z. h) Contraste unilateral derecho: h. I. Si utilizamos X o P. el nivel crítico p es la probabilidad de obtener un valor X o P tan grande como el obtenido o más grande. h.2. Si utilizamos Z. p = P(Z ~ =d· e) Contraste unilateral izquierdo: c. I. Si utilizamos X o P. el nivel critico p es la probabilidad de obtener un valor X o P tan pequeño como el obtenido o más pequeño. c.2. Si utilizamos Z. p = P(Z ~ =d· 7. Intervalo de confianza: 11 ( ;: 2 JP( 1 - Pl :2 ) p + + = -- + ~-- 11 + : 2 211 - 11 411 2 ( 11.4) donde: se refiere a lz,; 21 o 1= 1 - •. iJ. Conforme 11 va aumentando, 11/(11 + z2) va tendiendo a l. y z2/(211) y z2/(411 2) van tendiendo a cero, de modo que, con 11 grande. la ecuación (11.4) para los límites de confianza de la proporción puede reducirse a: P ± I:, 2 lv P(I - P)/11 ( 11.5) «) Ediciones Pirámide 496 / Análisis de datos en psicología 11 EJEMPLO 11.1. Al parecer, la sintomatología del 30 por ciento de los pacientes neuróticos remite espontáneamente durante los tres primeros meses del trastorno. Según esto, parece lógico pensar que una terapia eficaz con este tipo de trastornos deberá conseguir a lo largo de los tres primeros meses un número de recuperaciones significativamente mayor de las que se producen de forma espontánea. Los resultados obtenidos con 25 sujetos a los que se les ha aplicado una determinada terapia indican que, en los tres primeros meses, ha habido 11 recuperaciones. ¿Podemos afirmar que el número de mejoras obtenidas con la terapia difiere significativamente del esperable por simple recuperación espontánea? (ex = 0,05). Tenemos una variable dicotómica (pacientes recuperados-pacientes no recuperados) y una muestra de n = 25 observaciones. Llamaremos 7t a la proporción poblacional de la categoría pacientes recuperados. Hemos observado X = 11 recuperaciones y, por tanto, la proporción observada de recuperaciones es P = 11/25 = 0,44. Vamos a efectuar un contraste sobre 7t para determinar si la verdadera proporción de pacientes recuperados con la aplicación de la terapia es superior a la que cabe esperar por simple recuperación espontánea (es decir, superior a 0,30). l. Hipótesis: H0 : 7t ~ 0,30; H 1: 7t > 0,30 (contraste unilateral derecho). 2. Supuestos: tenemos una muestra aleatoria de 25 observaciones con probabili- dad constante 0,30 de que una observación cualquiera pertenezca a la catego- ría de pacientes recuperados. 3. Estadísticos de contraste 3: 3.1. X= 11. p = 0,44. 11 - 25(0,30) 3.2. z = --;::::===== J25(0,30)(1 - 0,30) 4. Distribuciones muestrales: 0,44 - 0,30 ----;:::===== = 1,53 Jo,30(1 - 0,30)/25 4.1. X y P se distribuyen binomialmente con parámetros n = 25 y 7t = 0,30. 4.2. Z se aproxima a N(O, 1 ). 5. Regla de decisión: 5.1. Se rechazaH 0 si la probabilidad de obtener valores X;::-; 11 o P ;::-; 0,44 es menor que ex= 0,05. Es decir, se rechaza H 0 si se verifica: P(X ;::-; 11) < 0,05, o, equivalentemente, P(P ;::-; 0,44) < 0,05. En la tabla de la distribución binomial, con n = 25 y 7t = 0,30, vemos que P(X ;::-; 11) = P(P ;::-; 0,44) = 0,098. 5.2. Se rechaza H 0 si Z ;::-; z0 .95 = 1,64. 6. Decisión: 6.1. Como P(X ;::-; 11) = P(P ;::-; 0,44) = 0,098 es mayor que ex= 0,05, mantene- mos H 0 . 3 En un contraste concreto sólo es necesario utilizar uno de los varios estadísticos de contraste propuestos. Nosotros aquí, en el ejemplo, utilizamos los tres estadísticos con el único objetivo de ejemplificar su uso. © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 497 6.2. Como Z = 1,53 es menor que z0 .95 = 1,64, mantenemos H 0 • Tanto con los estadísticos X y P como con el estadístico Z se llega a la misma decisión 4 . La conclusión es que la proporción de mejoras que se obtiene con la terapia en cuestión no es significativamente más alta que la proporción de mejoras que se producen por simple recuperación espontánea. 11 .2. Contrastes de hipótesis sobre dos proporciones 11.2.1. Dos proporciones independientes Ahora, en lugar de medir una variable dicotómica o dicotomizada (con dos niveles a los que seguiremos llamando éxito y fracaso) en una sola población, lo hacemos en dos. Tenemos, pues, dos poblaciones de las que extraemos sendas muestras aleatorias de tamaños n1 y n2 y en las que definimos los estadísticos X 1 = «número de éxitos en los n1 ensayos de la muestra 1» y X 2 = «número de éxitos en los n2 ensayos de la muestra 2». Tendremos: n 1 =proporción de éxitos en la población l. P 1 = X i/n1 = proporción de éxitos en la muestra l. E(P1)=n1 u~ = n1(1 - ni)/n1 1 (11.6) n2 = proporción de éxitos en la población 2. P 2 = X 2/n 2 = proporción de éxitos en la muestra 2. E(P2) = n2 u~ = n2(1 - 7t2)/n2 2 Teniendo en cuenta que una proporción no es más que una media, podemos seguir la lógica expuesta en el capítulo 4 acerca de los contrastes de hipótesis sobre dos medias independientes para diseñar contrastes de hipótesis referidos a dos proporciones independientes. En el cuadro 11.2 están resumimos los pasos del contraste. 4 La probabilidad asociada al estadístico Z (el nivel crítico p) es más parecida a la probabilidad exacta proporcionada por la distribución binomial si se utiliza la corrección por continuidad. En el ejemplo, el nivel crítico con los estadísticos X y P vale p = P(X ~ 11) = 0,098, mientras que el nivel crítico en el estadístico Z vale p = P(Z ~ 1,53) = 0,063. Si utilizamos la corrección por continuidad obtenemos: 11 - 0,5 - 25(0,30) z = = 1,31 J25(0,30)(1 - 0,30) en cuyo caso el nivel crítico con el estadístico Z vale p = P(Z ~ 1,31) = 0,0951, valor muy parecido al nivel crítico proporcionado por la distribución exacta (0,098). © Ediciones Pirámide 498 / Análisis de datos en psicología 11 CUADRO 11.2 Contraste de hipótesis sobre dos proporciones independientes. Resumen del procedimiento l. Hipótesis a) Contraste bilateral: H 0 : rr1 - rr2 = k; H 1: rr 1 - rr2 # k. h) Contraste unilateral derecho: H 0 : rr 1 - rr2 :::;; k: H 1: rr 1 - rr2 > k. e) Contraste unilateral izquierdo: H 0 : rr 1 - rr2 ;>, k; H 1: rr 1 - rr2 < k. 2. Supuestos: la variable estudiada es dicotómica o dicotomizada en las dos pobla- ciones. De esas dos poblaciones extraemos independientemente dos muestras aleatorias de tamaños 11 1 y 112 con probabilidades de éxito (rr1 y rr2, respectivamen- te) constantes en cada extracción. 3. Estadísticos de contraste: 3.1. Si, en H0 , k =O, donde: 3.2. Si, en H0 , k #O, P 1 - P2 Z=----;::======= jP(I - P)(l/11 1 + l/112) 11 1P 1 +11 2P 2 P=----- 111+112 (11.7) (11.8) (11.9) 4. Distribución muestra): Z (tanto [11.7] como [11.9]) se aproxima, conforme los tamaños muestrales van aumentando, a N(O, 1 ). 5. Zona critica: a) Contraste bilateral: Z :::;; z,12 y Z ;>, z 1 _ ,12 . h) Contraste unilateral derecho: Z ;>, z 1 -·· e) Contraste unilateral izquierdo: Z :::;; z,. 6. Regla de decisión: se rechaza H 0 si el estadístico de contraste Z cae en la zona crítica; en caso contrario, se mantiene. lCJ Edic10111!s Pirc'.:.m1de Contrastes de hipótesis sobre proporciones / 499 CUADRO 11.2 (continuación) 7. Nivel crítico: a) Contraste bilateral: p = 2[P(Z ;;:,: lzkJ)], siendo zk el valor concreto tomado por el estadístico Z. b) Contraste unilateral derecho: p = P(Z ;;:,: zk). e) Contraste unilateral izquierdo: p = P(Z ~ zk). 8. Intervalo de confianza: (11.10) EJEMPLO 11.2. El grado de dificultad de las preguntas de un test se suele medir por el número de sujetos que los aciertan, o más exactamente, por la proporción de aciertos. Para averiguar si dos preguntas de un determinado test de aptitud general difieren en dificultad hemos seleccionado 200 sujetos y los hemos repartido aleatoria- mente en dos grupos de 100. Un grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han acertado 70 sujetos y la 2 la han acertado 60. ¿Podemos afirmar, con un nivel de significación de 0,05, que las dos preguntas estudiadas difieren en dificultad? l. Hipótesis: H0 : n 1 - n2 =O; H 1: n1 - n2 #O (contraste bilateral). 2. Supuestos: la variable estudiada es dicotómica (acierto-error) en las dos poblaciones: la población de respuestas a la pregunta 1 y la población de respuestas a la pregunta 2; de esas dos poblaciones extraemos independiente- mente dos muestras aleatorias de tamaño 100 con probabilidades de acierto (n 1 y n2, respectivamente) constantes en cada extracción. 3. Estadístico de contraste (para el caso en el que k = O): 70 P1 =-=0,70 100 60 P2 = -=0,60 100 100(0,70) + 100(0,60) p = = 065 100 + 100 ' 0,70 - 0,60 z = = 1,48 J0,65(1 - 0,65)(1/100 + 1/100) 4. Distribución muestra(: Z se distribuye N(O, 1). 5. Zona crítica: Z ~ z0 •025 = -1,96 y Z;;:,: z0 .975 = 1,96. 6. Decisión: puesto que 1,48 está comprendido entre -1,96 y 1,96, mantenemos H0 • No podemos afirmar que las proporciones de acierto n 1 y n2 difieran y, por tanto, no podemos afirmar que las preguntas 1 y 2 difieran en dificultad. © Ediciones Pirámide 500 / Análisis de datos en psicología 11 7. Nivel crítico: p = 2[P(Z ~ 11,481)] = 2(0,0694) = 0,1388. Este valor nos indica que la hipótesis nula podría ser rechazada con un nivel de riesgo de 0,1388. Es decir, podríamos rechazar H 0 , pero con una probabilidad de equivocarnos de 0,1388. 8. Intervalo de confianza: (0, 70 - 0,60) ± 1,96 O, 70(0,30) 0,60(0,40) ---+ = (-0,03;0,23) 100 100 Los límites de confianza indican que la verdadera diferencia entre n1 y n2 se encuentra entre -0,03 y 0,23. Esto significa que la verdadera diferencia puede ser cero y, por tanto, las dos preguntas pueden ser igualmente dificiles, lo cual es coherente con la decisión tomada. 11 .2.2. Dos proporciones relacionadas Seguimos trabajando con una variable que sólo puede tomar dos valores (variable dicotómica o dicotomizada), pero ahora no disponemos de dos muestras independientes de tamaños n1 y n2 , sino una sola muestra de tamaño m en la que efectuamos dos medidas de una misma variable (se trata de un diseño longitudinal). La situación es similar a la presentada a propósito del contraste de hipótesis sobre dos medias relacionadas (apartado 4.4). Si en una muestra de m sujetos medimos, en dos momentos temporales diferen- tes (a los que llamaremos A = antes, y D = después), una variable dicotómica cualquiera (con valores 1 y 2), los datos obtenidos pueden representarse según muestra la tabla 11.1. TABLA 11.1 Disposición de los datos y notación en una tabla de contingencia bidimensional referida a dos medidas (A y D) en una variable dicotómica (con valores 1 = éxito y 2 =fracaso). Frecuencias absolutas D =Después 2 A= Antes 1 n11 n12 n1+ 2 n11 n12 nz+n+1 n+2 n 11 = Número de sujetos que puntúan 1 en las dos medidas. n12 =Número de sujetos que puntúan 1 en la medida antes y 2 en la medida después. © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 501 ni 1 = Número de sujetos que puntúan 2 en la medida antes y 1 en la medida después. n22 =Número de sujetos que puntúan 2 en las dos medidas. m = n 11 + n1i + ni 1 + n22 . Bajo la hipótesis nula de que la proporción de éxitos antes (n1+ = nA) y la pro- porción de éxitos después (n+ 1 = nD) son iguales, cabe esperar que en las dos medidas efectuadas (A y D) se produzcan tantos cambios de 1 a 2 como de 2 a 1 (n 12 :::::: n21 ). Es decir, cabe esperar que los cambios observados sean sólo resultado del proceso de muestreo. Pero si, por el contrario, H0 es falsa y nA difiere de nD, los cambios en una dirección serán más numerosos que en la otra (n 12 =/= n21). Haciendo: y podemos utilizar la distribución binomial para conocer la probabilidad asociada a un número concreto de cambios (en cualquier dirección) bajo la hipótesis nula de que la proporción de éxitos antes es la misma que la proporción de éxitos después: 1tA = 1to. Y con tamaños muestrales grandes, podemos contrastar la hipótesis nula nA = n0 mediante una versión del estadístico X 2 de Pearson propuesta por McNe- mar (1947): nf 2 + ni 1 - 2n 12n21 + ni 1 + nf2 - 2n 12n21 2(n 12 + n21 ) (n12 - n1¡)2 n12 + n21 (n12 - n21)2 + (n21 - n12)2 2(n 12 + n2¡) 2nf 2 + 2ni 1 - 4n 12n21 2(n12 + n21) (11.11) que se distribuye según x2 con 1 grado de libertad. Así pues, el contraste sobre dos proporciones relacionadas nos permite evaluar, a partir de los cambios que se producen en una y otra dirección, si la proporción de éxitos en la medida antes (nA) difiere o no de la proporción de éxitos en la medida después (n0 ). En el cuadro 11.3 aparece resumido el contraste sobre dos proporcio- nes relacionadas. Recordemos una vez más que llamamos éxito a uno cualquiera de los dos niveles de la variable dicotómica estudiada. © Ediciones Pirámide 502 / Análisis de datos en psicología 11 CUADRO 11.3 Contraste de hipótesis sobre dos proporciones relacionadas. Resumen del procedimiento l. Hipótesis: a) Contraste bilateral: H0 : n:A = n:D; H 1: n:A # n:D. b) Contraste unilateral derecho: H0 : n:A ~ n:D; H 1: n:A > n:D. e) Contraste unilateral izquierdo: H0 : n:A ~ n:D; H 1: n:A < n:D. 2. Supuestos: muestra aleatoria de m pares de puntuaciones, independientes entre sí, obtenidos al medir una variable dicotómica o dicotomizada. 3. Estadísticos de contraste: 3.1. T = 1112· 3.2. 5 ' (111 i - 1121 l2 X-=·----- 1112 + 1121 4. Distribuciones muestrales: 4.1. T se distribuye según el modelo de probabilidad binomial con parámetros 11 = 1112 + 1121 y 71: = 0,5. 4.2. xi se aproxima a la distribución ;.i:i con 1 grado de libertad a medida que 11 va aumentando 6 • 5. Reglas de decisión: a) Contraste bilateral: a.I. Se rechaza Ho T toma un valor tk tal que { P(T ~ td < :xi2 SI P(T ~ tkl < :x/2 a.2. Se rechaza H 0 si X 2 ~ i - .;.i:f. b) Contraste unilateral derecho: b.I. Se rechaza H0 st T toma un valor tk tal que P(T ~ tkl < :x. h.2. Se rechaza H 0 si Xi ~ 1 - 2.xf. e) Contraste unilateral izquierdo: c. l. Se rechaza H 0 si T toma un valor tk tal que P( T ~ tk) < :x. c.2. Se rechaza H0 si xi ~ 1 _ i.xf. ' Este estadístíco fue ídeado por McNemar en 1947. de ahí que. en muchos contextos, el contraste sobre dos proporciones relacionadas sea denominado prueha de McNemar. 6 Si n no es muy grande. la aproximación es un poco más exacta utilizando la corrección por continuidad. que consiste en restar 1 punto al valor absoluto de la diferencia n 12 - n21 para hacer el contraste algo más conservador: (11112 - 11211 - !)' xi=------ 1112 + n11 ~) Ediciones Pirámide 6. 7. Contrastes de hipótesis sobre proporciones / 503 CUADRO 11.3 (continuación) Nivel crítico: a) Contraste bilateral: a.I. p = 2[P(r ~ tt)J, siendo r el menor de n 12 y n21· a.2. p = P(X 2 ;;;?: xf), siendo xf el valor concreto tomado por X 2• b) Contraste unilateral derecho: b.1. p = P(T;;;?: lt). b.2. p = 2[P(X 2 ;;;?: xf)]. e) Contraste unilateral izquierdo: c.l. p = P(T ~ lt). c.2. p = 2[P(X 2 ;;;?: xf)]. Intervalo de confianza: Siendo PA = n12/m la proporción de éxitos en la medida antes, y P0 = n21 /m la proporción de éxitos en la medida después, el intervalo de confianza para nA - n" viene dado por: (11.12) EJEMPLO 11.3. Existe la hipótesis de que los procesos de psicosis esquizofrénica van acompañados de un incremento del nivel de cobre en sangre. Esto significa que los pacientes con cuadros de psicosis esquizofrénica graves presentan un nivel de cobre en sangre más alto que los pacientes con cuadros leves. Un psicólogo clínico cree haber descubierto un tratamiento mixto (droga-terapia) capaz de reducir el nivel de cobre en sangre. Para comprobar si esto es cierto elige una muestra aleatoria de 50 pacientes esquizofrénicos y mide en cada uno de ellos el nivel de cobre en sangre antes y después de ser sometidos al nuevo tratamiento. Los resultados obtenidos aparecen en la tabla 11.2. ¿Podemos concluir que la proporción de pacientes con nivel alto de cobre en sangre ha disminuido con la aplicación del nuevo tratamiento? (!X = 0,05). Nivel de cobre antes del tratamiento © Ediciones Pirámide TABLA 11.2 Alto (1) Bajo (2) Nivel de cobre después del tratamiento Alto (1) Bajo (2) 3 28 10 9 504 / Análisis de datos en psicología 11 Tenemos una muestra aleatoria de m = 50 sujetos a los cuales se les toman dos medidas en una variable dicotomizada: nivel de cobre en sangre (1 =alto, 2 =bajo). Para saber si la proporción de sujetos con nivel de cobre alto ha disminuido tras la aplicación del tratamiento debemos averiguar si n,.. > n0 (siendo n,.. y n0 la proporción de sujetos con nivel de cobre alto antes y después del tratamiento, respectivamente). l. Hipótesis: H0 : n,.. ~ n0 ; H 1: n,.. > n0 (contraste unilateral derecho). 2. Supuestos: muestra aleatoria de m = 50 pares de puntuaciones, independientes entre sí, obtenidos al medir una variable dicotomizada. 3. Estadístico de contraste: xi= (n12 - ni1)i n1i + ni1 (28 - 10¡i ----=8,53 28 + 10 4. Distribución muestra!: xi se aproxima a xi con 1 grado de libertad. 5. Regla de decisión: se rechaza H 0 si Xi ~ 1 _ i.X~, es decir, si xi ~ 0.9o'l.~ = 2,71. Como el valor tomado por el estadístico de contraste (8,53) es mayor que el punto crítico (2,71) rechazamos H 0 y concluimos que la proporción de pacien- tes esquizofrénicos con nivel de cobre en sangre alto ha disminuido significati- vamente tras la aplicación del nuevo tratamiento. 6. Intervalo de confianza: (0,56 - 0,20) ± 1,96j(28 + 10)/50i = (0,12;0,60) Vemos que el intervalo de confianza no incluye el cero, indicando esto que la verdadera diferencia entre n,.. y n0 es distinta de cero (lo cual podemos afirmar con una confianza del 95 por 100). EJEMPLO 11.4. En un grupo de terapia de pareja al que asisten 25 matrimonios se han efectuado dos controles con una diferencia de tres meses. Una cuestión básica para valorar la marcha de la terapia se refiere al grado de compenetración (buena o mala) entre los miembros de la pareja. Sabiendo que los matrimonios que manifesta- ron tener buena compenetración fueron 10 en el primer control y 18 en el segundo, y que 4 matrimonios de los que manifestaron buena compenetración en el primer control pasaron a manifestar mala compenetración en el segundo, ¿podemos concluir que la proporción de matrimonios con buena compenetración se ha incrementado durante los tres meses de terapia considerados? (ex = 0,05). Tenemos una muestra aleatoria de m = 25 matrimonios a los cuales se les toman dos medidas en una variable dicotomizada: grado de compenetración ( 1 = bueno, 2 =malo). Consideraremos que la proporción de matrimonios con buena compenetra- ción se haincrementado si n,.. < n0 (siendo n,.. y n0 la proporción de matrimonios con buena compenetración antes -primer control- y después -segundo control-, respectivamente). Con la información disponible formamos la tabla de frecuencias 11.3. © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 505 TABLA 11.3 Grado de compenetración en el segundo control Buena (1) Mala (2) Buena (!) Mala (2) 6 12 4 3 Grado de compenetración 1 en el primer control '--~~~~.__~~~~~~~~---1 l. Hipótesis: H0 : nA ~ nv; H 1: nA < nv (contraste unilateral izquierdo). 2. Supuestos: muestra aleatoria de m = 25 pares de puntuaciones, independientes entre sí, obtenidos al medir una variable dicotomizada. 3. Estadístico de contraste: T = n 12 = 4. 4. Regla de decisión: se rechaza H 0 si P(T :E; 4) < IX. En la tabla de la distribución binomial, con n = n 12 + n 21 = 16 y ir= 0,5, obtenemos P(T :E; 4) = 0,038. Como esa probabilidad es menor que IX= 0,05, rechazamos H 0 y concluimos que la proporción de matrimonios con buena compenetración ha aumentado significativamente. 5. Nivel crítico: p = P(T :E; 4) = 0,038. 11.3. Contrastes de hipótesis sobre más de dos proporciones 11.3.1. Más de dos proporciones independientes El estudio de J > 2 proporciones independientes ha merecido especial atención por parte de estadísticos y metodólogos durante muchas décadas, y todavía sigue siendo objeto de atención especial. La frecuencia con la que un profesional de cualquier área de conocimiento (y en especial en las ciencias sociales y del compor- tamiento) se ve en la necesidad de trabajar con más de dos proporciones indepen- dientes justifica sobradamente esta atención. Pero no vamos a tratar aquí, en este apartado, los contrastes sobre más de dos proporciones independientes. Lo haremos en el próximo capítulo (en el apartado 10.3), el cual está dedicado enteramente a la prueba X 2 de Pearson. 11.3.2. Más de dos proporciones relacionadas Al estudiar más de dos proporciones relacionadas nos encontramos en una situación similar a la expuesta para el caso de dos proporciones relacionadas. Seguimos trabajando con variables que sólo pueden tomar dos valores (variables dicotómicas o dicotomizadas). © Ediciones Pirámide 506 / Análisis de datos en psicología 11 A cada sujeto se le toman J medidas de la variable dicotómica estudiada (o se miden J variables dicotómicas en una muestra de n sujetos). Estamos, por tanto, ante un diseño idéntico al presentado a propósito del ANOVA A-EF-MR (medidas repetidas o bloques con un sujeto por nivel y bloque), pero con la diferencia de que, aquí, la variable medida (es decir, la variable dependiente) es una variable que sólo puede tomar dos valores. Los datos pueden organizarse en un tabla de doble entrada, tal como muestra la tabla 11.4, con los J niveles de la variable independiente (muestras, tratamientos, etcétera) en las filas y los n sujetos o bloques en las columnas. TABLA 11.4 Estructura de los datos y notación en un diseño con J tratamientos o muestras y n sujetos o bloques Sujetos o bloques Tratamientos 1 2 i T+; p +j n o muestras 1 Y11 Y21 Y¡, Y,, 1 T+1 P+1 2 Y12 Y22 Y¡z Y.2 T+2 p +2 ... ... ... ... ... ... ... j Y,; Y2; Y;; Y,,; T+; p +j ... ... ... ... ... ... ... J Yu Y21 Y¡J Y,,J T+J p +J 7;+ T,+ Ti+ 7;+ T,, + T La notación es exactamente la misma que la utilizada para el modelo de ANOVA A-EF-MR. Pero hay que tener presente que Yú ahora es una variable dicotómica o dicotomizada, con valores: 1 = éxito y O =fracaso. Las proporciones marginales P + i representan las proporciones de éxito observadas en cada tratamien- to o muestra: P + i = T+ /n. Cochran (1950) ha diseñado un procedimiento 7 para contrastar la hipótesis de que las J proporciones poblacionales de éxito n + i son iguales. El cuadro 11.4 recoge, resumidos, los pasos del contraste. 7 Este procedimiento es generalización del de McNemar para dos proporciones relacionadas. De hecho, si J = 2, el estadístico de McNemar y el de Cochran son exactamente el mismo (ver, por ejemplo, Conover, 1980, pág. 204). © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 507 CUADRO 11.4 Contraste de hipótesis sobre más de dos proporciones relacionadas. Resumen del procedimiento 1. Hipótesis: Ho: 1C + 1 = 1C + 2 = · · · = 1C + 1· Es decir, la proporción de éxitos no es la misma en cada uno de los J tratamientos. H1: 1C, .i :f:. 1C +;-para algún valor dej. Es decir, la proporción de éxitos es la misma en los J tratamientos. 2. Supuestos: la variable estudiada es dicotómica; de ella se toman J medidas en una muestra aleatoria de n sujetos o bloques, con probabilidad de éxito 1C + j constante en cada medida. 3. Estadístico de contraste: J(J- 1) r. T2 .- (J - l)T2 Q = +1 JT-'I.TT, (11.13) 4. Distribución muestral: Q se distribuye según X2 con J - l grados de libertad. 5. Zona crítica: Q;:: i -aXJ- i· 6. Regla de decisión: se rechaza H0 si el estadístico de contraste Q cae en la zona crítica; en caso contrario, se mantiene. Si se rechaza H0, podemos afirmar que la proporción de éxitos no es la misma en los J tratamientos o poblaciones. EJEMPLO 11.5. Un psicólogo quiere averiguar si 4 preguntas de un test que ha construido poseen o no la misma dificultad. Para ello, una muestra de 10 sujetos aleatoriamente seleccionados responde a las 4 preguntas. La tabla 11.5 recoge las respuestas (1 = aciertos, O = errores) dadas por los 10 sujetos a cada una de las preguntas. Basándonos en la proporción de aciertos de cada pregunta y utilizando :x = 0,05, ¿podemos afirmar que las preguntas difieren en dificultad? La variable es dicotómica y ha sido medida J = 4 veces en una muestra aleatoria de 10 sujetos. La prueba de Cochran es apropiada para analizar estos datos. l. Hipótesis: H o: rr + t = rr + 2 = rr + 3 = rr + 4 Es decir, la proporción de aciertos es la misma en las 4 pregur.tas. H 1: rr + i # rr + i' para algún valor de j. Es decir, la proporción de aciertos no es la misma en las 4 preguntas. © Ediciones Pirámide 508 / Análisis de datos en psicología 11 TABLA 11.5 Sujetos Preguntas 1 2 3 4 5 6 7 8 9 10 T+i T~i 1 1 1 1 1 o o 1 o 1 o 6 36 ~ 1 o o 1 o 1 o o 1 1 5 25 3 1 o 1 1 1 1 1 1 1 1 9 81 4 1 o o o o o 1 o o o 2 4 T¡ + 4 1 2 3 1 2 3 1 3 2 22 146 T!+ 16 1 4 9 1 4 9 1 9 4 58 2. Supuestos: la variable estudiada es dicotómica; de ella se toman J = 4 medidas en una muestra aleatoria de n = 10 sujetos con probabilidad de acierto constante en cada medida. 3. Estadístico de contraste: 4(4 - 1)(146) - (4 - 1)222 Q = 4(22) - 58 = 10 4. Distribución muestra(: Q se distribuye según ·¡_2 con 3 grados de libertad. 5. Zona crítica: Q ~ 0 . 95,d = 7,81. 6. Decisión: como el valor tomado por el estadístico de contraste Q es mayor que el punto crítico (10 > 7,81), rechazamos H 0 . Podemos concluir que la propor- ción de acierto no es la misma en las 4 preguntas, por lo que no todas poseen la misma dificultad. a) Comparaciones múltiples Si rechazamos la hipótesis general referida a la igualdad entre las J proporcio- nes, podemos estar interesados en concretar qué poblaciones (tratamientos) difieren de qué otras. Para ello, podemos utilizar cualquiera de los procedimientos de comparaciones múltiples ya conocidos, con la única salvedad de que ahora estamos trabajando con proporciones. Llamemos Lh a una comparación cualquiera y chi a los coeficientes asignados a cada proporción poblacional para definir esa comparación Lh: Lh = chln+ 1 + ch2n+ 2 + ··· + chJn+J = "'f.chin+i j Podemos estimar Lh mediante: Lh =chip +1 + ch2P +i + ··· + chJP +J ="'f. chip +i j (11.14) ( 11.15) © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 509 y obtener: at =----- L, nJ(J - ]) (11.16) n A partir de aquí podemos diseñar procedimientos para comparaciones múltiples entre proporciones aplicando la lógica ya estudiada en el capítulo 6.En todos los casos, la hipótesis sometida a contraste es: Para efectuar comparaciones planeadas ortogonales o comparaciones de tenden- cia podemos utilizar el estadístico: (11.17) que se distribuye según x2 con 1 grado de libertad. Rechazaremos la hipótesis Hoch1: Lh =O si el estadístico Z~ es mayor que el cuantil 100(1 - ix) de la distribución x2 con 1 grado de libertad. Cada término Z~ es un componente del estadístico Q. de modo que, para un conjunto cualquiera de J - 1 comparaciones ortogonales se verifica: J-1 ¿ z~ = Q (11.18) j= 1 Para comparaciones planeadas no ortogonales podemos utilizar el procedimiento de Dunn-Bonferroni: (11.19) siendo p = 1 - ix/(2k) y k el número de comparaciones que se ha planeado efectuar. Rechazaremos la hipótesis Hoch1: Lh =O si el valor absoluto de Lh es mayor que DMSoe· Para comparaciones a posteriori podemos utilizar el procedimiento de Tukey o el de Scheffé, dependiendo del tipo de contraste que estemos interesados en plantear: Tukey para efectuar las J(J - 1)/2 comparaciones por pares y Scheffé para efectuar todas las posibles comparaciones de cualquier tipo. Rechazaremos la hipótesis Hoch1: Lh =O si el valor absoluto de Lh es mayor que la DMS correspon- diente: DMS 1 -aqJ,oo • Tukey = ~ <f[ (11.20) DMSScherré = J1-aX;-1 ªL, (11.21) © Ediciones Pirámide 51 O / Análisis de datos en psicología 11 EJEMPLO 11.6. En el ejemplo 11.5 hemos rechazado la hipótesis referida a la igualdad entre las proporciones de acierto correspondientes a cada pregunta. Vamos a ilustrar ahora los procedimientos para comparaciones múltiples estudiados en el último apartado utilizando comparaciones referidas a los datos de ese ejemplo. Comencemos con las comparaciones planeadas ortogonales. Supongamos que deseamos efectuar las siguientes dos comparaciones: L 1 =(O):n:+ 1 + (l):n:+ 2 + (- l):n:+ 3 + (O):n:+ 4 L2 = (l):n:+ • + (l):n:+2 + (l):n:+J + (-3):n:+4 Las hipótesis que tendremos que contrastar serán: H0 (1 1: L1 =O y H0(2): L 2 =O. En consecuencia: L1 = (0)0,6 + (1)0,5 + (-1)0,9 + (0)0,2 = -0,4 L2 = (1)0,6 + (1)0,5 + (1)0,9 + (-3)0,2 = 1,4 <J- = =005 •2 4(22) - 58 (º2 + 12 + (-1)2 + 02) L, 10(4)(3) 10 ' u! = 4(22) - 58 (1 2 + 12 + 1 2 + ( - 3)2) = o,3 L, 10(4)(3) 10 Zi = -0,42/0,05 = 3,20 z~ = 1,42/0,3 = 6,53 Con un nivel de confianza de 0,95 obtenemos 0 ,95xf = 3,84. Por tanto, mantene- mos H o(I, y rechazamos H o(2)· Utilizando ahora el procedimiento de Dunn-Bonferroni para efectuar las mismas dos comparaciones obtenemos: DMS081L,> = z0 ,9875 j{i¡, = 2,24 JQ,05 = 0,50 DMSoe(Lil = z0 , 9875 Ft, = 2,24J'0,3 = 1,23 Comparando estos valores con los de L1 y l 2 llegamos, al igual que antes, a la decisión de mantener H O(I, y a la de rechazar H 0121• Por último, si utilizamos los procedimientos de Tukey y de Scheffé para efectuar las 4(4 - 1)/2 = 6 posibles comparaciones por pares, obtenemos las siguientes diferen- cias mínimas significativas: (J- = =o 05 •2 4(22) - 58 (1 2 + ( -1)2) L 10(4)(3) 10 ' q 3 63 DMS = 0.95 4,oo • = -'- foOs =O 57 Tukey j2 <1[ j2 V V,VJ • DMSscheffé = ~<Ji= fijl JQ,05 = 0,63 © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 511 APÉNDICE 11 Índices de riesgo El estadístico Z utilizado para contrastar dos proporciones independientes (ver apartado 11.2.1) puede utilizarse tanto en diseños transversales como en longitudinales. No obstante, cuando queremos comparar dos proporciones independientes en un diseño longitudinal, po- demos obtener información adicional recurriendo a los índices de riesgo. Los índices de riesgo son muy utilizados en la investigación biomédica y epidemiológica para evaluar el impacto de supuestos factores desencadenantes sobre la aparición de un determinado desen- lace. Resultan especialmente útiles para analizar diseños longitudinales en los que medimos dos variables dicotómicas. El seguimiento de los estudios longitudinales puede hacerse hacia adelante o hacia atrás. En los diseños longitudinales hacia adelante, llamados diseños prospectivos o de cohortes, los sujetos son clasificados en dos grupos con arreglo a la presencia o ausencia de algún factor desencadenante (por ejemplo, el hábito de fumar -fumadores y no fumadores-) y se les hace seguimiento durante un determinado período de tiempo para establecer la proporción de sujetos de cada grupo en los que se da un determinado desenlace objeto de estudio (por ejemplo, problemas cardiovasculares). En los diseños longitudinales hacia atrás, también llamados retrospectivos o de caso- control, se forman dos grupos de sujetos a partir de la presencia o ausencia de una deter- minada condición objeto de estudio (por ejemplo, sujetos sanos y pacientes con problemas vasculares) y se hace seguimiento hacia atrás intentando encontrar información sobre la proporción en la que se encuentra presente en cada grupo un determinado factor desenca- denante (por ejemplo, el hábito de fumar). Los datos recogidos tanto con un diseño de cohortes como con un diseño de caso-control pueden representarse de forma genérica en una tabla de contingencia 2 x 2 como la que muestra la figura 11.6. En ambos casos utilizaremos la misma notación. No obstante, cada diseño de recogida de datos requiere la utilización de unos estadísticos particulares. TABLA 11.6 Forma yenérica de representar las frecuencias obtenidas mediante un diseño de cohortes o un diseño de caso-control Desenlace ( lj) Sí U= 1) No U= 2) Total Desencadenante (X¡) 1 Sí (i = 1) nu n12 n1+ 1 No (i= 2) ni1 ni1 ni+ Total n+I n+2 n Diseños prospectivos o de cohortes En los diseños de cohortes se establecen dos grupos de sujetos a partir de la presencia o ausencia de una condición que se considera desencadenante y se hace seguimiento hacia © Ediciones Pirámide 512 / Análisis de datos en psicologla 11 adelante para determinar qué proporción de sujetos de cada grupo alcanza un determinado desenlace. La medida de interés en este tipo de diseños suele ser el riesgo relativo (R,), el cual expresa el grado en que la proporción de desenlaces es más alta en un grupo que en el otro: R = n11fn1 + r nz1fn2+ (l l.22) El valor del índice de riesgo relativo se interpreta de la siguiente manera: el riesgo de encontrar un determinado desenlace entre los sujetos expuestos al factor desencadenante es R, veces más alto que entre los sujetos no expuestos al factor desencadenante. De otra manera, por cada desenlace observado entre los sujetos no expuestos, cabe esperar que aparezcan R, desenlaces entre los sujetos expuestos. Un riesgo relativo de 1 indica que la probabilidad de encontrarnos con el desenlace es la misma en el grupo de sujetos expuestos y en el grupo de sujetos no expuestos. Por supuesto, encontrar un riesgo relativo mayor que 1 no es suficiente para poder concluir que el factor desencadenante es la causa del desenlace estudiado. Para poder esta- blecer relaciones de causalidad entre variables es necesario utilizar diseños experimentales (con asignación aleatoria imposible de llevar a cabo en los diseños de cohortes y de caso control), o basar nuestras conclusiones en teorías bien estructuradas. Consideremos los datos de la tabla 11. 7 referidos a un estudio sobre la relación entre el hábito de fumar, tabaquismo, y la presencia de problemas vasculares en una muestra de 240 sujetos. TABLA 11.7 Tabla de contingencia de tabaquismo por problemas vasculares Problemas vasculares Sí No Total Tabaquismo 1 Fumadores 23 81 104 1 No fumadores 9 127 136 Total 32 208 240 Entre los fumadores, la proporción de sujetos con problemas vasculares vale n11 /n 1 + = 23/104 = 0,221. Entre los no fumadores, n2 ¡/nz+ = 9/136 = 0,066. El riesgo rela- tivo se obtiene dividiendo ambas proporciones: R = n1¡/n1+ = 0,221= 334 r nz ¡/nz + 0,066 ' Este valor indica que el riesgo de encontrar problemas de tipo vascular entre los fuma- dores es 3,34 veces más alto que entre losno fumadores. O, de otra manera: por cada no fumador con problemas vasculares, cabe esperar que encontremos 3,34 fumadores. © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 513 Para valorar si el índice de riesgo obtenido es significativamente distinto de 1, podemos obtener el intervalo de confianza para R, mediante: (11.23) Si el intervalo de confianza contiene el valor 1, concluiremos que el riesgo de encontrar un desenlace es el mismo en el grupo de expuestos y en el de no expuestos. Si el intervalo de confianza no incluye el valor 1, concluiremos que los grupos estudiados poseen un riesgo significativamente distinto. Utilizando un nivel de confianza de 0,95 para construir un inter- valo de confianza con los datos de nuestro ejemplo (tabla 11.7), obtenemos: L; = 3,34exp(-1,96J81/[23(104)] + 127/[9(136)]) = 1,61 L.,= 3,34exp(+ 1,96J81/[23(104)] + 127/[9(136)]) = 6,91 Puesto que el intervalo de confianza no incluye el valor 1, podemos estimar, con una con- fianza del 95 por 100, que el riesgo de padecer problemas vasculares es significativamente más alto en el grupo de fumadores que en el de no fumadores. Diseños retrospectivos o de caso-control En los diseños de caso-control, tras formar dos grupos de sujetos a partir de alguna condición de interés, se va hacia atrás buscando la presencia de algún factor desencadenante. El mismo estudio sobre tabaquismo y problemas vasculares podría diseñarse seleccionando dos grupos de sujetos diferenciados por la presencia de problemas vasculares y buscando en la historia clínica la presencia o no del hábito de fumar. Puesto que el tamaño de los grupos se fija a partir de la presencia o ausencia de un determinado desenlace, no tiene sentido calcular un índice de riesgo basado en las proporciones de desenlaces observados (incidencias) en los fumadores y en los no fumadores (pues el número de fumadores y no fumadores no ha sido previamente establecido sino que es producto del muestreo). Pero podemos calcular la proporción o ventaja (odds) de tener problemas vasculares respecto de no tenerlos tanto en el grupo de fumadores como en el de no fumadores, y utilizar el cociente entre esas ventajas (odds) como una estimación del riesgo relativo: (11.24) Este cociente se conoce como odds ratio y suele utilizarse como una estimación del ries- go relativo en los diseños de caso-control (justamente por la imposibilidad de estimar las incidencias). La calidad de O, como estimador del riesgo relativo es tanto mayor cuanto más pequeñas son las proporciones de desencadenantes en cada grupo, pues cuanto más pequeñas son esas proporciones, más pequeña es también la diferencia entre R, y O,. © Ediciones Pirámide 514 / Análisis de datos en psicología 11 Basándonos en Jos datos de la tabla 11.7, Ja odds «tener problemas/no tener problemas» en el grupo de fumadores vale: 23/81 = 0,284; y en el grupo de no fumadores: 9/127 = 0,071. El índice de riesgo en un diseño de caso-control se obtiene dividiendo ambas odds: Este valor se interpreta del mismo modo que el índice de riesgo relativo R, (pues no es más que una estimación del mismo): el riesgo de encontrar sujetos con problemas vasculares entre los fumadores es 4 veces más alto que entre los no fumadores. Para determinar si este índice de riesgo es significativamente distinto de 1, podemos obtener un intervalo de confianza mediante: L; = O,exp(z.,2J-1- + - 1- + - 1- + - 1-) n11 n12 n21 n22 (11.25) L, = O,exp(z1 -.12 J-1- + - 1- + - 1- + - 1-) n11 n12 ni1 ni2 Con los datos de la tabla 11.7 y utilizando un nivel de confianza de 0,95, obtenemos: L; = 4.00exp(-1.96 L, = 4,00exp( + 1,96 _!._ + _!._ + ~ + - 1-) = 1 76 23 81 9 127 ' -+-+-+- =908 1 1 1 1 ) 23 81 9 127 ' De nuevo. puesto que el intervalo de confianza no incluye el valor 1, podemos estimar, con una confianza del 95 por 100, que el riesgo verdadero es mayor que 1 y, en conse- cuencia, que el riesgo de padecer problemas de tipo vascular es significativamente más alto en el grupo de fumadores que en el de no fumadores. EJERCICIOS 11.1. Queremos evaluar si 4 tipos de alucinaciones diferentes (A, B, C, y D) se dan o no con la misma frecuencia entre pacientes con psicosis paranoica. La tabla 11.8 presenta los datos obtenidos con 10 pacientes (1 =se da la alucinación; O= no se da). ¿A qué conclusión llegaremos, con (X = 0,05? TABLA 11.8 Pacientes 1 2 3 4 5 6 7 8 9 10 A 1 1 1 1 o 1 1 1 o 1 Síntomas B 1 o 1 o o 1 1 o 1 1 e 1 1 o o o 1 1 1 1 1 D o o o 1 1 1 o o o o © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 515 11.2. El ayuntamiento de Madrid encarga a un equipo de psicólogos el diseño de una campaña de persuasión que intente modificar la creciente actitud negativa de la población madrileña hacia los enfermos de sida. Al comenzar el trabajo, el equipo de psicólogos decide obtener evidencia sobre si una técnica persuasiva basada sólo en imágenes será o no lo bastante eficaz. Para ello, selecciona una muestra aleatoria de 15 personas y registra sus actitudes antes y después de una sesión de persuación. La tabla 11.9 recoge los resultados obtenidos (el signo « - » indica actitud negativa y el « + » actitud positiva). A la vista de estos resultados, ¿podemos afirmar que la técnica persuasiva consigue disminuir la proporción de sujetos que manifiestan actitud negativa? (r.< = 0,05). TABLA 11.9 Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Antes - - + + - - - + + - + + + - + Después - + + + - - + + + + + + + + - 11.3. El equipo de psicólogos del ejercicio 11.2. considera conveniente averiguar si combi- nando las imágenes con lemas informativos se obtiene un nivel de eficacia mayor que el alcanzado utilizando sólo las imágenes. Para ello, seleccionan una muestra de 2.000 personas con actitudes negativas hacia los enfermos de sida y, de estas 2.000 personas, seleccionan aleatoriamente a 30. A 15 de ellas les aplican la técnica persuasiva consistente en sólo imágenes; a las otras 15 les aplican la técnica que combina las imágenes con los lemas informativos. Tras esto, registran la actitud de las 30 personas ( 11.10: el signo « - » indica actitud negativa y el « + » actitud positiva). ¿A qué conclusión llegará el equipo de psicólogos? (r.< = 0,05). Sólo imágenes Imág. y lemas + TABLA 11.10 + + + + + + + + + + + + + 11.4. Un psicólogo está intentando decidir cuál de dos preguntas introducir en una prueba de orientación espacial que él mismo está construyendo. La pregunta 2 posee ciertas propiedades psicométricas que la hacen más aceptable, pero sería preferible la pregunta 1 si ésta resultara ser más dificil que la 2. Para decidir con cuál de las dos quedarse, plantea ambas preguntas a una muestra de 12 sujetos y registra cada respuesta como acierto (A) o error (E). Los resultados obtenidos aparecen en la tabla 11.11. Sin olvidar qué es lo que nuestro psicólogo desea conocer y considerando que la pregunta más fácil será aquella en la que más aciertos se produzcan, ¿a qué conclusión llegaremos utilizando r.< = 0,05? TABLA 11.11 Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 Pregunta 1 A E E E E E A A E E E A Pregunta 2 A E E A A A A A E A A A © Ediciones Pirámide 516 / Análisis de datos en psicología 11 11.5. Antes de dar comienzo los Juegos Olímpicos de Barcelona-92, se preguntó a 300 personas si pensaban que la calidad de la ceremonia inaugural sería alta o baja. 200 de ellas opinaron que la calidad de la ceremonia inaugural sería alta. El día siguiente a la inaugura- ción se volvió a hacer a esas 300 personas la misma pregunta. Se encontró que 280 personas pensaban que la calidad de la ceremonia había sido alta y que 10 de las que al principio pensaban que sería alta, ahora pensaban que había sido baja. Con los datos de que disponemos, ¿podemos afirmar que la ceremonia inaugural de los juegos olímpicos de Barcelona-92 ha hecho mejorar la expectativa de calidad que se tenía sobre ella? (oi =0,01). 11.6. Un psicólogo ha diseñado una prueba de aptitud con 17 ítems dicotómicos. ¿Cuántos aciertos, como mínimo, debe obtener un sujeto para poder afirmar, con ai = 0,05, que no ha respondido al azar? 11.7. Un investigador cree que el porcentaje de varones autoritarios supera en más de 20 puntos al porcentaje de mujeres autoritarias. Para comprobarlo, pasa una escala de autorita- rismo a 50 varones y a 40 mujeres y, dicotomizando por la mediana las puntuaciones de la escala, obtiene los resultados que aparecen en la tabla 11.12. ¿Podemos concluir que el investigador tiene razón? (oi = 0,05). 1 Varones Mujeres TABLA 11.12 Autoritarios No autoritarios 35 18 15 22 11.8. En un estudio sobre la relación entre diferencias sexuales y memoria a corto plazo. un psicólogo elaboró una lista de 10 palabras sin sentido, cada una de ellas formada por tres letras (consonante-vocal-consonante). Seleccionó al azar una muestra de 50 varones y otra de 50 mujeres y presentó a cada sujeto la lista durante un periodo de 45 segundos. Tras este periodo de tiempo los sujetos tenían que reproducir la lista completa por escrito. El psicólogo contabilizó el número de sujetos que efectuaron una reproducción correcta y obtuvo los siguientes resultados: varones = 30; mujeres = 25. ¿Puede el psicólogo, a partir de estos datos, concluir que los varones y las mujeres difieren en su capacidad de retención a corto plazo? (oi = 0,05). 11.9. Para estudiar la actitud de los terapeutas hacia la evaluación de la eficacia de sus tratamientos, un investigador seleccionó una muestra aleatoria de 100 terapeutas y les preguntó si estaban o no de acuerdo con tal evaluación. Encontró que 30 sí lo estaban y 70 no. Tras explicarles los motivos y propósitos de tal evaluación volvió a hacerles la misma pregunta, resultando que ahora eran 60 los que sí estaban de acuerdo y que 10 de los que estaban de acuerdo al principio pasaron a estar en desacuerdo tras la explicación. ¿Se puede concluir de estos datos que la explicación utilizada por el investigador ha hecho mejorar significativamente la opinión que los terapeutas tienen de la evaluación de la eficacia de sus tratamientos? (oi = 0,01). 11.10. Queremos contrastar la hipótesis de que la población de estudiantes de psicología está compuesta por un 60 por 100 de mujeres y un 40 por 100 de varones. Si extraemos aleatoriamente de esa población una muestra de 50 sujetos y utilizamos un nivel de © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 517 significación de 0,05, ¿con qué número de varones en la muestra comenzaríamos a rechazar nuestra hipótesis? 11.11. Dos psiquiatras han evaluado a 10 enfermos hospitalizados para determinar cuáles de ellos tienen pseudoalucinaciones y cuáles no. El informe de los psiquiatras incluye un sí cuando consideran que el enfermo tiene pseudoalucinaciones y un no cuando consideran que no las tiene. Los datos de los informes de ambos psiquiatras están recogidos en la tabla 11.13. ¿Podemos afirmar que entre los dos psiquiatras existe un acuerdo significativamente mayor que el que cabría esperar que se produjera por azar? (tx = 0,05). TABLA 11.13 Sujetos 1 2 3 4 5 6 7 8 9 10 Psiquiatra 1 sí sí no sí no no sí sí no sí Psiquiatra 2 sí no sí sí no no sí sí no no 11.12. Un partido político está interesado en conocer la evolución de la opinión pública respecto a los acontecimientos del 23-F. Tras encuestar a una serie de sujetos, se clasificó en la categoría de opinión blanda a los que estaban en la línea de la permisividad o aceptación de los hechos, y en la categoría de opinión dura a los que mantenían una actitud de repulsa y condena de los mismos. El día 25 de febrero de 1981 (2 días después de la intentona golpista) se entrevistó a una muestra aleatoria de 2.000 personas de la población española. Cinco años después, en 1986, se volvió a entrevistar a las mismas 2.000 personas. La tabla 11.14 muestra los resultados obtenidos. ¿Qué podemos concluir acerca del efecto ejercido por el paso del tiempo sobre la opinión de los sujetos? (tx = 0,01). TABLA 11.14 1981 1 Op~ni~n blanda Opm1on dura 1986 Opinión Opinión blanda dura 300 400 100 1.200 11.13. Un psicólogo sospecha que las preguntas de los cuestionarios de personalidad poseen un significado especial en función del contexto general del cuestionario del que forman parte. Esto haría que preguntas similares fueran respondidas de forma distinta por los mismos sujetos cuando esas preguntas forman parte de cuestionarios diferentes. Para confirmar su sospecha, el psicólogo pasó a 12 sujetos 3 cuestionarios de personalidad que poseían una pregunta idéntica (tanto en la forma como en el contenido). La predicción del psicólogo era que los sujetos responderían de forma distinta a esa pregunta dependiendo del cuestionario en el que se encontrara. La tabla 11.15 recoge las respuestas dadas por cada sujeto en cada uno de los 3 cuestionarios a la pregunta repetida (A significa que el sujeto está de acuerdo con el contenido de la pregunta; D significa que el sujeto está en desacuerdo). ¿A qué conclusión llegará el psicólogo utilizando tx = 0,05? © Ediciones Pirámide 518 / Análisis de datos en psicología 11 TABLA 11.15 Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 Cuestionario 1 A A D D A D A D A A A D Cuestionario 2 A A D A A D A D A A A A Cuestionario 3 D A A A A D D A A A D D 11.14. En una muestra aleatoria de 10 sujetos con problemas de enuresis se ha aplicado un tratamiento cognitivo-conductual y se han obtenido resultados positivos en 7 casos. ¿Es compatible este resultado con la hipótesis de que al menos el 90 por 100 de los sujetos en uréticos podrá tener curación con este tratamiento? (oc = 0,01 ). 11.15. En la teoría clásica de Skiner sobre el condicionamiento operante un refuerzo se define como un estímulo cuya presencia contingente con una respuesta hace que aumente la prohahilidad de aparición de esa respuesta. Según esto, no es posible saber a priori si un estímulo actúa o no como refuerzo de una respuesta; sólo podemos decir que un estímulo es reforzante después de haber comprobado que hace aumentar la probabilidad de aparición de la respuesta a la que sigue. Un psicólogo desea comprobar cuál de 3 estímulos seleccionados por él será más apropiado para ser utilizado con varios sujetos cuya conducta asertiva se desea modificar. Para ello. selecciona una respuesta asertiva concreta en cada uno de los sujetos y hace coincidir con esas respuestas cada uno de sus 3 estímulos por separado. Después de la presentación de cada uno de sus estímulos deja transcurrir un determinado período de tiempo (siempre el mismo) para registrar si la respuesta asociada al estímulo se repite ( 1) o no (O). La tabla 11.16 recoge los resultados obtenidos. ¿Podemos afirmar, con oc = 0,05, que los estímulos difieren significativamente en su utilidad como reforzadores de la respuesta asertiva seleccionada? TABLA 11.16 Sujetos 1 2 3 4 5 6 7 8 9 ID 11 12 Estímulo 1 1 1 o o 1 1 o o 1 o 1 1 Estímulo 2 o 1 o o o 1 1 1 o 1 o o Estímulo 3 1 1 o 1 1 o 1 1 1 1 o 1 SOLUCIONES 11.1. J proporciones relacionadas (prueba de Cochran). Q = 5,25; 0 , 95X~ = 7,81; mantenemos H 0 . Concluimos que no hay razón para pensar que los 4 tipos de alucinaciones se den con diferente frecuencia. 11.2. Dos proporciones relacionadas (prueba de McNemar). T = 1; P(T~ 1) = 0,188; mantenemos H 0 . © Ediciones Pirámide Contrastes de hipótesis sobre proporciones / 519 Concluimos que la campaña no ha conseguido cambiar la actitud de la población hacia los enfermos de SIDA. 11.3. Dos proporciones independientes (con k = O). Z = -2,196; z0 •05 = -1,645; rechazamos H0 . Concluimos que la campaña basada en imágenes y lemas informativos obtiene mejores resultados que la basada en sólo imágenes. 11.4. Dos proporciones relacionadas (prueba de McNemar). T =O; P(T= O)= 0,031; rechazamos H 0 . Esta decisión nos llevaráa seleccionar la pregunta 1 para la prueba de orientación espacial. 11.S. Dos proporciones relacionadas (prueba de McNemar). xi = 64; o.9sXI = 5,41; rechazamos H0 • La proporción de personas con expectativa de calidad alta se ha incrementado significativamente tras la ceremonia inaugural. 11.6. 12 aciertos. 11.7. Dos proporciones independientes (con k = 0,20). Z = 0,49; z0 •95 = 1,645; mantenemos H0 . Concluimos que no podemos afirmar que la proporción de varones autoritarios supere en más de 20 puntos a la de mujeres autoritarias. 11.8. Dos proporciones independientes (con k = O). Z = 1; z0 •975 = 1,96; mantenemos H0 • No podemos afirmar que los varones y las mujeres difieran en su capacidad de retención a corto plazo. 11.9. Dos proporciones relacionadas (prueba de McNemar). xi= 18; 0.9sXI = 5,41; rechazamos Ho. La proporción de terapeutas con opinión favorable hacia la evaluación de sus tratamientos se ha incrementado significativamente tras la explicación. 11.10. Con menos de 14 o más de 26. 11.11. Una proporción. X= 7; P(X;;:: 7) = 0,172; mantenemos H0 • El acuerdo alcanzado por los psiquiatras no supera el esperable por azar. 11.12. Dos proporciones relacionada.s (prueba de McNemar). xi= 180; o.99xi = 6,63; rechazamos H0 • La proporción de personas con opinión dura ha disminuido significativamente. © Ediciones Pirámide 520 / Análisis de datos en psicología 11 11.13. J proporciones relacionadas (prueba de Cochran). Q = 1,14; 0 , 9 sX~ = 5,99; mantenemos H 0 • Concluimos que no hay razón para pensar que la pregunta posea un significado diferente en los 3 cuestionarios. 11.14. Una proporción. X = 7; P(X .;:; 7) = 0,070; mantenemos H 0 . El resultado obtenido es compatible con la hipótesis de que al menos el 90 por 100 de los sujetos enuréticos podrá tener curación con ese tratamiento. 11.IS. J proporciones relacionadas (prueba de Cochran). Q = 2,4; 0 , 95x~ = 5,99; mantenemos H 0 . Concluimos que los estímulos no difieren en su capacidad para hacer que se repita la respuesta asertiva seleccionada. © Ediciones Pirámide img488 img489 img490 img491 img492 img493 img494 img495 img496 img497 img498 img499 img500 img501 img502 img503 img504 img505 img506 img507 img508 img509 img510 img511 img512 img513 img514 img515 img516 img517