Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
6.1. INTRODUCCIÓN Es frecuente encontrarse en situaciones en las que hay que trabajar con varia- bles que proceden de la combinación de otras variables, especialmente de combi- naciones lineales. Por ejemplo, muchas veces la puntuación total de un test psi- cológico se obtiene sumando las puntuaciones obtenidas en dos o más subescalas. Ya hemos abordado esta cuestión en capítulos anteriores. En éste vamos a expo- ner la obtención de los principales estadísticos (la media y la varianza) de una variable que se crea como una combinación lineal de dos o más variables. Supon- gamos, por ejemplo, que representamos por U, V y X a las puntuaciones en tres subescalas, mientras que T representa las puntuaciones totales que se obtienen sumando esas puntuaciones; la expresión formal sería: Ti = Ui + Vi + Xi En estas circunstancias es probable que queramos obtener la media y la va- rianza de esa nueva variable. Desde luego, un procedimiento correcto para hacer- lo consistiría en calcular para cada sujeto su puntuación Ti y luego operar sobre esos valores mediante las fórmulas y procedimientos que ya hemos expuesto en los capítulos anteriores: T _ = ∑Ti N y S2T = ∑(Ti − T _ )2 N Sin embargo, este procedimiento puede resultar muy laborioso, sobre todo cuando el número de sujetos y variables es muy grande. En este capítulo vamos a exponer procedimientos que nos permitirán deducir las características de estas variables a partir de las características de las variables componentes y de sus rela- ciones. Primero estudiaremos el caso más sencillo, el de la suma o resta de dos variables; luego expondremos el caso más frecuente, el de la suma de un número cualquiera de variables, y por último describiremos el caso general, aplicable a cualquier combinación lineal de variables. © Ediciones Pirámide 6Combinación lineal de variables PI00180301_06.indd 165PI00180301_06.indd 165 20/01/12 15:4920/01/12 15:49 6.2. SUMA Y RESTA DE DOS VARIABLES: MEDIA Y VARIANZA La combinación lineal de variables más sencilla es aquella en la que una va- riable se defi ne a partir de la simple suma o resta de otras dos variables. Defi ni- remos de esas dos formas las variables T y U: Ti = Xi + Yi [6.1] Ui = Xi − Yi [6.2] Veamos primero cuánto valdrán las medias de las nuevas puntuaciones: T _ = ∑Ti N = ∑(Xi + Yi) N = ∑Xi N + ∑Yi N = X _ + Y _ U _ = ∑Ui N = ∑(Xi − Yi) N = ∑Xi N − ∑Yi N = X _ − Y _ Por su parte, la varianza de T será: S2T = ∑(Ti − T _ )2 N = ∑[(Xi + Yi) − (X _ + Y _ )]2 N Reorganizamos el numerador, lo desarrollamos como un binomio al cuadrado y aplicamos la regla de distribución del sumatorio (véase el apéndice del capítulo 1): S2T = ∑[(Xi − X _ ) + (Yi − Y _ )]2 N = = ∑[(Xi − X _ )2 + (Yi − Y _ )2 + 2 · (Xi − X _ ) · (Yi − Y _ )] N = = ∑(Xi − X _ )2 + ∑(Yi − Y _ )2 + 2 · ∑(Xi − X _ ) · (Yi − Y _ ) N Por último, separamos la expresión en tres quebrados diferentes, y en cada uno de ellos reconocemos un elemento ya descrito en capítulos anteriores: S2T = ∑(Xi − X _ )2 N S2x + ∑(Yi − Y _ )2 N S2y + 2 · ∑(Xi − X _ ) · (Yi − Y _ ) N Sxy 166 / Análisis de datos en psicología I © Ediciones Pirámide PI00180301_06.indd 166PI00180301_06.indd 166 20/01/12 15:4920/01/12 15:49 Dejamos en manos del lector interesado en poner a prueba su pericia alge- braica el desarrollo de la demostración de que la varianza de U será similar a la de T, con la única diferencia de que el tercer quebrado irá precedido por un sig- no negativo, en lugar del signo positivo. Por tanto, podemos resumir lo expuesto hasta aquí de la siguiente forma: a) Si se defi ne una variable como la suma de dos variables, su media es igual a la suma de las medias de esas variables y su varianza es igual a la suma de las varianzas de esas variables más dos veces la covarianza entre ellas. Es decir: Si Ti = Xi + Yi entonces T _ = X _ + Y _ y S2T = S2x + S2y + 2 · Sxy [6.3] b) Si se defi ne una variable como la diferencia entre dos variables, su media es igual a la diferencia entre las medias de esas variables y su varianza es igual a la suma de las varianzas de esas variables menos dos veces la co- varianza entre ellas. Es decir: Si Ti = Xi − Yi entonces T _ = X _ − Y _ y S2T = S2x + S2y − 2 · Sxy [6.4] Veamos un ejemplo numérico de la aplicación de estas fórmulas. Supongamos que disponemos de las puntuaciones de cuatro personas en dos subtests, X e Y; defi nimos T como la suma de los subtests y U como su diferencia; es decir, Ti = = Xi + Yi y Ui = Xi − Yi. Si no conociésemos las fórmulas [6.3] y [6.4] obtendría- mos las puntuaciones T y U de cada sujeto y hallaríamos las medias y varianzas de esas puntuaciones, tal y como mostramos en la siguiente tabla: X Y T U T 2 U 2 X · Y 6 3 5 2 5 1 4 2 11 4 9 4 1 2 1 0 121 16 81 16 1 4 1 0 30 3 20 4 Suma 16 12 28 4 234 6 57 T _ = 28/4 = 7 U _ = 4/4 = 1 S2T = 234 4 − 72 = 9,5 S2U = 6 4 − 12 = 0,5 Combinación lineal de variables / 167 © Ediciones Pirámide PI00180301_06.indd 167PI00180301_06.indd 167 20/01/12 15:4920/01/12 15:49 Las fórmulas [6.3] y [6.4] nos permiten obtener estas características de for- ma más directa, sobre todo cuando el número de observaciones es muy grande. Para ello, debemos disponer de los siguientes estadísticos de las variables origi- nales, X e Y: X _ = 16/4 = 4 Y _ = 12/4 = 3 Sxy = 2,25 S2x = 2,5 S2y = 2,5 Ahora sustituimos en [6.3] y [6.4]: T _ = X _ + Y _ = 4 + 3 = 7 U _ = X _ − Y _ = 4 − 3 = 1 S2T = S2x + S2y + 2 · Sxy = 2,5 + 2,5 + 2 · 2,25 = 9,5 S2U = S2x + S2y − 2 · Sxy = 2,5 + 2,5 − 2 · 2,25 = 0,5 obteniendo los mismos estadísticos que hemos obtenido directamente con las puntuaciones de T y U. 6.3. SUMA DE J VARIABLES Expondremos ahora un procedimiento más general, aplicable a todos aquellos casos en los que la nueva variable se defi ne como la suma de un número cualquie- ra de variables. Por comodidad, representaremos a partir de aquí las variables con la misma letra, X, pero con diferentes subíndices para diferenciarlas. Con el primer subíndice nos referiremos a la observación y con el segundo a la variable; así, Xij representará al valor i-ésimo en la variable j-ésima. Expuesto con esta nomencla- tura, el procedimiento que vamos a describir es aplicable a toda variable defi nida de la siguiente forma: Ti = Xi1 + Xi2 + ... + XiJ [6.5] Esta expresión no es más que la suma de J variables. Extendiendo lo expues- to al tratar la suma de dos variables, la media de esta variable es igual a la suma de las medias de las variables sumadas. Es decir: Si Ti = Xi1 + Xi2 + ... + XiJ entonces T _ = X _ 1 + X _ 2 + ... + X _ J [6.6] El procedimiento para obtener la varianza de una variable defi nida de esta forma se simplifi ca bastante si utilizamos la matriz de varianzas y covarianzas, que ya hemos expuesto en el capítulo anterior. En concreto, en [6.1] se defi nía una 168 / Análisis de datos en psicología I © Ediciones Pirámide PI00180301_06.indd 168PI00180301_06.indd 168 20/01/12 15:4920/01/12 15:49 variable como la suma de dos variables. Si construimos la matriz S, o de varian- zas y covarianzas, de las variables sumadas, observamos que ésta contiene preci- samente los elementos de la fórmula de la varianza, defi nida en [6.3]: las varian- zas de las dos variables y dos veces la covarianza entre ellas. Esto no es casualidad. Ahorramos al lector la demostración de que esto ocurre con la suma de cualquier suma de variables. Es decir, que si una variable se defi ne como la suma de J va- riables, su varianza es igual a la suma de todos los elementos de la matriz S cons- truida con esas J variables (adviértase que se multiplica por 2 la suma de los ele- mentos que quedan por encima o por debajo de la diagonal). Es decir: Si Ti = Xi1 + Xi2 + ... + XiJ entonces S2T = S21 + S22 + ... + S2J + 2 · (S12 + S13 + ... + S1J+ ... S(J − 1)J) [6.7] Veamos también un ejemplo numérico. Supongamos que tras administrar un test compuesto por cuatro subtests (X1, X2, X3, X4) a un colectivo obtenemos la siguiente matriz S, de varianzas y covarianzas, así como las medias que también se indican para los subtests. Queremos hallar la media y la varianza de una va- riable, T, defi nida como la suma de los valores en los cuatro subtests (Ti = Xi1 + + Xi2 + Xi3 + Xi4): X1 X2 X3 X4 X1 32 15 7 18 X2 15 40 22 12 X3 7 22 20 14 X4 18 12 14 26 X _ J 118 33 83 56 La media de T se obtiene como la suma de las medias, T _ = 118 + 33 + 83 + + 56 = 290. La varianza se obtiene como la suma de los elementos de la matriz S de esas cuatro variables: S2T = 32 + 40 + 20 + 26 + 2 · (15 + 7 + 18 + 22 + 12 + 14) = 294 6.4. COMBINACIÓN LINEAL DE J VARIABLES Aunque los casos que hemos visto hasta aquí son los más sencillos y frecuen- tes, hay otros que no encajan en esas situaciones. Lo que vamos a abordar ahora es el caso general, aplicable a cualquier combinación lineal de variables. Los an- Combinación lineal de variables / 169 © Ediciones Pirámide PI00180301_06.indd 169PI00180301_06.indd 169 20/01/12 15:4920/01/12 15:49 teriores no son más que casos particulares del presente. Vamos a exponer cómo obtener la media y la varianza de una variable que se defi ne de la siguiente forma: Ti = k1 · Xi1 + k2 · Xi2 + ... + kJ · XiJ + c [6.8] En esta expresión, kj es el peso que tienen los valores de la variable Xj. Nótese que lo que hemos desarrollado en los apartados anteriores no son más que casos particulares de la expresión [6.8]. La suma y resta de dos variables serían aquellos casos en los que interviniesen dos variables, y las constantes multiplicadoras fue- ran ambas iguales a 1 (suma de dos variables) o una igual a 1 y la otra igual a −1 (diferencia de variables). La suma de J variables es el caso en el que todas las kj son iguales a 1. Además, en todos esos casos la constante sumada, c, es igual a 0. La media de una variable defi nida según [6.8] se obtiene aplicando la siguien- te defi nición: la media de una variable defi nida como una combinación lineal de variables es igual a la misma combinación lineal de las medias de las variables com- ponentes. Es decir: Si Ti = k1 · Xi1 + k2 · Xi2 + ... + kJ · XiJ + c entonces T _ = k1 · X _ 1 + k2 · X _ 2 + ... + kJ · X _ J + c [6.9] La varianza de una combinación lineal de variables se obtiene por el proce- dimiento que describimos a continuación; omitimos su laboriosa demostración. La varianza de una variable formada como una combinación lineal de variables es igual a la suma de las varianzas de las variables componentes multiplicadas por los cuadrados de sus coefi cientes, más dos veces las covarianzas por pares entre las va- riables, multiplicadas por los coefi cientes correspondientes. Es decir, Si Ti = k1 · Xi1 + k2 · Xi2 + ... + kJ · XiJ + c entonces S2T = k21 · S21 + k22 · S22 + ... + k2J · S2J + 2 · (k1 · k2 · S12 + + k1 · k3 · S13 + ... + k1 · kJ · S1J + ... + kJ − 1 · kJ · S(J − 1) J) [6.10] 170 / Análisis de datos en psicología I © Ediciones Pirámide PI00180301_06.indd 170PI00180301_06.indd 170 20/01/12 15:4920/01/12 15:49 PROBLEMAS Y EJERCICIOS 1. Obtenga: a) La matriz de correlaciones a partir de la siguiente matriz de varianzas- covarianzas. b) Si se defi ne la variable V = X3 − X1, calcule S2V. X1 X2 X3 X4 S = X1 25 10 −5,7 26,25 X2 10 16 0,6 2,8 X3 −5,7 0,6 9 5,25 X4 26,25 2,8 5,25 49 2. Considerando las matrices incompletas de correlaciones y varianzas-cova- rianzas que se muestran a continuación, obtenga las varianzas de las siguientes variables: a) U = X1 + X3 b) V = X4 − X1 X1 X2 X3 X4 R = X1 ( ) 0,2 0,4 X2 ( ) −0,5 X3 ( ) X4 X1 X2 X3 X4 S = X1 4 ( ) ( ) ( ) X2 9 ( ) ( ) X3 36 ( ) X4 49 3. Complete la matriz de correlaciones y la de varianzas-covarianzas (recuerde que ambas matrices son simétricas) del ejercicio anterior, sabiendo que: entre las variables X1 y X2 existe una relación lineal nula, así como una relación lineal di- recta perfecta entre las variables X2 y X3; y Sx3x4 = − 42. Combinación lineal de variables / 171 © Ediciones Pirámide PI00180301_06.indd 171PI00180301_06.indd 171 20/01/12 15:4920/01/12 15:49 4. Una prueba de capacidad verbal, formada por tres ítems linealmente indepen- dientes, ha sido aplicada a un estudiante de primer curso del Grado en Psicología, obteniendo una puntuación directa en la prueba igual a 9. Sabiendo que la pun- tuación en la prueba es igual a la suma de las puntuaciones de cada ítem, obten- ga la puntuación típica del estudiante en la prueba, teniendo en cuenta los datos que aparecen en la siguiente tabla: I1 I2 I3 Sx X _ 2 1 8 3 5 4 5. Si a la matriz de varianzas-covarianzas del ejercicio 1 le añadimos el vector de medias que aparece más abajo, obtenga la media y la varianza de las siguien- tes variables: U = 0,2 · X1 − 0,8 · X2; V = 5 · X2 + 2 · X4. X1 X2 X3 X4 X _ 3 7 1 8 6. Demuestre qué condición se ha de satisfacer para que la varianza de la suma de dos variables sea igual a la varianza de su diferencia. 7. Para mejorar el tiempo de respuestas, TR, ante situaciones de alarma, se aplicó un programa de mejora a un grupo de personal de seguridad. Para ello se midió el TR de cada participante ante una situación de peligro antes y después del programa. La variable eficacia del programa, EP, se evaluó mediante la dife- rencia del TR antes y después del programa. Sabiendo que la varianza del TRAntes fue igual a 25, que la varianza del TRDespués fue igual a 16, y que la de EP fue igual a 17, obtenga el valor de la correlación entre las variables TRAntes y TRDespués. 8. Supongamos que Ui = Xi − Yi y que la varianzas de X e Y son iguales, aunque las desconocemos. Obtenga el valor de S2U si: a) Existe una relación lineal directa perfecta entre X e Y. b) Existe una relación lineal inversa perfecta entre X e Y. c) Hay independencia lineal entre X e Y. 9. Se han medido las variables U, V, X e Y en una muestra, calculándose la matriz de varianzas-covarianzas que aparece a continuación, así como las medias. Entonces: a) Si se defi ne la variable W = U + V + Y, calcule la media y la varianza de W. b) Si se defi ne la variable T = V + X + Y 3 , calcule la media y la varianza de T. 172 / Análisis de datos en psicología I © Ediciones Pirámide PI00180301_06.indd 172PI00180301_06.indd 172 20/01/12 15:4920/01/12 15:49 U V X Y S = U 4 3 9,6 2,8 V 3 9 10,8 −6,3 X 9,6 10,8 36 4,2 Y 2,8 −6,3 4,2 49 Medias 2 4 5 8 10. Considerando la matriz de varianzas-covarianzas y el vector de medias que se presentan más abajo, calcule la media y la varianza de: a) La variable T = X + Y + V + W. b) La variable U = (X/4) − V. X Y V W S = X 25 1 12 6 Y 1 4 −9,6 1,8 V 12 −9,6 64 −2,4 W 6 1,8 −2,4 9 Medias 6 3 10 5 11. La puntuación V, utilizada en un proceso de evaluación clínica, se obtiene mediante el promedio de las puntuaciones típicas de los valores obtenidos en dos cuestionarios (A y B) de personalidad. ¿Cuánto valdrá la varianza de V si la co- rrelación entre las puntuaciones de esas dos pruebas vale: a) 1; b) 0 y c) −1? SOLUCIONES DE PROBLEMAS Y EJERCICIOS 1. a) X1 X2 X3 X4 R = X1 1 0,5 −0,38 0,75 X2 0,5 1 0,05 0,1 X3 −0,38 0,05 1 0,25 X4 0,75 0,1 0,25 1 b) S2V = 45,4. Combinación lineal de variables / 173 © Ediciones Pirámide PI00180301_06.indd 173PI00180301_06.indd 173 20/01/12 15:4920/01/12 15:49 2. S2U = 44,8; S2V = 41,8. 3. X1 X2 X3 X4 R = X1 0 −0,2 0,4 X2 1 −0,5 X3 −1 X4 X1 X2 X3 X4 S = X1 4 0 −2,4 5,6 X2 9 18 −10,5 X3 36 −42 X4 49 4. z = 0,104. 5. U: U _ = −5; S2U = 8,04. V: V _ = 51; S2V = 652. 6. La condición es que Sx1x2 sea igual a cero. 7. rAntes Después = 0,6. 8. Como S2y = S2x, entonces S2U = 2 · S2x · (1 − rxy). Por tanto: a) Si rxy = 1, entonces S2U = 0. b) Si rxy = −1, entoncesS2U = 4 · S2x. c) Si rxy = 0, entonces S2U = 2 · S2x. 9. a) W _ = 14; S2W = 61. b) T _ = 5,667; S2T = 12,378. 10. a) T _ = 24; S2T = 119,6 (el mismo resultado si se suman todos los ele- mentos de la matriz de varianzas-covarianzas). b) U _ = −8,5; S2U = 59,5625. 11. Se demuestra que, en estas condiciones, S2V = 1 2 + 1 2 · rAB, entonces, a) Si rAB = 1; S2V = 1. b) Si rAB = 0; S2V = 1 2 . c) Si rAB = −1; S2V = 0. 174 / Análisis de datos en psicología I © Ediciones Pirámide PI00180301_06.indd 174PI00180301_06.indd 174 20/01/12 15:4920/01/12 15:49 ANÁLISIS DE DATOS EN PSICOLOGÍA I PARTE SEGUNDA. ESTADÍSTICA DESCRIPTIVA CON (...) 6 COMBINACIÓN LINEAL DE VARIABLES 6.1. INTRODUCCIÓN 6.2. SUMA Y RESTA DE DOS VARIABLES: MEDIA (...) 6.3. SUMA DE J VARIABLES 6.4. COMBINACIÓN LINEAL DE J VARIABLES PROBLEMAS Y EJERCICIOS SOLUCIONES DE PROBLEMAS Y EJERCICIOS
Compartir