Logo Studenta

Cap 6 - Botella Leon y San Martin - Analisis de datos en psicologia I

¡Estudia con miles de materiales!

Vista previa del material en texto

6.1. INTRODUCCIÓN
Es frecuente encontrarse en situaciones en las que hay que trabajar con varia-
bles que proceden de la combinación de otras variables, especialmente de combi-
naciones lineales. Por ejemplo, muchas veces la puntuación total de un test psi-
cológico se obtiene sumando las puntuaciones obtenidas en dos o más subescalas. 
Ya hemos abordado esta cuestión en capítulos anteriores. En éste vamos a expo-
ner la obtención de los principales estadísticos (la media y la varianza) de una 
variable que se crea como una combinación lineal de dos o más variables. Supon-
gamos, por ejemplo, que representamos por U, V y X a las puntuaciones en tres 
subescalas, mientras que T representa las puntuaciones totales que se obtienen 
sumando esas puntuaciones; la expresión formal sería:
Ti = Ui + Vi + Xi
En estas circunstancias es probable que queramos obtener la media y la va-
rianza de esa nueva variable. Desde luego, un procedimiento correcto para hacer-
lo consistiría en calcular para cada sujeto su puntuación Ti y luego operar sobre 
esos valores mediante las fórmulas y procedimientos que ya hemos expuesto en 
los capítulos anteriores:
T
_
 = 
∑Ti
N
 y S2T = 
∑(Ti − T
_
)2
N
Sin embargo, este procedimiento puede resultar muy laborioso, sobre todo 
cuando el número de sujetos y variables es muy grande. En este capítulo vamos a 
exponer procedimientos que nos permitirán deducir las características de estas 
variables a partir de las características de las variables componentes y de sus rela-
ciones. Primero estudiaremos el caso más sencillo, el de la suma o resta de dos 
variables; luego expondremos el caso más frecuente, el de la suma de un número 
cualquiera de variables, y por último describiremos el caso general, aplicable a 
cualquier combinación lineal de variables.
© Ediciones Pirámide
6Combinación lineal de variables
PI00180301_06.indd 165PI00180301_06.indd 165 20/01/12 15:4920/01/12 15:49
6.2. SUMA Y RESTA DE DOS VARIABLES: MEDIA Y VARIANZA
La combinación lineal de variables más sencilla es aquella en la que una va-
riable se defi ne a partir de la simple suma o resta de otras dos variables. Defi ni-
remos de esas dos formas las variables T y U:
 Ti = Xi + Yi [6.1]
 Ui = Xi − Yi [6.2]
Veamos primero cuánto valdrán las medias de las nuevas puntuaciones:
T
_
 = 
∑Ti
N
 = 
∑(Xi + Yi)
N
 = 
∑Xi
N
 + 
∑Yi
N
 = X
_
 + Y
_
U
_
 = 
∑Ui
N
 = 
∑(Xi − Yi)
N
 = 
∑Xi
N
 − 
∑Yi
N
 = X
_
 − Y
_
Por su parte, la varianza de T será:
S2T = 
∑(Ti − T
_
)2
N
 = 
∑[(Xi + Yi) − (X
_
 + Y
_
)]2
N
Reorganizamos el numerador, lo desarrollamos como un binomio al cuadrado 
y aplicamos la regla de distribución del sumatorio (véase el apéndice del capítulo 1):
S2T = 
∑[(Xi − X
_
) + (Yi − Y
_
)]2
N
 =
= 
∑[(Xi − X
_
)2 + (Yi − Y
_
)2 + 2 · (Xi − X
_
) · (Yi − Y
_
)]
N
 =
= 
∑(Xi − X
_
)2 + ∑(Yi − Y
_
)2 + 2 · ∑(Xi − X
_
) · (Yi − Y
_
)
N
Por último, separamos la expresión en tres quebrados diferentes, y en cada 
uno de ellos reconocemos un elemento ya descrito en capítulos anteriores:
S2T = 
∑(Xi − X
_
)2
N
S2x
 + 
∑(Yi − Y
_
)2
N
S2y
 + 2 · 
∑(Xi − X
_
) · (Yi − Y
_
)
N
Sxy
166 / Análisis de datos en psicología I
© Ediciones Pirámide
PI00180301_06.indd 166PI00180301_06.indd 166 20/01/12 15:4920/01/12 15:49
Dejamos en manos del lector interesado en poner a prueba su pericia alge-
braica el desarrollo de la demostración de que la varianza de U será similar a la 
de T, con la única diferencia de que el tercer quebrado irá precedido por un sig-
no negativo, en lugar del signo positivo. Por tanto, podemos resumir lo expuesto 
hasta aquí de la siguiente forma:
a) Si se defi ne una variable como la suma de dos variables, su media es igual 
a la suma de las medias de esas variables y su varianza es igual a la suma 
de las varianzas de esas variables más dos veces la covarianza entre ellas. 
Es decir:
 Si Ti = Xi + Yi
 entonces T
_
 = X
_
 + Y
_
 y S2T = S2x + S2y + 2 · Sxy [6.3]
b) Si se defi ne una variable como la diferencia entre dos variables, su media 
es igual a la diferencia entre las medias de esas variables y su varianza es 
igual a la suma de las varianzas de esas variables menos dos veces la co-
varianza entre ellas. Es decir:
 Si Ti = Xi − Yi
 entonces T
_
 = X
_
 − Y
_
 y S2T = S2x + S2y − 2 · Sxy [6.4]
Veamos un ejemplo numérico de la aplicación de estas fórmulas. Supongamos 
que disponemos de las puntuaciones de cuatro personas en dos subtests, X e Y; 
defi nimos T como la suma de los subtests y U como su diferencia; es decir, Ti = 
= Xi + Yi y Ui = Xi − Yi. Si no conociésemos las fórmulas [6.3] y [6.4] obtendría-
mos las puntuaciones T y U de cada sujeto y hallaríamos las medias y varianzas 
de esas puntuaciones, tal y como mostramos en la siguiente tabla:
X Y T U T 2 U 2 X · Y
 6
 3
 5
 2
 5
 1
 4
 2
11
 4
 9
 4
1
2
1
0
121
 16
 81
 16
1
4
1
0
30
 3
20
 4
Suma 16 12 28 4 234 6 57
 T
_
 = 28/4 = 7 U
_
 = 4/4 = 1
S2T = 
234
4
 − 72 = 9,5 S2U = 
6
4
 − 12 = 0,5
Combinación lineal de variables / 167
© Ediciones Pirámide
PI00180301_06.indd 167PI00180301_06.indd 167 20/01/12 15:4920/01/12 15:49
Las fórmulas [6.3] y [6.4] nos permiten obtener estas características de for-
ma más directa, sobre todo cuando el número de observaciones es muy grande. 
Para ello, debemos disponer de los siguientes estadísticos de las variables origi-
nales, X e Y:
X
_
 = 16/4 = 4 Y
_
 = 12/4 = 3 Sxy = 2,25
 S2x = 2,5 S2y = 2,5
Ahora sustituimos en [6.3] y [6.4]:
T
_
 = X
_
 + Y
_
 = 4 + 3 = 7 U
_
 = X
_
 − Y
_
 = 4 − 3 = 1
S2T = S2x + S2y + 2 · Sxy = 2,5 + 2,5 + 2 · 2,25 = 9,5
S2U = S2x + S2y − 2 · Sxy = 2,5 + 2,5 − 2 · 2,25 = 0,5
obteniendo los mismos estadísticos que hemos obtenido directamente con las 
puntuaciones de T y U.
6.3. SUMA DE J VARIABLES
Expondremos ahora un procedimiento más general, aplicable a todos aquellos 
casos en los que la nueva variable se defi ne como la suma de un número cualquie-
ra de variables. Por comodidad, representaremos a partir de aquí las variables con 
la misma letra, X, pero con diferentes subíndices para diferenciarlas. Con el primer 
subíndice nos referiremos a la observación y con el segundo a la variable; así, Xij 
representará al valor i-ésimo en la variable j-ésima. Expuesto con esta nomencla-
tura, el procedimiento que vamos a describir es aplicable a toda variable defi nida 
de la siguiente forma:
 Ti = Xi1 + Xi2 + ... + XiJ [6.5]
Esta expresión no es más que la suma de J variables. Extendiendo lo expues-
to al tratar la suma de dos variables, la media de esta variable es igual a la suma 
de las medias de las variables sumadas. Es decir:
 Si Ti = Xi1 + Xi2 + ... + XiJ
 entonces T
_
 = X
_
1 + X
_
2 + ... + X
_
J [6.6]
El procedimiento para obtener la varianza de una variable defi nida de esta 
forma se simplifi ca bastante si utilizamos la matriz de varianzas y covarianzas, 
que ya hemos expuesto en el capítulo anterior. En concreto, en [6.1] se defi nía una 
168 / Análisis de datos en psicología I
© Ediciones Pirámide
PI00180301_06.indd 168PI00180301_06.indd 168 20/01/12 15:4920/01/12 15:49
variable como la suma de dos variables. Si construimos la matriz S, o de varian-
zas y covarianzas, de las variables sumadas, observamos que ésta contiene preci-
samente los elementos de la fórmula de la varianza, defi nida en [6.3]: las varian-
zas de las dos variables y dos veces la covarianza entre ellas. Esto no es casualidad. 
Ahorramos al lector la demostración de que esto ocurre con la suma de cualquier 
suma de variables. Es decir, que si una variable se defi ne como la suma de J va-
riables, su varianza es igual a la suma de todos los elementos de la matriz S cons-
truida con esas J variables (adviértase que se multiplica por 2 la suma de los ele-
mentos que quedan por encima o por debajo de la diagonal). Es decir:
 Si Ti = Xi1 + Xi2 + ... + XiJ
 entonces S2T = S21 + S22 + ... + S2J
 + 2 · (S12 + S13 + ... + S1J+ ... S(J − 1)J) [6.7]
Veamos también un ejemplo numérico. Supongamos que tras administrar un 
test compuesto por cuatro subtests (X1, X2, X3, X4) a un colectivo obtenemos la 
siguiente matriz S, de varianzas y covarianzas, así como las medias que también 
se indican para los subtests. Queremos hallar la media y la varianza de una va-
riable, T, defi nida como la suma de los valores en los cuatro subtests (Ti = Xi1 + 
+ Xi2 + Xi3 + Xi4):
X1 X2 X3 X4
X1 32 15 7 18
X2 15 40 22 12
X3 7 22 20 14
X4 18 12 14 26
X
_
J 118 33 83 56
La media de T se obtiene como la suma de las medias, T
_
 = 118 + 33 + 83 + 
+ 56 = 290. La varianza se obtiene como la suma de los elementos de la matriz S 
de esas cuatro variables:
S2T = 32 + 40 + 20 + 26 + 2 · (15 + 7 + 18 + 22 + 12 + 14) = 294
6.4. COMBINACIÓN LINEAL DE J VARIABLES
Aunque los casos que hemos visto hasta aquí son los más sencillos y frecuen-
tes, hay otros que no encajan en esas situaciones. Lo que vamos a abordar ahora 
es el caso general, aplicable a cualquier combinación lineal de variables. Los an-
Combinación lineal de variables / 169
© Ediciones Pirámide
PI00180301_06.indd 169PI00180301_06.indd 169 20/01/12 15:4920/01/12 15:49
teriores no son más que casos particulares del presente. Vamos a exponer cómo 
obtener la media y la varianza de una variable que se defi ne de la siguiente forma:
 Ti = k1 · Xi1 + k2 · Xi2 + ... + kJ · XiJ + c [6.8]
En esta expresión, kj es el peso que tienen los valores de la variable Xj. Nótese 
que lo que hemos desarrollado en los apartados anteriores no son más que casos 
particulares de la expresión [6.8]. La suma y resta de dos variables serían aquellos 
casos en los que interviniesen dos variables, y las constantes multiplicadoras fue-
ran ambas iguales a 1 (suma de dos variables) o una igual a 1 y la otra igual a −1 
(diferencia de variables). La suma de J variables es el caso en el que todas las kj 
son iguales a 1. Además, en todos esos casos la constante sumada, c, es igual a 0.
La media de una variable defi nida según [6.8] se obtiene aplicando la siguien-
te defi nición: la media de una variable defi nida como una combinación lineal de 
variables es igual a la misma combinación lineal de las medias de las variables com-
ponentes. Es decir:
 Si Ti = k1 · Xi1 + k2 · Xi2 + ... + kJ · XiJ + c
 entonces T
_
 = k1 · X
_
1 + k2 · X
_
2 + ... + kJ · X
_
J + c [6.9]
La varianza de una combinación lineal de variables se obtiene por el proce-
dimiento que describimos a continuación; omitimos su laboriosa demostración. 
La varianza de una variable formada como una combinación lineal de variables es 
igual a la suma de las varianzas de las variables componentes multiplicadas por los 
cuadrados de sus coefi cientes, más dos veces las covarianzas por pares entre las va-
riables, multiplicadas por los coefi cientes correspondientes. Es decir,
 Si Ti = k1 · Xi1 + k2 · Xi2 + ... + kJ · XiJ + c
 entonces S2T = k21 · S21 + k22 · S22 + ... + k2J · S2J + 2 · (k1 · k2 · S12 + 
 + k1 · k3 · S13 + ... + k1 · kJ · S1J + ... + kJ − 1 · kJ · S(J − 1) J) [6.10]
170 / Análisis de datos en psicología I
© Ediciones Pirámide
PI00180301_06.indd 170PI00180301_06.indd 170 20/01/12 15:4920/01/12 15:49
PROBLEMAS Y EJERCICIOS
 1. Obtenga:
a) La matriz de correlaciones a partir de la siguiente matriz de varianzas-
covarianzas.
b) Si se defi ne la variable V = X3 − X1, calcule S2V.
X1 X2 X3 X4
S =
X1 25 10 −5,7 26,25
X2 10 16 0,6 2,8
X3 −5,7 0,6 9 5,25
X4 26,25 2,8 5,25 49
 2. Considerando las matrices incompletas de correlaciones y varianzas-cova-
rianzas que se muestran a continuación, obtenga las varianzas de las siguientes 
variables:
a) U = X1 + X3
b) V = X4 − X1
X1 X2 X3 X4
R =
X1 ( ) 0,2 0,4
X2 ( ) −0,5
X3 ( )
X4
X1 X2 X3 X4
S =
X1 4 ( ) ( ) ( )
X2 9 ( ) ( )
X3 36 ( )
X4 49
 3. Complete la matriz de correlaciones y la de varianzas-covarianzas (recuerde 
que ambas matrices son simétricas) del ejercicio anterior, sabiendo que: entre las 
variables X1 y X2 existe una relación lineal nula, así como una relación lineal di-
recta perfecta entre las variables X2 y X3; y Sx3x4 = − 42.
Combinación lineal de variables / 171
© Ediciones Pirámide
PI00180301_06.indd 171PI00180301_06.indd 171 20/01/12 15:4920/01/12 15:49
 4. Una prueba de capacidad verbal, formada por tres ítems linealmente indepen-
dientes, ha sido aplicada a un estudiante de primer curso del Grado en Psicología, 
obteniendo una puntuación directa en la prueba igual a 9. Sabiendo que la pun-
tuación en la prueba es igual a la suma de las puntuaciones de cada ítem, obten-
ga la puntuación típica del estudiante en la prueba, teniendo en cuenta los datos 
que aparecen en la siguiente tabla:
I1 I2 I3
Sx
X
_ 2
1
8
3
5
4
 5. Si a la matriz de varianzas-covarianzas del ejercicio 1 le añadimos el vector 
de medias que aparece más abajo, obtenga la media y la varianza de las siguien-
tes variables: U = 0,2 · X1 − 0,8 · X2; V = 5 · X2 + 2 · X4.
X1 X2 X3 X4
X
_
3 7 1 8
 6. Demuestre qué condición se ha de satisfacer para que la varianza de la suma 
de dos variables sea igual a la varianza de su diferencia.
 7. Para mejorar el tiempo de respuestas, TR, ante situaciones de alarma, se 
aplicó un programa de mejora a un grupo de personal de seguridad. Para ello 
se midió el TR de cada participante ante una situación de peligro antes y después 
del programa. La variable eficacia del programa, EP, se evaluó mediante la dife-
rencia del TR antes y después del programa. Sabiendo que la varianza del TRAntes 
fue igual a 25, que la varianza del TRDespués fue igual a 16, y que la de EP fue igual 
a 17, obtenga el valor de la correlación entre las variables TRAntes y TRDespués.
 8. Supongamos que Ui = Xi − Yi y que la varianzas de X e Y son iguales, aunque 
las desconocemos. Obtenga el valor de S2U si:
a) Existe una relación lineal directa perfecta entre X e Y.
b) Existe una relación lineal inversa perfecta entre X e Y.
c) Hay independencia lineal entre X e Y.
 9. Se han medido las variables U, V, X e Y en una muestra, calculándose la 
matriz de varianzas-covarianzas que aparece a continuación, así como las medias. 
Entonces:
a) Si se defi ne la variable W = U + V + Y, calcule la media y la varianza de W.
b) Si se defi ne la variable T = 
V + X + Y
3
, calcule la media y la varianza de T.
172 / Análisis de datos en psicología I
© Ediciones Pirámide
PI00180301_06.indd 172PI00180301_06.indd 172 20/01/12 15:4920/01/12 15:49
U V X Y
S =
U 4 3 9,6 2,8
V 3 9 10,8 −6,3
X 9,6 10,8 36 4,2
Y 2,8 −6,3 4,2 49
Medias 2 4 5 8
 10. Considerando la matriz de varianzas-covarianzas y el vector de medias que 
se presentan más abajo, calcule la media y la varianza de:
a) La variable T = X + Y + V + W.
b) La variable U = (X/4) − V.
X Y V W
S =
X 25 1 12 6
Y 1 4 −9,6 1,8
V 12 −9,6 64 −2,4
W 6 1,8 −2,4 9
Medias 6 3 10 5
 11. La puntuación V, utilizada en un proceso de evaluación clínica, se obtiene 
mediante el promedio de las puntuaciones típicas de los valores obtenidos en dos 
cuestionarios (A y B) de personalidad. ¿Cuánto valdrá la varianza de V si la co-
rrelación entre las puntuaciones de esas dos pruebas vale: a) 1; b) 0 y c) −1?
SOLUCIONES DE PROBLEMAS Y EJERCICIOS
 1. a)
X1 X2 X3 X4
R =
X1 1 0,5 −0,38 0,75
X2 0,5 1 0,05 0,1
X3 −0,38 0,05 1 0,25
X4 0,75 0,1 0,25 1
b) S2V = 45,4.
Combinación lineal de variables / 173
© Ediciones Pirámide
PI00180301_06.indd 173PI00180301_06.indd 173 20/01/12 15:4920/01/12 15:49
 2. S2U = 44,8; S2V = 41,8.
 3. 
X1 X2 X3 X4
R =
X1 0 −0,2 0,4
X2 1 −0,5
X3 −1
X4
X1 X2 X3 X4
S =
X1 4 0 −2,4 5,6
X2 9 18 −10,5
X3 36 −42
X4 49
 4. z = 0,104.
 5. U: U
_
 = −5; S2U = 8,04. V: V
_
 = 51; S2V = 652.
 6. La condición es que Sx1x2 sea igual a cero.
 7. rAntes Después = 0,6.
 8. Como S2y = S2x, entonces S2U = 2 · S2x · (1 − rxy). Por tanto:
a) Si rxy = 1, entonces S2U = 0.
b) Si rxy = −1, entoncesS2U = 4 · S2x.
c) Si rxy = 0, entonces S2U = 2 · S2x.
 9. a) W
_
 = 14; S2W = 61.
b) T
_
 = 5,667; S2T = 12,378.
 10. a) T
_
 = 24; S2T = 119,6 (el mismo resultado si se suman todos los ele-
mentos de la matriz de varianzas-covarianzas).
b) U
_
 = −8,5; S2U = 59,5625.
 11. Se demuestra que, en estas condiciones, S2V = 
1
2
 + 
1
2
 · rAB, entonces,
a) Si rAB = 1; S2V = 1.
b) Si rAB = 0; S2V =
1
2
.
c) Si rAB = −1; S2V = 0.
174 / Análisis de datos en psicología I
© Ediciones Pirámide
PI00180301_06.indd 174PI00180301_06.indd 174 20/01/12 15:4920/01/12 15:49
	ANÁLISIS DE DATOS EN PSICOLOGÍA I
	PARTE SEGUNDA. ESTADÍSTICA DESCRIPTIVA CON (...)
	6 COMBINACIÓN LINEAL DE VARIABLES
	6.1. INTRODUCCIÓN
	6.2. SUMA Y RESTA DE DOS VARIABLES: MEDIA (...)
	6.3. SUMA DE J VARIABLES
	6.4. COMBINACIÓN LINEAL DE J VARIABLES
	PROBLEMAS Y EJERCICIOS
	SOLUCIONES DE PROBLEMAS Y EJERCICIOS

Continuar navegando