Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-44

¡Estudia con miles de materiales!

Vista previa del material en texto

106 ❍ CAPÍTULO 3 DESCRIPCIÓN DE DATOS BIVARIADOS
Las cantidades sx y sy son las desviaciones estándar para las variables x y y, respecti-
vamente, que usted puede hallar si usa la función de estadística de su calculadora o la 
fórmula computacional de la sección 2.3. La nueva cantidad sxy se denomina covarianza 
entre x y y, y está definida como
sxy � 
S(xi � 
_
 x )(yi � 
_
 y )
 _____________ 
n � 1
 
También hay una fórmula computacional para la covarianza:
sxy � 
Sxiyi � 
(Sxi)(Syi) ________ n 
 _______________ 
n � 1
 
donde 8xiyi es la suma de los productos xiyi para cada uno de los n pares de mediciones. 
¿En qué forma esta cantidad detecta y mide un modelo lineal de los datos?
Observe los signos de los productos cruz (xi � 
_
 x ) (yi � 
_
 y ) del numerador de r, o sea 
sxy. Cuando un punto de datos (x, y) se encuentre en el área I o III de la gráfica de dis-
persión que se muestra en la figura 3.8, el producto cruz será positivo; cuando un punto 
de datos esté en el área II o IV, el producto cruz será negativo. Podemos sacar estas 
conclusiones:
• Si casi todos los puntos están en las áreas I y III (formando un modelo positivo), 
sxy y r serán positivos.
• Si casi todos los puntos están en las áreas II y IV (formando un modelo negati-
vo), sxy y r serán negativos.
• Si los puntos están dispersos en las cuatro áreas (sin formar modelo), sxy y r serán 
cercanos a 0.
FIGURA 3.8
Los signos de los 
productos cruz (xi � x� )
(yi � y� ) de la fórmula de 
covarianza.
●
x
y
y
x
II : – I : +
III : + IV : –
x
y
y
x
II : – I : +
III : + IV : –
x
y
y
x
II : – I : +
III : + IV : –
a) Modelo positivo b) Modelo negativo c) Sin modelo
APPLETMIMI
El applet llamado Exploring Correlation (Exploración de correlación) ayudará a 
visualizar la forma en que el modelo de puntos afecta al coeficiente de correlación. 
Use su mouse para mover el apuntador en la parte inferior de la gráfica de dispersión 
(figura 3.9). Verá que el valor de r cambia cuando cambia el modelo de los puntos. 
Observe que un modelo positivo a) resulta en un valor positivo de r; cuando no hay 
modelo c) se obtiene un valor de r cercano a cero; un modelo negativo b) resulta en 
un valor negativo de r. ¿Qué modelo se muestra cuando r = 1? ¿Y cuando r = �1? 
Usted empleará este applet otra vez para la sección de Ejercicios de MiApplet al final 
de este capítulo.
Probabilidad_Mendenhall_03.indd 106Probabilidad_Mendenhall_03.indd 106 5/14/10 8:17:03 AM5/14/10 8:17:03 AM
 www.FreeLibros.me
Casi todas las calculadoras científicas y de gráficas pueden calcular el coeficiente de 
correlación, r, cuando los datos se introducen en la forma correcta. Verifique el manual 
de su computadora para la secuencia apropiada de comandos de entrada. Los programas de 
computadora como el MINITAB también están programados para realizar estos cálculos. 
La salida MINITAB de la figura 3.10 muestra la covarianza y coeficiente de correlación 
para x y y del ejemplo 3.5. En la tabla de covarianza, encontrará estos valores:
sxy � 15 545.20 s
2
x � 79 233.33 s
2
y � 3571.16
y en la salida de correlación encontrará r = .924.
De cualquier modo que usted decida calcular el coeficiente de correlación, se puede 
demostrar que el valor de r siempre está entre �1 y 1. Cuando r es positiva, x aumenta 
cuando y aumenta, y viceversa. Cuando r es negativa, x disminuye cuando y aumenta, 
o x aumenta cuando y disminuye. Cuando r toma el valor de 1 o �1, todos los puntos 
están exactamente en una recta. Si r � 0, entonces no hay relación lineal aparente entre 
las dos variables. Cuanto más cercano sea el valor de r a 1 o a �1, será más fuerte la 
relación lineal entre las dos variables.
Encuentre el coeficiente de correlación para el número de pies cuadrados de área de 
descanso y el precio de venta de una casa para los datos del ejemplo 3.5.
Solución Se necesita de tres cantidades para calcular el coeficiente de correlación. 
Las desviaciones estándar de las variables x y y se encuentran usando una calculadora 
con una función estadística. Se puede verificar que sx � 281.4842 y sy � 59.7592. Por 
último,
r � 0 ⇔ relación lineal 
positiva
r � 0 ⇔ relación lineal 
negativa
r � 0 ⇔ no hay relación
CONSEJOMIMI
FIGURA 3.9
Applet llamado Exploring 
Correlation
●
FIGURA 3.10
Salida del MINITAB de 
covarianza y correlación 
para el ejemplo 3.5
●
Covarianzas: x, y
 x y
x 79233.33
y 15545.20 3571.16
Correlaciones: x, y
 
Pearson correlation of x and y = 0.924
P-Value = 0.000
E J E M P L O 3.6
 3.4 MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS ❍ 107
Probabilidad_Mendenhall_03.indd 107Probabilidad_Mendenhall_03.indd 107 5/14/10 8:17:04 AM5/14/10 8:17:04 AM
 www.FreeLibros.me
108 ❍ CAPÍTULO 3 DESCRIPCIÓN DE DATOS BIVARIADOS
x “explica” y o y “depende 
de” x.
x es la variable explicativa o 
independiente.
y es la respuesta o variable 
dependiente.
CONSEJOMIMI
sxy � 
Sxiyi � 
(Sxi)(Syi) ________ n 
 _______________ 
n � 1
 
� 
7 240 383 � 
(20 980 )(4043.5)
 ______________ 
12
 
 ________________________ 
11
 � 15 545.19697
Esto concuerda con el valor dado en la salida MINITAB de la figura 3.10. Entonces
r � 
sxy
�
sxsy
 � 
15 545.19697
���
(281.4842)(59.7592)
 � .9241
que también concuerda con el valor del coefi ciente de correlación dado en la fi gura 3.10. 
(Se puede verifi car el valor de r usando una calculadora.) Este valor de r es bastante 
cercano a 1, lo cual indica que la relación lineal entre estas dos variables es muy fuerte. 
En el capítulo 12 se puede encontrar más información acerca del coefi ciente de corre-
lación y su papel para analizar relaciones lineales, junto con fórmulas computacionales 
alternativas.
A veces las dos variables, x y y, están relacionadas de una forma particular. Puede ser 
que el valor de y dependa del valor de x; esto es, el valor de x en alguna forma explica 
el valor de y. Por ejemplo, el costo de una casa (y) puede depender de su superficie de 
piso (x); el promedio de puntos de calificación de una estudiante (x) puede explicar su 
calificación en un examen vocacional (y). En estas situaciones, y se denomina variable 
dependiente, en tanto que x es la variable independiente.
Si una de las dos variables se puede clasificar como la variable dependiente y y la otra 
como x, y si los datos exhiben un modelo de línea recta, es posible describir la relación 
que vincula y a x usando una línea recta dada por la ecuación
y � a 
 bx
como se muestra en la figura 3.11.
FIGURA 3.11
Gráfi ca de una recta
●
x
y
10
y = a + bx
a
b
b
2 3 4 5
Como se puede ver, a es donde la recta cruza o interseca al eje y: a se denomina 
intersección y. También se puede ver que para todo aumento unitario en x, y aumenta en 
una cantidad de b. La cantidad b determina si la recta está aumentando (b � 0), dismi-
nuyendo (b � 0) o es horizontal (b � 0) y muy adecuadamente se denomina pendiente 
de la recta.
Probabilidad_Mendenhall_03.indd 108Probabilidad_Mendenhall_03.indd 108 5/14/10 8:17:04 AM5/14/10 8:17:04 AM
 www.FreeLibros.me

Continuar navegando