Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
106 ❍ CAPÍTULO 3 DESCRIPCIÓN DE DATOS BIVARIADOS Las cantidades sx y sy son las desviaciones estándar para las variables x y y, respecti- vamente, que usted puede hallar si usa la función de estadística de su calculadora o la fórmula computacional de la sección 2.3. La nueva cantidad sxy se denomina covarianza entre x y y, y está definida como sxy � S(xi � _ x )(yi � _ y ) _____________ n � 1 También hay una fórmula computacional para la covarianza: sxy � Sxiyi � (Sxi)(Syi) ________ n _______________ n � 1 donde 8xiyi es la suma de los productos xiyi para cada uno de los n pares de mediciones. ¿En qué forma esta cantidad detecta y mide un modelo lineal de los datos? Observe los signos de los productos cruz (xi � _ x ) (yi � _ y ) del numerador de r, o sea sxy. Cuando un punto de datos (x, y) se encuentre en el área I o III de la gráfica de dis- persión que se muestra en la figura 3.8, el producto cruz será positivo; cuando un punto de datos esté en el área II o IV, el producto cruz será negativo. Podemos sacar estas conclusiones: • Si casi todos los puntos están en las áreas I y III (formando un modelo positivo), sxy y r serán positivos. • Si casi todos los puntos están en las áreas II y IV (formando un modelo negati- vo), sxy y r serán negativos. • Si los puntos están dispersos en las cuatro áreas (sin formar modelo), sxy y r serán cercanos a 0. FIGURA 3.8 Los signos de los productos cruz (xi � x� ) (yi � y� ) de la fórmula de covarianza. ● x y y x II : – I : + III : + IV : – x y y x II : – I : + III : + IV : – x y y x II : – I : + III : + IV : – a) Modelo positivo b) Modelo negativo c) Sin modelo APPLETMIMI El applet llamado Exploring Correlation (Exploración de correlación) ayudará a visualizar la forma en que el modelo de puntos afecta al coeficiente de correlación. Use su mouse para mover el apuntador en la parte inferior de la gráfica de dispersión (figura 3.9). Verá que el valor de r cambia cuando cambia el modelo de los puntos. Observe que un modelo positivo a) resulta en un valor positivo de r; cuando no hay modelo c) se obtiene un valor de r cercano a cero; un modelo negativo b) resulta en un valor negativo de r. ¿Qué modelo se muestra cuando r = 1? ¿Y cuando r = �1? Usted empleará este applet otra vez para la sección de Ejercicios de MiApplet al final de este capítulo. Probabilidad_Mendenhall_03.indd 106Probabilidad_Mendenhall_03.indd 106 5/14/10 8:17:03 AM5/14/10 8:17:03 AM www.FreeLibros.me Casi todas las calculadoras científicas y de gráficas pueden calcular el coeficiente de correlación, r, cuando los datos se introducen en la forma correcta. Verifique el manual de su computadora para la secuencia apropiada de comandos de entrada. Los programas de computadora como el MINITAB también están programados para realizar estos cálculos. La salida MINITAB de la figura 3.10 muestra la covarianza y coeficiente de correlación para x y y del ejemplo 3.5. En la tabla de covarianza, encontrará estos valores: sxy � 15 545.20 s 2 x � 79 233.33 s 2 y � 3571.16 y en la salida de correlación encontrará r = .924. De cualquier modo que usted decida calcular el coeficiente de correlación, se puede demostrar que el valor de r siempre está entre �1 y 1. Cuando r es positiva, x aumenta cuando y aumenta, y viceversa. Cuando r es negativa, x disminuye cuando y aumenta, o x aumenta cuando y disminuye. Cuando r toma el valor de 1 o �1, todos los puntos están exactamente en una recta. Si r � 0, entonces no hay relación lineal aparente entre las dos variables. Cuanto más cercano sea el valor de r a 1 o a �1, será más fuerte la relación lineal entre las dos variables. Encuentre el coeficiente de correlación para el número de pies cuadrados de área de descanso y el precio de venta de una casa para los datos del ejemplo 3.5. Solución Se necesita de tres cantidades para calcular el coeficiente de correlación. Las desviaciones estándar de las variables x y y se encuentran usando una calculadora con una función estadística. Se puede verificar que sx � 281.4842 y sy � 59.7592. Por último, r � 0 ⇔ relación lineal positiva r � 0 ⇔ relación lineal negativa r � 0 ⇔ no hay relación CONSEJOMIMI FIGURA 3.9 Applet llamado Exploring Correlation ● FIGURA 3.10 Salida del MINITAB de covarianza y correlación para el ejemplo 3.5 ● Covarianzas: x, y x y x 79233.33 y 15545.20 3571.16 Correlaciones: x, y Pearson correlation of x and y = 0.924 P-Value = 0.000 E J E M P L O 3.6 3.4 MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS ❍ 107 Probabilidad_Mendenhall_03.indd 107Probabilidad_Mendenhall_03.indd 107 5/14/10 8:17:04 AM5/14/10 8:17:04 AM www.FreeLibros.me 108 ❍ CAPÍTULO 3 DESCRIPCIÓN DE DATOS BIVARIADOS x “explica” y o y “depende de” x. x es la variable explicativa o independiente. y es la respuesta o variable dependiente. CONSEJOMIMI sxy � Sxiyi � (Sxi)(Syi) ________ n _______________ n � 1 � 7 240 383 � (20 980 )(4043.5) ______________ 12 ________________________ 11 � 15 545.19697 Esto concuerda con el valor dado en la salida MINITAB de la figura 3.10. Entonces r � sxy � sxsy � 15 545.19697 ��� (281.4842)(59.7592) � .9241 que también concuerda con el valor del coefi ciente de correlación dado en la fi gura 3.10. (Se puede verifi car el valor de r usando una calculadora.) Este valor de r es bastante cercano a 1, lo cual indica que la relación lineal entre estas dos variables es muy fuerte. En el capítulo 12 se puede encontrar más información acerca del coefi ciente de corre- lación y su papel para analizar relaciones lineales, junto con fórmulas computacionales alternativas. A veces las dos variables, x y y, están relacionadas de una forma particular. Puede ser que el valor de y dependa del valor de x; esto es, el valor de x en alguna forma explica el valor de y. Por ejemplo, el costo de una casa (y) puede depender de su superficie de piso (x); el promedio de puntos de calificación de una estudiante (x) puede explicar su calificación en un examen vocacional (y). En estas situaciones, y se denomina variable dependiente, en tanto que x es la variable independiente. Si una de las dos variables se puede clasificar como la variable dependiente y y la otra como x, y si los datos exhiben un modelo de línea recta, es posible describir la relación que vincula y a x usando una línea recta dada por la ecuación y � a bx como se muestra en la figura 3.11. FIGURA 3.11 Gráfi ca de una recta ● x y 10 y = a + bx a b b 2 3 4 5 Como se puede ver, a es donde la recta cruza o interseca al eje y: a se denomina intersección y. También se puede ver que para todo aumento unitario en x, y aumenta en una cantidad de b. La cantidad b determina si la recta está aumentando (b � 0), dismi- nuyendo (b � 0) o es horizontal (b � 0) y muy adecuadamente se denomina pendiente de la recta. Probabilidad_Mendenhall_03.indd 108Probabilidad_Mendenhall_03.indd 108 5/14/10 8:17:04 AM5/14/10 8:17:04 AM www.FreeLibros.me
Compartir