Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
¿Hay una medida de variabilidad que sea más sensible que el rango? Considere, como ejemplo, las mediciones muestrales 5, 7, 1, 2, 4, mostradas como una gráfica de puntos en la figura 2.8. La media de estas cinco mediciones es x� � 8xi ___ n � 19 ___ 5 � 3.8 FIGURA 2.8 Gráfi ca de puntos que muestra las desviaciones de puntos desde la media ● 0 1 2 3 4 5 6 7 8 x x = 3.8 (xi – x) como se indica en la gráfica de puntos. Las distancias horizontales entre cada punto (medición) y la media _ x ayudarán a medir la variabilidad. Si las distancias son grandes, los datos son más dispersos o variables que si las distancias son pequeñas. Si xi es un punto particular (medición), entonces la desviación de esa medición desde la media es (xi – _ x ). Las mediciones a la derecha de la media producen desviaciones positivas y, las de la izquierda, negativas. Los valores de x y las desviaciones para nuestro ejemplo se detallan en las columnas primera y segunda de la tabla 2.1. TABLA 2.1 ● Cálculo de S(xi � x� ) 2 x (xi � xx�) (xi � xx�) 2 5 1.2 1.44 7 3.2 10.24 1 �2.8 7.84 2 �1.8 3.24 4 .2 .04 19 0.0 22.80 Como las desviaciones en la segunda columna de la tabla contienen información sobre variabilidad, una forma para combinar las cinco desviaciones en una medida numérica es promediarlas. Desafortunadamente, el promedio no funcionará porque algunas de las desviaciones son positivas, algunas son negativas y la suma es siempre cero (a menos que errores redondeados se hayan introducido en los cálculos). Observe que las desvia- ciones en la segunda columna de la tabla 2.1 suman cero. Otra posibilidad sería no hacer caso de los signos de las desviaciones y calcular el promedio de sus valores absolutos.† Este método se ha usado como medida de variabi- lidad en el análisis exploratorio de datos y en el análisis de datos de series de tiempo. Preferimos, no obstante, superar la dificultad causada por los signos de las desviaciones † El valor absoluto de un número es su magnitud, sin atender su signo. Por ejemplo, el valor absoluto de �2, representado por el símbolo |�2|, es 2. El valor absoluto de 2, esto es, |2|, es 2. 2.3 MEDIDAS DE VARIABILIDAD ❍ 61 Probabilidad_Mendenhall_02.indd 61Probabilidad_Mendenhall_02.indd 61 5/14/10 8:15:57 AM5/14/10 8:15:57 AM www.FreeLibros.me 62 ❍ CAPÍTULO 2 DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS al trabajar con su suma de cuadrados. De la suma de desviaciones cuadradas, se calcula una sola medida llamada varianza. Para distinguir entre la varianza de una muestra y la varianza de una población, usamos el símbolo s2 para una varianza muestral y s2 para una varianza de población. La varianza será relativamente grande para datos muy variables y relativamente pequeña para datos menos variables. Defi nición La varianza de una población de N mediciones es el promedio de los cuadrados de las desviaciones de las mediciones alrededor de su media m. La varianza poblacional se denota con s 2 y está dada por la fórmula s 2 � oS(xi – m) 2 _________ N La mayor parte de las veces, no tendremos todas las mediciones de población disponi- bles pero necesitaremos calcular la varianza de una muestra de n mediciones. Defi nición La varianza de una muestra de n mediciones es la suma de las des- viaciones cuadradas de las mediciones alrededor la media _ x dividida entre (n � 1). La varianza muestral se denota con s2 y está dada por la fórmula s2 � S(xi � _ x )2 _________ n � 1 Para el conjunto de n � 5 mediciones muestrales presentadas en la tabla 2.1, el cua- drado de la desviación de cada medición se registra en la tercera columna. Sumando, tendremos S(xi � _ x )2 � 22.80 y la varianza muestral es s 2 � S(xi � _ x )2 _________ n � 1 � 22.80 _____ 4 � 5.70 La varianza se mide en términos del cuadrado de las unidades originales de medición. Si las mediciones originales son en pulgadas, la varianza se expresa en pulgadas cuadra- das. Tomando la raíz cuadrada de la varianza, obtenemos la desviación estándar, que regresa la medida de variabilidad a las unidades originales de medición. Defi nición La desviación estándar de un conjunto de mediciones es igual a la raíz cuadrada positiva de la varianza. NOTACIÓN n: número de mediciones en la N: número de mediciones en la muestra población s2: varianza muestral s 2: varianza poblacional s � � __ s2 : desviación muestral estándar s � � ___ s 2 : desviación poblacional estándar La varianza y la desviación estándar no pueden ser números negativos. CONSEJOMIMI Probabilidad_Mendenhall_02.indd 62Probabilidad_Mendenhall_02.indd 62 5/14/10 8:15:57 AM5/14/10 8:15:57 AM www.FreeLibros.me Para el conjunto de n � 5 mediciones muestrales en la tabla 2.1, la varianza muestral es s2 � 5.70, de modo que la desviación estándar de la muestra es s � � __ s2 � � ____ 5.70 � 2.39. Cuanto más variable sea el conjunto de datos, mayor es el valor de s. Para el pequeño conjunto de datos que empleamos, el cálculo de la varianza no es demasiado difícil. No obstante, para un conjunto más grande, los cálculos pueden hacerse tediosos. Casi todas las calculadoras científicas tienen programas internos que calcularán _ x y s o m y s, de modo que el trabajo computacional es mínimo para el usua- rio. La tecla de la muestra o media poblacional suele estar marcada con _ x . La tecla de la desviación estándar de la muestra suele estar marcada s, sx o sxn�1, y la tecla de desvia- ción estándar poblacional con s, sx o sxn. Al usar cualquier calculadora con estas teclas de función interna, asegúrese de ver qué cálculo es realizado por cada tecla. Si necesita calcular manualmente s2 y s, es mucho más fácil usar la fórmula alter- nativa de cálculo dada a continuación. Esta forma computacional se denomina a veces método breve para calcular s2. FÓRMULA COMPUTACIONAL PARA CALCULAR s2 8x2i – (8xi) 2 ______ n s2 � n � 1 Los símbolos (8xi) 2 y 8x2i en la fórmula computacional son métodos breves para indicar la operación aritmética que es necesario efectuar. El usuario sabe de la fórmula para la media muestral que 8xi es la suma de todas las mediciones. Para hallar 8x 2 i, eleve al cuadrado cada medición individual y luego súmelas. 8x2i � Suma de cuadrados de las mediciones individuales (8xi) 2 � Cuadrado de la suma de las mediciones individuales La desviación estándar de la muestra, s, es la raíz cuadrada positiva de s2. Calcule la varianza y desviación estándar para las cinco mediciones de la tabla 2.2, que son 5, 7, 1, 2, 4. Use la fórmula computacional para s2 y compare sus resultados con los obtenidos usando la definición original de s2. Si usted usa calculadora, asegúrese de escoger la tecla correcta para la desviación estándar de la muestra. CONSEJOMIMI E J E M P L O 2.5 TABLA 2.2 ● Tabla para cálculo simplifi cado de s2 y s xi x 2i 5 25 7 49 1 1 2 4 4 16 19 95 2.3 MEDIDAS DE VARIABILIDAD ❍ 63 Probabilidad_Mendenhall_02.indd 63Probabilidad_Mendenhall_02.indd 63 5/14/10 8:15:57 AM5/14/10 8:15:57 AM www.FreeLibros.me
Compartir