Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Análisis Cuantitativo II Unidad 8: Análisis estadístico. Medidas de dispersión 6.1.1 DESVIACIÓN STANDAR VARIANZA ( 2 ) Es la más importante de las medidas de variación, porque tiene la ventaja de no prescindir de los signos de las desviaciones, pero al igual que la desviación media los valores extremos pueden distorsionarla. La varianza pretende descubrir cuanto varían los datos alrededor de la media poblacional. CALCULO DE LA VARIANZA • Datos crudos: ( ) n Xx n i i = − = 1 2 2 • Arreglo y distribución de frecuencia: ( ) = = − = n i i n i ii f Xxf 1 1 2 2 Veamos un ejemplo sencillo: Calculamos la varianza de la distribución: 4, 5, 6, 6, 8, 13 Su problema son las unidades ya que minutos al cuadrado no existen, y si hablamos de longitud m x m nos daría metros al cuadrado o sea superficie. El valor de la varianza no lo podemos tomar, pues, como la cantidad que resulta, en las unidades que nos proporcionan los datos. Para hacernos una idea aproximada, nunca exacta, hay que obtener la raíz cuadrada, y así esta nueva medida, es la desviación típica. DESVIACIÓN ESTÁNDAR Cuando se utiliza la varianza como medida de dispersión, para salvar el problema de trabajar con distintas dimensiones en la media y en la medida de variabilidad es necesario definir la Desviación Estándar como la raíz cuadrada de la varianza: 2 = La Desviación Estándar es útil para describir cuanto se apartan de la media de la distribución los elementos individuales. Una medida de ello se denomina puntuación estándar número de desviaciones a las que determinada observación se encuentra con respecto a la media. CARACTERÍSTICA DE LA VARIANZA Y DESVIACIÓN ESTÁNDAR 1. El cálculo de estas medidas está basado en todos los datos del conjunto. 2. Son medidas totalmente lógicas ya que consideran tanto los signos positivos como los negativos para el cálculo. 3. Establecen la desviación de los datos respecto de la media aritmética y no con respecto a otros valores. 4. No se ven afectadas por la suma de las cantidades constantes a los datos del conjunto, pero si están afectadas si los datos son multiplicados o divididos por cantidades constantes, variando estas en la misma proporción, se toma para su cálculo el principio de los mínimos cuadrados 5. Como consecuencia de considerar desviaciones cuadráticas pone mayor énfasis en las desviaciones extremas que en las demás desviaciones. 6. Al construir la tabla de frecuencias de una variable discreta y calcular a partir de ella la desviación estándar no hay pérdida de información por lo que la desviación para los datos observados es igual que para los datos tabulados. 7. En la construcción de una tabla de una variable continua hay pérdida de información por el agrupamiento de los valores en intervalos y se traduce en la discrepancia entre el valor de la desviación observada y tabulada. COEFICIENTE DE DESVIACIÓN (CV) X CV = Veamos un ejemplo: • DATOS CRUDOS: Año Recaudación (millones de pesos) ( ) 2 Xxi − 1999 378,23 78444,8064 2000 380,27 77306,2416 2001 392,27 70777,2816 2002 371,51 82254,24 2003 548,85 11981,4916 2004 662,89 20,9764 2005 831,94 30147,3769 2006 1083,27 180591,002 2007 1275,56 380997,563 5924,79 912520,979 ( ) n Xx n i i = − = 1 2 2 = 22.101391 9 979.912520 = 2 = = 42.31822.101391 = X CV = = 48.0 31.658 42.318 = Conclusión: hay una dispersión de $318.420 respecto de la recaudación promedio, lo que presenta un error del 48% • ARREGLO Y DISTRIBUCIÓN DE FRECUENCIAS ✓ Arreglo de frecuencias: xi fi ii xf ( ) 2 Xxf ii − 60 2 120 3568,4352 63 1 63 1539,7776 65 1 65 1386,8176 71 1 71 975,9376 75 1 75 742,0176 80 2 160 989,2352 85 2 170 594,4352 99 2 198 20,9952 100 3 300 15,0528 124 5 620 2367,488 132 2 264 1771,3152 145 2 290 3656,8352 160 1 160 3336,2176 25 2556 20964,56 ( ) = = − = n i i n i ii f Xxf 1 1 2 2 = 58.838 25 56.20964 = 2 = = 96.2858.838 = X CV = = 28.0 24.102 96.28 = Conclusión: Hay una dispersión de 29 latas respecto de la producción promedio, lo que presenta un error del 28% ✓ Distribución de frecuencias: Edad Nº de turistas xi fi xi ( ) 2 Xxf ii − 1-14 127 7,5 952,5 101823,514 15-28 324 21,5 6966 66397,2245 29-42 455 35,5 16152,5 45,2523642 43-56 165 49,5 8167,5 30899,419 57-70 75 63,5 4762,5 57482,9218 71-84 97 77,5 7517,5 168548,045 1243 44518,5 425196,377 ( ) = = − = n i i n i ii f Xxf 1 1 2 2 = 07.342 1243 377.425196 = 2 = = 49.1807.342 = X CV = = 52.0 81.35 49.18 = Conclusión: Hay una dispersión de 18 años respecto de la edad promedio, lo que presenta un error del 52% Veamos un último ejemplo: El departamento de Tesorería de una empresa desea conocer el comportamiento los gastos financieros (en miles de pesos) en los que ha incurrido la empresa, para lo cual observo el gasto de la misma durante 25 días, que se detalla a continuación: 100 76 145 125 135 50 100 85 71 50 50 100 90 71 135 125 85 71 125 125 145 100 135 90 135 Si queremos conocer canto los gastos se desvían de su promedio: xi fi Fi 50 3 3 7729.73 71 3 6 2656.97 76 1 7 613.06 85 2 9 496.76 90 2 11 231.56 100 4 15 2.31 125 4 19 2350.31 135 4 23 4689.51 145 2 25 3914.36 25 22684.56 ( ) = = − = n i i n i ii f Xxf 1 1 2 2 = 38,907 25 56.22684 = 2 = = 3038,907 = X CV = = 29.076,100 30 = Conclusión: Hay una dispersión de 30 mil pesos respecto del gasto promedio, lo que presenta un error del 29%. ( )2Xxf ii −
Compartir