Logo Studenta

Apunte Analisis Cuantitativo

¡Estudia con miles de materiales!

Vista previa del material en texto

Análisis Cuantitativo II 
Unidad 8: Análisis estadístico. Medidas de dispersión 
 
6.1.1 DESVIACIÓN STANDAR 
 
VARIANZA ( 2 ) 
 
Es la más importante de las medidas de variación, porque tiene 
la ventaja de no prescindir de los signos de las desviaciones, 
pero al igual que la desviación media los valores extremos 
pueden distorsionarla. 
La varianza pretende descubrir cuanto varían los datos alrededor de la media poblacional. 
 
CALCULO DE LA VARIANZA 
 
• Datos crudos: 
( )
n
Xx
n
i
i
=
−
= 1
2
2 
• Arreglo y distribución de frecuencia: 
( )


=
=
−
=
n
i
i
n
i
ii
f
Xxf
1
1
2
2
 
 
 
Veamos un ejemplo sencillo: 
Calculamos la varianza de la distribución: 
4, 5, 6, 6, 8, 13 
 
 
 
 
 
 
 
Su problema son las unidades ya que minutos al cuadrado no existen, y si 
hablamos de longitud m x m nos daría metros al cuadrado o sea 
superficie. El valor de la varianza no lo podemos tomar, pues, como la 
cantidad que resulta, en las unidades que nos proporcionan los datos. 
Para hacernos una idea aproximada, nunca exacta, hay que obtener la 
raíz cuadrada, y así esta nueva medida, es la desviación típica. 
 
DESVIACIÓN ESTÁNDAR 
Cuando se utiliza la varianza como medida de dispersión, para salvar el problema de trabajar con 
distintas dimensiones en la media y en la medida de variabilidad es necesario definir la Desviación 
Estándar como la raíz cuadrada de la varianza: 
2 =
 
La Desviación Estándar es útil para describir cuanto se apartan de la media de la distribución los 
elementos individuales. Una medida de ello se denomina puntuación estándar número de 
desviaciones a las que determinada observación se encuentra con respecto a la media. 
 
CARACTERÍSTICA DE LA VARIANZA Y DESVIACIÓN ESTÁNDAR 
 
1. El cálculo de estas medidas está basado en todos los datos del conjunto. 
2. Son medidas totalmente lógicas ya que consideran tanto los signos positivos como los 
negativos para el cálculo. 
3. Establecen la desviación de los datos respecto de la media aritmética y no con respecto a 
otros valores. 
 
4. No se ven afectadas por la suma de las cantidades constantes a los datos del conjunto, pero 
si están afectadas si los datos son multiplicados o divididos por cantidades constantes, 
variando estas en la misma proporción, se toma para su cálculo el principio de los mínimos 
cuadrados 
5. Como consecuencia de considerar desviaciones cuadráticas pone mayor énfasis en las 
desviaciones extremas que en las demás desviaciones. 
6. Al construir la tabla de frecuencias de una variable discreta y calcular a partir de ella la 
desviación estándar no hay pérdida de información por lo que la desviación para los datos 
observados es igual que para los datos tabulados. 
7. En la construcción de una tabla de una variable continua hay pérdida de información por el 
agrupamiento de los valores en intervalos y se traduce en la discrepancia entre el valor de la 
desviación observada y tabulada. 
 
COEFICIENTE DE DESVIACIÓN (CV) 
X
CV

=
 
Veamos un ejemplo: 
 
• DATOS CRUDOS: 
 
Año Recaudación (millones de pesos) ( )
2
Xxi − 
1999 378,23 78444,8064 
2000 380,27 77306,2416 
2001 392,27 70777,2816 
2002 371,51 82254,24 
2003 548,85 11981,4916 
2004 662,89 20,9764 
2005 831,94 30147,3769 
2006 1083,27 180591,002 
2007 1275,56 380997,563 
 5924,79 912520,979 
 
 
 
( )
n
Xx
n
i
i
=
−
= 1
2
2 = 22.101391
9
979.912520
=
 
2 = = 42.31822.101391 = 
X
CV

=
=
48.0
31.658
42.318
=
 
 
Conclusión: hay una dispersión de $318.420 respecto de la recaudación promedio, lo que presenta 
un error del 48% 
 
 
• ARREGLO Y DISTRIBUCIÓN DE FRECUENCIAS 
✓ Arreglo de frecuencias: 
 
xi fi ii xf ( )
2
Xxf ii − 
60 2 120 3568,4352 
63 1 63 1539,7776 
65 1 65 1386,8176 
71 1 71 975,9376 
75 1 75 742,0176 
80 2 160 989,2352 
85 2 170 594,4352 
99 2 198 20,9952 
100 3 300 15,0528 
124 5 620 2367,488 
132 2 264 1771,3152 
145 2 290 3656,8352 
160 1 160 3336,2176 
 25 2556 20964,56 
 
( )


=
=
−
=
n
i
i
n
i
ii
f
Xxf
1
1
2
2
=
58.838
25
56.20964
=
 
 
2 = = 96.2858.838 = 
X
CV

= = 28.0
24.102
96.28
= 
 
Conclusión: Hay una dispersión de 29 latas respecto de la producción promedio, lo que presenta un 
error del 28% 
 
✓ Distribución de frecuencias: 
 
Edad Nº de turistas xi fi xi ( )
2
Xxf ii − 
1-14 127 7,5 952,5 101823,514 
15-28 324 21,5 6966 66397,2245 
29-42 455 35,5 16152,5 45,2523642 
43-56 165 49,5 8167,5 30899,419 
57-70 75 63,5 4762,5 57482,9218 
71-84 97 77,5 7517,5 168548,045 
 1243 44518,5 425196,377 
 
( )


=
=
−
=
n
i
i
n
i
ii
f
Xxf
1
1
2
2
= 07.342
1243
377.425196
= 
 
2 = = 49.1807.342 = 
X
CV

= = 52.0
81.35
49.18
= 
 
Conclusión: Hay una dispersión de 18 años respecto de la edad promedio, lo que presenta un error 
del 52% 
 
 
 
 
 
 
 
 
 
 
Veamos un último ejemplo: 
 
El departamento de Tesorería de una empresa desea conocer el comportamiento los gastos 
financieros (en miles de pesos) en los que ha incurrido la empresa, para lo cual observo el gasto de la 
misma durante 25 días, que se detalla a continuación: 
 
100 76 145 125 135 
50 100 85 71 50 
50 100 90 71 135 
125 85 71 125 125 
145 100 135 90 135 
 
Si queremos conocer canto los gastos se desvían de su promedio: 
 
xi fi Fi 
50 3 3 7729.73 
71 3 6 2656.97 
76 1 7 613.06 
85 2 9 496.76 
90 2 11 231.56 
100 4 15 2.31 
125 4 19 2350.31 
135 4 23 4689.51 
145 2 25 3914.36 
 25 22684.56 
 
( )


=
=
−
=
n
i
i
n
i
ii
f
Xxf
1
1
2
2
=
38,907
25
56.22684
=
 
2 = = 3038,907 = 
X
CV

= = 29.076,100
30
=
 
 
Conclusión: Hay una dispersión de 30 mil pesos respecto del gasto promedio, lo que presenta un 
error del 29%. 
( )2Xxf ii −

Continuar navegando