Logo Studenta

TEORIA MEDIDA DE TENDENCIA CENTRAL Y DE DISPERSIÓN

¡Estudia con miles de materiales!

Vista previa del material en texto

1 
 
SUMATORIA 
 
1 2 3
1
.....
n
i n
i
a a a a a

    
Propiedades: ( )i i i ia b a b        , para y   constantes 
 
b d d b
ij ij
i a j c j c i a
a a
   
  donde a, b, c y d son constantes; a < b, c < d 
 
Sumas especiales: 
 1) 
1
( 1)
1 2 3 ....
2
n
k
n n
k n


      2) 
1
2 2 4 6 .... 2 ( 1)
n
k
k n n n

       
 3) 
2
1
(2 1) 1 3 5 .... (2 1)
n
k
k n n

        , 
2
1
1 3 5 ....
2
I
I
 
      
 
 
 
 4) 
2 2 2 2
1
1
1 2 .... ( 1) (2 1)
6
n
k
k n n n n

       5) 
2
3 3 3 3
1
( 1)
1 2 ....
2
n
k
n n
k n

 
      
 
 
 6) 
1
( 1)( 2)
( 1) 1 2 2 3 3 4 ...... ( 1) 
3
n
k
n n n
k k n n

 
            
 Porque 
2 2
1 1 1 1
1 ( 1)
( 1) ( ) ( 1) (2 1)
6 2
n n n n
k k k k
n n
k k k k k k n n n
   

            
 
( 1)(2 4) ( 1)( 2)
 
6 3
n n n n n n   
  
 7) 
1
( 1) ( 2) ( 3)
( 1)( 2) 1 2 3 2 3 4 3 4 5 ...... ( 1) ( 2) 
4
n
k
n n n n
k k k n n n

  
                  
 Porque 
3 2 3 2
1 1 1 1 1
( 1)(k+2) ( 3 2 ) 3 +2
n n n n n
k k k k k
k k k k k k k k
    
          
  
2
n(n+1) 1 ( 1) ( 1)
 = 3 ( 1)(2 1) 2 ( 1) 2(2 1) 4
2 6 2 4
n n n n
n n n n n n
  
           
 
 
 
2( 1) ( 1)( 2)( 3)5 6
4 4
n n n n n n
n n
   
      
 8) 
1
1 1 1 1 1 1 1 1 1 1 1 1
...... 1 ......
( 1) 1 2 2 3 3 4 ( 1) 2 2 3 3 4 1 1
n
k
n
k k n n n n n
       
                     
             
 
 9) 1 1 1
1
( )
n
i i n
i
a a a a 

   (Telescópica) 
10) 
n+1
2 3 n x 11 + x + x + x +.....+x =
x 1


 
11) 
2 3 11+ x + x + x +........ =
1 x
 (cuando x 1 ). 
 
 
 
 
 2 
 
MEDIDAS DE CENTRALIZACIÓN 
 
Los números que describen de manera concisa el comportamiento y las características generales 
de un conjunto de datos son los parámetros estadísticos. Los parámetros que miden la tendencia 
central de los datos se llaman medidas de centralización y los más representativos son la media, 
la mediana y la moda. 
 
 Media Aritmética 
Se calcula dividiendo la suma de los valores de todos los datos entre el número de datos. 
 Para datos no agrupados: 
n
x
x
i
 , Para datos agrupados: 
n
'xf
x
ii
 
En la última fórmula fi es la frecuencia de cada intervalo y x’i es la marca de clase. 
 
 Media Aritmética Ponderada 
Se aplica cuando no todos los datos tienen la misma importancia o peso. Su fórmula es similar a la 
de los datos agrupados, cambiando fi por los pesos pi y el denominador N por la suma de todos los 
pesos; en este caso xi sería el valor de cada dato. 
k21
kk2211
i
ii
p
p...pp
px...pxpx
p
px
x





 
 
 Mediana 
PARA DATOS NO AGRUPADOS: Es el valor del dato que ocupa la posición central cuando éstos 
se ordenan de menor a mayor (o viceversa). Divide a la lista de datos en dos grupos de igual 
número de elementos. 
- Si el número de datos es par la mediana es la media de los dos que ocupan las posiciones 
centrales. 
- Si el número de datos es impar la mediana es el dato central. 
Ejemplo: 
Sean los datos: 9, 7, 8, 10, 8, 11; al ordenar se tiene: 7, 8, 8, 9, 10, 11. 
La mediana es: 5,8
2
98


 
PARA DATOS AGRUPADOS: debe encontrarse primero el intervalo mediano, y luego ubicar en 
dicho intervalo la mediana (Me) con la fórmula: 
A.
f
F
2
N
aMe
i
1i
i

 
ai = límite inferior del intervalo mediano n = número de datos 
i = el menor intervalo que cumple Fi > n/2 Fi-1 = frecuencia acumulada del intervalo i-1 
Fi = frecuencia absoluta del intervalo mediano A = amplitud del intervalo 
 
 
 
 
 
 
 
 3 
 
Ejemplo: 
El administrador del gimnasio ABC está interesado en conocer la distribución de las edades de las 
42 personas inscritas y recopiló las siguientes edades: 
 
26 16 21 34 45 18 41 38 22 
48 27 22 30 39 62 25 25 38 
29 31 28 20 56 60 24 61 28 
32 33 18 23 27 46 30 34 62 
49 59 19 20 23 24 
 
I Intervalo xi fi Fi hi Hi 
1 
 24 ; 16 20 11 11 0,26 0,26 
2 
 32 ; 24 28 13 24 0,31 0,57 
3 
 40 ; 32 36 7 31 0,17 0,74 
4 
 48 ; 40 44 3 34 0,07 0,81 
5 
 56 ; 48 52 2 36 0,05 0,86 
6 


 64 ; 56 60 6 42 0,14 1,00 
 n = 42 1,00 
Tabla 3. Edades de asistentes al gimnasio 
 
En el caso de la gente que va al gimnasio, de la tabla 3, la mediana es: 
15.308.
13
11
2
42
24Me 

 
 Es decir, la mitad de las personas tienen 30 años o menos y la otra mitad supera esta edad. 
 
 
 Moda 
PARA DATOS NO AGRUPADOS: Se define como el valor que más veces se repite en el conjunto 
de datos. Si hay dos valores que se repiten mayoritariamente y con igual frecuencia, la distribución 
se llama bimodal. 
Ejm para 1, 2 , 3 , 3 , 5 , 100 la moda es 3 (unimodal) 
 2, 5, 5, 7, 8 , 8 , 10 la moda es 5 y 8 (bimodal) 
 3, 5, 7, 9, 10, 13, 15 no tiene moda 
 
PARA DATOS AGRUPADOS: la moda es: A.
dd
d
aMo
21
1
i 

 
 
 
 
 4 
 
ai = límite inferior de la clase modal (la que tiene la mayor frecuencia) 
d1 = exceso de la frecuencia modal sobre la frecuencia de la clase inmediatamente anterior 
a la clase modal 
d2 = exceso de la frecuencia modal sobre la frecuencia de la clase que sigue 
inmediatamente a la clase modal 
A = amplitud del intervalo de clase modal. 
 
Ejemplo: En el caso de la gente que va al gimnasio, de la tabla 3, la clase modal es la segunda. 
 268.
62
2
24Mo 

 , es decir tienen 26 años la mayoría de las personas que va a ese gimnasio. 
 
 Media Geométrica 
PARA DATOS NO AGRUPADOS : Es la raíz n-ésima del producto de los n datos. 
 
 n n321 x...............xxxMG  
 
PARA DATOS AGRUPADOS : 
 
 
f f f1 2 k    n
1 2 k
MG x x ...... x 
 
(fi es el número de veces que cada valor xi se repite) 
 Media Armónica 
PARA DATOS NO AGRUPADOS : Es el inverso de la media aritmética de los inversos de los 
datos. 
 
 




in21 x
1
1
x
1
...
x
1
x
1
n
MH 
 
PARA DATOS AGRUPADOS: 


i
i
x
1
f
n
MH 
 
(fi es el número de veces que cada valor xi se repite) 
 
Ejemplo: en los datos: 7; 8; 8; 9; 10; 11 
- La media aritmética es: 833,8
6
53
 , La media geométrica es: 73,811.10.9.8.8.76  
- La media armónica es: 63,8
11
1
10
1
9
1
8
1
8
1
7
1
6


 
 
 Propiedad: MH MG MA  
 
 5 
 
 
MEDIDAS DE DISPERSIÓN 
Las medidas de tendencia central determinan el centro de los datos estadísticos, pero no nos 
indican nada acerca de la posición respecto al centro. Por lo tanto, se necesita una medida que nos 
indique el grado de dispersión o variación respecto al centro con la finalidad de tener una 
comparación y ampliar la descripción de los datos. 
Las medidas de dispersión son: 
El rango, rango intercuartil, la varianza, la desviación estándar, el coeficiente de variación y la 
Desviación Media con respecto a la media aritmética. 
En este curso veremos la desviación absoluta con respecto a la media aritmética, la varianza y 
la desviación estándar. 
 Desviación Absoluta con respecto a la media aritmética 
 Para datos no agrupados DM = 

n
i
i 1
x x
n
 
 
Para datos agrupados DM = 

k
i i
i 1
f x ' x
n
 
 
Varianza y Desviación estándar 
Definición: La varianza es una medida que indica el grado de dispersión o variación de los valores 
de una variable cuantitativarespecto a la media aritmética. 
 Si los valores de la variable tienden a acercarse alrededor de la media, la varianza es pequeña. 
 Si los valores de la variable tienden a estar lejos de la media, la varianza es grande. 
 
Definición Matemática 
La varianza es la media aritmética de los cuadrados de las diferencias de los datos respecto a su 
media aritmética. 
Sus unidades están elevadas al cuadrado. 
 
La desviación estándar es la raíz cuadrada positiva de la varianza. 
La varianza calculada a partir de una muestra se denota s2 y la desviación estándar es ss2  
 
Varianza para datos no tabulados 
Si x1, x2, ...., xn son variables estadísticas cuantitativas y x es su media, entonces la varianza es: 
 
 
n
)xx(
s
n
1i
2
i
2



 
aplicando propiedades 
2
2 2s x x  , esto es 
2
n
1i
2
i
2 x
n
x
s 

 
 
 
 6 
Ejemplo: Si: 18, 19, 20, 16, 17, 22 son datos no tabulados que representan las edades de los 
alumnos del CEPRE-UNI. La varianza y la desviación estándar es: 
Resolución 
n = 6, 112x
n
1i
i 

, 6,18x  , 2
1
2114
n
i
i
x

 
Luego la varianza es: 22
2
n
1i
2
i
2 años 373,66,18
8
2114
x
n
x
s 

 
La desviación estándar es: S = 2 6,373 2,52S   años. 
Varianza para datos tabulados por Intervalos 
Si x1’, x2’, ............. xk’, son las marcas de clase de k intervalos, f1, f2, ...., fk, son las frecuencias 
absolutas de una variable x y x es la media, entonces la varianza s2 es: 
 
s2 = 
n
)x'x(f
k
1i
2
ii


 aplicando propiedades s2 = 
2
k
1i
2
ii
x
n
'xf


 
 
Ejemplo: 
El siguiente cuadro representa el número de hijos de una urbanización A, se desea saber, cuál es 
la varianza y desviación estándar. 
 
Ii x’i 
fi 
 de hijos 
X’i fi fi x’i2 

 2,0 

 4,2 

 6,4 

 8,6 

 10,8 

 12,10 
 
1 
 
3 
 
5 
 
7 
 
9 
 
11 
 
15 
 
12 
 
7 
 
1 
 
3 
 
2 
 
15 
 
36 
 
35 
 
7 
 
27 
 
22 
 
15 
 
108 
 
175 
 
49 
 
243 
 
242 
 40 142 832 
 n = 40, k = 6, 


k
1i
ii 142'xf , 


k
1i
2
ii 832'xf 55,3
40
142
x  hijos 
Luego la varianza es: s2 = 1975,855,3
40
832
x
n
'xf
2
2
k
1i
2
i


 hijos2 
 
La desviación estándar es: s = 2 8,1975 2,86s   hijos.

Continuar navegando