Logo Studenta

Medidas de Tendencia Central y tabla de frecuencias

¡Este material tiene más páginas!

Vista previa del material en texto

Medidas de tendencia central
Mediana
La mediana de un conjunto de observaciones ordenadas por su magnitud, es un valor de la
variable que divide al conjunto en dos subconjuntos iguales, de forma tal que el número de
valores mayores o iguales a la mediana es igual al número de valores menores o iguales a
ésta. La mediana puede definirse intuitivamente como el valor central de los observados.
Si se ordenan las n observaciones de menor a mayor, la mediana se define como el valor:
Q ocupa la posición
2
)1( +n
Si n es impar.
2/)1( += nxmediana
Si n es par.
2
1)2/(2/ ++
=
nn xx
mediana
Medidas de tendencia central
Mediana
Ejercicio
150 155 157 155 152 157 160 157 154 157
Ordenamiento
150 152 154 155 155 157 157 157 157 160
parn ==10
61
2
;5
2
=+





=
nn
156
2
157155
=
+
=mediana
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Medidas de tendencia central
Mediana
Propiedad
Su valor está afectado por el número de observaciones, pero no por los valores que
adopta la variable.
Medidas de tendencia central
Moda
Ejercicio
Propiedades
La moda de un conjunto de observaciones es el valor de la variable que se presenta con
mayor frecuencia.
Moda = 157
•Su valor no está afectado por valores extremos.
•Es la única medida de posición que puede ser usada para caracterizar datos cualitativos.
150 155 157 155 152 157 160 157 154 157
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Medidas de tendencia NO central
Cuantiles
Cuartiles
Son medidas de posición “no central”, tales que, según el número de subconjuntos en que
se divide la serie ordenada de datos, se denominan cuartiles, deciles o percentiles.
Los cuartiles de una serie de datos ordenados, son los valores de la variable que dividen 
al conjunto en cuatro subconjuntos que contienen la misma cantidad de dato
Si el resultado es entero
Si el resultado NO es entero y el decimal es igual a 0.5 
4/)1(1 += nxQ
4/)1(22 += nxQ
4/)1(33 += nxQ
2
## posteriorinmediatoenteroanteriorinmediatoentero xx
Qn
+
=
Si el resultado NO es entero y el decimal es menor 0.5
Si el resultado NO es entero y el decimal es mayor 0.5
anteriorinmediatoenteroxQn #=
posteriorinmediatoenteroxQn #=
Entre los dos cuartiles C1 y C3 se encuentra el 50% central de los datos observados.
Cuartiles
Ejercicio
150 152 154 155 155 157 157 157 157 160
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1541 375.2 === xxQ 156
2
157155
2
2 655.5
+
=
+
==
xx
xQ
1573 825.8 === xxQ
Medidas de tendencia NO central
Rango medio
Medidas de tendencia NO central
Amplitud semicuartil
Es el promedio de los valores máximos y mínimos de la variable. 
2
minmax xx +
Es el promedio de los valores del primer y tercer cuartil. 
2
31 QQ +
Tabla de Frecuencias
Tabla de frecuencia
Cuando la variable estudiada es de tipo discreto, los datos pueden sintetizarse en una
tabla
Ejemplo: Se pretende describir las veces en que se rompe un precio mínimo durante un
día de cotización a partir de una muestra de 200 hábiles
Rompimiento de 
precio mínimo
Nº de rompimientos
(ni)
Frecuencia relativa
fi =ni/N
0 48 0.24
1 106 0.53
2 32 0.16
3 14 0.07
Tabla de frecuencia
Tabla de Frecuencias
Si la variable es continua se suele proceder aun agrupamiento de los datos en tramos,
dividiendo el campo de variación en un conjunto de k intervalos de igual longitud anotando:
Los límites de cada intervalo
El valor central de cada intervalo
El número de observaciones constatadas en el mismo
No es posible determinar “a priori” la amplitud óptima que deben tener los intervalos y, en
consecuencia, en número de éstos. Un número excesivo de intervalos plantea el problema
de conducir a una tabla muy prolija y difícil de interpretar.
Pero si el agrupamiento es excesivo, se pierde una parte importante de la información
contenida en los datos.
En general, valores entre 5 y 15 intervalos, (dependiendo en parte del tamaño N de la
muestra) suelen ser razonables.
La siguiente tabla recoge, a título de ejemplo, el resultado de la tabulación en 11 intervalos
de los valores las desviaciones estándar del precio de 815 productos finales de la rama de
manufacturas.
Tabla de Frecuencias
Tabla de frecuencia continua
Límite del 
intervalo
Centro del intervalo
Xi
Nº de observaciones
ni
1.55-1.65 1.60 3
1.65-1.75 1.70 12
1.75-1.85 1.80 40
1.85-1.95 1.90 97
1.95-2.05 2.00 157
2.05-2.15 2.10 204
2.15-2.25 2.20 183
2.25-2,35 2.30 75
2.35-2,45 2.40 31
2.45-2.55 2.50 9
2.55-2.65 2.60 4
Puede resultar conveniente dejar 2 intervalos abierto en ambos extremos de la tabla, con
el fin de recoger los pocos valores extremos observados.
TAREA 1: Estadística descriptiva
Ejercicio 1.
Al preguntarle a un botones de un hotel qué propina le dan normalmente, éste respondió que
la media de aquel día había sido de $1,090 debido a que 9 viajeros le había dado $100 y uno
le había dado $10,000. Comente el correcto uso de alguna medida de tendencia central
Ejercicio 2.
Intuya por qué si la variable es continua y el sistema de medidas suficientemente preciso la
probabilidad de encontrar dos valores iguales es nula.
Ejercicio 3.
¿Por qué se pierde mucha información en la tabulación (tabla de frecuencia) si el número de
intervalos considerado es muy pequeño?, explique su percepción del tema
Ejercicio 4.
Para una persona que no sabe nadar ¿Es suficiente saber que la profundidad media en el
lago es 1,40m para lanzarse al baño en el mismo? ¿Cuál será la población y cuál la variable
aleatoria en este caso? ¿Aclararía mucho la decisión el conocer la profundidad mediana del
lago?
TAREA 1: EXCEL
Ejercicio 1.
Si la media aritmética y la media geométrica no son iguales, la suma de los errores de una
será mayor a la de otra. ¿Cuál será mayor?, ¿ Cuál usarías para realizar una regresión de
MCO? Si estás haciendo un estudio de estacionalidad y quieres detectar el comportamiento
de la venta en cada mes, claramente hay meses bien definidos, ejemplo febrero, marzo,
abril, junio, octubre y diciembre, ¿Qué pasa con mayo de 2006 y al respecto que media
propones usar?
Ejercicio 2.
Esta claro que la media aritmética y ponderada son distintas ¿Cuál media propones utilizar
si el estudio es sobre los precios al consumidor o si el estudio es acerca del precio de venta?
Ejercicio 3.
Gráficamente, que utilidad encuentras en la obtención de la mediana y los cuartiles
Ejercicio 4.
Gráficamente, que utilidad encuentras en el cálculo de los promedios móviles
60,000
75,000
90,000
105,000
120,000
135,000
150,000
En
e-
05
Fe
b-
05
M
ar
-0
5
A
br
-0
5
M
ay
-0
5
Ju
n-
05
Ju
l-0
5
A
go
-0
5
Se
p-
05
O
ct
-0
5
N
ov
-0
5
D
ic
-0
5
En
e-
06
Fe
b-
06
M
ar
-0
6
A
br
-0
6
M
ay
-0
6
Ju
n-
06
Ju
l-0
6
A
go
-0
6
Se
p-
06
O
ct
-0
6
N
ov
-0
6
D
ic
-0
6
En
e-
07
Fe
b-
07
M
ar
-0
7
A
br
-0
7
M
ay
-0
7
Ju
n-
07
Ju
l-0
7
Ventas por mes (ton) Media aritmética (ton) Media Geométrica [ton]
Media arit $5,230
Media pon $5,221
60,000
75,000
90,000
105,000
120,000
135,000
150,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
15,000
17,500
20,000
22,500
25,000
27,500
30,000
32,500
35,000
2/
01
/0
6
19
/0
1/
06
8/
02
/0
6
27
/0
2/
06
16
/0
3/
06
5/
04
/0
6
26
/0
4/
06
16
/0
5/
06
2/
06
/0
6
21
/0
6/
06
10
/0
7/
06
27
/0
7/
06
15
/0
8/
06
1/
09
/0
6
20
/0
9/
06
9/
10
/0
6
26
/1
0/
06
15
/1
1/
06
6/
12
/0
6
27
/1
2/
06
16
/0
1/
07
2/
02
/0
7
22
/0
2/
07
13
/0
3/
07
2/
04
/0
7
23
/0
4/
07
11
/0
5/
07
30
/0
5/
07
18
/0
6/
07
5/
07
/0
7
24
/0
7/
07
10
/0
8/
07
IPC
Promedio movil quincenal
Promedio movil mensual

Continuar navegando