Logo Studenta

U3 Medidas

¡Este material tiene más páginas!

Vista previa del material en texto

1 
ESTADÍSTICA TURÍSTICA 
 UNIDAD 3 
 MEDIDAS 
 3º AÑO Ciclo 2019 
 Licenciatura en Turismo 
 UNIVERSIDAD NACIONAL DE AVELLANEDA 
 
 Prof. Juan P. Falcón 
2 
UNIDAD Nº 3: 
MEDIDAS 
 Medidas de posición o de tendencia central: media 
aritmética, media ponderada y moda. Medidas de 
orden: mediana y cuantiles. 
 Medidas de dispersión o variabilidad: rango, 
coeficiente de variación de Pearson, varianza o 
desviación media, desviación típica o standard. . 
 Medidas de forma: medidas de asimetría, medidas de 
apuntamiento o curtosis. 
 Medidas de concentración: Índice de Gini. Curva de 
Lorenz. 
 
3 
MEDIDAS 
4 
MEDIDAS 
MEDIDAS DE POSICIÓN 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
MEDIDAS DE FORMA 
MEDIDAS DE CONCENTRACIÓN 
5 
MEDIDAS 
 Las medidas de posición sintetizan la información obtenida 
reduciéndola a un solo valor. 
MEDIDAS DE POSICIÓN
MEDIDAS DE 
POSICIÓN 
Centrales: aluden a un 
represente a toda la 
muestra o población. 
Media 
Moda 
Mediana 
No centrales Cuantiles: cuartiles, deciles y percentiles 
6 
MEDIDAS DE POSICIÓN
La media o promedio se obtiene dividiendo la 
suma de todos los valores entre el número total de 
los mismos (tamaño poblacional). 
1. La suma de los valores de la variable "importe 
de extras" es 4.116. 
2. Esta suma se divide por 30 (cantidad total de 
habitaciones), dando como resultado 137,2. 
3. Entonces diremos que el importe promedio de 
las extras por habitación del fin de semana 
es de 137,2 pesos. 
 
Media: $137,2 
 
7 
MEDIDAS DE POSICIÓN
La mediana es el valor de la variable tal que la 
mitad del resto de los valores están por debajo de él 
y la otra mitad por encima. 
1. Buscamos el orden de la mediana, haciendo (n+1)/2. 
En nuestro caso, tenemos (30+1)/2 = 15,5. 
2. Entonces vamos al lugar 15 y al lugar 16 y tenemos 
como valores de variable, el importe $115 y el 
importe $125, respectivamente. 
3. Hacemos un promedio de ambos valores y 
obtenemos la mediana igual a $120. 
4. Es decir, el 50% de las extras del fin de semana no 
supera los 120 pesos. 
 
Mediana: $120 
 
8 
MEDIDAS DE POSICIÓN
La moda es el valor de la variable que más veces 
se repite. 
1. Se observa que 82 es el importe que más se 
repite. Aparece 4 veces. 
 
Moda: $82 
 
9 
MEDIDAS DE POSICIÓN
Los cuantiles son medidas de orden que son 
útiles para captar distintos puntos de corte en las 
distribuciones de frecuencias. 
1. El procedimiento es idéntico al utilizado para 
hallar la mediana (recordemos que la mediana 
coincide con el segundo cuartil). 
2. Entonces, primero buscamos el orden del 
primer cuartil; esto es (n+1)/4 igual a (30+1)/4 = 
7,75 
3. Vamos al lugar 7 y al lugar 8 y tenemos los 
valores de variable 79 y 82, respectivamente. 
4. Aplicamos la siguiente fórmula de interpolación 
 79 + [7,75 - 7] * (82 - 79) = 81,25 
5. El 25% de las extras del fin de semana no 
supera el importe de $ 81,25. 
 
Cuartil 1: $81,25 
10 
MEDIDAS 
 Tabla a modo de ejemplo para calcular las medidas de posición (Parte 1) 
MEDIDAS DE POSICIÓN
Para el estudio de estas medidas, el caso 
que utilizaremos hace referencia a la serie 
de edades de los viajeros en el año 2004, 
según datos del Instituto de Estudios 
Turísticos (IET). 
La siguiente tabla recoge dicha serie: 
11 
MEDIDAS 
 Tabla a modo de ejemplo para calcular las medidas de posición (Parte 2) 
MEDIDAS DE POSICIÓN
12 
MEDIDAS 
 DE TENDENCIA CENTRAL 
MEDIDAS DE POSICIÓN
La media o promedio se obtiene dividiendo la suma de todos los 
valores entre el número total de los mismos (tamaño poblacional). 
Si la variable está agrupada en intervalos, los valores Xi utilizados 
serán las marcas de clase. 
 
MEDIA
13 
MEDIDAS 
 DE TENDENCIA CENTRAL 
MEDIDAS DE POSICIÓN
Es el valor de la variable que más veces se repite y, en consecuencia, 
en una distribución de frecuencias es el de máxima frecuencia (o 
densidad de frecuencia). 
En el caso de una distribución agrupada en intervalos, habría que 
hablar de un intervalo modal, que será aquél de máxima densidad de 
frecuencia. 
 
MODA (1)
14 
MEDIDAS 
 DE TENDENCIA CENTRAL 
MEDIDAS DE POSICIÓN
MODA (2)
Como se puede observar en la Tabla de ejemplo, el intervalo modal para la serie 
de edades de los viajeros es el [35, 45). 
Para darle a la moda un valor puntual dentro de ese intervalo, se usa un método 
aproximado que parte de la hipótesis de que la moda está más cerca de aquel 
intervalo contiguo con densidad de frecuencia mayor. 
Así, al ser la densidad del intervalo [25, 35) mayor que la del [45, 55), la moda 
tendrá que ser menor de 40.
15 
Es el valor de la variable tal que la mitad del 
resto de los valores están por debajo de él y la 
otra mitad por encima. 
 
También aquí se habla de un intervalo mediano. 
Para su detección a efectos prácticos, se calcula N/2 y se 
localiza el resultado (o el inmediatamente superior) en la 
columna de las frecuencias absolutas acumuladas, de 
forma que la mediana será el valor que corresponde a la 
frecuencia absoluta acumulada superior a la mitad del 
número de observaciones. 
MEDIDAS 
 DE TENDENCIA CENTRAL 
MEDIDAS DE POSICIÓN
MEDIANA (1)
16 
MEDIDAS 
 DE TENDENCIA CENTRAL 
MEDIDAS DE POSICIÓN
MEDIANA (2)
Así, como N/2 = 10.029.264, tendremos que el intervalo mediano será el [35, 45). 
Por lo tanto, en la columna Ni el valor inmediatamente superior a 10.029.264 
corresponde al mismo.
17 
MEDIDAS 
 NO CENTRALES 
MEDIDAS DE POSICIÓN
CUANTILES (1)
Son medidas de orden que son útiles para captar distintos 
puntos de corte en las distribuciones de frecuencias. 
Su cálculo es similar al de la mediana, sólo que el punto de partida 
no es N/2, sino: 
kN/4 para cuartiles 
kN/5 para quintiles 
kN/10 para deciles 
kN/100 para percentiles 
18 
MEDIDAS 
 NO CENTRALES 
MEDIDAS DE POSICIÓN
CUANTILES (2)
Dividen la serie en 4 partes iguales (C1, C2, C3). 
Cada cuartil agrupa a un 25 % de la distribución. 
CUARTILES 
Dividen la serie en 5 partes iguales (Q1, Q2, Q3, Q4). 
Cada quintil agrupa a un 20 % de la distribución. 
QUINTILES 
Dividen la serie en 10 partes iguales (D1, D2 9). 
Cada decil agrupa a un 10 % de la distribución. 
DECILES 
Dividen la serie en 100 partes iguales (P1, P2 99). 
Cada percentil agrupa a un 1 % de la distribución. 
PERCENTILES 
19 
MEDIDAS 
 NO CENTRALES 
MEDIDAS DE POSICIÓN
CUANTILES (3)
El percentil 67 se obtiene de igual manera que la mediana. 
Por tanto, como el 67% del total es 13.439.213,8, dicho percentil es: 
20 
MEDIDAS 
 NO CENTRALES 
MEDIDAS DE POSICIÓN
La edad media de los viajeros españoles en 2004 fue de 37,4 años. 
Se considera que la edad más frecuente está entre los 35 y 45 
años, tomando 39,6 como valor referente. 
Se considera que la mitad de los viajeros tienen menos de 38 años. 
Se considera que el 67% de los viajeros tienen menos de 47 años. 
Conclusión del ejemplo: 
21 
MEDIDAS 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
 Las medidas de dispersión tienen por objeto 
determinar hasta qué punto las medidas de posición 
son representativas del conjunto de datos de la serie. 
Ello equivale a cuantificar cómo son de dispersos los datos 
respecto a la medida de posición. 
ABSOLUTOS: 
El valor está expresado en las unidades de medida de la variable, y que, por 
lo tanto, no son comparables entre diferentes distribuciones (rango, la 
desviación media o varianza y la desviación típica). 
RELATIVAS: 
El resultado está expresado sin unidades de medida por lo que sirven para 
comparar la dispersión de distribuciones de frecuencias distintas 
(coeficiente de variación de Pearson). 
22 
MEDIDAS 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
No es suficiente con dar para caracterizar una distribución. 
Es necesario completar la caracterización añadiendo una medida de 
dispersión, una medida que brinde el grado de 
acercamiento/alejamiento de los distintos valores de la variable a la 
Rango 
Varianza o Desviación Media 
Desviación Típica o Standard 
ABSOLUTASCoeficiente de Variación de Pearson RELATIVAS 
23 
MEDIDAS 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
Se define como la diferencia entre el 
mayor y el menor valor de la variable, de 
tal forma que si se ordenan los valores de 
la variable de manera creciente se tiene 
que el rango se calcula como: 
RANGO O 
RECORRIDO 
R = xk x1
Ventaja: Sencillez de cálculo. 
Inconveniente: es una medida imprecisa, puesto que sólo 
tiene en cuenta el máximo y el mínimo de la distribución, sin 
tener en cuenta la frecuencia de cada valor. 
24 
MEDIDAS 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
VARIANZA O 
DESVIACIÓN MEDIA 
(S2) 
Los resultados están 
expresados en las unidades 
de los valores de la variable, 
pero elevados al cuadrado. 
Cuanto más elevado sea su 
valor, más dispersión 
existirá, por lo que la media 
será menos representativa. 
Su cálculo se basa en las 
respecto a la media aritmética, 
por lo que el coeficiente de 
variación de Pearson es útil 
para determinar y/o comparar 
la representatividad de una o 
varias medias aritméticas. 
25 
MEDIDAS 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
DESVIACIÓN TÍPICA O STANDARD (S) 
Se define como la raíz cuadrada de la varianza, 
tomando el resultado como signo positivo. 
Presenta como ventaja que su valor viene 
expresado en la misma unidad que la variable. 
26 
MEDIDAS 
MEDIDAS DE DISPERSIÓN O VARIABILIDAD 
Es el cociente entre desviación típica y media 
aritmética. Por tanto, es una medida de 
dispersión relativa. 
Esta medida da la dispersión en porcentaje, por 
lo que permite su interpretación de forma fácil, y 
además facilita poder comparar la dispersión de 
varias distribuciones aunque las variables estén 
en diferentes unidades de medida. 
COEFICIENTE 
DE 
VARIACIÓN 
DE PEARSON 
27 
MEDIDAS 
 Las medidas de forma establecen una tipología 
de las distribuciones según la forma de su 
representación gráfica. 
MEDIDAS DE FORMA
Medidas de asimetría 
Medidas de Apuntamiento o Curtosis Se clasifican en: 
28 
MEDIDAS 
 MEDIDAS DE ASIMETRÍA 
MEDIDAS DE FORMA
 El objetivo de la medida de la asimetría es estudiar la 
deformación horizontal de los valores de la variable 
respecto al valor central de la media. 
Una distribución es SIMÉTRICA 
cuando a la derecha y a la izquierda 
de su media existe el mismo número 
de valores, equidistantes de la media, 
y además con la misma frecuencia.
29 
MEDIDAS 
 MEDIDAS DE ASIMETRÍA 
MEDIDAS DE FORMA
 En caso de que no satisfaga esta condición diremos que la distribución 
es asimétrica, pudiendo ser de 2 tipos: 
 
Para medir el grado de asimetría de una distribución o compararlo con el de otra, se pueden utilizar: 
Coeficiente de Asimetría de Pearson 
Coeficiente de Asimetría de Fisher 
30 
MEDIDAS 
 MEDIDAS DE APUNTAMIENTO O CURTOSIS 
MEDIDAS DE FORMA
 Miden la mayor o menor cantidad de datos que se agrupan en torno 
a la moda. 
Distribución mesocúrtica 
Distribución leptocúrtica 
Distribución platicúrtica 
Se definen 3 tipos de 
distribuciones según su 
grado de curtosis 
31 
MEDIDAS 
 MEDIDAS DE APUNTAMIENTO O CURTOSIS 
MEDIDAS DE FORMA
 Distribución mesocúrtica: 
 Presenta un grado de concentración medio 
alrededor de los valores centrales de la variable 
(el mismo que presenta una distribución normal). 
 Distribución leptocúrtica: 
 Presenta un elevado grado de concentración alrededor de 
los valores centrales de la variable. 
 Distribución platicúrtica: 
 Presenta un reducido grado de concentración alrededor de 
los valores centrales de la variable. 
32 
MEDIDAS 
MEDIDAS DE CONCENTRACIÓN
33 
MEDIDAS 
 Las medidas de concentración hacen referencia al mayor 
o menor grado de equidad en el reparto total de los valores 
de la variable. 
MEDIDAS DE CONCENTRACIÓN
Concentración máxima, o menor equidad en 
el reparto. En este caso, un solo individuo 
percibe el total y los demás nada. 
Concentración mínima o mayor equidad en el 
reparto. El conjunto total de valores de la 
variable está repartido por igual. 
En términos de 
concentración se 
pueden encontrar 
las siguientes 
situaciones 
extremas: 
Para medir la concentración se utilizan fundamentalmente dos medidas: 
el Índice de Gini y la Curva de Lorenz. 
Son aplicables, básicamente, a variables económicas (rentas, salarios, etc.).
34 
MEDIDAS 
 LA CURVA DE LORENZ 
 Se construye representando en el eje de las abscisas el 
porcentaje de frecuencias acumuladas y en el eje de las 
ordenadas los porcentajes acumulados del total de la 
variable. 
 Al unir los puntos resultantes se obtiene la curva, cuya 
forma permitirá determinar el nivel de concentración. 
 
MEDIDAS DE CONCENTRACIÓN
Para representar la curva de Lorenz, 
basta con dibujar un cuadrado cuyos 
lados están divididos en una escala de 
0% a 100%. 
Generalmente la curva se representa 
junto con la diagonal del cuadrado, 
denominada LÍNEA DE EQUIDAD. 
La curva de Lorenz siempre se sitúa por 
debajo de esta línea, es creciente y 
convexa.
La diagonal resultará útil para determinar el nivel de 
concentración de la distribución, pudiendo darse dos casos 
extremos: 
Concentración mínima: la curva coincide con la 
diagonal, se trata de una situación de máxima equidad. 
Concentración máxima: la curva coincide con los lados 
del cuadrado, por lo tanto no existe equidad alguna en el 
reparto. 
35 
MEDIDAS 
 ÍNDICE DE GINI 
 
MEDIDAS DE CONCENTRACIÓN
36 
MEDIDAS 
 ÍNDICE DE GINI 
 Cuantifica el grado de aproximación existente entre la curva de Lorenz y la línea de equidad. 
 
MEDIDAS DE CONCENTRACIÓN
Se calcula como una proporción de las áreas en el 
diagrama de la curva de Lorenz. 
Si el área entre la línea de equidad y la curva de Lorenz 
es A, y el área por debajo de la curva de Lorenz es B, 
entonces el índice de Gini es el cociente entre el área 
comprendida entre la curva de Lorenz y la línea de 
equidad, y el área comprendida entre la línea de máxima 
concentración y la de equidad. A/(A+B). 
Oscila entre 0 y 1. 
Cuanto más próximo esté su valor a 0 menor será la 
concentración, es decir, mayor equidad habrá en el 
reparto de la variable entre los individuos; por el contrario 
cuanto mayor esté a 1 mayor será la concentración. 
 A/(A+B)

Continuar navegando