Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 ESTADÍSTICA TURÍSTICA UNIDAD 3 MEDIDAS 3º AÑO Ciclo 2019 Licenciatura en Turismo UNIVERSIDAD NACIONAL DE AVELLANEDA Prof. Juan P. Falcón 2 UNIDAD Nº 3: MEDIDAS Medidas de posición o de tendencia central: media aritmética, media ponderada y moda. Medidas de orden: mediana y cuantiles. Medidas de dispersión o variabilidad: rango, coeficiente de variación de Pearson, varianza o desviación media, desviación típica o standard. . Medidas de forma: medidas de asimetría, medidas de apuntamiento o curtosis. Medidas de concentración: Índice de Gini. Curva de Lorenz. 3 MEDIDAS 4 MEDIDAS MEDIDAS DE POSICIÓN MEDIDAS DE DISPERSIÓN O VARIABILIDAD MEDIDAS DE FORMA MEDIDAS DE CONCENTRACIÓN 5 MEDIDAS Las medidas de posición sintetizan la información obtenida reduciéndola a un solo valor. MEDIDAS DE POSICIÓN MEDIDAS DE POSICIÓN Centrales: aluden a un represente a toda la muestra o población. Media Moda Mediana No centrales Cuantiles: cuartiles, deciles y percentiles 6 MEDIDAS DE POSICIÓN La media o promedio se obtiene dividiendo la suma de todos los valores entre el número total de los mismos (tamaño poblacional). 1. La suma de los valores de la variable "importe de extras" es 4.116. 2. Esta suma se divide por 30 (cantidad total de habitaciones), dando como resultado 137,2. 3. Entonces diremos que el importe promedio de las extras por habitación del fin de semana es de 137,2 pesos. Media: $137,2 7 MEDIDAS DE POSICIÓN La mediana es el valor de la variable tal que la mitad del resto de los valores están por debajo de él y la otra mitad por encima. 1. Buscamos el orden de la mediana, haciendo (n+1)/2. En nuestro caso, tenemos (30+1)/2 = 15,5. 2. Entonces vamos al lugar 15 y al lugar 16 y tenemos como valores de variable, el importe $115 y el importe $125, respectivamente. 3. Hacemos un promedio de ambos valores y obtenemos la mediana igual a $120. 4. Es decir, el 50% de las extras del fin de semana no supera los 120 pesos. Mediana: $120 8 MEDIDAS DE POSICIÓN La moda es el valor de la variable que más veces se repite. 1. Se observa que 82 es el importe que más se repite. Aparece 4 veces. Moda: $82 9 MEDIDAS DE POSICIÓN Los cuantiles son medidas de orden que son útiles para captar distintos puntos de corte en las distribuciones de frecuencias. 1. El procedimiento es idéntico al utilizado para hallar la mediana (recordemos que la mediana coincide con el segundo cuartil). 2. Entonces, primero buscamos el orden del primer cuartil; esto es (n+1)/4 igual a (30+1)/4 = 7,75 3. Vamos al lugar 7 y al lugar 8 y tenemos los valores de variable 79 y 82, respectivamente. 4. Aplicamos la siguiente fórmula de interpolación 79 + [7,75 - 7] * (82 - 79) = 81,25 5. El 25% de las extras del fin de semana no supera el importe de $ 81,25. Cuartil 1: $81,25 10 MEDIDAS Tabla a modo de ejemplo para calcular las medidas de posición (Parte 1) MEDIDAS DE POSICIÓN Para el estudio de estas medidas, el caso que utilizaremos hace referencia a la serie de edades de los viajeros en el año 2004, según datos del Instituto de Estudios Turísticos (IET). La siguiente tabla recoge dicha serie: 11 MEDIDAS Tabla a modo de ejemplo para calcular las medidas de posición (Parte 2) MEDIDAS DE POSICIÓN 12 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE POSICIÓN La media o promedio se obtiene dividiendo la suma de todos los valores entre el número total de los mismos (tamaño poblacional). Si la variable está agrupada en intervalos, los valores Xi utilizados serán las marcas de clase. MEDIA 13 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE POSICIÓN Es el valor de la variable que más veces se repite y, en consecuencia, en una distribución de frecuencias es el de máxima frecuencia (o densidad de frecuencia). En el caso de una distribución agrupada en intervalos, habría que hablar de un intervalo modal, que será aquél de máxima densidad de frecuencia. MODA (1) 14 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE POSICIÓN MODA (2) Como se puede observar en la Tabla de ejemplo, el intervalo modal para la serie de edades de los viajeros es el [35, 45). Para darle a la moda un valor puntual dentro de ese intervalo, se usa un método aproximado que parte de la hipótesis de que la moda está más cerca de aquel intervalo contiguo con densidad de frecuencia mayor. Así, al ser la densidad del intervalo [25, 35) mayor que la del [45, 55), la moda tendrá que ser menor de 40. 15 Es el valor de la variable tal que la mitad del resto de los valores están por debajo de él y la otra mitad por encima. También aquí se habla de un intervalo mediano. Para su detección a efectos prácticos, se calcula N/2 y se localiza el resultado (o el inmediatamente superior) en la columna de las frecuencias absolutas acumuladas, de forma que la mediana será el valor que corresponde a la frecuencia absoluta acumulada superior a la mitad del número de observaciones. MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE POSICIÓN MEDIANA (1) 16 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE POSICIÓN MEDIANA (2) Así, como N/2 = 10.029.264, tendremos que el intervalo mediano será el [35, 45). Por lo tanto, en la columna Ni el valor inmediatamente superior a 10.029.264 corresponde al mismo. 17 MEDIDAS NO CENTRALES MEDIDAS DE POSICIÓN CUANTILES (1) Son medidas de orden que son útiles para captar distintos puntos de corte en las distribuciones de frecuencias. Su cálculo es similar al de la mediana, sólo que el punto de partida no es N/2, sino: kN/4 para cuartiles kN/5 para quintiles kN/10 para deciles kN/100 para percentiles 18 MEDIDAS NO CENTRALES MEDIDAS DE POSICIÓN CUANTILES (2) Dividen la serie en 4 partes iguales (C1, C2, C3). Cada cuartil agrupa a un 25 % de la distribución. CUARTILES Dividen la serie en 5 partes iguales (Q1, Q2, Q3, Q4). Cada quintil agrupa a un 20 % de la distribución. QUINTILES Dividen la serie en 10 partes iguales (D1, D2 9). Cada decil agrupa a un 10 % de la distribución. DECILES Dividen la serie en 100 partes iguales (P1, P2 99). Cada percentil agrupa a un 1 % de la distribución. PERCENTILES 19 MEDIDAS NO CENTRALES MEDIDAS DE POSICIÓN CUANTILES (3) El percentil 67 se obtiene de igual manera que la mediana. Por tanto, como el 67% del total es 13.439.213,8, dicho percentil es: 20 MEDIDAS NO CENTRALES MEDIDAS DE POSICIÓN La edad media de los viajeros españoles en 2004 fue de 37,4 años. Se considera que la edad más frecuente está entre los 35 y 45 años, tomando 39,6 como valor referente. Se considera que la mitad de los viajeros tienen menos de 38 años. Se considera que el 67% de los viajeros tienen menos de 47 años. Conclusión del ejemplo: 21 MEDIDAS MEDIDAS DE DISPERSIÓN O VARIABILIDAD Las medidas de dispersión tienen por objeto determinar hasta qué punto las medidas de posición son representativas del conjunto de datos de la serie. Ello equivale a cuantificar cómo son de dispersos los datos respecto a la medida de posición. ABSOLUTOS: El valor está expresado en las unidades de medida de la variable, y que, por lo tanto, no son comparables entre diferentes distribuciones (rango, la desviación media o varianza y la desviación típica). RELATIVAS: El resultado está expresado sin unidades de medida por lo que sirven para comparar la dispersión de distribuciones de frecuencias distintas (coeficiente de variación de Pearson). 22 MEDIDAS MEDIDAS DE DISPERSIÓN O VARIABILIDAD No es suficiente con dar para caracterizar una distribución. Es necesario completar la caracterización añadiendo una medida de dispersión, una medida que brinde el grado de acercamiento/alejamiento de los distintos valores de la variable a la Rango Varianza o Desviación Media Desviación Típica o Standard ABSOLUTASCoeficiente de Variación de Pearson RELATIVAS 23 MEDIDAS MEDIDAS DE DISPERSIÓN O VARIABILIDAD Se define como la diferencia entre el mayor y el menor valor de la variable, de tal forma que si se ordenan los valores de la variable de manera creciente se tiene que el rango se calcula como: RANGO O RECORRIDO R = xk x1 Ventaja: Sencillez de cálculo. Inconveniente: es una medida imprecisa, puesto que sólo tiene en cuenta el máximo y el mínimo de la distribución, sin tener en cuenta la frecuencia de cada valor. 24 MEDIDAS MEDIDAS DE DISPERSIÓN O VARIABILIDAD VARIANZA O DESVIACIÓN MEDIA (S2) Los resultados están expresados en las unidades de los valores de la variable, pero elevados al cuadrado. Cuanto más elevado sea su valor, más dispersión existirá, por lo que la media será menos representativa. Su cálculo se basa en las respecto a la media aritmética, por lo que el coeficiente de variación de Pearson es útil para determinar y/o comparar la representatividad de una o varias medias aritméticas. 25 MEDIDAS MEDIDAS DE DISPERSIÓN O VARIABILIDAD DESVIACIÓN TÍPICA O STANDARD (S) Se define como la raíz cuadrada de la varianza, tomando el resultado como signo positivo. Presenta como ventaja que su valor viene expresado en la misma unidad que la variable. 26 MEDIDAS MEDIDAS DE DISPERSIÓN O VARIABILIDAD Es el cociente entre desviación típica y media aritmética. Por tanto, es una medida de dispersión relativa. Esta medida da la dispersión en porcentaje, por lo que permite su interpretación de forma fácil, y además facilita poder comparar la dispersión de varias distribuciones aunque las variables estén en diferentes unidades de medida. COEFICIENTE DE VARIACIÓN DE PEARSON 27 MEDIDAS Las medidas de forma establecen una tipología de las distribuciones según la forma de su representación gráfica. MEDIDAS DE FORMA Medidas de asimetría Medidas de Apuntamiento o Curtosis Se clasifican en: 28 MEDIDAS MEDIDAS DE ASIMETRÍA MEDIDAS DE FORMA El objetivo de la medida de la asimetría es estudiar la deformación horizontal de los valores de la variable respecto al valor central de la media. Una distribución es SIMÉTRICA cuando a la derecha y a la izquierda de su media existe el mismo número de valores, equidistantes de la media, y además con la misma frecuencia. 29 MEDIDAS MEDIDAS DE ASIMETRÍA MEDIDAS DE FORMA En caso de que no satisfaga esta condición diremos que la distribución es asimétrica, pudiendo ser de 2 tipos: Para medir el grado de asimetría de una distribución o compararlo con el de otra, se pueden utilizar: Coeficiente de Asimetría de Pearson Coeficiente de Asimetría de Fisher 30 MEDIDAS MEDIDAS DE APUNTAMIENTO O CURTOSIS MEDIDAS DE FORMA Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Distribución mesocúrtica Distribución leptocúrtica Distribución platicúrtica Se definen 3 tipos de distribuciones según su grado de curtosis 31 MEDIDAS MEDIDAS DE APUNTAMIENTO O CURTOSIS MEDIDAS DE FORMA Distribución mesocúrtica: Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: Presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable. 32 MEDIDAS MEDIDAS DE CONCENTRACIÓN 33 MEDIDAS Las medidas de concentración hacen referencia al mayor o menor grado de equidad en el reparto total de los valores de la variable. MEDIDAS DE CONCENTRACIÓN Concentración máxima, o menor equidad en el reparto. En este caso, un solo individuo percibe el total y los demás nada. Concentración mínima o mayor equidad en el reparto. El conjunto total de valores de la variable está repartido por igual. En términos de concentración se pueden encontrar las siguientes situaciones extremas: Para medir la concentración se utilizan fundamentalmente dos medidas: el Índice de Gini y la Curva de Lorenz. Son aplicables, básicamente, a variables económicas (rentas, salarios, etc.). 34 MEDIDAS LA CURVA DE LORENZ Se construye representando en el eje de las abscisas el porcentaje de frecuencias acumuladas y en el eje de las ordenadas los porcentajes acumulados del total de la variable. Al unir los puntos resultantes se obtiene la curva, cuya forma permitirá determinar el nivel de concentración. MEDIDAS DE CONCENTRACIÓN Para representar la curva de Lorenz, basta con dibujar un cuadrado cuyos lados están divididos en una escala de 0% a 100%. Generalmente la curva se representa junto con la diagonal del cuadrado, denominada LÍNEA DE EQUIDAD. La curva de Lorenz siempre se sitúa por debajo de esta línea, es creciente y convexa. La diagonal resultará útil para determinar el nivel de concentración de la distribución, pudiendo darse dos casos extremos: Concentración mínima: la curva coincide con la diagonal, se trata de una situación de máxima equidad. Concentración máxima: la curva coincide con los lados del cuadrado, por lo tanto no existe equidad alguna en el reparto. 35 MEDIDAS ÍNDICE DE GINI MEDIDAS DE CONCENTRACIÓN 36 MEDIDAS ÍNDICE DE GINI Cuantifica el grado de aproximación existente entre la curva de Lorenz y la línea de equidad. MEDIDAS DE CONCENTRACIÓN Se calcula como una proporción de las áreas en el diagrama de la curva de Lorenz. Si el área entre la línea de equidad y la curva de Lorenz es A, y el área por debajo de la curva de Lorenz es B, entonces el índice de Gini es el cociente entre el área comprendida entre la curva de Lorenz y la línea de equidad, y el área comprendida entre la línea de máxima concentración y la de equidad. A/(A+B). Oscila entre 0 y 1. Cuanto más próximo esté su valor a 0 menor será la concentración, es decir, mayor equidad habrá en el reparto de la variable entre los individuos; por el contrario cuanto mayor esté a 1 mayor será la concentración. A/(A+B)
Compartir