Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
MEDIDAS DE DISPERSIÓN RANGO, VARIANZA, DESVIACIÓN ESTÁNDAR, COEFICIENTE DE VARIACIÓN MEDIDAS DE DISPERSIÓN Sesión 05 RESULTADO DE APRENDIZAJE DE LA SESIÓN Al finalizar la sesión, el estudiante analiza, resuelve ejercicios de medidas de dispersión usando las fórmulas e interpreta sus resultados. REFLEXIÓN DESDE LA EXPERIENCIA No se puede decidir comparando las medias. En estos casos las medias no aportan suficiente información, Se necesita un indicador de cómo están diseminados los datos alrededor del centro de la distribución. Se debe recurrir MEDIDAS DE DISPERSIÓN SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA Todos los valores representativos discutidos en las clases anteriores han sido una especie de promedio o medida de posición. Sin embargo, el uso de un solo valor para describir una distribución oculta muchos hechos importantes. Por ejemplo, dos grupos separados de datos puede contener la misma media, pero un grupo puede estar mas disperso o esparcido alrededor de la media que el otro. Por lo que es necesario una medida de dispersión, esparcimiento o variación para ayudar a definir completamente la distribución. Mientras menor es la dispersión, mas típico es el valor de la media para toda la distribución. MEDIDAS DE DISPERSIÓN INTRODUCCIÓN SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA Llamadas también medidas de variabilidad, miden el grado de separación de los datos respecto a un valor central. Son útiles porque: Permiten juzgar la confiabilidad de la medida de tendencia central. Los datos demasiados dispersos tienen un comportamiento especial. Es posible comparar dispersión de diversas muestras. Permite determinar el tipo de población, tipo muestreo. Mide la bondad de ajuste en un análisis de regresión. Cuantifica los riesgo en toma de decisiones. Etc….. MEDIDAS DE DISPERSIÓN CONCEPTO SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA ABSOLUTAS Varianza Coeficiente de Variación Desviación Estándar MEDIDAS DE DISPERSIÓN RELATIVAS Rango Intercuartílico Rango o Amplitud MEDIDAS DE DISPERSIÓN: Absolutas RANGO o AMPLITUD: R Se define como la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos, es decir: R = X máx. – X mín. Indica intuitivamente la mayor distancia, diferencia o variación que existe en un conjunto de datos entre el valor máximo y el valor mínimo CARACTERÍSTICAS: Solo usa dos datos para su cálculo. Hace referencia al recorrido que hace la variable desde el valor mínimo hasta el valor máximo. Es afectado por valores atípicos, por lo que no se recomienda su uso. Es la medida de dispersión mas sencilla de calcular. El rango aumenta o se mantiene al incrementar el número de datos. Se usa cuando el número de datos es pequeño. MEDIDAS DE DISPERSIÓN: Absolutas RANGO o AMPLITUD: R R = 50 – 10 = 40 min. EJEMPLO Se tiene el tiempo de espera (en minutos), de los pacientes que acudieron al servicio de medicina en el Hospital San Pedro. Diciembre 2020. 10 13 22 26 16 23 35 53 17 32 41 35 24 23 27 16 20 50 48 Determine la variabilidad total de los tiempos de espera. X máx. = 50 X mín. = 10 Los siguientes datos corresponden a las notas del curso de Estadística General de la UCSUR 10 12 15 08 15 18 17 16 11 12 07 18 17 16 15 10 11 13 14 15 16 10 10 18 12 07 12 14 16 16 14 13 15 17 10 15 12 15 17 16 12 14 18 17 10 16 13 11 EJEMPLO Determine la variabilidad total de las notas. X máx. = 18 X mín. = 07 R = 18 – 7 = 11 ptos MEDIDAS DE DISPERSIÓN: Absolutas Se define como la diferencia entre el primer y tercer cuartil, es decir: RIC = Q3 – Q1 Indica la variabilidad total del 50% de los datos centrales entre el cuartil 1 y cuartil 3 CARACTERÍSTICAS: Su cálculo es sencillo, solo usa dos cuartiles. Hace referencia al recorrido que hace la variable desde el cuartil 1 hasta el cuartil 3. No es afectado por valores atípicos o extremos, se recomienda su uso. El rango aumenta o se mantiene al incrementar el número de datos. Excluye el 25% mas alto y el 25% mas bajo. Se usa cuando la mediana es representativa a un conjunto de datos RANGO INTERCUARTÍLICO MEDIDAS DE DISPERSIÓN: Absolutas RIC = 15.65 – 8.82 = 6.83 años RANGO INTERCUARTÍLICO EJEMPLO Si Q1=8,82 años; Q3=15,65 años corresponde la experiencia (en años) del personal que labora en el Hospital María Auxiliadora. a.-¿Entre qué valores se encuentra el 50% intermedio de estos datos? El 50% de los trabajadores con experiencia intermedia se encuentran entre 8,82 y 15,65 años. b.- ¿Cuál es el rango intercuartílico? MEDIDAS DE DISPERSIÓN: Absolutas Es una medida de Dispersión que indica cómo las observaciones se separan de la Media Aritmética. Se define como el promedio de las desviaciones al cuadrado de cada uno de los datos con respecto a la media. Indica el grado de variabilidad de los datos con respecto a la media. CARACTERÍSTICAS: Sus unidades están elevadas al cuadrado. Se usa cuando la media es representativa a un conjunto de datos. Esta medida de dispersión será grande si las observaciones están distantes de la media y pequeña si están cerca. Es mayor o igual a cero. VARIANZA MEDIDAS DE DISPERSIÓN: Absolutas VARIANZA Para obtener sus valores depende como se presentan los datos. 117 161 116 353 123 376 DATOS NO AGRUPADOS DATOS AGRUPADOS Sin Intervalos Con Intervalos POBLACIÓN MUESTRA (Xi : valor de la variable) (Xi : marca de clase) MEDIDAS DE DISPERSIÓN: Absolutas VARIANZA EJEMPLO Los siguientes son tiempos de hospitalización en días de una muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5 Interés: Determine el grado de variabilidad del tiempo de hospitalización = 323 = 2.78 dias2 Realizando los cálculos preliminares: NOTA: AL TRABAJAR CON LA VARIANZA LAS UNIDADES ESTAN ELEVADAS AL CUADRADO POR LO QUE DIFICULTAD SU INTERPRETACION, OSEA NO ES RECOMENDABLE USAR LA VARIANZA PARA ANALIZAR DATOS, EN ESTE CASO RECURRIREMOS A SU ALTERNATIVA LA DESVIACION ESTANDAR. MEDIDAS DE DISPERSIÓN: Absolutas VARIANZA EJEMPLO Un pediatra registra en una tabla el número de meses que los niños tardan en dar sus primeros pasos luego de haber nacido y considera una muestra aleatoria de 50 niños. Interés: Determine el grado de variabilidad de los meses que los niños tardan en dar sus primeros pasos Meses Xi Niños fi 9 1 10 4 11 9 12 16 13 11 14 8 15 1 Total 50 MEDIDAS DE DISPERSIÓN: Absolutas VARIANZA EJEMPLO Meses Xi Niños fi 9 1 9 81 10 4 40 400 11 9 99 1089 12 16 192 2304 13 11 143 1859 14 8 112 1568 15 1 15 225 Total 50 610 7526 = 12.2 meses El grado de variabilidad de los meses que tardan los niños en dar sus primeros pasos es 1.7 con respecto a la media. MEDIDAS DE DISPERSIÓN: Absolutas VARIANZA EJEMPLO: Interés: Determine el grado de variabilidad de las calorías que se pierde en una hora de gimnasio. Las calorías que se pierden en una hora de gimnasio, en una muestra aleatoria de 80 personas se presentan a continuación en la siguiente tabla. Calorías Marca de clase Xi fi 90-130 110 15 130-170 150 22 170-210 190 24 210-250 230 15 250-290 270 4 Total 80 Calorías Marca de clase (Xi) fi 90-130 110 15 1650 181500 130-170 150 22 3300 495000 170-210 190 24 4560 866400 210-250 230 15 3450 793500 250-290 270 4 1080 291600 Total 80 14040 2628000 MEDIDAS DE DISPERSIÓN: Absolutas VARIANZA EJEMPLO = 175.5 El grado de variabilidad de las calorías que se pierde en una hora de gimnasio es de con respecto a la media. (Xi : marca de clase) MEDIDAS DE DISPERSIÓN: Absolutas La desviación estándar o desviación típica es una medida de variabilidad de los datos respecto a la media aritmética. Se define como la raíz cuadrada de la varianza. Indica la dispersión promedio de los datos con respecto a la media. CARACTERÍSTICAS: Sus unidades no están elevadas al cuadrado. Se usa cuando la media es representativa a un conjuntode datos. Cuanto menor sea la desviación estándar, menor será la dispersión (más homogénea) y cuanto mayor sea la desviación típica, mayor dispersión (menos homogénea). Es mayor o igual a cero. DESVIACIÓN ESTÁNDAR MEDIDAS DE DISPERSIÓN: Absolutas Para obtener sus valores depende como se presentan los datos. 117 161 116 353 123 376 DATOS NO AGRUPADOS DATOS AGRUPADOS Sin Intervalos Con Intervalos POBLACIÓN MUESTRA (Xi : valor de la variable) (Xi : marca de clase) DESVIACIÓN ESTÁNDAR MEDIDAS DE DISPERSIÓN: Absolutas EJEMPLO Retomando el ejemplo de los tiempos de hospitalización en días de una muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5 Interés: Determine la desviación estándar de los tiempo de hospitalización. NOTA: EL RESULTADO 1,67 DIAS SOLO INDICA LA DISPERSIÓN PROMEDIO DE LOS TIEMPO DE ESPERA, PERO NO PODEMOS ATRIBUIRLE UNA CUALIDAD QUE INDIQUE SI ES POCA DISPERSION, DISPERSION ACEPTABLE, DISPERSION ALTA O MUY ALTA, EN ESTE CASO RECURRIREMOS AL COEFICIENTE DE VARIACION. DESVIACIÓN ESTÁNDAR = 1.67 días Indica la dispersión promedio del tiempo de hospitalización es de 1,67 días con respecto al promedio. MEDIDAS DE DISPERSIÓN: Relativas Es una MEDIDA RELATIVA de variabilidad de los datos entre la media y la desviación estándar de una población. Expresa qué tanto por ciento la desviación estándar representa de la media aritmética. Se obtiene: Indica la variabilidad promedio de los datos con respecto a la media aritmética expresada en porcentajes. COEFICIENTE DE VARIACIÓN *100% *100% *100% Población Muestra MEDIDAS DE DISPERSIÓN: Relativas Además, es útil para comparar la variabilidad relativa de datos de dos o más distribuciones expresados en unidades iguales o diferentes. Habrá mayor dispersión en la distribución que tenga mayor coeficiente de variación y viceversa. COEFICIENTE DE VARIACIÓN Si 00 < C.V. ≤ 10%, poca dispersión. Si 10 < C.V. ≤ 33%, dispersión aceptable. Si 33 < C.V. ≤ 50%, alta dispersión. Si C.V. > 50%, dispersión muy alta. Si CV ≤ 33%, Población HOMOGÉNEA Si CV > 33%, Población HETEROGÉNEA MEDIDAS DE DISPERSIÓN: Relativas EJEMPLO Retomando el ejemplo de los tiempos de hospitalización en días de una muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5 Interés: Determine el porcentaje de variación de los tiempo de hospitalización con respecto a la media. COEFICIENTE DE VARIACIÓN La desviación estándar es el 30.4% de la media, es decir, el 30.4% de la variación de los tiempos de hospitalización respecto de la media. Además, la dispersión de los tiempos de hospitalización es aceptable y se trata de una población homogénea. *100% *100% = 30.4% MEDIDAS DE DISPERSIÓN: Relativas EJEMPLO Interés: ¿Que grupo es más homogéneo o menos variable? COEFICIENTE DE VARIACIÓN *100% 6.9% Supongamos que de dos poblaciones se han obtenido los siguientes datos: Grupo 1 Grupo 2 Edad μ = 25 años 21 años PESO TALLA μ = 72.5 Kg 165 cm = 5 Kg 5 cm N = 15 15 La dispersión de las tallas del grupo 2 es menor que la dispersión de los pesos del grupo 1. *100% 3.03% APLIQUEMOS LO APRENDIDO 1.- Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas que se muestran a continuación muestran los salarios percibidos hasta fines de mayo de este año (expresado en miles de soles): Dpto. producción Dpto. ventas Intervalos Nº trabajadores Intervalos Nº trabajadores 1 – 1.5 12 6 - 8 4 1.5 – 2 28 8 – 10 6 2 – 2.5 32 10 – 12 12 2.5 – 3 24 12 – 14 15 3 – 3.5 12 14 – 16 3 a) Hallar la desviación típica correspondiente a cada departamento. b) Determinar cuál de los departamentos presenta mayor dispersión relativa. SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA 15 16 18 18 19 21 21 22 23 25 27 29 30 31 31 35 44 46 48 48 50 52 52 53 2.- Hallar las medidas de dispersión en datos no agrupados e interpreta Edades fi 30 – 34 34 – 38 38 – 42 42 – 46 46 – 50 6 2 8 3 10 3.- Hallar las medidas de dispersión en datos agrupados e interpreta La siguiente información corresponde a las edades de los pacientes que sufren de insuficiencia renal: APLIQUEMOS LO APRENDIDO SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA INTEGREMOS LO APRENDIDO ¿Qué se entiende por variabilidad? ¿Cuál es la diferencia entre la desviación estándar y la varianza? ¿En dónde podemos utilizar lo aprendido? SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA Actividad Asincrónica (virtual) Resolver el cuestionario virtual de la semana 5 REFERENCIAS BIBLIOGRÁFICAS Anderson, D. (2008). Estadística para administración y economía. México, D. F.: Cengage Learning. 10ª edición. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EfmckGutuRVEmTlp_PFA2sgBe6-Gdu3J7-Ct0rYCLZSK8Q Johnson, R. (2004). Estadística elemental: lo esencial. México, D. F.: International Thomson. Disponible en Biblioteca: 519.5 / J67 / 2004. Martínez, C. (2012). Estadística y muestreo. Bogotá: Ecoe Ediciones. Disponible en Biblioteca: 519.52 / M26 / 2012. Palacios C., Severo. (2010). Estadística experimental. Aplicada a ciencia e ingeniería. 1ª. Edición. Concytec. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/ehinostrozar_cientifica_edu_pe/EejSxiCIZo5Mmz284-ZjriEB5JkTJwJPoZ7JkAqOVg8X9A?e=ZTN4Ey Salazar, C. Del Castillo, S. (2018). Fundamentos básicos de estadística. 1ª edición. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EX7CejlZbBZKukecWJpvRaIBy06W6cs1qX2fG0CxlWcwSQ Triola, M. (2018). Estadística. México, D. F.: Pearson Educación. 12ª edición. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EWWDv2kMz_NOsnHN6OaNyVYBOCVZIFLGBFaQqmrXUGmg3Q Walpole, R.; Myers, R.; Myers, S; Ye, K. (2012) Probabilidad y estadística para ingeniería y ciencias. 9ª edición. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/ehinostrozar_cientifica_edu_pe/ESqzEQPTJSNCiWzRQ3xtcxsBhDRarSKofShxY9d5uLyyVQ?e=CyCmyl SECCIÓN DE REFERENCIA SECCIÓN DE REFERENCIA
Compartir