Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística Descriptiva y Probabilidades SESIÓN 6 TEMARIO 1. Medidas de dispersión para datos no agrupados. 2. Medidas de dispersión para datos agrupados. LOGRO DE LA SESIÓN Al finalizar la sesión de clase, el estudiante calcula e interpreta las medidas de dispersión para analizar la variabilidad en datos no agrupados y agrupados . Medidas de dispersión Son cantidades que miden el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio. Medidas de dispersión La importancia que tienen es porque proporcionan más información que permite juzgar la confiabilidad de las medidas de tendencia central. Si los datos están muy dispersos, las medidas de tendencia central son menos representativas de los datos que cuando están más agrupadas alrededor de la media. PRINCIPALES MEDIDAS DE DISPERSIÓN Rango o recorrido de la variable Varianza Desviación estándar Coeficiente de variación Definiciones de Estadígrafos Varianza: (S2) Es el promedio aritmético de las desviaciones estándar respecto a su media elevadas al cuadrado. Desviación estándar: (S) Representa el grado de dispersión de los valores de una variable, con respecto a su media. Coeficiente de variación: (CV) Indica el porcentaje de variabilidad de los datos respecto a la media: CV Dispersión 0 ≤ CV < 20% BAJA 20% ≤ CV < 50% MEDIA 50% ≤ CV < 100% ALTA Medidas de dispersión Medidas de dispersión Rango o recorrido de la variable: Es la diferencia entre el valor máximo y el valor mínimo de la variable para un conjunto de datos. Sea la variable representada por X: Donde: Xmax: valor máximo de la variable Xmin: valor mínimo de la variable Rango (R) = X max – X min Medidas de dispersión Varianza: Se define como la media aritmética del cuadrado de las desviaciones de las observaciones con respecto a su media. Para datos no agrupados: Para datos agrupados: Medidas de dispersión Desviación estándar: Se define como la raíz cuadrada de la varianza. Desviación estándar poblacional: Desviación estándar muestral: Medidas de dispersión Coeficiente de variación: Se define como el cociente entre la desviación estándar y la media. Permite comparar dos a más conjuntos de datos. Coeficiente de variación poblacional: Coeficiente de variación muestral: En general consideraremos lo siguiente: CV < 10% -> Implica DATOS HOMOGÉNEOS 10% ≤ CV ≤ 30% -> Implica DATOS VARIABLES CV > 30% -> Implica DATOS HETEROGÉNEOS Medidas de dispersión PROPIEDAD 1 Si todos los valores observados son iguales a b (donde b es una constante) entonces PROPIEDAD 2 Si a cada valor de las observaciones se le suma (o resta) una constante, la varianza del nuevo conjunto transformado e será la misma que la varianza de las observaciones iniciales, es decir: PROPIEDAD 3 Si a cada valor de las observaciones se le multiplica por una constante diferente de cero, la varianza del nuevo conjunto transformado es la varianza del conjunto original multiplicado por la constante elevado al cuadrado. Un estudiante de la carrera de Ingeniería de Software revisó durante 11 días el ranking de una revista científica que publica artículos sobre la industria de software a través de Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web www.scopus2018.com Además, la cantidad de visitas a la página web www.sciencie2018.com se presenta a continuación: N° de visitas por día a la página web www.scopus2018.pe 4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200 N° de visitas por día a la página web www.sciencie2018.com 3200 4300 4700 4400 4200 4200 4200 4100 4100 4300 Calcule el valor de la desviación estándar de ambas páginas web. EJERCICIO 1 4,000 700 490,000 3,200 -100 10,000 3,600 300 90,000 3,500 200 40,000 3,000 -300 90,000 3,250 -50 2,500 2,900 -400 160,000 3,400 100 10,000 3,450 150 22,500 2,800 -500 250,000 3,200 -100 10,000 Σ= 36,300 1,175,000 n= 11 3,300 117,500 𝑋= 𝑆2 = 𝑥𝑖 − 𝑋 𝑥𝑖 − 𝑋 2𝑥𝑖 3,200 -970 940,900 4,300 130 16,900 4,700 530 280,900 4,400 230 52,900 4,200 30 900 4,200 30 900 4,200 30 900 4,100 -70 4,900 4,100 -70 4,900 4,300 130 16,900 41,700 1,321,000 10 4,170 146,778 𝑥𝑖 − 𝑋 𝑥𝑖 − 𝑋 2𝑥𝑖 Σ= 𝑋 = 𝑆2 = n = www.scopus2018.com www.science2018.com ¿Cuál tiene mayor varianza? ¿Qué significa eso? A mayor varianza mayor variabilidad o dispersión. EJERCICIO 1 Solución: Se define como la raíz cuadrada de la varianza. Para el ejercicio: Desviación Estándar Poblacional 𝜎 = 𝜎2 Desviación Estándar Muestral s = 𝑠2 Variable ¿Estimador o parámetro? Varianza Desviación estándar Visitas diarias a: www.scopus2018.com Muestral (Est) 𝑆2 =117 500 S= 117 500 = 342. 78 Visitas diarias a : www.science2018.com Muestral (Est) 𝑆2 = 146 778 S= 146 778 = 383. 11 Número de hijos en la comunidad andina Poblacional (Parámetro) 𝜎2 =4.71 𝜎 = 4.71 = 2. 71 DESVIACIÓN ESTÁNDAR http://www.netjoven.pe/ http://www.mujeractiva.com/ Solo nos interesa una parte de la tabla. La media es 4.3 xi fi Xi - µ (Xi - µ)2 fi x (Xi - µ)2 0 2 -4.3 18.49 36.98 2 3 -2.3 5.29 15.87 4 7 -0.3 0.09 0.63 6 4 1.7 2.89 11.56 7 4 2.7 7.29 29.16 Total 20 94.2 Número de hijos fi Fi hi Hi Xi 0 2 2 10% 10% 2 3 5 15% 25% 4 7 12 35% 60% 6 4 16 20% 80% 7 4 20 20% 100% Total 20 100% 𝜇 = 𝑥𝑖 ∙ ℎ𝑖 = 4.3 ¿Esta varianza poblacional tiene algún significado por si misma? No porque la varianza es útil para comparar variabilidad. EJERCICIO 1 Solución: A las familias de una comunidad alto andina se le preguntó por el número de hijos, obteniéndose los siguientes resultados (considere datos poblacionales). Como se puede observar, la mayor dispersión se dio en el curso de matemática (CV = 12.5%). Ejercicio explicativo: Coeficiente de variación EJERCICIO 2 Se tomaron dos exámenes a estudiantes del primer ciclo en los cursos de matemática y química general, las notas están sobre 100 puntos. En el curso de matemática la media fue de 72 puntos y una desviación estándar de 9 puntos; en el curso de química general se obtuvo una media de 80 puntos y desviación estándar 6 ¿En cuál de los cursos hay mayor dispersión? (considere datos poblacionales) En matemática: 𝜇 = 72 σ = 9 CV = 9 / 72 = 0.125 En química general: 𝜇 = 80 σ = 6 CV = 6 / 80 = 0.075 Solución: Ejercicio explicativo: Coeficiente de variación EJERCICIO 3 Un estadístico ha llegado a la conclusión que el grado de dispersión relativa porcentual para los datos presentados en la tabla no supera el 10%, por ende cataloga a los datos como homogéneos. Posteriormente el estadístico valida la información brindada por su asistente mediante un software estadístico, por lo que el asistente le brinda la siguiente tabla de frecuencias del peso de 62 alumnos. Peso (kg) N° de alumnos (fi) Fi [40; 42> 12 12 [42; 44> 10 22 [44; 46 > 14 36 [ 46; 48> 8 44 [48; 50> 7 51 [50; 52> 6 57 [52; 54> 5 62 Total 62 ¿El estadístico tiene razón al decir que el grado de dispersión relativa por porcentual no supera el 10%? Considere una media de 45.8387. EJERCICIO 3 Solución: El grado de dispersión relativa porcentual hace referencia al coeficiente de variación. 𝐶𝑉 = S X . 100% Media (promedio) 𝑿 = 45.8387 (dato) Cálculo de la desviación estándar: S Peso (kg) N° de alumnos (fi) Xi [40; 42> 12 41 [42; 44> 10 43 [44; 46 > 14 45 [ 46; 48> 8 47 [48; 50> 7 49 [50; 52> 6 51 [52; 54> 5 53 Total 62 𝐟𝐢 𝐱 𝐗𝐢 − 𝐗 𝟐 Completa la tabla y demuestra que el valor de la desviación estándar S es igual a 3.7730 EJERCICIO 3 Solución: El grado de dispersión relativa porcentual hace referencia al coeficiente de variación. 𝐶𝑉 = 𝑆 𝑋 . 100% Media (promedio) 𝑿 = 45.8387 (dato) Desviación Estándar 𝑺 = 3.7730 Reemplazando: 𝐶𝑉 = 3.7730 45.8387 . 100% = 8.23% Conclusión: El grado de dispersión relativa porcentual o también conocido como el coeficiente de variación es de 8.23%, el cual es bajo y significa que los datos tienen baja dispersiónrespecto a la media y se pueden catalogar como homogéneos. En consecuencia, tiene razón el estadístico. TRABAJO GRUPAL ES FUNDAMENTAL QUE TODOS PARTICIPEN EN LAS DELIBERACIONES, EXPONIENDO SUS PUNTOS DEL VISTA. EVITANDO QUE ALGUIEN SE ADJUDIQUE UN PROTAGONISMO DESMEDIDO, O TOME UNILATERALMENTE DECISIONES QUE AFECTAN A TODOS. SE FORMARAN GRUPOS DE CUATRO ALUMNOS Ejercicio 1 A continuación se presenta la información de 20 ingenieros donde se contabilizó el número de ingresos a la mina Antacasi en un mes. Calcular la varianza poblacional. Xi 5 10 15 20 25 fi 3 7 5 3 2 Ejercicio 2 Una empresa de fabricación de productos cerámicos dispone de tres centros de producción. En el centro A, el más grande y moderno, se hace un estudio de los m² de azulejo producidos al mes durante el año pasado, obteniéndose una media de producción mensual m2, con una desviación típica SA = 15 m². Se sabe que el centro B, por tener maquinaria más anticuada que A, produce cada mes un tercio de la producción de A, y que el centro C, por tener un horno menos que B, produce cada mes 25 m² menos que B ¿Cuál es la varianza de la producción mensual de C? 250Ax Ejercicio 3 Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9 respectivamente. ¿Para cuál de las dos variables el valor de la media es más representativo? Ejercicio 4 LONGITUD CANTIDAD [ 67.5 – 72.5 > 5 [ 72.5 – 77.5 > 95 [ 77.5 – 82.5 > 790 [ 82.5 – 87.5 > 100 [ 87.5 – 92.5 > 10 En una empresa maderera se han seleccionado un grupo de 1000 piezas de madera de las mismas características de acuerdo a su longitud en metros, los resultados se muestran en la siguiente tabla: a) Calcular la varianza. b) Analizar la homogeneidad de la muestra. ¿Qué hemos aprendido? CIERRE 1. ¿Para qué sirven las medidas de dispersión? 2. ¿Cuál es la relación entre el coeficiente de variación y la homogeneidad de un conjunto de datos. CIERRE
Compartir