Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA Dpto. de Estadística e Informática Semana 3. Medidas de tendencia central Inicio • Motivación • Logros • Saberes previos Desarrollo • Medidas de tendencia central • Propiedades de transformación de variables • Percentiles • Ejercicios resueltos Cierre • Ejercicios propuestos • Autoevaluación (Moodle) 2 3 ¿Qué medidas estadísticas permite? ¿Resumir el número de contagios de todas las regiones? ¿Determinar el número de pruebas rápidas realizadas con mayor frecuencia? ¿Identificar las regiones que están dentro del 25% de menores de personas fallecidas? https://covid19.minsa.gob.pe/sala_situacional.asp https://covid19.minsa.gob.pe/sala_situacional.asp 4 ¿Qué es una medida estadística? ¿Para qué sirven las medidas estadísticas? ¿Para qué sirven las medidas de posición? Al término de la sesión, el estudiante estará en capacidad de: Calcular e interpretar medidas de tendencia central. Calcular e interpretar medidas de posición de percentiles. Aplicar las propiedades de transformación de variables. Resolver ejercicios propuestos. 5 Medidas de variabilidad Medidas de asimetría Medidas de tendencia central Media o promedio Media ponderada Mediana Moda Percentiles Rango Rango intercuartil Variancia Desviación estándar Coeficiente de variabilidad Coeficiente de asimetría de Pearson Diagrama de cajas 6 Autoevaluación (Aula virtual) Ejemplos, ejercicios resueltos y propuestos Percentiles Propiedades de transformación La moda La mediana La media o promedio y la media ponderada Las medidas estadísticas son calculadas con los datos de las variables (cuantitativas y cualitativas) que pueden provenir de una población (N: Tamaño de la población) o muestra (n: Tamaño de la muestra), con la finalidad de resumir y representar el conjunto de datos. 7 Observaciones: 1. Las medidas estadísticas asumen las mismas unidades de medida de la variable en estudio. 2. Para las variables cuantitativas, se pueden calcular todas las medidas estadísticas. 3. En el caso de las variables cualitativas, sólo es posible calcular como medidas la moda y la proporción. Son medidas estadísticas que se localizan en la parte central de la distribución del conjunto de los datos. Permiten resumir y representar en un sólo valor el conjunto de datos. Las principales medidas de tendencia central son: •La media o promedio •La media ponderada •La mediana •La moda •Percentil Medidas de Tendencia Central 8 9 Ejemplo 1. Suponga que se tiene los datos de las ventas semanales (en dólares) de una muestra de 8 vendedores. Calcule la venta promedio semanal. 1 1 N j j X N Media Poblacional: 1 1 n j j X X n Media Muestral: La media o promedio de un conjunto de observaciones es igual a la suma de sus valores dividido entre el número de observaciones 150 120 300 280 350 250 160 280 3.236 8 890,1 8 280160250350280300120150 8 1 8 1 i ixX Interpretación. La venta promedio semanal por vendedor fue de $ 236.3 10 1. La media está afectada por valores extremos (altos o pequeños). 2. Localiza la parte central de un conjunto de observaciones. 3. Para un conjunto de observaciones la media es única. 4. La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero. 5. La suma de los cuadrados de las desviaciones de las observaciones con respecto a la media es mínima. 1 1 0 n n j j j j X X X n X n X n X 2 2 1 1 , n n j j j j X X X c donde c R 1 1 1 2 2 1 2 1 ... ... k j j j k k p k k j j w x w x w x w x x w w w w La media ponderada se usa cuando se quiere que los valores de la variable tengan un peso (wi). 11 Ejemplo 2. Hallar el promedio ponderado semestral de un estudiante con notas en los siguientes cursos: Curso Créditos (wi) Nota (Xi) Matemática 4 14 Redacción 3 12 Estadística 4 16 14 12 16 14 3 4*14 3*12 4*16 14.2 4 3 4 p x x Caso 1. Cuando los datos se encuentran en una tabla de frecuencias correspondiente a una variable cuantitativa discreta. La media se calcula por: n xf f xf x k j jj k j j k j jj p 1 1 1 Caso 2. Si son las medias de k grupos y cada grupo tiene un tamaño respectivamente, entonces la media de todos los datos se calcula por: 1 2, ,..., kx x x 1 2, ,..., kn n n 1 2 ... kn n n n k j j k j jj p n xn x 1 1 12 Ejemplo 3. En la siguiente tabla se presenta el número de cursos matriculados en el presente semestre para una muestra de 300 alumnos. Hallar el número promedio de cursos matriculados por alumno. Interpretación. El número promedio de cursos matriculados por alumno en este semestre es de 4.4 4.4 300 66058041003402201 n xf x k j jj p Número de cursos Xi Número de alumnos fi 2 20 3 40 4 100 5 80 6 60 Total 300 13 La mediana es el valor que ocupa la posición central de un conjunto de datos, previamente ordenados. La mediana se calcula: Ejemplo 4. Los siguientes datos corresponden a los pesos (en Kg.) de 10 personas: 50, 77, 53, 76, 63, 64, 75, 54, 52, 80. Calcule la mediana Datos ordenados: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80 𝑺𝒊,𝒏 𝒆𝒔 𝒊𝒎𝒑𝒂𝒓: 𝒎𝒆 = 𝑿 𝒏+𝟏 𝟐 𝑺𝒊,𝒏 𝒆𝒔 𝒑𝒂𝒓: 𝒎𝒆 = 𝑿 𝒏 𝟐 + 𝑿 𝒏 𝟐 +𝟏 𝟐 Interpretación. Un 50% de personas pesan menos de 63.5 Kg. y el otro 50% pesa más de 63.5 Kg. 14 10 10 1 5 62 2 63 64 10 , 63.5 2 2 2 X X X X n par me 1. La mediana divide a las n observaciones previamente ordenadas, en dos partes iguales. El 50% con valores menores a la mediana y el otro 50% con valores mayores a la mediana. 2. La suma de las desviaciones absolutas de las observaciones con respecto a la mediana es un valor mínimo. 3. La mediana no está afectada por valores extremos. 1 1 , n n j j j j X me X c donde c R 15 La moda de un conjunto de datos es el valor o atributo que ocurre con mayor frecuencia. mo = Valor más frecuente Propiedades: 1. Puede no existir o puede haber más de una moda en un conjunto de datos. 2. No es afectada por valores extremos. 3. Se aplica tanto para información cualitativa como cuantitativa. 16 Ejemplo 5. Se tiene longitudes (en cm.) de una raza de peces de rio para muestras en tres zonas (A, B y C). Calcule e interprete la moda para cada muestra. Muestra de la zona A Muestra de la zona B Muestra de la zona C 4.0 4.3 4.6 4.0 4.1 4.4 4.0 4.1 4.3 4.1 4.4 4.7 4.1 4.2 4.5 4.1 4.2 4.3 4.2 4.5 4.8 4.1 4.3 4.6 4.1 4.3 4.5 No hay moda mo= 4.1 mo1 = 4.1 mo2 = 4.3 Interpretación. Zona A. No hay moda Zona B. La longitud más frecuente de las truchas es 4.1 cm. Zona C. Existen dos modas: 4.1 y 4.3 17 Ejercicio 1. En un estudio del medio ambiente para evaluar la calidad de aire, se registró la cantidad de microgramos de partículas en suspensión por mt2 de aire para muestras evaluadas en dos zonas. Halle e interprete las medidas de tendencia central Zona A 48 26 28 28 32 34 34 36 36 36 46 48 24 Zona B 25 25 25 32 36 38 40 35 35 45 48 52 18 Zona B. El promedio: La mediana: La moda: Solución: Zona A. El promedio: n = 13 impar, me = X n+1 2 = X7 = 34 n = 12 par, me = X n 2 + X 1+ n 2 2 = X6 + X7 2 = 35 + 36 2 = 35.5 La cantidad microgramos de partículas más frecuente fue 36.0 en la zona A. Datos ordenados: 24,26,28,28,32,34,34,36,36,36,46,48,48 Datos ordenados: 25,25,25,32,35,35,36,38,40,45,48,52 19 0 36m La mediana: La cantidadpromedio de microgramos de partículas por mt2 fue 35.1 en la zona A. La moda: El 50% de las muestras la cantidad de microgramos de partículas es menor a 34 y el otro 50% mayor a 34 en la zona A. 0 25m 48 26 ... 24 456 35.1 13 13 X 32 32 ... 52 436 36.3 12 12 X Ejercicio 2. Los tiempos promedios de tardanza (minutos) de muestras de 40, 25 y 15 trabajadores de los turnos de día, tarde y noche fueron 8.5, 12.0 y 15.5 respectivamente. Hallar el tiempo promedio de tardanza de los trabajadores para los tres turnos. Solución: Calculando la media ponderada: Interpretación. El tiempo promedio de tardanza de los trabajadores en los tres turnos fue de 10.9 minutos. 20 𝐧𝟏 = 𝟒𝟎,𝐗 𝟏 = 𝟖.𝟓; 𝐧𝟐 = 𝟐𝟓,𝐗 𝟐 = 𝟏𝟐.𝟎; 𝐧𝟑 = 𝟏𝟓,𝐗 𝟑 = 𝟏𝟓.𝟓 𝐗 𝐩 = 𝟒𝟎 × 𝟖.𝟓 + 𝟐𝟓 × 𝟏𝟐.𝟎 + 𝟏𝟓 × 𝟏𝟓.𝟓 𝟒𝟎 + 𝟐𝟓 + 𝟏𝟓 = 𝟏𝟎.𝟗 Para una nueva variable transformada: Y = a ± bX, donde a y b son constantes reales. Entonces, sus medidas estadísticas son calculadas: Medida estadística Media o promedio Mediana Moda ii bXaY XbaY XY bmeame XY bmoamo 21 Ejemplo 6. Un ganadero, estima que la producción promedio de leche de sus 150 vacas de la raza Holstein es 22.5 y las 220 vacas de la raza Cebú es 20.8 litros por día. Si usando un nuevo nutriente, espera que la producción de leche aumente en un 12% en la raza Holstein pero un disminución del 5% en la raza Cebú. a. Halle la producción promedia de leche para cada raza con el nuevo nutriente. b. Halle y compare la producción promedia de leche que tendrá el ganadero sin y con el nuevo nutriente para las dos razas. 𝐑𝐚𝐳𝐚 𝐇𝐨𝐥𝐬𝐭𝐞𝐢𝐧:𝐧𝟏 = 𝟏𝟓𝟎,𝐗 𝟏 = 𝟐𝟐.𝟓 ⟹ 𝐘𝟏 = 𝟏.𝟏𝟐𝐱𝐗𝟏 ⟹ 𝐘 𝟏 = 𝟏.𝟏𝟐𝐱𝐗 𝟏 = 𝟏.𝟏𝟐𝐱𝟐𝟐.𝟓 = 𝟐𝟓.𝟐 22 𝐑𝐚𝐳𝐚 𝐂𝐞𝐛ú:𝐧𝟐 = 𝟐𝟐𝟎,𝐗 𝟐 = 𝟐𝟎.𝟖 ⟹ 𝐘𝟐 = 𝟎.𝟗𝟓𝐱𝐗𝟐 ⟹ 𝐘 𝟐 = 𝟎.𝟗𝟓𝐱𝐗 𝟐 = 𝟎.𝟗𝟓𝐱𝟐𝟎.𝟖 = 𝟏𝟗.𝟖 𝐒𝐢𝐧 𝐧𝐮𝐭𝐫𝐢𝐞𝐧𝐭𝐞:𝐗 = 𝟏𝟓𝟎𝐱𝟐𝟐.𝟓 + 𝟐𝟐𝟎𝐱𝟐𝟎.𝟖 𝟏𝟓𝟎 + 𝟐𝟐𝟎 = 𝟐𝟏.𝟓 𝐍𝐮𝐞𝐯𝐨 𝐧𝐮𝐭𝐫𝐢𝐞𝐧𝐭𝐞:𝐘 = 𝟏𝟓𝟎𝐱𝟐𝟓.𝟐 + 𝟐𝟐𝟎𝐱𝟏𝟗.𝟖 𝟏𝟓𝟎 + 𝟐𝟐𝟎 = 𝟐𝟐.𝟎 El percentil Pq divide a un conjunto de datos previamente ordenado en un q% menores que Pq y un (100 – q)% mayores que Pq. Para calcular el percentil Pq, se determina en primer lugar la posición (Pos). )()1()( )( .0)(. )( 100 1 EEEq Eq xxdxPDecimaldE xPEnteroEn qxPos Cuartiles. Divide el conjunto de datos en cuatro partes iguales (25% cada parte). • Primer cuartil. Percentil 25: Q1 = P25 • Segundo cuartil. Percentil 50: Q2 = P50 = me • Tercer cuartil. Percentil 75: Q3 =P75 23 Ejemplo 7. Se cuenta con los datos de los tiempos (en minutos) de tardanza de los trabajadores de una compañía de seguro. Halle e interprete el percentil 45. 15 12 18 22 24 10 9 13 25 18 6 14 Datos ordenados: 6, 9, 10, 12, 13, 14, 15, 18, 18, 22, 24, 25 utosxxxPPosición min85.13131485.01385.085.545 100 112 56545 Interpretación: El 45% de los trabajadores tienen un tiempo de tardanza menor 13.85 minutos y el otro 55% más de 13.85 minutos 24 1 12 1 45 12, 45 5.85 100 100 n q y n Pos qx x Ejercicio 3. Los siguientes datos corresponden a los pesos, en Kg. de 10 personas: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80 25 2 3 2 10 1 25 10 25 2.75 100 0.75 52 0.75 53 52 52.75 q y n Pos x P x x x Kg a. Calcule el peso máximo para que una persona sea considerada dentro del 25% de menores pesos. El peso máximo debe ser igual a 52.75 Kgs. Para considera a una persona dentro del 25% de menores pesos b. Calcule el peso mínimo para que una persona sea considerada dentro del 25% de mayores pesos. El peso mínimo debe ser igual a 76.25 Kgs. 25 75 8 9 8 10 1 75 10 75 8.25 100 0.25 76 0.25 77 76 76.25 q y n Pos x P x x x Kg Ejercicio 4. En la siguiente tabla se presenta la distribución de número de parcelas que poseen cada agricultor en una muestra al azar de 50 de la sierra central. Halle e interprete las medidas de tendencia central y el percentil 42.5. Número de parcelas Xi Número de agricultores fi 1 15 2 8 4 12 5 10 6 5 Total 50 26 25 26 82.5 82.5 1 15 2 8 4 12 5 10 6 5 Pr : 3.18 50 4 4 : 4 2 2 : 4 50 1 82.5 42.075 5 0.075 5 5 5 100 omedio X X X Mediana me Moda mo P Pos x P Ejercicios propuestos. 1. Los siguientes datos corresponden al número árboles infectados con el nemátodo del pino (Bursaphelebchus Xylophilus) para una muestra de 40 parcelas de 64 mt2 cada una. a. Halle e interprete el percentil 35 b. ¿Cuál debe ser el valor mínimo del número de árboles infectados para que una parcela sea considerada dentro del 16% de las de mayor número? c. ¿Cuál debe ser el valor máximo del número de árboles infectados para que una parcela sea considerada dentro del 28 de las de menor número? d. ¿Para qué valores del número de árboles infectados se tendrá el 80% central de parcelas? 0 2 3 5 6 6 8 9 12 12 14 18 0 2 4 5 6 6 8 10 12 14 16 18 1 2 4 5 6 6 8 10 12 14 16 18 27 2. Los siguientes datos corresponden a una muestra de 12 apicultores sobre su producción de miel anual (en kgrs) por colmena. 250.5 320.0 345.5 260.4 358.2 268.5 380.1 410.2 430.4 480.3 410.3 420.1 a. Calcular e interpretar las medidas de tendencia central b. Si se espera un incremento del 15.5% en la producción de miel en los meses de verano y una disminución del 4.5% en invierno. Halle la producción promedia de miel para dad estación y para las dos estaciones juntas. 28 3. La gerencia de marketing de una empresa ha decidido aumentar 10% los precios de los ternos en la sucursal Sur pero restando 90 nuevos soles, mientras que en la sucursal Norte disminuir en 4.5% los precios de los ternos y en la sucursal Centro aumentar 125 nuevos soles cada terno. A continuación se presenta las medidas estadísticas de los precios de las sucursales. N para Variable N N* Media Mínimo Mediana Máximo Moda moda Sucursal Sur 15 0 450,5 345,0 450,0 650,0 450 3 Sucursal Norte 15 0 582,3 320,0 580,0 910,0 600 2 Sucursal Centro15 0 500,3 310,0 550,0 810,0 550 3 Halle las medidas estadísticas (media, mediana y moda) de los nuevos precios de los ternos para la sucursal Sur, Norte y Centro. 29 Referencias bibliográficas Anderson D., Sweendy D., Williams T. (2016) Estadística para Administración y Economía. 12ª. Edición. México. Cengage Learning Editores. Capítulo 3 Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para Administración y Economía (6ta. ed.) Madrid: Pearson Education. Prentice Hall 30
Compartir