Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística Descriptiva y Probabilidades SESIÓN 7 TEMARIO 1. Medidas de posición. 2. Medidas de forma: asimetría y curtosis. LOGRO DE LA SESIÓN Al finalizar la sesión de clase, el estudiante calcula e interpreta las medidas de posición y de forma para un conjunto de datos. La medidas de posición corresponden a los valores de la variable que dividen a un conjunto de datos ordenados en intervalos que contienen el mismo número de observaciones. También se les conoce con el nombre de cuantiles. Cuartiles (Qk) Los cuartiles son tres valores que dividen al conjunto de datos en cuatro partes iguales. Deciles (Dk) Los deciles son nueve valores que dividen al conjunto de datos en diez partes iguales. Medidas de posición Percentiles (Pk) Los percentiles son novena y nueve valores que dividen al conjunto de datos en cien partes iguales. P5 P50 P99P80 Equivalencias: Q2 = D5 = P50 = Me Q3 = P75 D7 = P70 Medidas de posición 25% 50% 75%0% 100% Q1 Q2 Q3 D1 D2 D3 D4 D5 D6 D7 D8 D9 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% P90P50P5 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% P20 P75 P99 Cálculo de percentiles para datos no agrupados (Pk) Donde: Pk: Percentil k-ésimo. Li: Valor del dato ubicado en la posición con el valor de k aproximado a entero. Ld: Valor del dato superior o inmediato a Li Procedimiento a seguir: 3. Ubicar el percentil buscado en la posición calculada si éste es un número entero, de lo contrario dicho valor se calcula en forma proporcional en base a la siguiente fórmula: Posición = k (n + 1) 100 Pk = Li + parte decimal x (Ld – Li) 2. Calcular la posición del percentil k-ésimo mediante la siguiente expresión: 1. Ordenar los datos en forma ascendente Caso: Duración de una batería Un fabricante de componentes electrónicos se interesa en determinar el tiempo de vida útil de cierto tipo de batería. Se presenta a continuación una muestra de 24 horas de vida registradas: ¿Cuál es la valor a partir del cuál se encuentra el 30% superior de los tiempos en horas de vida útil de las baterías? 134 122 122 125 126 172 131 180 134 120 136 161 140 140 140 145 146 153 155 159 139 162 128 132 Cálculo de percentiles para datos no agrupados (Pk) 120 122 122 125 126 128 131 132 134 134 136 139 140 140 140 145 146 153 155 159 161 162 172 180 Caso: Duración de una batería Cálculo de percentiles para datos no agrupados (Pk) Solución: 1. Ordenando los datos en forma ascendente 2. Cálculo de la posición del percentil 70: Posición = 70 (24+1) Posición = 17.5 100 Caso: Duración de una batería Cálculo de percentiles para datos no agrupados (Pk) El valor de 17.5 se encuentra entre las posiciones 17 y 18 de los datos ordenados en forma ascendente: X17 = 146, entonces: Li = 146 X18 = 153, entonces: Ld = 153 3. Cálculo de P70: Pk = Li + parte decimal x (Ld – Li) P70 = 146 + 0.5 x (153 – 146) P70 = 149.5 horas Interpretación: El 70% de los tiempos de vida útil registrados son menores a 149.5 horas. 120 122 122 125 126 128 131 132 134 134 136 139 140 140 140 145 146 153 155 159 161 162 172 180 Cálculo de percentiles para datos agrupados (Pk) Procedimiento a seguir: 1. Calcular la posición del percentil k-ésimo mediante la siguiente expresión: Posición = k n 100 2. Ubicar la posición calculada en los valores de la frecuencia acumulada Fi. Cálculo de percentiles para datos agrupados (Pk) Donde: Pk: Percentil k-ésimo. Li: Límite inferior del intervalo donde se encuentra el valor del percentil Pk. c: Amplitud de la clase k: Valor k-ésimo Fi-1: Frecuencia acumulada. fi: Frecuencia absoluta del intervalo donde se encuentra el valor del percentil Pk. kn -F i-1100P =L +c k i f i 3. El percentil estará ubicado en el intervalo que tenga un valor de frecuencia acumulada correspondiente al mínimo valor que es mayor o igual a la posición calculada. Una vez identificado el intervalo se calcula el percentil usando la siguiente fórmula: Caso: Aplicativos en Android La empresa SYSTEM S.A.C. se dedica al desarrollo de aplicativos desarrollados en ANDROID para dispositivos móviles. A la empresa le interesa desarrollar aplicaciones de calidad que tengan el menor tamaño en MB posible para que los usuarios puedan hacer las descarga más rápidamente en sus dispositivos móviles. A continuación se presentan los tamaños registrados en MB de 40 aplicaciones desarrolladas: Tamaño del aplicativo (MB) N° de aplicativos [0; 10> 8 [10; 20> 12 [20; 30> 7 [30; 40> 10 [40; 50] 3 Total 40 El área de calidad de software de la empresa indicó que si el promedio del tamaño registrado de las aplicaciones desarrolladas pertenece al 45% inferior de los datos, se le dará un bono a los programadores a fin de mes. ¿Cuál es la decisión final que tomará el gerente de la empresa? Cálculo de percentiles para datos agrupados (Pk) Solución: 1. Calculo de la marca de clase y de la media: Tamaño del aplicativo (MB) N° de aplicativos (fi) Marca de clase (Xi) Frecuencia acumulada (Fi) fi . Xi [0; 10> 8 5 8 40 [10; 20> 12 15 20 180 [20; 30> 7 25 27 175 [30; 40> 10 35 37 350 [40; 50] 3 45 40 135 Total 40 880 Caso: Aplicativos en Android Cálculo de percentiles para datos agrupados (Pk) X = 880/40 = 22 MB Solución: 2. Cálculo de la posición del percentil: Tamaño del aplicativo (MB) N° de aplicativos (fi) Marca de clase (Xi) Frecuencia acumulada (Fi) fi . Xi [0; 10> 8 5 8 40 [10; 20> 12 15 20 180 [20; 30> 7 25 27 175 [30; 40> 10 35 37 350 [40; 50] 3 45 40 135 Total 40 880 Caso: Aplicativos en Android Cálculo de percentiles para datos agrupados (Pk) Para el 45% superior de los datos corresponde k = 45. Posición = k n = 45 (40) = 18 100 100 Tamaño del aplicativo (MB) N° de aplicativos (fi) Marca de clase (Xi) Frecuencia acumulada (Fi) fi . Xi [0; 10> 8 5 Fi-1 = 8 40 [10; 20> fi = 12 15 Fi = 20 180 [20; 30> 7 25 27 175 [30; 40> 10 35 37 350 [40; 50] 3 45 40 135 Total 40 880 Ubicamos la posición calculada (Posición = 18) en la columna de frecuencias acumuladas (Fi). Caso: Aplicativos en Android Cálculo de percentiles para datos agrupados (Pk) 3. Calculo del valor del percentil P45: kn -F i-1100P =L +c k i f i Caso: Aplicativos en Android Cálculo de percentiles para datos agrupados (Pk) Reemplazando los valores: P45 = 10 + 10 x (45 x 40 / 100 - 8) 12 P45 = 18.3 MB Conclusión: Como el valor de la media ( X = 22 MB) es mayor que el valor de P45 = 18.3 MB, no se entregará el bono a los programadores a fin de mes; teniendo en cuenta las indicaciones del área de calidad del software de la empresa. Cálculo de cuartiles (Qi) y deciles (Di) para datos agrupados Procedimiento a seguir: 1. A diferencia del calculo del percentil, la posición se calcula: Cuartil: Decil: Posición = k n 4 2. Ubicar la posición calculada en los valores de la frecuencia acumulada Fi. (Se sigue el mismo procedimiento que el percentil) Posición = k n 10 Cálculo de cuartiles (Qk) y deciles (Dk) para datos agrupados Cuartil: 3. El cuantil a calcular estará ubicado en el intervalo asociado a la frecuencia acumulada correspondiente al mínimo valor que es mayor o igual a la posición calculada. Una vez identificado el intervalo se calcula el cuantil usando las siguientes fórmulas, según sea el caso: kn -F i-1100P =L +c k i f i 4 Qk kn -F i-1100P =L +c k i f i 10 DkDecil: Medidas de forma Las medidas de forma permiten conocer si una distribución de frecuencias tiene características como: simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución. Son medidas de forma la asimetría y la curtosis. Asimetría Curtosis • Son medidasque permiten conocer la forma que tiene la curva que representa al conjunto de datos. Nos brindan información sobre la dirección de la dispersión de los datos. • Si esta dispersión tiende hacia el lado derecho, diremos que la curva tiene asimetría positiva, en caso contrario diremos que tiene asimetría negativa. • Si las dispersiones de la curva son iguales diremos que la curva es simétrica. Asimetría Si Ak < 0, la distribución tiene asimetría negativa. Si Ak = 0, la distribución es simétrica. Si Ak > 0, la distribución tiene asimetría positiva. (x -Me) A =3 k s Coeficiente de asimetría de Pearson (Ak) : media muestral Me: mediana S: desviación estándar Caso: Componente electrónico Se realiza un estudio sobre el tiempo de vida útil de un componente electrónico. A continuación se presenta la tabla de datos agrupados por intervalos para una muestra de 40 tiempos en horas de vida útil de los componentes electrónicos en estudio: Tiempo de vida útil (Horas) N° de componentes (fi) [500; 700> 6 [700; 900> 12 [900; 1100> 10 [1100; 1300> 8 [1300; 1500] 4 Total 40 Calcular e interpretar el coeficiente de asimetría correspondiente a los tiempos en horas de vida útil de la muestra de 40 componentes electrónicos. Coeficiente de asimetría de Pearson (Ak) Solución: 1. Completando la tabla de frecuencias: 2. Cálculo de las medidas estadísticas: Tiempo de vida útil (Horas) N° de componentes (fi) Marca de clase (Xi) Frecuencia acumulada (Fi) fi . Xi fi . (Xi - ) 2 [500; 700> 6 600 6 3600 821400 [700; 900> 12 800 18 180 346800 [900; 1100> 10 1000 28 250 9000 [1100; 1300> 8 1200 36 280 423200 [1300; 1500] 4 1500 40 180 1123600 Total 40 920 2724000 Media ( ) = 38800/40 = 970 Mediana (Me) = 900+200x(20-18)/10 = 940 Varianza (S2) = 2724000/(40-1) = 69846.15 Desviación estándar (S) = 69846.15 1/2 = 264.28 Nota: Para el Cálculo de la mediana (Me), se debe considerar la posición n/2 = 40/2 = 20 Caso: Componente electrónico Coeficiente de asimetría de Pearson (Ak) 3. Reemplazando en la fórmula de Asimetría: (x -Me) A =3 k s Ak = 3 x (970 – 940) / 264.28 Ak = 0.341 4. Interpretación: La distribución de los datos presenta una asimetría positiva. Caso: Componente electrónico Coeficiente de asimetría de Pearson (Ak) Distribución Platicúrtica • Si el grado de apuntamiento es menor que el de la distribución normal. Distribución Mesocúrtica • Si el grado de apuntamiento es igual que el de la distribución normal. Distribución Leptocúrtica • Si el grado de apuntamiento es mayor que el de la distribución normal. Estas medidas nos brindan información sobre el grado de deformación vertical de una distribución de frecuencias en comparación con la curva normal que le corresponde. Tipos de distribuciones según su grado de curtosis: Curtosis a) Si Ku < 0.263, la distribución es Platicúrtica. b) Si Ku = 0.263, la distribución es Mesocúrtica. c) Si Ku > 0.263, la distribución es Leptocúrtica. 75 25 u 90 10 (P -P ) K = 2(P -P ) Coeficiente de curtosis P10, P25, P75, P90: percentiles Caso: Casa prefabricada La resistencia es una característica importante de los materiales utilizados en casas prefabricadas. Cada uno de los 50 elementos de placa prefabricados se sometieron a prueba de esfuerzo severo y se registró el ancho máximo (mm) de las grietas resultantes. Los datos registrados para la muestra en estudio fue la siguiente: Ancho máximo de la grieta (mm) N° de elementos de placa (fi) [0.4; 0.5> 6 [0.5; 0.6> 14 [0.6; 0.7> 10 [0.7; 0.8> 9 [0.8; 0.9] 4 [0.9; 1] 7 Total 50 Calcular e interpretar el coeficiente de asimetría correspondiente a los anchos máximos (mm) de las grietas resultantes para la muestra de 50 elementos de placa prefabricados. Coeficiente de curtosis Solución: 1. Completando la tabla de frecuencias: 2. Cálculo de las medidas de posición: Ancho máximo de la grieta (mm) N° de elementos de placa (fi) Frecuencia acumulada (Fi) [0.4; 0.5> 6 6 [0.5; 0.6> 14 20 [0.6; 0.7> 10 30 [0.7; 0.8> 9 39 [0.8; 0.9] 4 43 [0.9; 1] 7 50 Total 50 Percentil Posición Fórmula Valor P75 37.5 = 0.7+0.1x(37.5-30)/9 0.78 P25 12.5 = 0.5+0.1x(12.5-6)/14 0.55 P90 45 = 0.9+0.1x(45-43)/7 0.93 P10 5 = 0.4+0.1x(5-0)/6 0.48 Caso: Casa prefabricada Coeficiente de curtosis 3. Reemplazando en la fórmula de curtosis: 4. Interpretación: Los datos presentan una distribución PLATICÚRTICA. Percentil Valor P75 0.78 P25 0.55 P90 0.93 P10 0.48 75 25 u 90 10 (P -P ) K = 2(P -P ) Ku = 0.255556 Caso: Casa prefabricada Coeficiente de curtosis ¿Qué hemos aprendido? CIERRE 1. ¿Qué es una medida de posición? 2. ¿Cuál es la diferencia entre asimetría positiva y negativa? 3. ¿Qué mide el coeficiente de curtosis? CIERRE
Compartir