Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Nacional de Colombia-Bogotá Facultad de Ciencias Probabilidad y Estad́ıstica Fundamental Taller 1 2019-II 1. El histograma de frecuencia relativa que aparece a continuación se construyó a partir de datos obtenidos de una muestra aleatoria de 25 familias. A cada una se le preguntó el número de cuartos de galón de leche que hab́ıan comprado la semana previa. a) Use este histograma de frecuencia relativa para determinar el número de cuartos de leche comprados por la proporción más grande de las 25 familias. La categoŕıa asociada con la frecuencia relativa más grande se denomina categoŕıa modal. b) ¿Qué proporción de las 25 familias compró más de 2 cuartos de leche? c) ¿Qué proporción compró más de 0 pero menos de 5 cuartos? d) Encuentre el rango intercuart́ılico para el conjunto de datos. 2. La regla emṕırica dice que para una distribución de mediciones que sea aproximadamente normal (forma de campana), se deduce que el intervalo con puntos extremos µ ± σ contiene aproxima- damente 68 % de las mediciones; µ±2σ contiene aproximadamente 95 % de las mediciones y µ±3σ contiene casi todas las mediciones. A partir de la definición, resuelva: Los ritmos de respiración en reposo para estudiantes en edad universitaria están normalmente distribuidos, en forma aproximada, con una media de 12 y desviación estándar de 2.3 respira- ciones por minuto. ¿Qué fracción de todos los estudiantes en edad universitaria tienen ritmos de respiración en los intervalos siguientes? 1 a) 9.7 a 14.3 respiraciones por minuto b) 7.4 a 16.6 respiraciones por minuto c) 9.7 a 16.6 respiraciones por minuto 3. El teorema de Chebyshev afirma que dado un número k mayor o igual a 1 y un conjunto de n mediciones, al menos[1 − (1/k2)] de las mediciones estarán dentro de k desviaciones estándar de su media. Considere una población formada por el número de profesores por colegio en pequeños colegios de dos años. Suponga que el número de profesores por colegio tiene un promedio µ = 175 y una desviación estándar σ = 15. a) Use el teorema de Chebyshev para hacer un enunciado acerca del porcentaje de colegios que tienen entre 145 y 205 profesores. b) Suponga que la población está normalmente distribuida. ¿Qué fracción de colegios tiene más de 190 profesores? 4. En las temporadas que siguieron a la de 2001 en la que implantó récord, Barry Bonds conectó 46, 45, 45, 5 y 26 cuadrangulares, respectivamente. A continuación aparecen dos gráficas de caja, una de los cuadrangulares de Bond en 2001 y una segunda que inclúıa los años 2002-2006. Las estad́ısticas empleadas para construir estas gráficas de caja se dan en la tabla. Años Min Q1 Mediana Q3 RI Max n 2001 16 25,0 34,0 41,5 16,5 73 16 2006 5 25,0 34,00 45,0 20,0 73 21 a) Calcule los ĺımites superiores para estas dos gráficas de caja. b) ¿Puede usted explicar por qué el número récord de cuadrangulares es un resultado at́ıpico en la gráfica de caja de 2001, pero no en la gráfica de caja de 2006? 5. El conjunto de datos que se encuentra en el aula googleplaystore y se adjunta, contiene informa- ción de algunas Apps de arte y diseño. Las variables dadas incluyen puntuación, tamaño, número de instalaciones entre otras. Considere ahora la variable Rating, que es la calificación obtenida a partir de la opinión de los usuarios. a) Identifique el tipo de variable que es Rating (cualitativa, cuantitativa discreta ó cuantitativa continua) y la escala de medición correspondiente (nominal, ordinal, intervalo o razón). 2 b) Trace una gráfica que usted considere adecuada y analice preliminarmente la tendencia, dispersión y forma de los datos. (Que no sea un diagrama de caja) c) Encuentre mediante comandos en R e interprete algunas medidas descriptivas de centro, localización, dispersión y forma (cuartiles inferior y superior, percentiles 10, 25, 50, 75 y 95 de la distribución, media, mediana, desviación estándar,etc) d) Construya y analice una gráfica de caja (Boxplot), comparando la calificación de la App con respecto al grupo de edad objetivo (dado en la variable Content). Ayuda (funciones en R) : mean(), median(), min(), max(), range(), IQR(), quantile(), box- plot(). 3 Solución 1. a) La proporción más grande son las familias que compraron 2 cuartos de leche, por tanto 0,36 ∗ 25 = 9 y el número de cuartos de leche comprados por las 9 familias es 18. b) (0,2 ∗ 25) + (0,12 ∗ 25) + (0,04 ∗ 25) = 9 Aśı la proporción de familias que compró más de 2 cuartos de leche es 925 . c) (0,2 ∗ 25) + (0,36 ∗ 25) + (0,2 ∗ 25) + (0,12 ∗ 25) = 22 Aśı la proporción de familias que compró más de 0 cuartos pero menos de 5 cuartos de leche es 2225 . d) El rango intercuantilico es (1, 3). 2. a) 68 % b) 95 % c) 81,5 % 3. a) Al menos el 75 % de los colegios tienen entre 145 y 205 profesores. b) Dado que µ+σ = 175+15 = 190, se tiene que el 16 % de colegios tiene más de 190 profesores. 4. a) Para el primer diagrama de caja se tiene IQR = 16,5 LS = 41,5 + 1,5 ∗ 16,5 = 66,25 Y para el segundo diagrama de caja se tiene IQR = 20 LS = 45 + 1,5 ∗ 20 = 75 b) Es un dato at́ıpico para el año 2001 porque el ĺımite superior es menor que para los otros años, esto debido al IQR y Q3. 5. a) Rating es una variable cuantitativa de escala intervalo. b) datos¡-read.csv(”googleplaystore.csv”,sep=”;”) Puntaje¡- datos$Rating hist(Puntaje) c) Centro, localización y dispersión summary(Puntaje) range(Puntaje) sd(Puntaje) Forma: asimetŕıa install.packages(.e1071”) ; library(e1071) skewness(Puntaje) d) boxplot(Puntaje datos$Content) 4
Compartir