Logo Studenta

Taller_1_PEF

¡Estudia con miles de materiales!

Vista previa del material en texto

Universidad Nacional de Colombia-Bogotá
Facultad de Ciencias
Probabilidad y Estad́ıstica Fundamental
Taller 1 2019-II
1. El histograma de frecuencia relativa que aparece a continuación se construyó a partir de datos
obtenidos de una muestra aleatoria de 25 familias. A cada una se le preguntó el número de
cuartos de galón de leche que hab́ıan comprado la semana previa.
a) Use este histograma de frecuencia relativa para determinar el número de cuartos de leche
comprados por la proporción más grande de las 25 familias. La categoŕıa asociada con la
frecuencia relativa más grande se denomina categoŕıa modal.
b) ¿Qué proporción de las 25 familias compró más de 2 cuartos de leche?
c) ¿Qué proporción compró más de 0 pero menos de 5 cuartos?
d) Encuentre el rango intercuart́ılico para el conjunto de datos.
2. La regla emṕırica dice que para una distribución de mediciones que sea aproximadamente normal
(forma de campana), se deduce que el intervalo con puntos extremos µ ± σ contiene aproxima-
damente 68 % de las mediciones; µ±2σ contiene aproximadamente 95 % de las mediciones y µ±3σ
contiene casi todas las mediciones. A partir de la definición, resuelva:
Los ritmos de respiración en reposo para estudiantes en edad universitaria están normalmente
distribuidos, en forma aproximada, con una media de 12 y desviación estándar de 2.3 respira-
ciones por minuto. ¿Qué fracción de todos los estudiantes en edad universitaria tienen ritmos de
respiración en los intervalos siguientes?
1
a) 9.7 a 14.3 respiraciones por minuto
b) 7.4 a 16.6 respiraciones por minuto
c) 9.7 a 16.6 respiraciones por minuto
3. El teorema de Chebyshev afirma que dado un número k mayor o igual a 1 y un conjunto de n
mediciones, al menos[1 − (1/k2)] de las mediciones estarán dentro de k desviaciones estándar de
su media.
Considere una población formada por el número de profesores por colegio en pequeños colegios
de dos años. Suponga que el número de profesores por colegio tiene un promedio µ = 175 y una
desviación estándar σ = 15.
a) Use el teorema de Chebyshev para hacer un enunciado acerca del porcentaje de colegios que
tienen entre 145 y 205 profesores.
b) Suponga que la población está normalmente distribuida. ¿Qué fracción de colegios tiene
más de 190 profesores?
4. En las temporadas que siguieron a la de 2001 en la que implantó récord, Barry Bonds conectó
46, 45, 45, 5 y 26 cuadrangulares, respectivamente. A continuación aparecen dos gráficas de caja,
una de los cuadrangulares de Bond en 2001 y una segunda que inclúıa los años 2002-2006.
Las estad́ısticas empleadas para construir estas gráficas de caja se dan en la tabla.
Años Min Q1 Mediana Q3 RI Max n
2001 16 25,0 34,0 41,5 16,5 73 16
2006 5 25,0 34,00 45,0 20,0 73 21
a) Calcule los ĺımites superiores para estas dos gráficas de caja.
b) ¿Puede usted explicar por qué el número récord de cuadrangulares es un resultado at́ıpico
en la gráfica de caja de 2001, pero no en la gráfica de caja de 2006?
5. El conjunto de datos que se encuentra en el aula googleplaystore y se adjunta, contiene informa-
ción de algunas Apps de arte y diseño. Las variables dadas incluyen puntuación, tamaño, número
de instalaciones entre otras. Considere ahora la variable Rating, que es la calificación obtenida a
partir de la opinión de los usuarios.
a) Identifique el tipo de variable que es Rating (cualitativa, cuantitativa discreta ó cuantitativa
continua) y la escala de medición correspondiente (nominal, ordinal, intervalo o razón).
2
b) Trace una gráfica que usted considere adecuada y analice preliminarmente la tendencia,
dispersión y forma de los datos. (Que no sea un diagrama de caja)
c) Encuentre mediante comandos en R e interprete algunas medidas descriptivas de centro,
localización, dispersión y forma (cuartiles inferior y superior, percentiles 10, 25, 50, 75 y 95
de la distribución, media, mediana, desviación estándar,etc)
d) Construya y analice una gráfica de caja (Boxplot), comparando la calificación de la App
con respecto al grupo de edad objetivo (dado en la variable Content).
Ayuda (funciones en R) : mean(), median(), min(), max(), range(), IQR(), quantile(), box-
plot().
3
Solución
1. a) La proporción más grande son las familias que compraron 2 cuartos de leche, por tanto
0,36 ∗ 25 = 9 y el número de cuartos de leche comprados por las 9 familias es 18.
b)
(0,2 ∗ 25) + (0,12 ∗ 25) + (0,04 ∗ 25) = 9
Aśı la proporción de familias que compró más de 2 cuartos de leche es 925 .
c)
(0,2 ∗ 25) + (0,36 ∗ 25) + (0,2 ∗ 25) + (0,12 ∗ 25) = 22
Aśı la proporción de familias que compró más de 0 cuartos pero menos de 5 cuartos de leche
es 2225 .
d) El rango intercuantilico es (1, 3).
2. a) 68 %
b) 95 %
c) 81,5 %
3. a) Al menos el 75 % de los colegios tienen entre 145 y 205 profesores.
b) Dado que µ+σ = 175+15 = 190, se tiene que el 16 % de colegios tiene más de 190 profesores.
4. a) Para el primer diagrama de caja se tiene
IQR = 16,5
LS = 41,5 + 1,5 ∗ 16,5 = 66,25
Y para el segundo diagrama de caja se tiene
IQR = 20
LS = 45 + 1,5 ∗ 20 = 75
b) Es un dato at́ıpico para el año 2001 porque el ĺımite superior es menor que para los otros
años, esto debido al IQR y Q3.
5. a) Rating es una variable cuantitativa de escala intervalo.
b) datos¡-read.csv(”googleplaystore.csv”,sep=”;”)
Puntaje¡- datos$Rating
hist(Puntaje)
c) Centro, localización y dispersión
summary(Puntaje)
range(Puntaje)
sd(Puntaje)
Forma: asimetŕıa install.packages(.e1071”) ; library(e1071) skewness(Puntaje)
d) boxplot(Puntaje datos$Content)
4

Continuar navegando

Materiales relacionados

52 pag.
Matematica 4

User badge image

Sofia Benitez

118 pag.
estadística probabilidad 1

SIN SIGLA

User badge image

YENNY CAROLINA RODRIGUEZ LAMPREA

15 pag.
Que son los Percentilos - agus luci

User badge image

Desafío COL y ARG Veintitrés