Logo Studenta

Repaso para el Final de Estadística Respuestas

¡Este material tiene más páginas!

Vista previa del material en texto

Repaso para el Final de Estadística 2021.
1)- Determine cuáles de las afirmaciones siguientes son verdaderas, cuáles falsas y por qué:
● La Estadística es una ciencia que aplica métodos para coleccionar datos
estadísticos, analizarlos y hacer deducciones a partir de ellos.V
● Con las técnicas de muestreo , siempre se pueden obtener muestras ,que permiten
hacer inferencias acerca de las características de la población.F
● De la población argentina, las 10000 personas elegidas para responder a una
encuesta, constituyen necesariamente una muestra aleatoria.F
● Medir es comparar una magnitud con otra de su misma especie.V
2)- Analice las siguientes variables, identificando cuáles son cualitativas y cuáles
cuantitativas.
a)Número de hijos por familia. Cuantitativa
b)Cantidad de áreas afectadas por los incendios en una cierta época del año.
Cuantitativa
c)Tiempo requerido por un obrero para realizar una determinada tarea. Cuantitativa
d)Cantidad de combustible consumido por un vehículo. Cuantitativa
e)Flujo de tránsito en una ruta. Cuantitativa
f)Religión que profesan los habitantes de un país. Cualitativa
g) Caudal de río en las distintas épocas del año. Cuantitativa
h)Razas del ganado bovino. Cualitativa
3)-En base a la siguiente pregunta :¿qué información brinda ,en una tabla de frecuencias ,la
frecuencia relativa porcentual?, señale la opción CORRECTA y JUSTIFIQUE:
● El número de sujetos que hay por cada categoría o intervalo.
● La cantidad de sujetos en relación al total cuando éste es igual a 1.
● La cantidad de sujetos respecto al total por cada 100 sujetos. (X)
● El puntaje medio de cada intervalo.
● El tamaño que debe tener cada intervalo de clase.
4)-¿Cuál de las siguientes afirmaciones es INCORRECTA?. Justificar la respuesta.
● La MAD es una medida de dispersión más robusta que el rango.
● El rango se puede calcular con cualquier tipo de variables. (X)
● La media sólo se calcula en variables cuantitativas.
● La moda es la observación que se presenta con mayor frecuencia.
● La mediana es un índice adecuado cuando se encuentran valores extremos en una
distribución.
5)-¿Cuál es la opción correcta?.Justifica la elección.
A. El recorrido sólo toma en cuenta los valores centrales de la distribución.
B. La media es un punto de equilibrio de una distribución de puntajes. (X)
C. La mediana está afectada por los valores extremos de una distribución de puntajes.
D. La media es la medida de tendencia central más robusta y representativa.
E. La MAD es el promedio de desvíos respecto a la media.
F. La moda es la medida de dispersión más representativa de una muestra .
6)- Responder:
a)Qué significa que el valor de la desviación estándar, para un conjunto de
observaciones, esté muy próxima a cero?.
Los valores de la distribución están muy próximos entre sí y respecto de la
media.
b)¿Qué decisión se debiera tomar para poder explicar el comportamiento de una
muestra, de manera fiable, si el CV de la distribución correspondiente es igual al
69%?.
Si CV=69% > 20%, significa que hay mucha heterogeneidad entre los datos. En
consecuencia podría establecerse que la media no es representativa de los datos
que conforman dicha muestra.
c)Un grupo de 20 estudiantes tienen una altura promedio de 1,79 m. Si se incorpora
otro estudiante que mide 1,50m, ¿cuál es el promedio de los 21 estudiantes?.
𝟏, 𝟕𝟕𝟔 m
7)-En base a las afirmaciones:
A)Después de agrupar un conjunto de datos en cierto número de intervalos, la mediana se
encuentra necesariamente en el intervalo que tiene mayor número de observaciones.
B)La varianza es la raíz cuadrada de la desviación estándar correspondiente.
¿Cuál es la correcta de las siguientes?. Justifique su elección.
● A es verdadera y B es falsa.
● B es verdadera y A es falsa.
● A y B son falsas. (X)
● A y B son verdaderos.
8)-Marque con verdadero o falso según corresponda, dando razones de cada respuesta.
● Una distribución leptocúrtica es más aplanada que una mesocúrtica ya que el Cu <
2,7. F
● En una distribución asimétrica negativa la acumulación de puntajes está a la
izquierda. F
● Todo alumno que tenga un promedio general de 7 ha promocionado todas las
materias que ha rendido. F
● El coeficiente de variación es alto si excede el 20% y ,por lo tanto, la media es
representativa de los datos.F
● La media no siempre es la medida de resumen más representativa de una
distribución. V
9)-Determinar cuáles de las afirmaciones siguientes son verdaderas y cuáles falsas. Justificar
cada una de sus respuestas.
● Si para un conjunto de observaciones , el coeficiente de variación tiene un valor de
aproximadamente 68% significa que los datos son bastante homogéneos. F
● Si en un conjunto de valores referidos a los salarios de determinados empleados, el
coeficiente de asimetría es -1,9 , significa que hay una gran concentración en el grupo
de empleados con salarios menores. F
● El rango intercuartílico es una medida de dispersión que concentra el 50% de las
observaciones V
● La media es una medida de tendencia central donde la suma de las desviaciones de
cada valor ,respecto de dicha media, siempre es igual a cero. Esto es, en general :
∑ (𝒙𝒊 − )= 𝟎 V𝑥
10)-En una clase compuesta por veinte alumnos, se desea seleccionar una comisión
constituida por cuatro de ellos. ¿Cuál sería el número de comisiones posibles, en el
supuesto de que un alumno concreto debiera, obligatoriamente, formar parte de la
comisión?. La expresión que permite calcular el total de resultados es:
A) 20C4 B) 19C3 C)19V3 D)20V4 (B)
11)-Determine cuál es la afirmación que corresponde al concepto de espacio muestral:
● El número de veces que ocurre un evento en sucesivas repeticiones.
● El evento que resulta a partir de una variable aleatoria.
● El conjunto de todos los resultados posibles de un proceso aleatorio. (X)
● Una sucesión continua de eventos posibles.
● La probabilidad asociada a una variable aleatoria.
12)-Analice cuáles de las siguientes afirmaciones son verdaderas, cuáles falsas y por qué:
● Dados dos eventos A y B , la probabilidad de que ocurra A o B ,es siempre la suma :
P(A)+P(B). F
● Si P(A ∩B)=0, entonces Ay B son mutuamente excluyentes.V
● Dados dos eventos A y B , complementarios entre sí, entonces P(A)=1-P(B) V
● Dos eventos A y B cumplen siempre que: P(Ay B)=P(A).P(B).F
● La probabilidad de un evento aleatorio es un número mayor que cero y menor o igual
a 1. F
● Que dos eventos A y B sean dependientes significa que la posibilidad que ocurra A,
por ejemplo, imposibilita o anula la posibilidad que ocurra B. F
13)-Un aparato tiene dos componentes A y B. Los fallos en el aparato vienen motivados por
fallos en alguna de las componentes. Al cabo de 5 años, la componente A ha fallado en el
6% de los aparatos, y la componente B en el 8%.En el 4% de los aparatos han fallado las
dos componentes.
a)Los fallos de A y B, ¿son independientes?.
No
b)Si B ha fallado, ¿cuál es la probabilidad de que A haya fallado?
1/2
14)
opción B
15)-Analizar cuáles de los siguientes planteos son verdaderos o falsos. Justificar en cada
caso.
a)Si la media, mediana y moda difieren bastante entre sí, para un mismo conjunto de
observaciones, significa que el correspondiente coeficiente de asimetría se encuentra
entre -0,3 y 0,3 aproximadamente.
FALSO. Si el coeficiente de asimetría se encuentra entre -0,3 y 0,3, significa que
hay bastante simetría, o sea que esas medidas de centralización estarían muy
cercanas entre sí.
b) Si en un conjunto de valores referidos a los salarios de determinados empleados, el
coeficiente de asimetría es 1,5, significa que hay una gran concentración en el grupo
de empleados con salarios mayores.
FALSO. Que el valor del coeficiente de asimetría, sea 1,5, significa que hay
asimetría positiva. En consecuencia, hay un abultamiento de los datos hacia la
izquierda, lo que implica, que hay una gran concentración en el grupo de
empleados con salarios menores.
c) Si en un conjunto de observaciones, una vez ordenados los datos de menor a mayor,
el 75% de las observaciones es superiora 7,25 , entonces el valor del Percentil P75 es
7,25.
FALSO. En un conjunto de datos, una vez ordenados de menor a mayor, el
Percentil P75 = 7,25 indica que el 75% de las observaciones es inferior a 7,25.
d)En un experimento que consiste en arrojar consecutivamente, dos veces, una
moneda no cargada al aire, la probabilidad de que “salga al menos una vez cara” es
0,75.
VERDADERO. El espacio muestral es Ω={ (C,C), (C,X),(X,C),(X,X)} y A: el
evento “ que salga al menos una cara”, es A={(C,C), (C,X),(X,C)}. Luego
P(A)=3/4.
e) En un experimento que consiste en extraer una bolilla de una urna, la cual, contiene
10 bolillas: 3 verdes y 7 azules, se extraen sin reposición dos bolillas, una detrás de
otra. Entonces los eventos A: “ que salga una bolilla verde en la primera extracción” y
B: “que salga una bolilla azul en la segunda extracción” son independientes.
FALSO
16)-En base al siguiente gráfico, determine:
a)¿Qué significa la ubicación de las medidas de centralización?.
Significa que no hay simetría en la distribución de los datos, por cuanto, difieren entre sí.
b)En caso de haber asimetría, ¿cuál es el signo de la misma?.
Hay asimetría positiva ya que la media se encuentra a la derecha de la mediana.
c) ¿Por debajo de qué valor se encuentra el 50% de los datos?, ¿por qué?.
Por debajo de 26 euros, ya que el valor de la mediana es 26.
d) ¿Entre qué valores se encuentra el 50% de lo datos?. Justifique.
Entre 25 y 28. El cuartil Q3=28 indica que el 75% se encuentra por debajo de ese valor y
Q1=25 indica que el 25% se encuentra por debajo de 25. La diferencia de ambos porcentajes
encierra, desde luego, el 50%.
e)¿Cuál es el porcentaje que supera a 28 euros?.
Es el 25% porque el valor 28 corresponde al tercer cuartil , o sea, al percentil P75.
17)-El siguiente histograma corresponde a los puntajes finales de alumnos de un curso de
Estadística.
a) Hubo alguna calificación menor a 45 puntos?. No
b) ¿Qué porcentaje de alumnos obtuvo entre 30 y 70? 12/16x 100≅ 46,15 %
c) ¿Qué proporción de alumnos obtuvo más de 55 puntos ?. 24/26
d) ¿Qué proporción de alumnos obtuvo menos de 50 o más de 75 puntos?.10/26
e) Si se consideran desaprobados los alumnos que sacaron menos de 65 puntos,
1°.-¿cuál es la razón entre los desaprobados y los aprobados? 7/19
2°-¿cuál es la proporción de aprobados?. 19/29
18)-Sea X la variable aleatoria: “número de veces que apareció cara al arrojar una moneda
(no cargada) tres veces.¿Qué tipo de variable aleatoria es?, ¿por qué?.
Discreta porque toma valores naturales.
19)-Para una empresa de 10 empleados, se considera el evento: “concurrencia al trabajo, de
un empleado, en un día laborable “. Si la probabilidad de asistir al trabajo es, para cualquier
empleado, igual a 0,25, se pide:
a)Para cada empleado, el experimento o ensayo cuyos posibles resultados son : concurre al
trabajo en un día laborable o no concurre al trabajo en un día laborable :
● ¿qué nombre recibe?, ¿por qué?,
Es un experimento Bernoulli porque consiste en observar una sola vez la
ocurrencia del evento: “concurrencia al trabajo, de un empleado, en un día
laborable “. Siendo p: probabilidad de concurrir en un día laborable, o sea
p=0,25, resulta q = 0,75.
● ¿cuál es la distribución de la variable aleatoria?.𝑿~𝑩𝒆𝒓(𝟎, 𝟐𝟓)
b)Para los ensayos sobre los 10 empleados:
● ¿qué nombre recibe el modelo de probabilidad que se obtiene?,
Binomial, ya que al realizarse los ensayos sobre los 10 empleados, la variable
aleatoria X es la suma de 10 variables independientes de Bernoulli ( donde la
concurrencia de cualquier empleado es independiente de otro). Además, todas las
variables tienen el mismo parámetro p=0,25.
● ¿cuál es la variable aleatoria asociada al mismo?, ¿cuáles son sus valores?.
X= número de empleados, que concurren al trabajo, un día laborable. Sus
valores son: 0,1,2,3,4,5,6,7,8,9,10 .
20)-
C)
21)-Si la media de una distribución de probabilidad normal es 500 y la desviación estándar
es 10. Responda:
● ¿Entre qué par de valores está aproximadamente el 68% de las observaciones?.
● ¿Entre qué par de valores está aproximadamente el 95% de las observaciones?.
● ¿Entre qué par de valores está aproximadamente el 99% de las observaciones?.
22)-
(b)
23)-Determinar cuáles de las afirmaciones siguientes son verdaderas ,cuáles falsas y por qué.
Si se sabe que una población sigue una distribución normal ,con media µ y desviación
estándar σ, entonces la distribución muestral de la media muestral:
a)Seguirá también la distribución normal con muestras de cualquier tamaño y con
exactamente la misma media poblacional µ. V
b) El error estándar es directamente proporcional al tamaño de la muestra. F
c) Conforme disminuye el tamaño de la muestra, disminuye también la variación en
dicha distribución muestral de medias. F
24)-Completa para que cada afirmación sea correcta:
a)Una estimación puntual es un solo valor (del estadístico) que se usa para
.....estimar........ un valor poblacional (parámetro).
d)La diferencia entre estimación puntual e intervalar es ,solamente, que en la primera
se da un valor para estimar al parámetro mientras que en la segunda ,se da un
conjunto de valores obtenidos a partir de los datos muestrales en el que , podemos
establecer, va a contener el verdadero valor con cierta ......confianza............. asociada.
c) Que un estimador sea consistente significa que ,cuando n se hace suficientemente
…Grande…, éste se asemeja mucho al correspondiente parámetro.
d) Que un estimador insesgado sea eficiente significa que tiene la menor ..
varianza... posible.
d) Que un estimador sea ............Suficiente.............. significa que contiene la
suficiente cantidad de información de la distribución.
25)-Una hipótesis estadística es :
● Un supuesto sobre el comportamiento de uno o más constantes.
● Un supuesto sobre el comportamiento de uno o más estimadores.
● Un supuesto sobre el comportamiento de uno o más sucesos dados.
● Un supuesto sobre el comportamiento de uno o más elementos.
● Un supuesto sobre el comportamiento de uno o más parámetros. (X)
26)-Señalar cuál es la afirmación INCORRECTA dando razones de su respuesta.
a)Para un test bilateral con un nivel de significación 𝛼 ,la región de aceptación o no
rechazo, se encuentra entre los dos valores críticos.
b)Si la potencia de un test es 0,90 entonces el valor del error de tipo 2 (β ) es 0,10.
c)Con un nivel de significación pequeño , entonces la probabilidad de rechazar una
hipótesis nula cuando ésta es verdadera, disminuye.
d)El p-valor es una medida de credibilidad, para rechazar o no la hipótesis nula , que
puede tomar cualquier valor real.
(D) de probabilidad
27)-Supongamos que se quiere realizar una Prueba de hipótesis para la media poblacional y
que responde a la siguiente gráfica:
Determinar si las siguientes afirmaciones son verdaderas o falsas, justificando su
respuesta.Entonces :
● Si la variable pivotal toma el valor de -2,54, se rechaza H0 al 5%.
VERDADERO. Porque -2,54 < -1,96, lo que significa, que el valor del estadístico
de prueba cae en una de las zonas de rechazo
● Si el p – valor es menor que 0,001, se rechaza la Hipótesis Nula con una muy fuerte
evidencia que la misma es cierta.
FALSO. Se rechaza la Hipótesis Nula pero con una evidencia extremadamente
fuerte que la misma no es cierta.
● Es un prueba bilateral para la media muestral.
FALSO. Es una prueba bilateral para la media poblacional.
● La probabilidad de error de Tipo I es 0,025.
FALSO. La probabilidad es 0,05 ya que hay dos regiones de rechazo.
28)- Se tienen dos variables : X= contenido de humus x (kg/m2) e Y= contenido de nitrógeno
(kg/m2) delsuelo de cierta zona geográfica.Supongamos que para un grupo de n valores de la
variable X (independiente), se encuentran los correspondientes valores de Y( dependiente), y
se obtiene un diagrama de dispersión como el siguiente:
Determinar si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta.
Entonces:
● La recta de mínimos cuadrados correspondiente a dicho diagrama de dispersión,tiene
pendiente positiva.
VERDADERO. A medida que aumentan los valores de X, también lo hacen, los
correspondientes de Y.
● El valor estimado de nitrógeno, cuando el contenido de humus es aproximadamente
1,5 kg/m2 es 0,25 kg/m2
FALSO. El valor de nitrógeno para 1,5 kg/m2 de humus, que se observa en la
recta, es alrededor de 0,4 kg/m2 .
● En el caso que el valor de la pendiente sea 0,20/ 9 significa que el contenido de
humus aumenta 0,20 kg/m2 por cada incremento de 9 kg/m2 del contenido de
nitrógeno.
FALSO. Significa que el contenido de nitrógeno aumenta 0,20 kg/m2 por cada
incremento de 9 kg/m2 del contenido de humus.
29)-Analizar cuáles de las siguientes afirmaciones son verdaderas y cuáles falsas, dando
razones de cada respuesta:
a) En una localidad de 100000 habitantes se observó que , en un grupo de 100
individuos la probabilidad de contraer cierta enfermedad es p=0,02.Entonces la
variable aleatoria correspondiente tiene distribución binomial con parámetros p=0.02
y n=100
VERDADERO. Si cada persona tiene una probabilidad p=0,02 de contraer la
enfermedad, la variable aleatoria X: “número de personas que contraen la
enfermedad”, tiene distribución Binomial de parámetros p=0,02 y n = 100 .
b)Si una variable aleatoria , que sigue una distribución de Poisson, cuenta el número
de imperfecciones en una tela de género donde la media es de 3 imperfecciones por
m2 entonces, en 0,5m2, el número promedio de imperfecciones será de 1,25
FALSO. En 1 m2 el promedio de imperfecciones es 3, entonces en 0,5 m2 el
número será 1,5.
c)Si en la siguiente situación gráfica x1=-1,2 y x2=0,34 entonces el área sombreada es
aproximadamente el 48%del área total
FALSO.El área está dada por 𝑃(−1,2 < 𝑥 < 0,34)=1- [P(x< - 1,2) +P(x >0,34)] = 1 −
[𝑃(𝑥 > 1,2) + 𝑃(𝑥 > 0,34) ] = 1 − 0,1151 − 0,3669 = 0,518
d)Si la media de una distribución de probabilidad normal es µ y la desviación estándar
es σ el 68% de las observaciones se encuentran entre µ-σ y µ+σ.
VERDADERO
30)-La probabilidad de que un valor elegido al azar de una determinada población, sea mayor
o igual que la mediana es igual a : a) 0,25 b)0,5 c) 1 d)no se puede determinar
(B)
31)-Con relación a las características principales del coeficiente de correlación de Pearson
(rxy) , ¿Cuál de las siguientes afirmaciones es incorrecta?:
● Si el signo es positivo, significa que las variables en cuestión tienden a variar en el
mismo sentido ysi el signo es negativo ,quiere decir que las características varían en
sentido contrario.
● -1 rxy 1 .≤ ≤
● El que en un caso se obtenga un coeficiente de correlación bajo significa que no existe
correlación alguna entre las variables.(X)
32)-Determinar la verdad o falsedad de las afirmaciones siguientes dando razones de cada
respuesta:
a)En una distribución Normal de media µ y desviación 𝜎, aproximadamente el 99% de
las observaciones de esa población, se encuentra entre µ-2σ y µ+2σ.
FALSO
b)Si X es una variable aleatoria tal que X~N(2 ; 1,5) entonces si se toman muestras
aleatorias de la población correspondiente, de tamaño 49, la variable aleatoria sigue𝑥
una distribución Normal de media µ =2 y =
𝑥
σ
𝑥
1,5
7
VERDADERO
c) En cierta población la prevalencia de alergia es de 20%. Si selecciona una muestra
aleatoria de tamaño n=10.Entonces la probabilidad de que no se halle ningún alérgico
es:0,8 10
VERDADERO
d) Se quiere realizar una prueba de hipótesis para la media poblacional, respecto de la
cual, se tiene por investigaciones anteriores que se comporta como una normal de
media µ=25. Se extrae una muestra de tamaño 9, para la cual, se registra una media
𝑥 ̅= 22.5 y una desviación típica de 1,5. Entonces el estadístico de prueba
es. : ~𝑁(0,1)�̅�−25
1,5/ 𝑛
FALSO. Cuando se reemplaza σ por el s de la muestra (porque se desconoce
dicho parámetro), el estadístico sigue una distribución de Student con n-1= 8
grados de libertad
e)En un análisis de regresión lineal, si el coeficiente de determinación es cercano al
0%, entonces podemos concluir que no existe ningún tipo de relación entre las
variables
FALSO. Que no haya relación lineal no significa que pueda existir otro tipo de
relación entre las variables involucradas
33)-Completa el siguiente cuadro