Logo Studenta

__Mate V - 2 Parcial - Preguntero Completo!

¡Este material tiene más páginas!

Vista previa del material en texto

1 
 
 4.1 ¿Cuál de las siguientes es una de las condiciones que debe verificarse para aplicar un test de bondad 
de ajuste? Todas las casillas observadas tienen que tener al menos 5 observaciones. 
Por hipótesis del test respectivo. 
4.1 en una prueba de bondad de ajuste En qué valores de la distribución del estadístico de prueba se 
ubica la zona de rechazo de Ho? en los valores más altos. 
4.1 Qué valores puedo asumir el estadístico de prueba de un test de bondad de ajuste? valores no 
negativos. 
4.1 Cuál es el concepto de prueba de bondad de ajuste? prueba estadística que determina si existe una 
diferencia significativa entre la distribución de frecuencias observadas y una distribución teórica de 
probabilidad que supuestamente describiría la distribución observada. 
4.1 el test de bondad de ajuste se diferencia de acuerdo a la distribución que se supone que tiene la 
variable analizada. Falso 
 el test genérico para cualquier distribución teórica conocida o ad hoc. 
4.1 qué sucede cuando los números de los grados libertad son muy pequeños? cuando los números de 
los grados de libertad son muy pequeños, la distribución chi cuadrado muestra un fuerte sesgo hacia la 
derecha. caso típico para 5 grados de libertad. 
 
 4.1.1 cuál es la definición de frecuencias esperadas? las que esperamos ver en una tabla de contingencia 
o de distribución de frecuencia, si la hipótesis nula es verdadera 
4.1.1 el método de mínimos cuadrados a Qué valores determina para reducir al mínimo la suma de las 
diferencias al cuadrado de la línea de predicción? los valores b0 (intersección de la muestra con el eje y) ; 
b1 (producto de la muestra). 
4.1.2 ¿Qué sucede cuando crece el número de grados de libertad? La curva rápidamente se torna más 
simétrica hasta que el número alcanza valores altos. 
Punto en el cual esta distribución puede ser aproximada por la normal. 
4.1.2 Cuál es la ecuación para calcular los grados de libertad tabla de contingencia? número de grados de 
libertad = ( número de renglones - 1) ( número de columna - 1) 
Para utilizar la prueba de chi cuadrado es necesario calcular el número de grados Libertad en la tabla de 
contingencias aplicando la ecuación usando n - 1 grados de libertad haciendo que n sea igual al tamaño de la 
muestra. 
4.1.2 ¿Cuántos grados de libertad tiene el estadístico del test de bondad de ajuste? (donde n = cantidad 
de casos de muestra; k = cantidad de valores de la variable considerados; r = cantidad de filas; c = cantidad 
de columnas) k-1. 
Se pierde un grado de libertad que estará determinado por el resto de los valores muéstrales. 
4.2 una tabla de contingencia. Seleccione las cuatro respuestas correctas: 
 permite analizar la asociación entre 2 variables cualitativas 
 entre variables categóricas se asocia a un estadístico chi cuadrado. 
 es una organización de datos de doble entrada. 
 en sus bordes contienen las frecuencias marginales. 
no va: permite analizar la relación lineal entre 3 o más variables cuantitativas 
 
Cesar
Resaltado
Cesar
Resaltado
Cesar
Resaltado
Cesar
Resaltado
 2 
 
4.2 La tabla de contingencia para un estudio de satisfacción de una empresa obtiene los siguientes 
resultados: la frecuencia para cada combinación de renglón está dado por x1= número de elementos de 
interés en el grupo 1 = 163 y x2 = número de elementos de interés en el grupo 2 = 154, y la columna está 
dada por n1 – x1 = número de elementos que no son de interés en el grupo 1 = 64 y n2 – x2 = número de 
elementos que no son de interés en el grupo 2. ¿Cuáles son los totales por cada renglón y por cada 
columna? Seleccione 4 respuestas correctas. 
 x = x1 + x2, número total de elementos de interés = 317 
 n – x = (n1 – x1) + (n2 – x2), número total de elementos que no son de interés = 172 
 n1 = tamaño de muestra total en el grupo 1 = 227 
 n2 = tamaño de muestra total en el grupo 2 = 262 
todas menos FO – Fe= frecuencia observada menos frecuencia esperada= 241 
4.2 en el caso de calcular la frecuencia esperada en cualquier celda, si la hipótesis nula es verdadera 
Cómo será la proporción de elementos de interés en las dos poblaciones? los elementos de interés en las 
dos poblaciones será la misma. 
 4.2 ¿En una prueba de independencia cuántos factores de interés existen? En una prueba de 
independencia existen dos factores de interés. 
4.2 Cómo son los grados de libertad en la tabla de contingencia? son iguales a ( número de reglones - x 1) 
multiplicado por ( número de columnas - 1) 
4.2 Cómo está constituido una tabla de contingencia? una tabla de contingencia está constituida por 
reglones y columnas. 
4.2 la tabla de contingencia constituida por dos renglones y dos columnas como se denomina? tabla de 
contingencia de 2 x 2 
Donde cada reglón corresponde a un nivel de una variable y las partes del cuerpo la tabla son frecuencias. 
4.2 consiste en comprobar si dos características cualitativas están relacionadas entre Sí a qué tipo de 
pruebas se refiere? test de independencia. 
4.2 el test de Independencia considera si dos variables categóricas están relacionadas o no. verdadero. 
4.2 un fondo de contingencia de dos factores presenta la frecuencia con la que ocurren elemento de 
interés para cada grupo. La frecuencia para cada combinación de reglón está dada por x1= número de 
elementos del grupo 1 y x2= número de elementos de interés en el grupo 2, y la columna está dada por 
n1 - x1 = número de elementos que no son de interés de grupo 1 y n 2 - x2 =número de elementos que 
no son de interés en el grupo 2 . Cuáles son los totales de los renglones y columnas? seleccione 4 
correctas. 
 x = x1 + x2, número total de elementos de interés. 
 n - x = (n1 - x 1 ) + ( n2 - x2), número total de elementos que no son de interés. 
 n1= tamaño de muestra total en el grupo 1 
 n 2 =tamaño de muestra total en el grupo 2 
 
 4.2 cuando se busca comparar los conteos de respuestas categóricas entre dos grupos 
independientes,que se puede construir? seleccione las tres respuestas correctas: una tabla, de 
contingencia, de dos factores. 
no va de frecuencias. 
Cesar
Resaltado
Cesar
Resaltado
 3 
 
4.2 en una prueba de Independencia. Qué valores de la distribución del estadístico de prueba indican 
que la evidencia muestral da cuenta de cierta asociación de las variables? en los valores más altos. 
4.2 la tabla de contingencia de dos factores presenta la frecuencia con la que ocurren .Qué tipo de 
elementos? seleccione 2 respuestas correctas: elementos de interés y elementos que no son de interés. 
4.2 en la prueba de chi cuadrada para la diferencia entre dos proporciones, es el procedimiento de 
prueba de hipótesis utiliza un estadístico de prueba que se aproxima por medio de que distribución? Chi 
cuadrado 
 Se emplea para probar varias hipótesis sobre las varianzas, proporciones y bondad de ajuste. 
4.2 para probar la hipótesis nula de que no existe diferencia entre las dos proporciones poblacionales 
contra la hipótesis alternativa de que las dos proporciones poblacionales son diferentes, que estadístico 
de prueba usted debe utilizar? chi cuadrado 
 4.2 el estadístico de prueba chi cuadrado para diferencia entre dos proporciones que tipo de solución 
tiene aproximadamente? distribución chi cuadrado. 
4.2 A que igual estadístico de prueba de chi cuadrado? es igual a la diferencia al cuadrado entre las 
frecuencias observadas y esperadas , divididas entre frecuencia esperada en cada celda de la tabla, sumada 
en todas las celdas de la tabla. 
4.2 En el caso de calcular la frecuencia esperada en cualquier celda, si la hipótesis nula es verdadera, 
como será la proporción de elementos de interés en las dos pobaciones? Los elementos de interés en las 
dos poblaciones será la misma 
4.2 para probar la hipótesis nula de que no existe diferencia entre las dos proporciones poblacionales 
contra la hipótesis alternativa de que las dos proporcionespoblacionales son diferentes. Qué ecuación 
usted debe utilizar? 
 
 es la diferencia al cuadrado entre las frecuencias observadas y esperadas divididas entre frecuencia esperada en cada 
celda de la tabla sumada en todas las celdas de la tabla. 
4.2 utilizando la fórmula de la proporción general estimada para los grupos y teniendo los siguientes 
datos x 1 = 163; x 2 =154 ; n1= 227 ; n 2 = 262 Cuál es el valor? 0,6483 
 
4.2 Cuál es la fórmula para calcular la proporción general estimada para dos grupos 
 
4.2 Cuál es el estadístico que representa la proporción general estimada de los elementos de interés 
para los dos grupos combinados ? (cálculo de la proporción general estimada para dos grupos 
combinados) 
 
4.2.1 Cuál es la fórmula para calcular la frecuencia esperada? la frecuencia esperada de una celda es el 
producto su total de reglón por el total de columna dividido entre el tamaño total de la muestra. 
Cesar
Resaltado
 4 
 
4.2.1 Calcule la frecuencia esperada, teniendo en cuenta los siguientes datos: total renglón = 67; total 
columna = 88; tamaño total de muestra = 187 31,53. 
Se utiliza para resolver la frecuencia esperada que es el producto de su total de renglón por el total de columna, divido 
entre el tamaño total de la muestra. 
4.2.1 el estadístico de prueba chi cuadrado tiene aproximadamente una distribución chi cuadrado 
calcule los grados de libertad teniendo en cuenta los siguientes datos: número de renglones =4 número 
de columna =3. 
6 
 Se resuelve la siguiente manera grados de libertad= (r-1)*(c-1)=6 
5.1 cuál de los siguientes aspectos es crítico si se realizan comparaciones de dos en dos para sacar 
conclusiones referidas a la diferencia de más de dos medias entre sí? al hacer un mayor número de 
contraste aumenta el error de tipo 1 
Si se realizan todas las comparaciones posibles de a dos medias el error tipo 1 sería muy grande para la hipótesis al 
menos una media es diferente. 
5.1 la ANOVA sirve para comparar: las medias de 3 o más poblaciones. 
5.1 por qué se opta por aplicar la prueba anova y no comparaciones de dos en dos de las respectivas 
medias poblacionales? para evitar el mayor esfuerzo computacional y realizar un único conjunto de 
cálculos. 
5.1 en un experimento se compararon tres métodos para capacitar empleados nuevos de una empresa 
de servicios; para evaluar los resultados de cada uno, se administró una prueba 50 ítems relacionados 
con la tarea desarrollar, a cada uno de 24 ingresantes repartidos en grupos de 8 personas cada uno. Cuál 
de las siguientes puede ser una variable de respuesta en este estudio? Cantidad promedio de respuestas 
correctas. 
5.1 en un experimento se compararon tres métodos para capacitar empleados nuevos de una empresa 
de servicios; para evaluar los resultados de cada uno, se administró una prueba 50 ítems relacionados 
con la tarea desarrollar, a cada uno de 24 ingresantes repartidos en grupos de 8 personas cada uno. Que 
tipo de prueba recomienda realizar? ANOVA 
 
5.1 cuál de los siguientes aspectos es crítico si se realizaran comparaciones de dos en dos, para sacar 
conclusiones referidas a la diferencia de más de dos medias entre si? al hacer un mayor número de 
contrastes aumenta el error de tipo I 
5.1 para utilizar la prueba F del análisis de varianza. Qué supuestos se deben cumplir acerca la 
población? Seleccione las cuatro respuestas correctas. Aleatoriedad, Independencia, normalidad y 
homogeneidad de la varianza 
No va: confianza. 
5.1 Cuáles las siguientes son hipótesis alternativas válidas de una prueba anova seleccione las tres 
respuestas correctas 
HA: no todas las medias poblacionales son iguales. 
HA: al menos una de las medias poblacionales es diferente. 
HA: una o más de las medias poblacionales es diferente. 
no van: todas las medias poblacionales son diferentes entre sí y todas las medias poblacionales son iguales 
Cesar
Resaltado
Cesar
Resaltado
 5 
 
5.1 indicar Cuáles las siguientes afirmaciones son correctas en el caso de una anova seleccione las cuatro 
respuestas correctas. 
 Cuanto más alto sea F, mayor la evidencia de que difieren entre sí las medidas de las poblaciones. 
 Un valor de F suficientemente elevado indica que la variabilidad se debe principalmente al grupo al 
que fueron asignadas las observaciones. 
 Se rechaza la Ho si el valor de F es suficientemente elevado. 
 lo que significa que las medias de la variable dependiente difieren o varían mucho entre los grupos 
de la variable independiente. 
5.1.1 En la ANOVA pueden distinguirse. Seleccione 4 respuestas correctas 
 La variación dentro 
 La variación total 
 La variación entre 
 La media global 
5.1.1 Cómo está representada la variación total en el análisis de varianza de un factor? la variación total 
está representada por la suma de cuadrados totales. 
 5.1 2 Cómo está representada la variación entre grupos en el análisis de varianza de un factor? la 
variación entre grupos está representada por la suma de cuadrados entre grupos. 
 5.1.3 Cuántos grados libertad corresponde a cada varianza? Dentro: n-k 
 del total de grado libertad de la muestra se pierde uno por cada media muestral, calculada en cada uno de los niveles 
del tratamiento. 
5.1.4 si la hipótesis nula es verdadera y no hay diferencia entre las c medias grupales los tres cuadrados 
medios (o varianzas) CME (cuadrado medio entre), CMO (cuadrado medio dentro) y CMT (cuadrado 
medio total), proporcionan estimaciones de la varianza total en los datos. Verdadero. 
Aunque se desee comparar las medias de los grupos para determinar si existe una diferencia entre ellos el nombre de 
ANOVA surge del hecho de que se están comparando varianzas. De esta manera se somete la prueba de hipótesis nula. 
5.1.4 En un experimento de compararon tres métodos para capacitar a empleados nuevos de una empresa 
de servicios; para evaluar los resultados de cada uno se (…) una prueba 50 ítems relacionados con la tarea 
a desarrollar, a cada uno de los 24 integrantes repartidos en grupos de 8 personas cada uno. ¿Qué hipótesis 
es relevante contrastar? Ho: las medias de respuestas correctas para los tres métodos son iguales. 
Por la especificación de la prueba ANOVA de un factor. 
5.1.5 Cuál es el estadístico de prueba F para probar la razón de dos varianzas? es igual a la varianza de la 
muestra 1( la varianza muestral más grande) dividida la varianza de la muestra 2 (la varianza muestral más 
pequeña). 
5.1.5 Cómo se calcula el estadístico de prueba FESTAD del análisis de varianza de un factor? 
 
 El estadístico de prueba FESTAD del ANOVA de un factor como el cociente entre el CME (cuadrado medio entre) 
y CMD (cuadrado medio dentro). 
5.1.6 el procedimiento de Tukey-kramer permite hacer comparaciones simultáneas entre todos los pares 
de grupos: verdadero. 
 este procedimiento de comparaciones múltiples se usa para el anova de un factor con la finalidad de determinar cuál 
de las medias c son significativamente diferentes. 
Cesar
Resaltado
Cesar
Resaltado
 6 
 
 5.3.1 ¿Cómo está representada la variación dentro de los grupos en el análisis de varianza de un factor? 
La variación dentro de los grupos está representada por la suma de cuadrados dentro de los grupos. 
Mide la diferencia entre cada valor y la media de su propio grupo y suma los cuadrados de esas diferencias en todos los 
grupos. 
6.1 ¿Cuál de las siguientes actividades permite mejorar la precisión de la estimación de una regresión 
lineal? Aumentar el tamaño de la muestra. 
6.1 ¿Qué es el error estándar de la estimación? Es la desviación estándar alrededor de la línea de predicción. 
6.1 El análisis de regresión permite identificar el tipo de relación matemática que existe entre una variable 
dependiente y una variable independiente con la finalidad de cuantificar el efecto que los cambios en esta 
última tienen sobre la primera, así como para identificar observacionespoco comunes. Verdadero. 
Se basa en la relación o asociación existente entre variables. La variable conocida recibe el nombre de variable 
independiente, la variable que estamos intentando predecir es la variable dependiente. 
6.1 en el análisis de regresión cómo se llaman las variables que se utilizan? seleccione las 2 (dos) 
respuestas correctas: variable dependiente y variable independiente. 
6.1 incrementos que se produce en la variable Y cuando la variable X aumenta una unidad? pendiente 
estimada en una regresión lineal 
 6.1 Cuál es el objetivo del análisis de regresión el análisis de regresión tiene como objetivo estimar la 
relación que vincula a una variable dependiente con una o varias variables independientes. 
6.1 Cuál es el concepto de una regresión simple? la regresión simple relación una variable dependiente 
con una sola variable independiente. 
6.1 La regresión lineal simple es la que utiliza 7 variables numéricas independientes para pronosticar una 
variable numérica dependiente. Falso. 
La regresión lineal simple es la que utiliza una sola variable numérica independiente para pronosticar la variable 
numérica dependiente. 
6.1 Se realizó un estudio para una empresa, y se determinó una estimación de su función de costos, en el 
tramo de producción (5.000; 30.000) unidades, Costo de producción -15,65 + 1,29 Cantidad producida 
¿Cuál es el costo de producción estimado si se producen 18.000 unidades? $23.204,35. 
Surge de reemplazar X en la fórmula de la estimación indicada de la regresión por $18.000. 
6.1 se necesita estimar el precio de una vivienda en función de su superficie. Qué tipo de análisis 
recomendaría? Regresión lineal simple con la superficie como variable independiente y el precio de la 
vivienda como variable dependiente. 
6.1 en el análisis de regresión cómo se llama la variable que se desea pronosticar? Variable Dependiente. 
6.1 en el análisis de regresión cómo debe ser la relación entre las variables? en el análisis de regresión 
debe existir una relación de causalidad entre las variables. 
6.1 Se realizó un estudio para una empresa, y se determinó una estimación de su función de costos, en el 
tramo de producción (5.000; 30.000) unidades, Costo de producción -15,65 + 1,29 Cantidad producida 
¿Cuál es el costo de producción estimado si se producen 31.500 unidades? No puede determinarse en base 
a la información disponible. 
El valor de X indicado está fuera del dominio de estimación 
6.1 es el análisis de la relación o dependencia entre variables sirve para explicar y predecir la variable 
dependiente Y a partir de valores y observan independiente X: test de hipótesis 
Cesar
Resaltado
 7 
 
 6.1 Cuáles son los tipos de relaciones encontradas en los diagramas de dispersión? selección en las 4 
respuestas correctas: relación lineal positiva / negativa ; relación curvilínea positiva / negativa; relación 
curvilínea forma de u; sin relación entre X Y no va: relación logarítmica positiva / negativa. 
 
6.1. Incremento que se produce en la variable Y cuando la variable x aumenta una unidad: pendiente 
estimada en una regresión lineal 
6.1.1 En la estimación mediante la línea de regresión ¿Cuál es la ecuación para una recta? Selección 4 
respuestas correctas. 
 Y (variable dependiente) 
 a (intersección en Y) 
 b (dependiente de la línea) 
 X (variable independiente) 
No va: Se (error estándar de la estimación) 
La ecuación para una recta donde la variable dependiente (Y) está determinada por la variable independiente (X). Y 
= a + bX. 
6.1.1 Cómo está conformada la ecuación de regresión Simple (la línea de predicción) seleccione las 
cuatro respuestas correctas: valor estimado de Y para la observación i ; valor X para observación i ; 
intersección de la muestra con el eje Y ; pendiente de la muestra 
 No va: valor de la frecuencia esperada. 
6.1.1 el método de mínimos cuadrados Qué valores determina para reducir al mínimo la suma de las 
diferencias al cuadrado alrededor de la línea de predicción? los valores de b0 ( intersección de la muestra 
con el eje Y) b1 ( pendiente de la muestra) 
6.1.1 ¿Cuál es la ecuación de regresión lineal simple? (la línea de predicción) Yi = b0 + b1 Xi. 
6.1.1 la recta de regresión: pasa necesariamente por el punto cuyos componentes son las medias de 
ambas variables. 
6.1.1 porque se utiliza el método de mínimos cuadrados para estimar los parámetros de la regresión?: 
las estimaciones que producen tienen propiedades estadísticas deseables. 
Los estimadores obtenidos por MCO son los mejores estimadores lineales insesgados de los parámetros de la recta de 
regresión. 
6.1.1 cuando se utiliza el método de mínimos cuadrados para determinar los coeficientes de regresión de 
un conjunto de datos Cuáles son las 3 medidas de variación necesarias para calcular? seleccione las tres 
respuestas correctas: Suma de cuadrados total (SCT) suma de cuadrados de regresión (SCR)y suma de 
cuadrados de error (SCE) 
SCT es una medida de los valores de Y, alrededor de la media Y. 
SCR es la variación que se explica por la relación entre X y Y. 
SCE representa la variación debida a otro factores que no son la relación entre X y Y 
6.1.2 ¿Cuál es el coeficiente de determinación? Es igual a la suma de cuadrados de regresión dividido la 
suma de cuadrados total. 
El cociente de la suma de cuadrados de regresión y de la suma de cuadrados totales, mide la proporción de la variación 
en Y que se explica por la variable independiente X en el modelo de regresión, este cociente es el coeficiente de 
determinación. 
6.1.2 el coeficiente de determinación: es conocido también como coeficiente de regresión. 
Cesar
Resaltado
 8 
 
6.1.2 el coeficiente de determinación: mide el porcentaje de varianza explicada por la recta de regresión. 
6.1.2 Nos indica el porcentaje del ajuste que se ha conseguido con el modelo lineal; ¿A qué concepto 
corresponde esta definición? R2 
Por definición de coeficiente de determinación. 
6.1.3 los supuestos de la regresión son importante para la validez de cualquier conclusión Cuáles son 
esos seleccione las 4 respuestas correctas: linealidad, independencia de los errores, normalidad del error, 
igualdad de la varianza. No va: contingencia 
6.1.3 Cómo son los parámetros del modelo poblacional de regresión lineal (pendiente y ordenada al 
origen) constantes. 
6.1.4 que evalúa el análisis residual?en forma visual los supuestos de la regresión y ayuda a determinar si 
el modelo de regresión seleccionado es el adecuado 
 el residuo o valor del error estimado es la diferencia entre los valores observados y estimados de la variable 
dependiente para un valor dado de X. En un diagrama de dispersión el residuo aparece como la distancia vertical 
entre un valor observado de Y la línea de predicción. 
6.1.4 el recibo o valor del error estimado (ei) Cuál es su ecuación? 
 
es la diferencia entre los valores observados y estimado de la variable dependiente para un valor dado de X 
 6.1.5 Cuál es la ecuación del modelo de regresión múltiple con dos variables independientes 
 
 
6.1.5 Cuáles son las ventas estimadas para un supermercado que cobra 79 centavos (x1i), durante un 
mes en que los gastos ascienden a $400 (x2i)? para b0 igual 5837,5208; b1= 53, 2173; b2= 3,6131 
utilizando la ecuación de regresión múltiple. 3078.5 
5837,5208 - 53,2173 (79) + 3, 6131 (400) 
6.1.5 Qué son los modelos de regresión múltiple?: son aquellos que emplean dos o más variables 
independientes para pronosticar el valor de una variable dependiente. 
6.1.5 como se conoce el proceso por el cual podemos servirnos de más de una variable independiente 
para estimar la variable dependiente? Regresión múltiple y análisis de correlación. 
6. 1.5 Cuál es la principal ventaja de la regresión múltiple? La principal ventaja es que nos permite utilizar 
una parte mayor de la información de que disponemospara estimar la variable dependiente. 
6.1.5 Cuáles son los pasos para determinar la regresión múltiple? Definir la ecuación de regresión 
múltiple, examinar el error estándar de estimación para la regresión múltiple, y aplicar el análisis de 
correlación múltiple para averiguar con qué eficacia describe la ecuación de regresión de datos 
observados. 
6.2 ¿Qué indica el coeficiente de correlación cuando tiende a 1 en valor absoluto? Indica un fuerte grado 
de asociación lineal entre variables. 
si los puntos se graficaran en un diagrama de dispersión, todos se podrían conectar en una línea recta. 
6.2 que indica el coeficiente de correlación cuando tiende a cero (0) en valor absoluto? indica un fuerte 
grado de asociación exponencial entre variables. 
 cuando el coeficiente de correlación se acerca a cero no existe una relación lineal o es muy baja 
Cesar
Resaltado
 9 
 
6.2 Explique cuál es el objetivo del análisis de correlación? Evaluar el grado de asociación entre dos 
variables. 
6.2 ¿Cuál es el concepto de covarianza? Cantidad que mide el grado de variación conjunta de dos variables. 
Es la fuerza de la relación lineal entre dos variables numéricas (X; Y) 
6.2 ¿Cómo se puede cuantificar el grado de asociación entre dos variables? Calculando el coeficiente de 
correlación. Es la raíz del coeficiente de determinación. Es la segunda medida con que puede describirse la eficacia 
con que una variable es explicada por otra. 
6.2 Cómo es la asociación lineal entre x, y cuando el coeficiente de correlación Exactamente igual a 1 o a 
- 1? cuando el coeficiente de correlación es exactamente igual a 1 o a -1, existe asociación lineal perfecta 
entre X Y 
 6.2 para que podemos utilizar el coeficiente de correlación? para determinar si existe una relación lineal 
estadísticamente significativa entre X y / Y 
 Mide la fuerza de la relación entre dos variables numéricas utilizando el coeficiente de correlación r 
6.2 que mide el coeficiente de correlación? la fuerza relativa de una relación lineal entre dos variables 
numéricas. 
6.2 Aunque el coeficiente correlación lineal indica que la relación entre ambas variables es fuerte 
seleccione las 4 correctas; 
 no significa que esté determinada la causalidad entre ellas. 
 Generalmente requiere un modelo teórico que vincule su interrelación. 
 no establece cuál de las variables es condicionada por la otra. 
 es importante contar con un test que indique cuan significativa es la relación detectada. 
 no va: el valor no nos da idea del sentido de la relación lineal. 
6.2.1 el coeficiente de correlación de Pearson seleccione las dos respuestas correctas: "carece de unidad 
de medida" (por ser un coeficiente) y "tiende a cero cuando no existe relación lineal entre ambas variables 
6.2.1 el coeficiente de determinación: es el cuadrado del coeficiente de correlación. 
6.2.1 el coeficiente de correlación de Pearson Sólo toma valores comprendidos entre cero y uno falso 
 puede tomar valores en intervalo [ - 1; 1] 
6.2.2 Cuando el coeficiente de correlación de Pearson, en valor absoluto, está próximo a 1, existe una 
correlación muy fuerte entre las variables. Verdadero. Ya que ambas variables se comportan de manera muy 
similar respecto de las diferencias con sus medias, tanto en signo como en magnitud proporcional. 
 
6.2.2 indicar que afirmaciones son correctas acerca del valor del coeficiente de correlación y su respecto 
diagrama de dispersión seleccione las cuatro respuestas correctas: 
 cuando diagrama de dispersión exhibe pero esta no es lineal el coeficiente de correlación de 
Pearson tiende a 0. 
 cuando el diagrama de dispersión exhibe la relación lineal con pendiente positiva el coeficiente de 
correlación de Pearson tiende a 1 
 cuando el diagrama de dispersión exhibe la relación lineal con pendiente negativa el coeficiente de 
correlación de Pearson tiende a - 1 
 cuando el diagrama dispersión no exhibe ningún tipo de relación el coeficiente de correlación de 
Pearson tiende a cero. 
no va: cuando el diagrama de dispersión exhibe una forma lineal paralela, el eje de las abscisas el 
coeficiente de correlación de Pearson tiende a 1. 
Cesar
Resaltado
 10 
 
() Se dispone de la información sobre las siguientes series ¿Qué debería tener en cuenta antes de aplicar 
un modelo de regresión lineal? 
x 12 41 93 147 204 264 373 509 773 
y 930 815 632 487 370 265 147 76 17 
La posible relación no lineal de las variables. 
() Se dispone de la siguiente información de dos variables, ¿Cuál es el valor del coeficiente de correlación? 
X 12 41 93 147 204 264 373 509 773 
Y 930 815 632 487 370 265 147 76 17 
-0,9995. Puede calcularse con la formula 
 () Se dispone de la siguiente información de dos variables que puede decirse de 
la correlación entre las variables. 
x 12 41 93 147 204 264 373 509 773 
y 930 815 632 487 370 265 147 76 17 
Es negativa casi perfecta 
Puede observarse que cuando una de las variables aumenta la otra disminuye. 
()se dispone la información sobre los siguientes valores, qué debería tener en cuenta antes de aplicar un modelo 
de regresión lineal? 
x 12 41 93 147 204 264 373 509 773 
y 930 815 632 487 370 265 147 76 17 
la posible relación no lineal de las variables. 
() Se dispone de la siguiente información de un estudio de atención del niño. Cuál sería la hipótesis nula en una 
prueba de independencia? 
Nivel de atención Niños Niñas Total 
Alto 5 6 11 
Bajo 30 29 59 
Total 35 35 70 
Rta: el nivel de atención y el sexo del niño son independientes. 
() Se dispone de la siguiente información de un estudio de atención del niño. Cuántos grados libertad tendrá el 
test? 
Nivel de atención Niños Niñas Total 
Alto 5 6 11 
Bajo 30 29 59 
Total 35 35 70 
1 (filas - 1 por columnas -1) 
() Se dispone de la siguiente información de un estudio de atención del niño. Cuál es el estadístico 
muestral? Y qué decisión estadística se debe tomar? seleccione las dos respuestas correctas: 
Nivel de 
atención Niños Niñas Total 
Alto 5 6 11 
Bajo 30 29 59 
Total 35 35 70 
0,1079 y no rechazar la hipótesis nula. 
 11 
 
()El siguiente gráfico corresponde a un diagrama de dispersión entre las variables X e Y que supuesto del 
modelo de regresión lineal no cumplen estos datos? Linealidad. 
 
() El R2 es: Una medida de bondad de ajuste. 
()Qué pruebas se puede utilizar para probar si la proporción poblacional π1 es igual a la población 
poblacional π2? La prueba de chi cuadrado para la diferencia entre dos proporciones 
() Los siguientes datos corresponden a un estudio sobre recordación de marca (variable Y) y la cantidad 
de veces que un dividuo está expuesto acciones publicidades de esa marca (variable X) cuál es el valor 
del coeficiente de correlación? 
x 20 18 16 15 14 12 12 10 8 5 
y 12 16 10 14 12 10 9 8 7 2 
0.8691 
Se puede calcular con la siguiente fórmula 
() Los siguientes datos corresponden a un estudio sobre recordación de marca (variable Y) y la cantidad de 
veces que un individuo está expuesto a acciones publicidades de esa marca (variable X). ¿Cómo podría 
describir la relación entre las variables en base a la información suministrada por el coeficiente de 
correlación? Seleccione 4 respuestas correctas. 
x 20 18 16 15 14 12 12 10 8 5 
y 12 16 10 14 12 10 9 8 7 2 
 
 Las variables entre si tienen una correlación fuerte 
 La correlación es positiva 
 Cuando la variable X se ubica por debajo de su media, mayoritariamente la variable Y también se 
ubica por debajo de su media. 
 Cuando la variable X se ubica por encima de su media, mayoritariamente la variable Y también se 
ubica por encima de su media. 
() Para estudiar la dependencia entre la práctica de algún deporte y la salud, se seleccionó una muestra 
aleatoria simple de 100 personas, con los siguientes resultados: 
 Sin episodios de 
enfermedad en el año 
Con algún episodio de 
enfermedad en el año 
Realizadeportes 38 9 
No realiza deportes 31 22 
Se rechaza la Ho, ya que la evidencia indica que realizar deportes y menos episodios de enfermedad están 
asociados. Se realiza la prueba de independencia y se obtiene que se rechaza. Lo cual significa que las variables no 
son independientes 
 
 12 
 
() La asignación de temas de un determinado examen se realiza de manera aleatoria. La siguiente tabla 
muestra la cantidad de exámenes tomados de cada uno de los 4 temas en la última fecha de examen. 
Contrastar la hipótesis de que los temas son seleccionados al azar a un nivel de significación del 5%. ¿Qué 
decisión estadística se toma? 
Tema Exámenes 
Tomados 
1 13 
2 22 
3 18 
4 17 
No se rechaza la hipótesis, de que todos los valores son igualmente probables. 
 
()La asignación de temas en un determinado examen se realiza de manera aleatoria la siguiente tabla 
muestra la cantidad de exámenes tomados de cada uno de los cuatro temas en las últimas fechas 
examen contrastar la hipótesis de que los temas son seleccionados al azar a un nivel de significación del 
5% 
Tema Exámenes 
Tomados 
1 13 
2 22 
3 18 
4 17 
 Cuál es el valor del estadístico muestral? 7.81 
() La asignación de temas de un determinado examen se realiza de manera aleatoria. La siguiente tabla 
muestra la cantidad de exámenes tomados de cada uno de los 4 temas en la última fecha de examen. 
Contrastar la hipótesis de que los temas son seleccionados al azar a un nivel de significación del 5%. ¿Cómo 
se establece la regla de decisión? 
Tema Exámenes 
Tomados 
1 13 
2 22 
3 18 
4 17 
Se rechaza la h o si el valor del estadístico muestral es mayor que 7.82 
() La asignación de temas de un determinado examen se realiza de manera aleatoria. La siguiente tabla 
muestra la cantidad de exámenes tomados de cada uno de los 4 temas en la última fecha de examen. 
Contrastar la hipótesis de que los temas son seleccionados al azar a un nivel de significación del 5%. ¿Cuál 
es el valor crítico del estadístico de prueba? 
Tema Exámenes 
Tomados 
1 13 
2 22 
3 18 
4 17 
2,3428 
 13 
 
() En un sector industrial se registraron la cantidad de horas de trabajo contratadas de una actividad 
eventual, según el costo de la mano de obra por hora. Si se estima una regresión lineal, utilizando el salario 
como variable independiente ¿Cuál es el valor de la pendiente? 
Salario por horas 30 28 32 25 25 25 22 24 35 40 
demanda de hora de trabajo 25 30 27 40 42 40 50 45 30 25 
-1,354. Se calcula usando la fórmula: 
 
() En un sector Industrial se registra la cantidad de horas de trabajo contratadas de una actividad eventual según 
el costo de la mano de obra por hora Si se estima una regresión lineal utilizando el salario como variable 
independiente. Cuál es el valor de la ordenada al origen? 74,12 
Salario por horas 30 28 32 25 25 25 22 24 35 40 
demanda de hora de trabajo 25 30 27 40 42 40 50 45 30 25 
 
Se puede realizar con la siguiente fórmula 
() En un sector Industrial se registraron la cantidad de horas de trabajo contratados en actividad eventual según el 
costo de la mano de obra por hora. Si se estimula regresión lineal utilizando el salario como variable 
independiente Cuál es el valor esperado de la demanda de horas y salarios ubica en $ 50? 
Salario por horas 30 28 32 25 25 25 22 24 35 40 
demanda de hora de trabajo 25 30 27 40 42 40 50 45 30 25 
 No puede determinarse con la información disponible. 
Ya que el valor de la variable independiente está fuera del dominio de estimación de la regresión. Eventualmente 
para dar respuesta este problema se podría realizar un pronóstico. 
 
 () En un sector industrial se registraron la cantidad de horas de trabajo contratadas de una actividad 
eventual, según el costo de la mano de obra por hora. Si se estima una regresión lineal, utilizando el salario 
como variable independiente ¿Cuál es el valor de la pendiente? 
Salario por horas 30 28 32 25 25 25 22 24 35 40 
demanda de hora de trabajo 25 30 27 40 42 40 50 45 30 25 
 homocedasticidad. 
 
() En un sector Industrial se registraron la cantidad de horas de trabajo contratados en actividad eventual según el 
costo de la mano de obra por hora. Si se estimula regresión lineal utilizando el salario como variable 
independiente Cuál es el valor esperado de la demanda de horas y salarios ubica en $ 38? 
Salario por horas 30 28 32 25 25 25 22 24 35 40 
demanda de hora de trabajo 25 30 27 40 42 40 50 45 30 25 
22,7 
 
 
 14 
 
() Se quiere evaluar la eficacia de diferentes métodos de enseñanza, comparando con un método actual 
tradicional. Para ello se selecciona al azar 25 alumnos y se distribuyen aleatoriamente en 5 grupos. Al 
primero de ellos recibe sus clases con el método actual, los siguientes grupos reciben sus clases a partir de 
métodos distintos más innovadores. Las siguientes corresponden a puntuaciones corresponden a 
puntuaciones de test de contenidos aplicados en todos los grupos. 
Grupos 
1 2 3 4 5 
180 172 163 158 147 
173 158 170 146 152 
175 167 158 160 143 
182 160 162 171 155 
181 175 170 155 160 
¿Puede asegurarse que los resultados no cambian con diferentes métodos de enseñanza? Indicar el valor 
crítico del estadístico de prueba. 11,24. 
Se calcula la tabla ANOVA en base a los datos muéstrales. El estadístico muestral F surge del cociente de los cuadrados 
medidos entre e intra. 
 () Señale las descripciones correspondientes a los valores faltantes del siguiente esquema relativo al 
coeficiente de correlación lineal: (selección 3 respuestas correctas). 
 
 Correlación negativa perfecta (valor -1) 
 Ninguna correlación (valor 0) 
 Correlación positiva perfecta (valor 1) 
 ()Se realiza un estudio de rendimiento de un cultivo según 3 procedimientos de cultivo: Se asignan al 
azar 24 plantas entre los tres procedimientos, se comparan los respectivos rendimiento si se obtiene una 
tabla ANOVA, pero la versión que le llega usted paralizar está incompleta Determine el valor del 
estadístico muestral. 
 
 Suma de 
Cuadrados Gl 
Media 
cuadrática F Sig. 
Inter-grupos 323.792 .002 
 
Intra-grupos 21 
 
Total 1.460.958 
 
 38,73 
 
 
 
 
 
 15 
 
()Se realiza un estudio de rendimiento de un cultivo según 3 procedimientos de cultivo. Se asignan al 
azar 24 plantas entre los tres procedimientos, se comparan los respectivos rendimientos si se obtiene 
una tabla ANOVA, pero la versión que le llega usted paralizar está incompleta. Qué decisión estadística 
corresponde tomar, en base a la evidencia disponible (α = 0,01)? 
 
Suma de 
Cuadrados Gl 
Media 
cuadrática F Sig. 
Inter-grupos 323.792 .002 
 
Intra-grupos 21 
 
Total 1.460.958 
 
Se rechaza la Ho, por lo tanto, los métodos difieren entre sí en cuanto al rendimiento medio. 
Completando los GL de la varianza inter grupos (entre) se deduce la suma de cuadrados entre.Se despeja y se obtiene 
la suma de cuadrados intra grupos y se obtiene cuadrados medio intra grupos.Y se logra el indicado. 
()Se realiza un estudio de rendimiento de un cultivo según 3 procedimientos de cultivo: Se asignan al 
azar 24 plantas entre los tres procedimientos, se comparan los respectivos rendimiento si se obtiene una 
tabla ANOVA, pero la versión que le llega usted paralizar está incompleta. Determine la media 
cuadrática ( cuadrados medios) intra grupos. 
 
 Suma de 
Cuadrados Gl 
Media 
cuadrática F Sig. 
Inter-grupos 323.792 .002 
 
Intra-grupos 21 
 
Total 1.460.958 
647.584 
 
 () Se dispone de la siguiente información, a partir de un estudio de casos. Se debe estimar una regresión, 
utilizando como variable independiente los años de escolaridad. ¿Cuál es el valor del coeficiente de 
determinación? 
X = cantidad de años de 
escolaridad 
Y = ingreso medio 
(índice) 
535 
7 70 
10 100 
12 129 
15 145 
17 150 
20 152 
 
0.889. Surge de realizar el cálculo: 
 
 16 
 
() Se dispone de la siguiente información, a partir de un estudio de casos.¿Cuál es el valor del coeficiente 
de correlación de Pearson? 
X = cantidad de años de 
escolaridad 
Y = ingreso medio 
(índice) 
5 35 
7 70 
10 100 
12 129 
15 145 
17 150 
20 152 
 0.943 Se puede calcular con la siguiente fórmula 
() Se dispone de la siguiente información, a partir de un estudio de casos. Se debe estimar una regresión, 
utilizando como variable independiente los años de escolaridad. ¿Cuál es el valor de la ordenada al origen? 
X = cantidad de años de 
escolaridad 
Y = ingreso medio 
(índice) 
5 35 
7 70 
10 100 
12 129 
15 145 
17 150 
20 152 
Debemos usar el criterio de mínimos cuadrados. 
() Se dispone de la siguiente información, a partir de un estudio de casos. Se debe estimar una regresión, 
utilizando como variable independiente los años de escolaridad. ¿Cuál es el valor de la ordenada al origen? 
X = cantidad de años de 
escolaridad 
Y = ingreso medio 
(índice) 
5 35 
7 70 
10 100 
12 129 
15 145 
17 150 
20 152 
 
7,883 Surge de aplicar la siguiente fórmula 
 
 17 
 
() Se dispone de la siguiente información, a partir de un estudio de casos. Se debe estimar una regresión, 
utilizando como variable independiente los años de escolaridad. ¿Cuál es el valor de la ordenada al origen? 
X = cantidad de años de 
escolaridad 
Y = ingreso medio 
(índice) 
5 35 
7 70 
10 100 
12 129 
15 145 
17 150 
20 152 
 
14,73 Surge de aplicar la siguiente fórmula 
Se realizó un estudio médico comparando tres poblaciones diferentes y sus respectivas capacidades pulmonares y 
se obtuvo el siguiente resultado de una ANOVA. Qué decisión estadística corresponde tomar con un nivel de 
significancia del 0.001? 
ANALISIS DE VARIANZA 
Variación SumaCuad. G.L MediaCuad. F 
Entre grupos 1,16 2 0,58 6,91 
Intra grupos 1,01 12 0,084 
 
Total 2,17 14 
No se rechaza la Ho, es decir, no puede considerarse que la capacidad pulmonar de los tres grupos difieren entre sí. 
 
 Los miembros del grupo de running se organizan en tres grupos para probar tres esquemas diferentes de 
entrenamiento. La asignación a los diferentes esquemas al azar. El primer grupo entrena con recorridos externos a 
ritmo pausado, el segundo esquema consiste en series cortas muy intensas y el tercer esquema incorpora 
actividades con aparatos en gimnasio. Tras un tiempo entrenar con estos diferentes temas se realiza una prueba 
de igual recorrido y se registran los tiempos logrados por cada miembro del grupo. 
A- Recorridos extensos a 
ritmo pausado 
B- Series cortas muy 
intensas 
C- Con trabajo en 
gimnasio 
15 14 13 
16 13 12 
14 15 11 
15 16 14 
17 14 11 
 A una significación del 5%, puede considerarse que alguno de los métodos resulta superior a los demás? Cuánto 
vale el estadístico muestral de la prueba ANOVA? 9,37 
 el estadístico muestral F surge del cociente de los cuadrados medios entre e intra. 
 
 
 
 18 
 
Los miembros del grupo de running se organizan en tres grupos para probar tres esquemas diferentes de 
entrenamiento. La asignación a los diferentes esquemas al azar. El primer grupo entrena con recorridos externos a 
ritmo pausado, el segundo esquema consiste en series cortas muy intensas y el tercer esquema incorpora 
actividades con aparatos en gimnasio. Tras un tiempo entrenar con estos diferentes temas se realiza una prueba 
de igual recorrido y se registran los tiempos logrados por cada miembro del grupo. 
A una significación del 5% puede considerarse que alguno de los métodos resulta superior a los demás Qué 
decisión corresponde tomar en base a la prueba ANOVA? 
A- Recorridos extensos a 
ritmo pausado 
B- Series cortas muy 
intensas 
C- Con trabajo en 
gimnasio 
15 14 13 
16 13 12 
14 15 11 
15 16 14 
17 14 11 
 rechazar la Ho, es decir reconocer que hay diferencia entre los métodos de entrenamiento.

Continuar navegando