Logo Studenta

ASIGNACION #2 SEMINARIO

Vista previa del material en texto

.
SEMINARIO DE INVESTIGACIÓN
ANÁLISIS DE BASES DE DATOS
Nombre: 					Fecha: 
No. de Cuenta: 				Centro Universitario: 
Correo electrónico universitario: 
-------------------------------------------------------------------------------------------------------------------------------
DISEÑO COMPLETAMENTE AL AZAR
En el 2008, en el Centro Experimental Demostrativo de Horticultura (CEDEH) ubicado en el Valle de Comayagua se evaluó el nivel de producción de siete diferentes híbridos de chile jalapeño comúnmente cultivados con fines de exportación al mercado norteamericano. Luego de varias cosechas (aprox. 5) se logró cuantificar el Rendimiento total (RT) de cada híbrido; y luego de sustraer todo el producto de descarte (i.e., frutos mordidos, podridos, heridos, deformes, dañados por insectos & quemados por el sol) también se pudo cuantificar el Rendimiento comercial (RC) de cada uno.
Suba a RStation la base de datos denominada “Rendimientos Comerciales” y almacénela en un vector llamado: Rendimientos.Comerciales. Luego usando los códigos discutidos en clase corra el análisis y llene las casillas con la información solicitada.
ESTADÍSTICAS BÁSICAS O DESCRIPTIVAS (13%)
Número de tratamientos: 
Número de observaciones: 
Valor mínimo del RC: 
Valor máximo del RC: 
Primer cuartillo del RC: 
Mediana del RC: 
Tercer cuartillo del RC: 
Media aritmética del RC: 
Varianza del RC: 
Desviación estándar del RC: 
Rango del RC: 
Rango Inter cuartillo del RC: 
Moda de del RC: 
GRAFICA DE MEDIAS CON INTERVALO DE CONFIANZA (IC) AL 95% (10%)
Usando el código discutido en clase, defina los factores del modelo estableciendo a RC_kg.ha como la Respuesta y a Tratamiento (factor) como Híbridos.
Después de definir los factores, elabore una gráfica de medias con el IC al 95% de la Respuesta en función de los Híbridos (Respuesta ~ Híbridos) e insértela en el siguiente cuadro. Agregue al eje de las abscisas (X) el siguiente título: Rendimientos Comerciales (kg/ha), mientras que al eje de las ordenadas (Y) no agregue título alguno. Finalmente, agregue a la gráfica el siguiente encabezado y subtítulo: Evaluación de Híbridos de Chile Jalapeño, (Media ± Intervalo de Confianza al 95%).
GRAFICA TIPO VIOLÍN (10%)
Elabore una gráfica de tipo violín usando a Híbridos para el eje de las ordenadas (Y) y a Respuesta para definir el eje de las abscisas (X) e insértela en el siguiente cuadro. Defina el color de las observaciones de cada tratamiento en color azul mientras que el color de las medias en rojo. Además, agregue al eje X el siguiente título: Rendimientos Comerciales (kg/ha), mientras que al eje Y no agregue título alguno. Finalmente, agregue a la gráfica el siguiente encabezado: Evaluación de Híbridos de Chile Jalapeño.
ANÁLISIS DE VARIANZA (16%)
Deseamos saber si hay diferencias significativas entre los 7 diferentes híbridos de chile jalapeño con un nivel de significancia del 5% (α = 0.05) y para ello los compararemos bajo la siguiente hipótesis:
Hipótesis:
Ho: µEl Rey = µGrande = µIxtapa = µMagnific = µMitla = µMonet = µNorteño
Ha: al menos una µ es diferente.
Corra el análisis de varianza (ANAVA) de la Respuesta en función de los Híbridos (Respuesta ~ Híbridos) usando a Rendimientos.Comerciales como la base de datos (es decir: data=). Con la información generada por el ANAVA proporcione la información que se le pide a continuación:
ANAVA (Test Tipo III)	Significativo al 5%
Fuente de variación	Suma de cuadrados	GL*	Prueba F	P-valor	Si	No
Intercepto.	8.6407e+10	1	646.7069	2e-16		
Híbridos.	2.5420e+08	6	0.3171	0.9208	☒	☐
Errores experimentales.	2.8058e+09	21	Escriba aquí	Escriba aquí		
* GL: Grados de libertad.
A partir de la información del ANAVA llegamos a la siguiente conclusión:
☐	No existen diferencias significativas entre las medias de los híbridos de chile jalapeño.
☒	Hay diferencias significativas entre las medias, pero no sabemos cuáles de los híbridos son diferentes.
Recuerde que sí el p-valor ≤ 0.05 entonces se rechaza la Ho en favor de la Ha.
Recuerde que sí el p-valor > 0.05 entonces no se puede rechazar la Ho.
Coeficiente de determinación (R2): 
Coeficiente de variación: 
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
NORMALIDAD DE LOS ERRORES EXPERIMENTALES
HISTOGRAMA DE LOS RESIDUOS ESTANDARIZADOS (10%).
Usando el código discutido en clase, elabore un histograma de los residuos estandarizados con la curva normal superpuesta e insértela en el siguiente cuadro.
Q-Q PLOT CON IDENTIFICACIÓN DE VALORES EXTREMOS (11%).
Usando el código discutido en clase, elabore un Q-Q plot para la identificación de valores extremos e inserte la gráfica en el siguiente cuadro.
Identifique en el Q-Q plot los valores extremos que nos pueden desviar de una condición de normalidad y escríbalos aquí: (%) 
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
PRUEBA DE NORMALIDAD DE LOS ERRORES EXPERIMENTALES (6%)
Deseamos saber si los errores experimentales (Residuos) están normalmente distribuidos bajo la siguiente hipótesis:
Hipótesis:
Ho = Los residuos están normalmente distribuidos.
Ha = Los residuos no están normalmente distribuidos.
Usando el código discutido en clase, analice la normalidad de los errores experimentales. Seguidamente, complete el siguiente cuadro seleccionando además la prueba de normalidad más apropiada en base al número de errores experimentales (Seleccione solo un test).
Test	No. errores experimentales	p-valor	Seleccione un test
Shapiro-Wilk*	28	0.2710	☒
Kolmogorov-Smirnov**	28	0.8908	☐
Cramer-von Mises.	28	0.000	☐
Anderson-Darling.	28	0.5191	☐
* Use la prueba de Shapiro-Wilk solo cuando N < 50.
** Use la prueba de Kolmogorov-Smirnov cuando N ≥ 50.
Considerando la hipótesis y el p-valor de la prueba de normalidad arriba seleccionada se concluye que:
Los errores experimentales están normalmente distribuidos.	☒
Los errores experimentales no están normalmente distribuidos.	☐
PRUEBA DE CORRELACIÓN DE LOS ERRORES EXPERIMENTALES (2%)
(Prueba de Durbin-Watson)
Usando el código discutido en clase, analice la correlación de los errores experimentales bajo la siguiente hipótesis:
Hipótesis:
Ho : Los errores experimentales son independientes los unos de los otros.
Ha : Los errores experimentales están correlacionados.
p-valor: 
Considerando la hipótesis y el p-valor arriba descritos, seleccione una opción del siguiente cuadro:
Los errores experimentales son independientes los unos de los otros.	☒
Los errores experimentales están correlacionados.	☐
Recuerde que sí el p-valor ≤ 0.05 entonces se rechaza la Ho en favor de la Ha.
Recuerde que sí el p-valor > 0.05 entonces no se puede rechazar la Ho.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
PRUEBAS DE HOMOGENEIDAD DE VARIANZAS (6%)
La Prueba de Levene para la homogeneidad de varianzas (σ2) Usando las variables Respuesta e Híbridos corra el análisis de Respuesta en función de Híbridos (Respuesta ~ Híbridos).
Hipótesis:
Ho : σ2El Rey = σ2Grande = σ2Ixtapa = σ2Magnific = σ2Mitla = σ2Monet = σ2Norteño
Ha : al menos una σ2 es diferente.
p-valor: 
Considerando la hipótesis y el p-valor arriba descritos se concluye que:
 Hay homogeneidad de varianzas poblacionales.
 No hay homogeneidad de varianzas poblacionales.
Recuerde que sí el p-valor ≤ 0.05 entonces se rechaza la Ho en favor de la Ha.
Recuerde que sí el p-valor > 0.05 entoncesno se puede rechazar la Ho.
Prueba de Bartlett para la homogeneidad de varianzas (σ2) Usando las variables Respuesta e Híbridos corra el análisis de Respuesta en función de Híbridos (Respuesta ~ Híbridos).
Hipótesis:
Ho : σ2El Rey = σ2Grande = σ2Ixtapa = σ2Magnific = σ2Mitla = σ2Monet = σ2Norteño
Ha : al menos una σ2 es diferente.
p-valor: 
Considerando la hipótesis y el p-valor arriba descritos se concluye que:
 Hay homogeneidad de varianzas poblacionales.
 No hay homogeneidad de varianzas poblacionales.
Recuerde que sí el p-valor ≤ 0.05 entonces se rechaza la Ho en favor de la Ha.
Recuerde que sí el p-valor > 0.05 entonces no se puede rechazar la Ho.
La Prueba de F para comparar varianzas (σ2)
Hipótesis:
Ho : σ2El Rey = σ2Grande = σ2Ixtapa = σ2Magnific = σ2Mitla = σ2Monet = σ2Norteño
Ha : al menos una σ2 es diferente.
p-valor: 
Considerando la hipótesis y el p-valor arriba descritos se concluye que:
 Hay homogeneidad de varianzas poblacionales.
 No hay homogeneidad de varianzas poblacionales.
Recuerde que sí el p-valor ≤ 0.05 entonces se rechaza la Ho en favor de la Ha.
Recuerde que sí el p-valor > 0.05 entonces no se puede rechazar la Ho.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
PRUEBAS DE SEPARACIÓN DE MEDIAS
Diferencia Significativa Honesta de Tukey (6%). Usando el código discutido en clase, corra el análisis de Tukey para la separación de medias y proporcione la información que se le pide a continuación.
Híbridos de Chile Jalapeño	Media	Grupos	Valor máximo	Valor mínimo
El Rey	51561.11	a	68888.89	37555.56
Grande	56677.78	a	63811.11	45800.00
Ixtapa	54911.11	a	68400.00	41844.44
Magnific	55161.11	a	72155.56	41466.67
Mitla	51672.22	a	66577.78	37311.11
Monet	58927.78	a	70288.89	48177.78
Norteño	59950.00	a	72333.33	43422.22
Tratamientos con las mismas letras no son significativamente diferentes.
Diferencia Menos Significativa de Fisher (5%). Usando el código discutido en clase, corra el análisis de Fisher para la separación de medias y proporcione la información que se le pide a continuación.
Híbridos de Chile Jalapeño	Media	Grupos
Norteño	59950.00	a
Monet	58927.78	a
Grande	56677.78	a
Magnific	55161.11	a
Ixtapa	54911.11	a
Mitla	51672.22	a
El Rey	51561.11	a
Tratamientos con las mismas letras no son significativamente diferentes.
Comparaciones Múltiples de Duncan (5%). Usando el código discutido en clase, corra el análisis de Duncan para la separación de medias y proporcione la información que se le pide a continuación.
Híbridos de Chile Jalapeño	Media	Grupos
Norteño	59950.00	a
Monet	58927.78	a
Grande	56677.78	a
Magnific	55161.11	a
Ixtapa	54911.11	a
Mitla	51672.22	a
El Rey	51561.11	a
Tratamientos con las mismas letras no son significativamente diferentes.

Otros materiales