Logo Studenta

Taller 2do_parcial_E (1)

¡Este material tiene más páginas!

Vista previa del material en texto

1. Se ha establecido durante el transcurso de esta asignatura que el primer paso para analizar un conjunto de datos provenientes de un experimento o producidos por un determinado tratamiento se debe analizar la NORMALIDAD de estos. Determine sus conceptos (lo más detallado posible) que significa que un conjunto de datos se distribuya normalmente, como se puede determinar la normalidad (todos los procedimientos posibles), escriba al menos un ejemplo (para ello plantee algún ejemplo de biotecnología ambiental)
1. Conceptos de normalidad 
· La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el valor de una variable aleatoria a una situación ideal. En otras palabras, la distribución normal adapta una variable aleatoria a una función que depende de la media y la desviación típica. Es decir, la función y la variable aleatoria tendrán la misma representación, pero con ligeras diferencias. (Rodo, 2019)
· La distribución normal es una distribución con forma de campana donde las desviaciones estándar sucesivas con respecto a la media establecen valores de referencia para estimar el porcentaje de observaciones de los datos. Estos valores de referencia son la base de muchas pruebas de hipótesis, como las pruebas Z y t. (Minitab, 2019)
· La distribución normal sirve para conocer la probabilidad de encontrar un valor de la variable que sea igual o inferior a un cierto valor xi, conociendo la media, la desviación estándar, y la varianza de un conjunto de datos en sustituyéndolos en la función que describe el modelo. El cálculo resulta bastante complejo, pero, afortunadamente, existen tablas estandarizadas que permiten eludir este procedimiento. Su aplicación más importante es que en la gráfica, el área sombreada corresponde a la probabilidad de encontrar un valor de la variable que sea igual o inferior a un valor dado. Esa probabilidad se determina usando una tabla estandarizada. (Becerra, 2015)
Formula
Variable aleatoria X aproximada a una distribución normal.
Donde los parámetros de la distribución son la media o valor central y la desviación típica:
Parámetros de una distribución normal.
1. ¿Qué significa que un conjunto de datos se distribuya normalmente?
Esto significa que, si uno toma al azar un número suficientemente grande de casos y construye un polígono de frecuencias con alguna variable continua, por ejemplo, peso, talla, presión arterial o temperatura, se obtendrá una curva de características particulares, llamada distribución normal. Es la base del análisis estadístico, ya que en ella se sustenta casi toda la inferencia estadística.
La gráfica de la distribución normal tiene la forma de una campana, por este motivo también es conocida como la campana de Gauss. Sus características son las siguientes:
1. Tiene forma de campana.
1. Es simétrica.
1. Alcanza su máximo en µ (la media).
1. La media es también la moda y la mediana.
1. Es asintótica al eje de las abscisas y, como no lo toca nunca, cualquier valor de X entre -infinito y +infinito es teóricamente posible. (Quevedo, 2011)
1. ¿Cómo se puede determinar la normalidad?
· Prueba Anderson Darling
El estadístico de bondad de ajuste de Anderson-Darling -AD- mide el área entre la línea ajustada -basada en la distribución normal- y la función de distribución empírica -que se basa en los puntos de los datos-. El estadístico de Anderson-Darling es una distancia elevada al cuadrado que tiene mayor ponderación en las colas de la distribución.
Según Guisande & Barreiro (2006), el estadístico Anderson Darling puede ser utilizado para comprobar si los datos satisfacen el supuesto de normalidad para una prueba t. También se lo puede definir como aquel estadístico no paramétrico que es utilizado para probar si un conjunto de datos muéstrales provienen de una población con una distribución de probabilidad continua específica, por lo general, de una distribución normal. Esta prueba se basa en la comparación de la función de la distribución acumulada empírica de los resultados de la muestra con la distribución esperada si los datos fueran normales. Al momento de obtener los resultados, si la diferencia observada es suficientemente grande, la hipótesis nula de normalidad de la población es rechazada.
El estadístico A2 mide el área entre la línea ajustada basada en la distribución elegida y la función de paso no paramétrica, basado en los puntos de la gráfica. El estadístico es una distancia elevada al cuadrado que tiene mayor ponderación en las colas de la distribución, por lo tanto, un valor pequeño de Anderson-Darling indica que la distribución se ajusta mejor a los datos.
Donde:
N: número de casos.
S: desviación estándar.
· Prueba Ryan - Joiner
El estadístico de Ryan-Joiner mide qué tan bien se ajustan los datos a una distribución normal, calculando la correlación entre los datos y las puntuaciones normales de los datos. Según Hanke & Wichern (2014) la prueba de Ryan Joiner proporciona un coeficiente que indica exactamente la correlación entre los datos y las puntuaciones normales de los datos. Una vez que el coeficiente de correlación se acerca a 1, los datos se encuentran dentro de la gráfica de probabilidad normal; caso contrario, esto es, cuando el valor critico adecuado es menor, se rechaza la hipótesis nula de normalidad. Cabe recalcar que para rechazar la hipótesis nula de normalidad se calcula, primero, la medida de la correlación entre los residuos y sus respectivas puntuaciones normales y, luego, se utiliza dicha correlación como estadística de prueba. La prueba de Ryan-Joiner -similar a la prueba de Shapiro-Wilk- se basa en la regresión y correlación. Esta prueba resulta mucha más adecuada para muestras superiores a 30 observaciones.
· Prueba Shapiro-Wilk
Según Novales (2010), esta prueba se emplea para contrastar normalidad cuando el tamaño de la muestra es menor a 50 observaciones y en muestras grandes es equivalente al test de Kolmogórov-Smirnov. El método consiste en comenzar ordenando la muestra de menor a mayor valor, obteniendo el nuevo vector muestral. Cuando la muestra es como máximo de tamaño 50, se puede contrastar la normalidad con la prueba de Shapiro-Wilk, procediéndose a calcular la media y la varianza muestral. Se rechaza la hipótesis nula de normalidad si el estadístico Shapiro-Wilk -W- es menor que el valor crítico proporcionado por la tabla elaborada por los autores para el tamaño de la muestra y el nivel de significancia dado.
Shapiro-Wilk, como prueba de normalidad, fue introducido considerando que el gráfico de probabilidad normal que examina el ajuste de un conjunto de datos de muestra para la distribución normal es semejante a la de regresión lineal - la línea diagonal del gráfico es la recta de ajuste perfecto-, con la diferencia de que esta línea es similar a los residuos de la regresión. Mediante el análisis de la magnitud de esta variación -análisis de varianza-, la calidad del ajuste puede ser examinado. La prueba puede aplicarse a muestras grandes, como fue sugerido por Royston, que también produjo algoritmos para implementar su extensión y que se implementa en algunos softwares especializados estadísticos.
· Prueba Kolmogórov-Smirnov
La prueba de Kolmogórov-Smirnov es una prueba de bondad de ajuste ampliamente utilizada para probar la normalidad de los datos muestrales, siendo particularmente útil en procesos físicos no lineales e interactivos, por cuanto éstos conducen, generalmente, a distribuciones no gaussianas y, por lo tanto, el mecanismo generador de los procesos puede entenderse mejor al examinar la distribución de las variables seleccionadas. Además, para implementar pruebas de normalidad algunas pruebas estadísticas requieren o son óptimos bajo el supuesto de normalidad y, por lo tanto, constituye un prerrequisito determinar si este supuesto se cumple. (Flores, 2021)
1. Escriba al menos un ejemplo (para ello plantee algún ejemplo de biotecnología ambiental)
Tamaño de muestra en experimentos biotecnológicos con suspensiones celulares
Se propone la metodología del Bootstrappara estudiar la calidad de las estimaciones de la media a través de los errores estándar, sesgo e intervalos de confianza, y determinar el tamaño óptimo de muestra usando muestreo piloto, en experimentos biotecnológicos que involucran el estudio de la dinámica de células en suspensión. Se utilizaron las variables peso seco (mg/ml) y número total de células/ml de los cultivares B6749 y V64-10 de caña de azúcar (Saccharum spp.). El tamaño de muestra óptimo se calculó a partir del mínimo relativo o punto de máxima curvatura de la función generada entre los errores estándar Bootstrap y el tamaño de muestra. Se encontraron reducciones en más del 50% del tamaño de la muestra cuando estos resultados son comparados con los métodos clásicos utilizados para el cálculo del tamaño de muestra. (Zambrano, 2004)
1. Se realiza un análisis experimental sobre cierto químico que busca controlar los efectos de microorganismos, se tomaron mediciones en el fluido que se desea controlar antes y después de utilizar el químico en el fluido (TRATAMIENTO).
2.1) ¿Como se debería realizar el diseño del análisis experimental?? (Datos pareados o independientes) Explique el por qué la elección de su diseño experimental. 
2.2) ¿Podría afirmar estadísticamente si la utilización del químico produjo algún efecto favorable? Utilice una probabilidad del 95%. 
2.3) Establezca un intervalo de confianza del 99% para la diferencia de medias.
Solución:
1.1) ¿Como se debería realizar el diseño del análisis experimental?? (Datos pareados o independientes) Explique el por qué la elección de su diseño experimental. 
El diseño del análisis experimental se debería realizar considerando datos pareados, porque 
Utilizan un mismo equipo donde se realizan la aplicación de agua, por ende, estarán en dependencia antes, durante y después de aplicar el químico para controlar los microorganismos. No puedo analizar de forma independiente porque no son equipos distintos, es un solo equipo donde analizo antes y después por ende tendrá una correlación la cual debo analizar para determinar si mi hipótesis planteada cumple o no. 
b.2) ¿Podría afirmar estadísticamente si la utilización del químico produjo algún efecto favorable? Utilice una probabilidad del 95%. 
Se realiza una prueba de hipótesis. Para ello, se siguen los pasos para probar hipótesis descritos en Lind, Marchal y Wathen (2012), los cuales, se muestran a continuación:
 Figura 1. Pasos para probar una hipótesis
 Fuente: Lind, Marchal y Wathen (2012).
Paso 1. Se establecen las hipótesis nula y alternativa
Como interesa saber la utilización del químico produjo algún efecto favorable, entonces, las hipótesis a contrastar son:
Hipótesis Nula:
Hipótesis Alternativa:
Paso 2. Se selecciona un nivel de significancia
Con una probabilidad del 95%, se tiene que:
Como se trata de una prueba de dos colas, entonces:
Por tanto, se tiene 0.025 para cada cola (izquierda y derecha).
Paso 3. Se identifica el estadístico de prueba
El estadístico de prueba sigue una distribución t con (n-1) grados de libertad.
Donde:
· Cálculo del estadístico de prueba
Para obtener el valor del estadístico de prueba, primero se deben calcular la media y la desviación estándar de la diferencia entre las observaciones apareadas.
En la tabla 1, se muestran los cálculos previos para luego obtener el valor de la media y la desviación.
 Tabla 1. Cálculos
	Antes
	Después
	d
	
	
	8
	9
	-1
	-3,5
	12,25
	12
	9
	3
	0,5
	0,25
	15
	8
	7
	4,5
	20,25
	16
	12
	4
	1,5
	2,25
	9
	10
	-1
	-3,5
	12,25
	16
	11
	5
	2,5
	6,25
	14
	13
	1
	-1,5
	2,25
	15
	14
	1
	-1,5
	2,25
	11
	9
	2
	-0,5
	0,25
	14
	10
	4
	1,5
	2,25
	
	Total
	25
	
	60,5
Media:
La media se calcula de la siguiente manera:
Donde:
Sustituyendo,
El valor de la media es 2.5.
Desviación estándar:
La desviación estándar se calcula de la siguiente manera:
Sustituyendo,
El valor de la desviación estándar es 2.5927.
Ahora, se sustituye el valor de la media y la desviación, para obtener el estadístico de prueba.
El valor del estadístico de prueba es 3.049.
Paso 4. Se formula una regla para tomar decisiones
Buscamos el valor crítico en la tabla de la distribución t, considerando n-1 = 9 grados de libertad y un nivel de significancia de 0.025 (una cola), o directamente se observa con 0.05 para dos colas.
Por tanto, el valor crítico es:
Así, la regla de decisión será:
Es decir,
Paso 5. Decisión
Como el valor del estadístico de prueba es mayor al valor crítico , cae en la región de rechazo, por tanto, se rechaza Ho. Con un nivel de significancia de 0.05, se concluye que, la utilización del químico si produce un efecto favorable.
b.3) Establezca un intervalo de confianza del 99% para la diferencia de medias.
El intervalo para la diferencia de medias, en muestras pareadas, se obtiene de la siguiente manera:
Calculamos 
Buscamos 
Con una probabilidad del 99%, se tiene que:
En la tabla de la distribución t se busca el valor crítico para una cola con 0.005 y grados de libertad, o directamente para dos colas, con 0.01. 
Por tanto, el valor crítico es:
Sustituyendo,
Ahora, el intervalo será:
Por tanto, el intervalo de confianza del 99% para la diferencia de las medias de las observaciones apareadas es (-0.1646; 5.1646).
1. Se están desarrollando pruebas en dos puntos efluentes de una fábrica, para ello se han tomado mediciones, obteniéndose:
	EFLUENTES
	1
	2
	5030
	2200
	8130
	1690
	2800
	7030
	3320
	13700
	4250
	26850
	860
	4670
	7330
	1230
	11400
	15040
	17660
	11910
	6890
	2810
	2130
	10730
	4980
	22800
	1130
	7720
	1330
	2190
3.1. ¿El analista de datos experimentales dice que se deben analizar como datos independientes, está usted de acuerdo? EXPLIQUE CON LOS DETALLES QUE CONSIDERE NECESARIOS
Considero que estos datos son independientes porque se dice que se manejan dos efluentes de una fábrica, es decir, que cada punto de efluente tendrá diferentes circunstancias, o parámetros según el diseño por el que se los elaboró, por ejemplo, los coeficientes de rugosidad, los factores o perdidas de carga y de fricción, serán variados, son diferentes sistemas aislados de cierta manera uno del otro, por las necesidades que se establecen de cajón. 
3.2. ¿Qué quiere decir que los datos siguen una distribución normal? Establezca la normalidad de los datos mostrados en la tabla con una significancia del 5%. ¿¿Que ocurre si los datos no están normalizados??
Seguir los datos de distribución normal significa que los datos gráficamente muestran una forma acampanada, al sabes que los datos siguen esta distribución podemos hacer uso de las comparativas que usan tablas de T.Student, y Distribución Normal.
Una de la manera de calcular sí es una distribución normal es usando la herramienta de Rcmdr, la cual se determinó los Pvalue de los siguientes efluentes:
	Nombre
	Pvalue de Efluente 1
	P value de Efluente 2
	Valor P
	0.1803
	0.05092
	Criterio rechazo
	Pvalue < alfa; se rechaza Ho
	Conclusión numérica
	0.1803>0.05 
	0.0509>0.05
3.3 Plantéese hipótesis y desarrolle la comparación de medias con una probabilidad
del 95% y 99%. Emita sus conclusiones 
Xmed= 9897.50
(5030-9897.50)2 +(2200-9897.50)2 +(8130-9897.50)2 +(1690-9897.50)2 +(13700-9897.50)2 +(4250-9897.50)2 +(26850-9897.50)2 +(11400-9897.50)2 +(15040-9897.50)2 +(17660-9897.50)2 +(11910-9897.50)2 +(10730-9897.50)2 +(4980-9897.50)2 +(22800-9897.50)2 +(1130-9897.50)2S12 =
15
S12 = 62005060
(2800-4120.83)2 +(7030-4120.83)2 +(3320-4120.83)2 +(4670-4120.83)2 +(7330-4120.83)2 +(1230-4120.83)2 +(6890-4120.83)2 +(2810-4120.83)2 +(2130-4120.83)2 +(7720-4120.83)2 +(1330-4120.83)2 +(2190-4120.83)2 +S22 =
11
S22 = 6147935.606
· Planteo de hipótesis 
Ho: U1=U2
H1:U1≠U2
· Aplicación de estadísticos 
· Ttabulado
Grados de libertad
· Parámetros de tabla para confiabilidad de 95%
v =19
α= 0.05/2
según tablas de T.student el valor talfa = 2.0930 por ende
2.75 > 2.09 Rechazo
Conclusión: Las mediaso tratamientos no me dan el mismo efecto ya que mi hipótesis iniciada definía que las medias eran iguales y según el criterio de rechazo, se concluyen valores diferentes del efluente, lo que puede deberse a su carácter independiente un efluente del otro.
· Parámetros de tabla para confiabilidad de 99%
v =19
α= 0.01/2 
según tablas de T.student el valor talfa = 2.86 por ende
2.75 > 2.86 Rechazo
Conclusión: Las medias o tratamientos me dan el mismo efecto ya que mi hipótesis iniciada definía que las medias eran iguales y según el criterio de rechazo, se concluyen valores iguales del efluente, debido a que To es mayor a Ttabulado, lo que puede deberse a que puede ser que usen un doble sistema de vertido donde sea el mismo líquido, pero para evitar taponamiento usan dos efluentes. 
3.4 Realice una comparación de varianzas con una significancia del 1% y emita sus conclusiones
· Planteo mi hipótesis
· Aplicación de estadísticos 
Ho: 
10
· Parámetros para tabular Fisher
N1-1 =16-1=15
N2-1=12-1=11
α= 0.01 // 1- α= 0.9
· Según la tabla el valor corresponde a: 2.167
Fo>Ftab Rechazo
10 >2.167
Conclusión: Según el criterio de rechazo, a la hipótesis no se admite como verdadera ya que el Fo es mayor al Ftabulado lo que quiere decir que se rechaza el criterio, eso quiere decir que las pruebas en los puntos de efluente en efecto son diferentes.
1. Se está realizando análisis de un proceso a diferentes temperaturas, se detallan en la siguiente tabla:
	T1 (25°C)
	T2 (50°C)
	T3 (75°C)
	131
	129
	128
	138
	134
	138
	125
	136
	136
	129
	137
	139
	132
	137
	141
	135
	129
	142
	132
	136
	137
	134
	138
	145
	138
	134
	137
4.1) Cual es el factor o factores y los niveles a analizar en este proceso?? 
El factor: T°
Los niveles: 3: 25ºC, 50ºC y 75ºC.
4.2) Realice un análisis ANOVA y determine si existe algún efecto de la temperatura en el proceso. Utilice una significancia del 5% 
· Hipótesis Nula:
· Hipótesis Alternativa:
· Análisis de varianza (ANOVA):
En la tabla 2 y 3, se presenta el resumen de datos y análisis de varianza, respectivamente.
 Tabla 2. Resumen de los datos
	Grupos
	Cuenta
	Suma
	Promedio
	Varianza
	T1 (25ºC)
	9
	1194
	132,6666
	17,5
	T2 (50ºC)
	9
	1210
	134,444
	11,277
	T3 (75ºC)
	9
	1243
	138,111
	22,611
Tabla 3. Análisis de Varianza
	Fuente de variación
	Suma de cuadrados
	Grados de libertad
	Media cuadrática
	F
	Probabilidad
	Valor crítico para F
	Tratamientos
	138,7407407
	2
	69,37037037
	4,0497
	0,03051
	3,4028
	Error
	411,111
	24
	17,12962963
	
	
	
	Total
	549,851
	26
	 
	 
	 
	 
Conclusión: 
Como Calculado es mayor al Fcritico, la hipótesis se rechaza, por ende, no todas las medias poblacionales son iguales, por ende, sus temperaturas no son consideradas iguales, todo esto con un nivel de confianza del 95%
4.3) Emite sus comentarios al respecto. 
La tabla ANOVA no puede determinar los tratamientos que presentan inconvenientes, por ende, se deben aplicar otras pruebas que permitan conocer donde esta el problema, es aquí, donde se pueden usar rangos de confianza como un criterio de aceptación donde se comparan estas medias.
Los intervalos de confianza de la diferencia entre las medias de tratamiento se calculan de la siguiente manera:
· Valor de t:
Ttabulado con 24 grados de libertar y una significancia de 0.05
Por tanto,
De la tabla ANOVA:
· Comparación entre 25ºC y 50ºC
El intervalo de confianza incluye el valor de cero, por ende, se concluye que no hay una diferencia entre las medias de estos tratamientos
· Comparación entre 25ºC y 75ºC
El intervalo de confianza no contiene al cero, por tanto, si existe una diferencia significativa entre las medias de estos tratamientos
· Comparación entre 50ºC y 75ºC
El intervalo de confianza contiene al cero, por tanto, no existe una diferencia significativa entre las medias de los tratamientos seleccionados.
Por ende, las medias de los tratamientos que difieren son las de los niveles 25ºC y 75ºC.
4.4) Si existe algún efecto debería ser positivo o negativo??
En caso de que exista el efecto positivo, la temperatura será mayor, donde la respuesta de proceso analizado será mas rápida, por una velocidad de reacción donde participan las constantes de velocidad de reacción.
1. Se realizan cultivos de microrganismos, y se desea establecer cuál es el mejor tratamiento, se plantean 4 posibilidades:
	T1
	T2
	T3
	T4
	8.69
	8
	17.39
	10.37
	6.68
	16.41
	13.73
	9.16
	6.83
	12.43
	15.62
	8.13
	6.43
	10.99
	17.65
	4.40
	1.30
	15.53
	15.42
	10.38
5.1) Realice un análisis ANOVA: LSD, TUKEY Y DUNCAN, para medias y emita sus comentarios. SI se requiere plantéese una significancia del 5% 
5.2) Cual de los 3 análisis ANOVA realizados usted recomendaría usar? 
5.3) Cuál es el mejor tratamiento y por qué? 
5.4) Si no existiera evidencia de mejora en algún tratamiento, que factores consideraría usted para emitir su recomendación??
Solución:
Datos:
Planteamiento de hipótesis: 
5.1) Realice un análisis ANOVA: LSD, TUKEY Y DUNCAN, para medias y emita sus comentarios. SI se requiere plantéese una significancia del 5% 
· ANOVA
· Sumatoria de cuadrados
Se demuestra el valor de la varianza por grupo
· Suma de cuadrados de errores
La respuesta de la suma de cuadrados de error representa la varianza dentro de los grupos, donde se demuestra que se acepta el valor según el objetivo de búsqueda de varianza.
1. Calcular medias de niveles y error:
· CM Tratamiento
a. CM Error
2. Valor de varianzas de medias de tratamientos y error
3. Criterio de rechazo:
Se rechaza la hipótesis nula, es decir: “los tratamientos son iguales lo que se significar que ninguno puede tener efector favorables. 
Conclusión 
Se rechaza , estadísticamente se ha demostrado que las medias de todos los tratamientos no son iguales. Por ende, al menos 1 como mínimo presenta diferencia.
MÉTODO DE DIFERENCIA MÍNIMA SIGNIFICATIVA (LSD)
· Comparar las medias de cada posibilidad
· Determinar las posibles comparaciones:
Entonces:
	
	
	
1. Estadístico de prueba
Se rechaza la H0 (comparación de medias) si ocurre que:
Se realiza las comparaciones 
	Comparaciones posibles 
	Diferencias de medias muestrales
	LSD Tabulado
	Criterio
	
	-6,686
	
	No se rechaza H0
	
	-9.976
	
	No se rechaza H0
	
	-2.502
	
	No se rechaza H0
	
	-3.29
	
	No se rechaza H0
	
	4.184
	
	Se rechaza H0 (significativamente diferentes)
	
	7.474
	
	Se rechaza H0 (significativamente diferentes)
Conclusiones 
Se ha demostrado que el tratamiento 4 es el mejor, por ende tendrá una mayor relevancia o peso frente a los demas tratamientos donde se consideraron los mismos test de prueba.
MÉTODO DE TUKEY 
Datos:
Alpha= 0.05
K=4; designación de tabla (P)
N-k=16; designación de tabla (f)
Se plantea un Rango de datos ESTUDENTIZADO (5%)= 4,05
1. Compara las diferencias entre las medias muestrales vs el estadístico crítico
 
2. Criterio de rechazo 
RECHAZO SI:	 		
	Comparaciones posibles 
	Diferencias de medias muestrales
	Calculado
	Criterio
	
	-6,686
	
	No significativa (medias iguales)
	
	-9.976
	
	No significativa (medias iguales)
	
	-2.502
	
	No significativa (medias iguales)
	
	-3.29
	
	No significativa (medias iguales)
	
	4.184
	
	No significativa (medias iguales)
	
	7.474
	
	Significativa (Medias diferentes)
3. Conclusión 
Todas las medias son iguales menos a del valor 4 por ende se toma en consideración este análisis para los datos posteriores.
MÉTODO DE DUNCAN
Datos:
N-k=16; designación de tabla (f)
Se plantea un nivel de significancia del (5%)
1. Criterios de rechazo 
 
SIGNIFICATIVAMENTE DIFERENTES SI :	
2. El error estándar está dado por:
3. Cálculo del Rango 
	Valores tabulados: 
	
	Estadístico 2= 3
	Rango 2=3,9723
	Estadístico 3= 3,15
	Rango 3= 4,1709
	Estadístico 4=3,23
	Rango 4= 4,27
4. ordenar las medias de mayor a menor 
T3=15,962
T2= 12,672
T4=8,488
T1=5,986
5. Realizar las restas en base al orden establecido.
	OrdenResta
	T3-T1
	9,976
	T3-T4
	7,474
	T3-T2
	3,29
	T2-T1
	6.686
	T2-T4
	4.184
	T4-T1
	2.502
6. Comparar los resultados con el valor de 𝑅𝑝 tabulado.
	Orden
	Resta
	Rk
	Rango
	Criterio
	T3-T1
	9,976
	4
	4,27
	Significativo
	T3-T4
	7,474
	3
	4,1709
	Significativo
	T3-T2
	3,29
	2
	3,9723
	No Significativo
	T2-T1
	6.686
	3
	4,1709
	Significativo
	T2-T4
	4.184
	2
	3,9723
	Significativo
	T4-T1
	2.502
	2
	3,9723
	No significativo
7. conclusión 
El tratamiento cuatro sigue demostrando diferencia frente a los demas 
5.2) Cual de los 3 análisis ANOVA realizados usted recomendaría usar? 
Usaria LSD, ya que es claro, completo, se puede mencionar verificar por un análisis ANOVA, Un claro ejemplo es evidenciado en el método Tukey ya que al utilizar la tabla de datos genero un resultado diferente al método LSD.
5.3) Cuál es el mejor tratamiento y por qué? 
Por mucho el mejor tratamiento siempre fue el cuatro, cada prueba lo daba como ganador porque al analizar de forma inferencial, se concluyó que este tratamiento resulto estar por encima de la base de los demás, siendo el mas efectivo para los microorganismos.
5.4) Si no existiera evidencia de mejora en algún tratamiento, que factores consideraría usted para emitir su recomendación??
Pues consideraría, modificar los niveles, ya que al modificar tales tratamientos puedo encontrar nuevos estadísticos inferenciales que me aporten mediante hipótesis, afirmaciones que si me sirvan para utilizar en el tratamiento, es aplicación de prueba y error considero yo. 
Bibliografía
Becerra, M. (2015). UNAM. Obtenido de Dsitribución normal: http://prepa8.unam.mx/academia/colegios/matematicas/paginacolmate/applets/matematicas_VI_12/Applets_Geogebra/disnormal.html
Flores, C. (2021). PRUEBAS PARA COMPROBAR LA NORMALIDAD DE DATOS EN PROCESOS PRODUCTIVOS: ANDERSON-DARLING, RYAN-JOINER, SHAPIRO-WILK Y KOLMOGÓROV-SMIRNOV. Ciencias sociales y humanisticas. Obtenido de http://portal.amelica.org/ameli/jatsRepo/341/3412237018/html/index.html
Minitab. (2019). Minitab. Obtenido de Distribucion normal: https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/normality/what-is-the-normal-distribution/
Quevedo, F. (2011). ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD. Medwave. Obtenido de https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5033
Rodo, P. (10 de noviembre de 2019). Economipedia. Obtenido de Distribución normal: https://economipedia.com/definiciones/distribucion-normal.html
Zambrano, A. (2004). TAMAÑO DE MUESTRA EN EXPERIMENTOS BIOTECNOLÓGICOS CON SUSPENSIONES CELULARES. Interciencia. Obtenido de http://ve.scielo.org/scielo.php?script=sci_arttext&pid=S0378-18442004000700011
1)
 
Se ha establecido durante el transcurso de esta as
ignatura que el primer paso 
para analizar un conjunto de datos provenientes de un experimento o 
producidos por un determinado tratamiento se debe analizar la NORMALIDAD 
de estos. Determine sus conceptos (lo más detallado posible) que significa que un 
conju
nto de datos se distribuya normalmente, como se puede determinar la 
normalidad (todos los procedimientos posibles), escriba al menos un ejemplo 
(para ello plantee algún ejemplo de biotecnología ambiental)
 
 
a)
 
Conceptos de normalidad 
 
Ø
 
La 
distribución normal es un modelo teórico capaz de aproximar 
satisfactoriamente el valor de una variable aleatoria a una situación ideal. En otras 
palabras, la distribución normal adapta una variable aleatoria a una función que 
depende de la media y la desv
iación típica. Es decir, la función y la variable 
aleatoria tendrán la misma representación, pero con ligeras diferencias.
 
(Rodo, 
2019)
 
Ø
 
La distribución normal es una distribución con forma de campana donde las 
desviaciones estándar sucesivas con respecto a la media establecen valores de 
referencia para estimar el porcentaje de observaciones de los datos. Estos valores 
de referencia son la base de muchas pruebas de hipótesis, como las pruebas Z y t.
 
(Minitab, 2019)
 
Ø
 
La distribución normal sirve para conocer la probabilidad de encontrar un valor 
de la variable que sea igual o inferior a un cierto valor x
i
, conociendo la media, la 
desviación estándar, y la varianza de un conjunto de datos
 
en sustituyéndolos en 
la función que describe el modelo. El cálculo resulta bastante complejo, pero, 
afortunadamente, existen tablas estandarizadas que permiten eludir este 
procedimiento. Su aplicación más importante es que en la gráfica, el área 
sombread
a corresponde a la probabilidad de encontrar un valor de la variable que 
sea igual o inferior a un valor dado. Esa probabilidad se determina usando una 
tabla estandarizada.
 
(Becerra, 2015)
 
Formula
 
 
Variable aleatoria X 
aproximada a una distribución normal.
 
 
Donde los parámetros de la distribución son la media o valor central y la 
desviación típica:
 
 
 
Parámetros de una distribución normal.
 
1) Se ha establecido durante el transcurso de esta asignatura que el primer paso 
para analizar un conjunto de datos provenientes de un experimento o 
producidos por un determinado tratamiento se debe analizar la NORMALIDAD 
de estos. Determine sus conceptos (lo más detallado posible) que significa que un 
conjunto de datos se distribuya normalmente, como se puede determinar la 
normalidad (todos los procedimientos posibles), escriba al menos un ejemplo 
(para ello plantee algún ejemplo de biotecnología ambiental) 
 
a) Conceptos de normalidad 
 La distribución normal es un modelo teórico capaz de aproximar 
satisfactoriamente el valor de una variable aleatoria a una situación ideal. En otras 
palabras, la distribución normal adapta una variable aleatoria a una función que 
depende de la media y la desviación típica. Es decir, la función y la variable 
aleatoria tendrán la misma representación, pero con ligeras diferencias. (Rodo, 
2019) 
 La distribución normal es una distribución con forma de campana donde las 
desviaciones estándar sucesivas con respecto a la media establecen valores de 
referencia para estimar el porcentaje de observaciones de los datos. Estos valores 
de referencia son la base de muchas pruebas de hipótesis, como las pruebas Z y t. 
(Minitab, 2019) 
 La distribución normal sirve para conocer la probabilidad de encontrar un valor 
de la variable que sea igual o inferior a un cierto valor x
i
, conociendo la media, la 
desviación estándar, y la varianza de un conjunto de datos en sustituyéndolos en 
la función que describe el modelo. El cálculo resulta bastante complejo, pero, 
afortunadamente, existen tablas estandarizadas que permiten eludir este 
procedimiento. Su aplicación más importante es que en la gráfica, el área 
sombreada corresponde a la probabilidad de encontrar un valor de la variable que 
sea igual o inferior a un valor dado. Esa probabilidad se determina usando una 
tabla estandarizada. (Becerra, 2015) 
Formula 
 
Variable aleatoria X aproximada a una distribución normal. 
 
Donde los parámetros de la distribución son la media o valor central y la 
desviación típica: 
 
 
Parámetros de una distribución normal.

Continuar navegando