Logo Studenta
¡Este material tiene más páginas!

Vista previa del material en texto

Joel Morales, José Luis Quemé y Mario Melgar. 
Centro guatemalteco de 
investigación y capacitación de 
la caña de azúcar. 
-CENGICAÑA-
Santa Lucia Cotz. Agosto 2009.
Primera Edición 
InfoStat 
Manual de uso 
 Contenido 
 
 
Aspectos generales de InfoStat ........................................................................................................................... 1 
Aspecto de la base de datos: Video. ............................................................................................................... 1 
¿Cómo importar una base de datos desde Excel? ....................................................................................... 1 
¿Cómo pegar una base de datos desde Excel? ............................................................................................ 2 
Transformación de datos ................................................................................................................................ 3 
Prueba de hipótesis ............................................................................................................................................. 4 
Términos de importancia al realizar una prueba de hipótesis ......................................................................... 4 
Pasos para evaluar una hipótesis estadística. .................................................................................................. 5 
Prueba de hipótesis acerca de una media poblacional normal. Video ............................................................ 5 
Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video ........................................................ 8 
Prueba de hipótesis acerca de dos medias independientes. Video ................................................................. 9 
Diseño completamente al azar .......................................................................................................................... 10 
Características generales .............................................................................................................................. 10 
Utilización del diseño ................................................................................................................................... 10 
Supuestos del modelo. .................................................................................................................................. 10 
Diseño de bloques completos al azar ................................................................................................................ 14 
Hipótesis del modelo .................................................................................................................................... 14 
Supuestos del modelo ................................................................................................................................... 14 
Serie de Experimentos ...................................................................................................................................... 19 
Análisis de experimentos factoriales ................................................................................................................ 23 
Arreglos combinatorios ................................................................................................................................ 24 
Parcelas divididas ......................................................................................................................................... 28 
Franjas divididas ........................................................................................................................................... 31 
Análisis de correlación lineal simple. ............................................................................................................... 34 
Regresión Lineal............................................................................................................................................... 36 
RL Simple..................................................................................................................................................... 36 
Supuestos del modelo de regresión .......................................................................................................... 37 
RL Múltiple .................................................................................................................................................. 41 
Bibliografía ....................................................................................................................................................... 42 
Anexos .............................................................................................................................................................. 43 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
1 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Aspectos generales de InfoStat 
 
Aspecto de la base de datos: Video. 
 
La base de datos es la matriz de información, sobre la que se trabaja. La forma de ingreso 
de la información es en base a los criterios de organización de datos, donde se colocan en 
las columnas las variables y en las filas las observaciones, por lo que cada fila es un 
individuo o unidad experimental y cada celda contiene el dato o el valor que pertenece a 
cada variable para cada observación. 
¿Cómo importar una base de datos desde Excel? 
 
InfoStat posee grandes ventajas respecto a la facilidad en el manejo de datos, es muy 
versátil en la importación de datos desde Excel (versión 2003 o anterior), esto es 
importante, pues este último es muy utilizado en la generación de bases de datos tomados 
en campo. 
 
Es posible importar directamente una base de datos desde Excel y otros formatos. Esto 
facilita el manejo y presentación de los mismos. 
 
 
Figura 1: Selección de la hoja de cálculo importada desde Excel. 
 
 
 
 
Abrir%20una%20base%20de%20datos.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
2 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
¿Cómo pegar una base de datos desde Excel? 
 
Muchas veces poseemos la base de datos de tal forma, que no coincide la primera fila y la 
primera columna con información propia de la base , o se poseen objetos distintos como 
gráficas o logotipos. Considerando esto, es relativamente fácil, el copiar la base de datos 
que se desea analizar de forma directa a la tabla de InfoStat. Para esto se puede incluir la 
primera fila como el nombre de las columnas o no. Se debe de presionar el botón derecho 
del ratón y seleccionar la opción “pegar” o “pegar incluyendo nombre de columnas”. 
 
 
 
Figura 2: Como pegar una base de datos en la tabla de InfoStat. 
 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
3 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Transformación de datos 
 
Muchas veces se trabaja con variables cualitativas o datos no paramétricos, los cuales no 
cumplen con el supuesto de normalidad. Por lo anterior es necesario realizar 
transformación de estos datos. 
 
InfoStat ofrece una gran cantidad de transformaciones para una variable, y a la vez permite 
la operación entre variables. 
 
 
Figura 3: Menú a seleccionar para realizar una transformación 
Para realizar la transformación se debe de seleccionar la variable, luego de indicar que se 
desea realizar una transformación. 
 
 
Figura 4: Opciones de trasformación 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
4 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Prueba de hipótesis 
 
 Hipótesis Nula (Ho) 
 
Esta es la que el investigadorevalúa y está dispuesto a sostener como probable, a menos 
que la evidencia experimental en su contra sea sustancial. 
 
 Hipótesis alternativa (Ha) 
 
Es la negación de la hipótesis nula. 
 
Términos de importancia al realizar una prueba de hipótesis 
 
 Error tipo I (α) 
 
Es la probabilidad de rechazar una Ho cuando es falsa. 
 
 Error tipo II (β) 
 
Es la probabilidad de no rechazar una Ho Cundo es falsa. 
 
Cuadro 1: Posibles errores. 
 
 
Tomada de Anderson, E; Black, W. et al. 1999. 
 
 Nivel de significancia 
 
Es el valor de probabilidad de error tipo I, que el investigador está dispuesto a aceptar. 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
5 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Pasos para evaluar una hipótesis estadística. 
 
1. Definir la hipótesis nula y alternativa adecuada para el caso de evaluación. 
 
Cuadro 2: Casos de hipótesis a evaluar 
 
 
2. Seleccionar el estadístico de prueba, necesario para evaluar la hipótesis. 
 
Cuadro 3: Estadísticos utilizados en la prueba de hipótesis 
 
Tomado de López, E. 2008. 
 
3. Especificar el nivel de significancia. 
4. Establecer la regla de decisión. 
5. Establecer los valores del estadístico seleccionado de la prueba y compararlo con el 
valor critico establecido. 
6. Conclusión. 
 
Prueba de hipótesis acerca de una media poblacional normal. Video 
 
 
Ejemplo: 
 
En una región cañera se siembra predominantemente una variedad de caña de azúcar que 
tiene un TCH promedio de 103.5 toneladas ha
-1
. Un programa de mejoramiento ha 
desarrollado una nueva variedad, comúnmente usada, con rendimientos mayores a la 
variedad predominante. Para probar esta aseveración se siembran nueve lotes 
experimentales con la nueva variedad y se obtienen los siguientes rendimientos: 
 
 
 
 
Prueba%20de%20hipótesis%20para%20una%20media%20poblaciónal%20normal.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
6 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Cuadro 4: Rendimiento en toneladas de caña por hectárea, tomado de 9 lotes distintos. 
Lote TCH 
1 103.15 
2 103.92 
3 104.26 
4 103.36 
5 103.72 
6 104.19 
7 103.42 
8 104.38 
9 104.5 
Prom. 103.88 
 
 
 
 
Identificación del parámetro sobre el cual se desea inferir en base a la muestra: 
 
Media (µ) 
 
Hipótesis a probar: 
 
Ho: µ≤103.5 Ha: µ>103.5 
 
Elección del modelo probabilístico bajo el cual se operará: 
 
La t de Student 
 
Especificación del nivel de significancia. 
 
α = 5% o 0.05 
 
Establecer la regla de decisión: 
 
 
Se Rechaza la Ho si p ≤ α 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
7 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
 
Figura 5: Ubicación de la prueba 
 
Se debe de seleccionar la columna a analizar y se debe de indicar el parámetro con el cual 
se realizará la comparación. 
 
 
Prueba T para un parámetro 
 
Valor del parámetro probado: 103.5 
Variable n Media DE LI(95) T p(Unilateral D) 
TCH 9 103.88 0.49 103.57 2.32 0.0246 
 
La regla de desición: 
 
En base a la prueba T, se observa una probabilidad de p = 0.0246. Este valor es menor a la 
probabilidad permitida (α= 0.05), por lo que se rechaza Ho. 
 
Conclusión: 
La muestra apoya la aseveraión del programa de mejoramiento. 
 
 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
8 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video 
 
Cuadro 5: Rendimientos en toneladas de caña por hectarea, de dos variedades tamados de 6 lotes. 
NF CP72-2086 CG97-77 
1 160 130 
2 112 118 
3 184 225 
4 186 149 
5 104 168 
6 152 139 
Prom. 150 155 
 
Es importante que se ingresen los datos en dos columnas, una para cada población o 
conjunto de datos. 
 
 
Figura 6: Ubicación de la prueba 
En este caso la hipótesis a evaluar es: 
 
Ho: la diferencia entre las medias es igual a cero, que es igual a decir que ambas medias 
son iguales µ1 = µ2. 
 
Ha: µ1 ≠ µ2. 
 
Prueba T (muestras apareadas) 
Obs(1) Obs(2) media(dif) Media(1) Media(2) DE(dif) T Bilateral 
CG97-77 CP72-2086 5.17 154.83 149.67 40.23 0.31 0.7658 
 
 
Conclusión: 
 
En base a las evidencias se puede aseverar que los tonelajes de ambas variedades son 
semejantes. 
Prueba%20de%20hipótesis%20para%20dos%20medias.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
9 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Prueba de hipótesis acerca de dos medias independientes. Video 
 
Cuadro 6: Rendimientos en toneladas de caña por hectárea, bajo dos tratamientos de aplicación de fosforo. 
Fosforo 0 Fosforo 240 
P0 P240 
150 165 
155 167 
149 168 
153 167 
 
Es necesario que para ingresar los datos en InfoStat, se debe de crear una columna donde se 
coloque el nombre o código de la variable, útil para la clasificación, y una columna donde 
se ingrese el valor de la variable a estudiar. 
 
 
 
Figura 7: Ubicación de la prueba 
 
 
Prueba T para muestras Independientes 
 
Variab Grupo(1)Grupo(2) media(1) media(2) p(Var.Hom.) T p 
TCH {P0} {P240} 151.75 166.75 0.2307-9.91 0.0001 
 
 
Conclusión: 
 
Al observar la salida del análisis, se puede decir que el rendimiento del tratamiento P240 es 
mayor que el rendimiento del tratamiento P0. 
 
 
Prueba%20de%20hipótesis%20para%20dos%20medias%20muestrales.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
10 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Diseño completamente al azar 
 
 
Es importante que al momento de realizar un análisis de varianza, se tenga bien claro las 
fuentes de variación consideradas por dicho modelo. 
 
 
Tomado de López, E. 2008 
 
Como la media general y el error experimental son términos que poseen en común todos los 
modelos, no es necesario el indicarlos entre las fuentes de variación. 
Características generales 
 
 Se usa cuando las unidades experimentales son homogéneas 
 Con el se puede probar cualquier número de tratamientos (ya sean niveles de un 
solo factor o combinaciones de nivel de varios factores) 
 Los tratamientos se aplican a las unidades experimentales al azar. 
 Cualquier número de repeticiones por tratamiento es posible. 
Utilización del diseño 
 
Este diseño se recomienda cuando existe homogeneidad entre unidades experimentales, 
esto quiere decir que no existe influencia de la ubicación de la unidad experimental sobre el 
efecto del tratamiento, esto es muy utilizado en ensayos a nivel de laboratorio, cuando se 
utilizan macetas o medios de cultivos, donde las condiciones son las mismas para todas las 
unidades experimentales. 
Supuestos del modelo. 
 
 Los errores son independientes. 
 Los errores están normalmente distribuidos con media cero y varianza constante 
 Existe homogeneidad de varianzas entre los tratamientos 
 El modelo es lineal y de efectos aditivos. 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
11 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Ejemplo: Video. 
 
Cuadro 7: Rendimiento (TCH), evaluando 3 frecuencias de riego. 
Tratamientos Repetición 1 Repetición 2 Repetición 3 
Testigo (práctica regional) 123 133 131 
Riego cada 21 días 175 167 192 
Riego cada 28 días 199 203 166 
Riego cada 35 días 179 188 203 
Tomado de Martínez, A. (1998). 
 
En este caso los datos se deben de ingresar en la Tabla de InfoStat, indicandoen una 
columna el tratamiento evaluado y en la columna de la par la variable de respuesta 
correspondiente a cada tratamiento. 
 
Cuadro 8: Tabla de datos como se debe de ingresar a InfoStat. 
Tratamientos TCH 
Testigo (práctica regional) 123 
Riego cada 21 días 175 
Riego cada 28 días 199 
Riego cada 35 días 179 
Testigo (práctica regional) 133 
Riego cada 21 días 167 
Riego cada 28 días 203 
Riego cada 35 días 188 
Testigo (práctica regional) 131 
Riego cada 21 días 192 
Riego cada 28 días 166 
Riego cada 35 días 203 
 
En la pestaña estadísticas se encuentra la opción análisis de varianza, al aceptar aparece un 
cuadro donde se debe de indicar las variables dependientes (TCH) y las variables de 
clasificación (Tratamientos). Para esto se debe de utilizar los botones de acción . 
 
completamente%20al%20azar.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
12 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
 
 
Figura 8: Selección de las variables. 
 
 
Al aceptar aparecerá otro recuadro, donde se debe indicar las fuentes de variación del 
modelo, como ya se mencionó la media general y el error no se indican. Esto se realiza en 
la pestaña . A un lado se encuentra la pestaña donde se puede indicar 
la prueba de media que se desea realizar, donde se encuentran varias opciones. 
 
 
Figura 9: Selección del método de comparación de medias. 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
13 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Análisis de la varianza 
 
 
Variable N R² R² Aj CV 
TCH 12 0.83 0.77 7.98 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 7526.25 3 2508.75 13.37 0.0018 
Tratamientos 7526.25 3 2508.75 13.37 0.0018 
Error 1500.67 8 187.58 
Total 9026.92 11 
 
Test:LSD Fisher Alfa=0.05 DMS=25.78763 
Error: 187.5833 gl: 8 
 Tratamientos Medias n 
Riego cada 35 días 190.00 3 A 
Riego cada 28 días 189.33 3 A 
Riego cada 21 días 178.00 3 A 
Testigo (práctica regional.. 129.00 3 B 
Letras distintas indican diferencias significativas(p<= 0.05) 
 
 
 
 
 
 
 
 
Riego cada 35 dias
Riego cada 28 días
Riego cada 21 dias
Testigo (práctica regional)
Tratamientos
125.56
144.50
163.45
182.40
201.35
T
C
H
A A
A
B
A A
A
B
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
14 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Diseño de bloques completos al azar 
 
 
 
 
Tomado de López, E. 2008. 
Hipótesis del modelo 
 
τ = τi (todos los tratamientos producen el mismo efecto) 
τ ≠ τi para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos 
distintos). 
 
Supuestos del modelo 
 
εij ~ NID (0,σ2) 
Los errores son independientes y normalmente distribuidos, con media cero y varianza 
constante (homogeneidad de varianzas). 
 
No existe interacción entre bloque y tratamiento (*) 
 
(*) Significa que un tratamiento no debe modificar su acción (o efecto) por estar en uno u 
otro bloque. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
15 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Ejemplo: Video 
 
Cuadro 9: Rendimiento en Toneladas de caña por hectárea, caña plantilla, finca Margaritas. 
 Bloques 
Variedad I II III IV 
CGSP98-08 177 182 182 166 
CG00-032 136 158 141 156 
CGSP-98-05 166 193 158 186 
CGSP-98-16 195 213 176 185 
CG00-120 231 213 216 188 
CG00-129 175 172 168 155 
CG00-001 170 171 179 185 
CG00-092 190 206 208 196 
CG99-045 164 163 179 175 
CG00-028 199 189 226 208 
CG00-044 188 181 208 192 
CG-99-014 210 203 191 210 
PR75-2002 249 217 227 231 
CP72-2086 161 165 194 179 
 
Para este análisis la base de datos se debe de ordenar de tal forma que se tenga una columna 
donde se indique el tratamiento aplicado y a la par en otra columna a que bloque pertenece 
y en una tercera el valor de la variable medida. 
 
Cuadro 10: Forma de ingresar los datos a la base de datos. 
Variedad Bloque TCH 
CGSP98-08 I 177 
CG00-032 I 136 
… 
CP72-2086 IV 179 
 
Para realizar el análisis de varianza se debe de ir a la pestaña estadísticas, se despliega un 
menú, donde se debe seleccionar la opción análisis de varianza. 
 
Se debe de seleccionar en el apartado “variables dependientes” la columna del tonelaje 
(TCH) y en el apartado “variable de clasificación” la columna que indica el tratamiento 
aplicado y la columna donde se indica a que bloque pertenece. 
 
bloques%20completos%20al%20azar.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
16 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
Figura 10: Selección de los términos del modelo. 
Para indicar el modelo de bloques completos al azar, se observan las fuentes de variación 
en el recuadro “términos del modelo”, y debajo de este se observa un botón de acción 
llamado “agregar interacción” en este caso no se debe de agregar, de esta forma se cumple 
con uno de los supuestos del modelo. 
 
Figura 11: Especificación del modelo. 
Luego de elegir el método de comparación de medias, se debe de seleccionar en base a que 
agrupación se desea la comparación. 
 
No activar 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
17 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
Figura 12: Agrupamiento de las medias para su comparación. 
 
Análisis de la varianza 
 
 
Variable N R² R² Aj CV 
TCH 56 0.79 0.71 6.80 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 24459.00 16 1528.69 9.40 <0.0001 
Bloque 82.07 3 27.36 0.17 0.9172 
Variedad 24376.93 13 1875.15 11.53 <0.0001 
Error 6340.93 39 162.59 
Total 30799.93 55 
 
Test:LSD Fisher Alfa=0.05 DMS=18.23722 
Error: 162.5879 gl: 39 
Variedad Medias n 
PR75-2002 231.00 4 A 
CG00-120 212.00 4 B 
CG00-028 205.50 4 B C 
CG-99-014 203.50 4 B C 
CG00-092 200.00 4 B C 
CG00-044 192.25 4 C D 
CGSP-98-16 192.25 4 C D 
CGSP98-08 176.75 4 D E 
CG00-001 176.25 4 D E 
CGSP-98-05 175.75 4 D E 
CP72-2086 174.75 4 D E 
CG99-045 170.25 4 E 
CG00-129 167.50 4 E 
CG00-032 147.75 4 F 
Letras distintas indican diferencias significativas(p<= 0.05) 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
18 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
En la pestaña donde se selecciona el método de comparación de medias, también existe una 
opción que devuelve un gráfico de barras con la jerarquía del test seleccionado. 
 
 
Figura 13: Evaluación de tres distintos ciclos de riego. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
P
R
7
5
-2
0
0
2
C
G
0
0
-1
2
0
C
G
0
0
-0
2
8
C
G
-9
9
-0
1
4
C
G
0
0
-0
9
2
C
G
0
0
-0
4
4
C
G
S
P
-9
8
-1
6
C
G
S
P
9
8
-0
8
C
G
0
0
-0
0
1
C
G
S
P
-9
8
-0
5
C
P
7
2
-2
0
8
6
C
G
9
9
-0
4
5
C
G
0
0
-1
2
9
C
G
0
0
-0
3
2
Variedad
143.27
167.92
192.56
217.21
241.86
T
C
H
A
B
BC BC
BC
CD CD
DE DE DE DE
E
E
F
A
B
BC BC
BC
CD CD
DE DE DE DE
E
E
FInfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
19 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Serie de Experimentos 
 
 
Es común que se realicen experimentos con la misma estructura, pero en distintas 
localidades. Con esto se desea obtener conclusiones válidas para toda una región, esto 
suponiendo aleatorización de las localidades. 
 
Para esto es necesario el analizar por separado las localidades y luego realizar un análisis 
que integre todas las localidades. Estos ensayos se pueden realizar no solo para localidades 
distribuidas en el espacio, si no también ensayos distribuidos en el tiempo, por ejemplo el 
realizar un ensayo de herbicidas para verano y otro en invierno con la misma estructura, y 
concluir para todo el año. 
 
También es importante que se cumpla con el supuesto de homocedasticidad entre ensayos, 
esto se puede probar por medio de la prueba de Hartley. 
 
 
 
 
 
Siendo: 
 
Yijk = toneladas de caña por hectárea referentes al i-ésimo producto madurante en el 
jésimo bloque o repetición de la k-ésima localidad; 
μ = media general 
τi = efecto del i-ésimo producto madurante 
βj / k = efecto del j-ésimo bloque en la k-ésima localidad, 
lk = efecto de la k-ésima localidad, 
(τl)ik = efecto de la interacción entre el i-ésimo producto madurante y la k-ésima localidad, 
εijk = error experimental asociado a la observación Yijk. 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
20 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Ejemplo: Video. 
Cuadro 11: Toneladas de caña por hectárea, plantilla, en tres localidades. 
 Las Margaritas San Bonifacio Tululá 
 Bloque Bloque Bloque 
Variedad I II III IV I II III IV I II III IV 
CGSP98-08 177 182 182 166 148 152 168 175 111 110 115 103 
CG00-032 136 158 141 156 115 124 104 141 95 90 68 125 
CGSP-98-05 166 193 158 186 153 140 104 145 99 127 130 132 
CGSP-98-16 195 213 176 185 153 117 111 179 125 82 119 107 
CG00-120 231 213 216 188 162 164 153 158 107 112 113 110 
CG00-129 175 172 168 155 153 127 144 99 105 117 115 119 
CG00-001 170 171 179 185 164 158 157 153 81 82 103 122 
CG00-092 190 206 208 196 171 133 157 181 50 99 97 92 
CG99-045 164 163 179 175 162 117 149 153 96 85 111 93 
CG00-028 199 189 226 208 172 103 109 107 131 122 135 100 
CG00-044 188 181 208 192 157 150 90 92 137 109 111 94 
CG-99-014 210 203 191 210 144 152 156 151 108 99 127 136 
PR75-2002 249 217 227 231 169 162 175 190 123 112 128 129 
CP72-2086 161 165 194 179 130 123 155 153 83 100 106 112 
 
En este caso, como se puede observar, en el modelo el efecto del bloque se encuentra 
anidado en la localidad, por lo que se debe de indicar en las fuentes de variación, para esto 
se utiliza el símbolo “>” para indicar que el efecto del bloque se encuentra dentro de la 
localidad (Localidad>Bloque) y teniendo en cuenta que el error de la localidad es 
Localidad>Repetición, como se ha mencionado en ejemplos anteriores. 
 
Figura 14: Fuentes de variación del modelo 
serie%20de%20experimentos.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
21 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Análisis de la varianza 
 
 
Variable N R² R² Aj CV 
TCH 168 0.88 0.83 11.08 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor (Error) 
Modelo 227787.23 50 4555.74 17.26 <0.0001 
Localidad 177483.08 2 88741.54 200.72 <0.0001 (Loc>Rep) 
Localidad>Repetición 3979.12 9 442.12 1.68 0.1025 
Variedad 25378.43 13 1952.19 7.40 <0.0001 
Localidad*Variedad 20946.58 26 805.64 3.05 <0.0001 
Error 30873.63 117 263.88 
Total 258660.85 167 
 
Test:LSD Fisher Alfa=0.05 DMS=8.98910 
Error: 442.1250 gl: 9 
 Localidad Medias n 
San Bonifacio 187.54 56 A 
Las Margaritas 144.36 56 B 
Tululá 108.02 56 C 
Letras distintas indican diferencias significativas(p<= 0.05) 
 
 
Test:LSD Fisher Alfa=0.05 DMS=13.13374 
Error: 263.8771 gl: 117 
Variedad Medias n 
PR75-2002 176.00 12 A 
CG00-120 160.58 12 B 
CG-99-014 157.25 12 B C 
CG00-028 150.08 12 B C D 
CGSP98-08 149.08 12 B C D 
CG00-092 148.33 12 B C D 
CGSP-98-16 146.83 12 C D 
CGSP-98-05 144.42 12 C D 
CG00-001 143.75 12 D 
CG00-044 142.42 12 D 
CP72-2086 138.42 12 D 
CG00-129 137.42 12 D 
CG99-045 137.25 12 D 
CG00-032 121.08 12 E 
Letras distintas indican diferencias significativas(p<= 0.05) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
22 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
 
 
 
 
 
 
 
 
San Bonifacio Las Margaritas Tululá
Localidad
103.93
126.40
148.86
171.33
193.79
T
C
H
A
B
C
A
B
C
P
R
7
5
-2
0
0
2
C
G
0
0
-1
2
0
C
G
-9
9
-0
1
4
C
G
0
0
-0
2
8
C
G
S
P
9
8
-0
8
C
G
0
0
-0
9
2
C
G
S
P
-9
8
-1
6
C
G
S
P
-9
8
-0
5
C
G
0
0
-0
0
1
C
G
0
0
-0
4
4
C
P
7
2
-2
0
8
6
C
G
0
0
-1
2
9
C
G
9
9
-0
4
5
C
G
0
0
-0
3
2
Variedad
118.10
134.49
150.89
167.28
183.67
T
C
H
A
B
BC
BCD BCD BCD CD
CD D D
D D D
E
A
B
BC
BCD BCD BCD CD
CD D D
D D D
E
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
23 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Análisis de experimentos factoriales 
 
 
Cuando se habla de experimentos factoriales, es cuando evaluamos simultáneamente el 
efecto de dos o más valores. Dependiendo del arreglo y las interacciones entre los factores 
se pueden generar diversos diseños adecuados a distintas condiciones en campo. 
 
 
 
Ventajas 
a. Se logra una gran eficiencia en el uso de los recursos experimentales disponibles. 
 
b. Se obtiene información respecto a las diversas interacciones. 
 
c. Los resultados experimentales son aplicables a un rango de condiciones más 
amplio debido a las combinaciones de los diversos factores en un solo experimento. 
Los resultados son de naturaleza más comprensiva. 
 
d. Los experimentos factoriales son más eficientes que los experimentos simples. 
 
 
 
Inconvenientes 
a. El resultado del experimento y el análisis estadístico resultante son más 
complejos. 
 
b. Con un gran número de combinaciones de tratamientos, la relación de unidades 
experimentales homogéneas es más difícil. 
 
c. Convencidos de que algunas de las combinaciones de tratamientos pueden ser de 
muy poco o ningún interés, algunos de los recursos experimentales pueden ser 
malgastados. 
 
d. El número de tratamientos o combinaciones aumentan rápidamente. 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
24 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Arreglos combinatorios 
 
El modelo que se describe corresponde a un experimento bifactorial, en arreglo 
combinatorio dispuesto en un diseño en bloques completos al azar, debido a que es el más 
usado. 
 
 
 
Tomado de López, E. 2008. 
 
 
 
Siendo que: 
 
Yijk = Variable de respuesta observada o medida en la ijk - ésima unidad experimental 
μ = Media general 
αi = Efecto del i - ésimo nivel del factor "A" 
βj = Efecto del j - ésimo nivel del factor "B" 
(αβ)ij = Efectode la interacción entre el i - ésimo nivel del factor "A" y el j - ésimo nivel 
del factor "B" 
γk = Efecto del k - ésimo bloque 
εijk = Error experimental asociado a la ijk - ésima unidad experimental 
 
 
Ejemplo: Video 
 
 
Cuadro 12: Rendimiento en toneladas de caña por hectárea, evaluando distintas concentraciones de tres elementos. 
Tratamientos Bloque 
N (Kg/ha) P (Kg/ha) K (Kg/ha) I II III IV 
50 0 0 147.88 160.41 129.54 105.21 
150 0 0 129.79 136.2 124.1 111.44 
50 100 0 148.61 160.53 135.84 130.03 
150 100 0 148.12 163.32 161.08 151.28 
50 0 100 126.82 141.77 124.09 127.18 
150 0 100 135.96 142.43 135.96 129.6 
50 100 100 160.48 160.53 136.02 141.89 
150 100 100 178.69 159.99 163.81 148.13 
 
Tomado de Pérez, O. (2002) 
Arreglo%20combinatorio.contrastes.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
25 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Es importante que se cree una columna para indicar los distintos niveles de cada factor y 
otra columna para indicar la repetición o el bloque como también la variable de respuesta. 
 
Cuadro 13: Ejemplo de cómo se debe de ingresar datos en la tabla de InfoStat. 
Nivel N Nivel P Nivel K Bloque TCH 
50 0 0 I 147.88 
150 0 0 I 129.79 
50 100 0 I 148.61 
… 
150 100 100 IV 148.13 
 
 
Figura 15: Variables de clasificación a seleccionar. 
 
Se debe de agregar la interacción de todos los elementos por medio del botón de acción
, se agregará todas las combinaciones posibles, y se debe de eliminar 
las interacciones donde se relacione con el bloque. 
 
También existe la opción de agregar contrastes en el análisis, para esto se debe de indicar el 
contraste deseado en la pestaña contrastes. Se debe de seleccionar entre que agrupaciones 
se desean los contrastes y que tratamientos se desean realizar. Para esto se encuentran dos 
botones, el botón , sirve para indicar que tratamiento se desea contrastar al seleccionar 
el tratamiento y luego presionar el botón de acción. Y el botón indica contra que 
tratamientos se realiza el contraste, es importante activar la casilla 
cuando se realizan más de un contraste. Por último con el botón se ingresa el 
contraste deseado. 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
26 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
Figura 16: Fuentes de variación del modelo. 
 
 
Figura 17: Pasos para agregar contrastes ortogonales 
 
 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
27 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Análisis de la varianza 
 
 
Variable N R² R² Aj CV 
TCH 32 0.81 0.71 6.31 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 7030.28 10 703.03 8.71 <0.0001 
Bloque 2314.84 3 771.61 9.55 0.0004 
Nivel N 215.64 1 215.64 2.67 0.1171 
Nivel P 3611.86 1 3611.86 44.73 <0.0001 
Nivel K 152.99 1 152.99 1.89 0.1832 
Nivel N*Nivel P 434.46 1 434.46 5.38 0.0305 
Nivel N*Nivel K 146.68 1 146.68 1.82 0.1921 
Nivel P*Nivel K 30.99 1 30.99 0.38 0.5423 
Nivel N*Nivel P*Nivel K 122.81 1 122.81 1.52 0.2311 
Error 1695.89 21 80.76 
Total 8726.17 31 
 
Contrastes 
Nivel N*Nivel P*Nivel K SC gl CM F p-valor 
Contraste1 215.64 1 215.64 2.67 0.1171 
Contraste2 3611.86 1 3611.86 44.73 <0.0001 
Contraste3 152.99 1 152.99 1.89 0.1832 
Contraste4 434.46 1 434.46 5.38 0.0305 
Contraste5 146.68 1 146.68 1.82 0.1921 
Contraste6 30.99 1 30.99 0.38 0.5423 
Contraste7 122.81 1 122.81 1.52 0.2311 
Total 4715.44 7 673.63 8.34 0.0001 
 
Coeficientes de los contrastes 
Nivel N*Nivel P*Nivel K Cont.1 Cont.2 Cont.3 Cont.4 Cont.5 Cont.6 Cont.7 
50.00:0.00:0.00 -1.00 -1.00 -1.00 1.00 1.00 1.00 -1.00 
50.00:0.00:100.00 -1.00 -1.00 1.00 1.00 -1.00 -1.00 1.00 
50.00:100.00:0.00 -1.00 1.00 -1.00 -1.00 1.00 -1.00 1.00 
50.00:100.00:100.00 -1.00 1.00 1.00 -1.00 -1.00 1.00 -1.00 
150.00:0.00:0.00 1.00 -1.00 -1.00 -1.00 -1.00 1.00 1.00 
150.00:0.00:100.00 1.00 -1.00 1.00 -1.00 1.00 -1.00 -1.00 
150.00:100.00:0.00 1.00 1.00 -1.00 1.00 -1.00 -1.00 -1.00 
150.00:100.00:100.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 
 
Conclusión: 
 
El análisis indicó que el efecto principal de P fue estadísticamente significativo. 
 
Con la inclusión de ambos (N y P) se obtuvieron las máximas producciones. 
 
No hay diferencia estadística significativa entre 50 y 0 Kg de N/ha evaluando bajo 
aplicaciones de P y K. 
 
El nivel 150 Kg de N/ha difieren estadísticamente del nivel 0 Kg de N/ha, con aplicaciones 
iguales de PK. 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
28 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Parcelas divididas 
 
En este diseño se trabajan con todas las posibles combinaciones de los factores, lo que lo 
diferencia del anterior es el arreglo, por lo que se puede adecuar de mejor forma a 
condiciones reales de campo. 
 
 
 
Figura 16: Arreglo de parcelas divididas en el espacio. 
 
Tomado de López, E. 2008 
 
Siendo: 
 
Yijk = Variable de respuesta medida en la ijk - ésima unidad experimental 
μ = Media general 
βj = Efecto del j - ésimo bloque 
αi = Efecto del i - ésimo nivel del factor A. 
(αβ)ij = Efecto de la interacción del i-ésimo nivel del factor A con el j – ésimo bloque, que 
es utilizado como residuo de parcelas grandes y es representado por error(a) 
ρk = Efecto del k - ésimo nivel del factor B 
(αρ)ik = Efecto debido a la interacción del i-ésimo nivel del factor A con el k – ésimo nivel 
del factor B. 
εijk = Error experimental asociado a Yijk , es utilizado como residuo a nivel de parcela 
pequeña, y es definido como: Error(b) 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
29 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
Ejemplo: Video. 
 
Cuadro 14: Efecto de dos distintas mezclas de herbicidas, en 13 variedades, evaluando altura. 
 Bloque 
Mezcla de herbicida Variedad I II III 
M1 
CP72-2086 16.2 13.8 19 
CP73-1312 21.8 22 23 
CP88-1165 23.2 31 29.6 
RB73-2577 17.8 17 15.6 
SP79-1287 31.6 28.2 27 
CG98-10 26.2 30.8 26.6 
CG96-78 15.6 16.4 20 
CG98-78 20.4 17.2 14.8 
CG99-048 33.8 30 30 
MEX82-114 23 13.8 18.2 
RB84-5210 21.2 29.2 28 
RB87-2015 23.4 21.6 25 
CG96-135 17 18.6 18.6 
M2 
CP72-2086 24.8 22.4 30.6 
CP73-1312 38.8 20 18.8 
CP88-1165 21.4 40.8 31.2 
RB73-2577 17.8 38.6 19.2 
SP79-1287 25.8 20 30.4 
CG98-10 19.8 21.8 26 
CG96-78 21.8 20.4 34 
CG98-78 26.4 24.6 18 
CG99-048 17.6 26.4 21.2 
MEX82-114 36.6 25.2 15.4 
RB84-5210 20.6 20.6 32.4 
RB87-2015 21.2 32.4 36.8 
CG96-135 20 19.4 21.2 
Datos tomados de Ing. Gerardo Espinoza, Fisiólogo. CENGICAÑA. 
Cuadro 15: Forma de crear la base de datos en InfoStat. 
Variedad Mezcla Bloque Altura 
CP72-2086 M1 I 16.2 
CP73-1312 M1 I 21.8 
CP88-1165 M1 I 23.2 
Parcelas%20divididas.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
30 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Para este caso es importante el considerar las fuentes de variación del modelo y el error del 
efectoA o parcela grande. Para este caso se debe de indicar el error apropiado de dicho 
efecto (Factor A*Bloque), por medio de el carácter \ (diagonal invertida), para lo cual se 
utiliza el comando Alt + 93, esto es importante pues en el momento de realizar la 
comparación de medias se utiliza el error adecuado. 
 
En este caso el factor A o parcela grande es la mezcla de herbicida, y el factor B parcela 
pequeña la variedad. 
 
 
 
Figura 17: Ingreso del modelo de parcelas divididas a InfoStat. 
 
Análisis de la varianza 
 
Variable N R² R² Aj CV 
Altura 78 0.49 0.18 24.51 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor (Error) 
Modelo 1545.05 29 53.28 1.57 0.0830 
Mezcla 139.20 1 139.20 26.63 0.0356 (Mezcla*Bloque) 
Bloque 14.45 2 7.23 0.21 0.8094 
Mezcla*Bloque 10.45 2 5.23 0.15 0.8581 
Variedad 737.85 12 61.49 1.81 0.0739 
Mezcla*Variedad 643.10 12 53.59 1.57 0.1314 
Error 1633.63 48 34.03 
Total 3178.68 77 
 
Test:Tukey Alfa=0.05 DMS=2.23128 
Error: 5.2267 gl: 2 
Mezcla Medias n 
M2 25.14 39 A 
M1 22.47 39 B 
Letras distintas indican diferencias significativas(p<= 0.05) 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
31 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Franjas divididas 
 
Cuando las condiciones del campo o la naturaleza de los tratamientos no permiten una 
completa aleatorización de todas las combinaciones de los factores, este diseño es 
recomendable. 
 
Figura 18: Arreglo de un diseño de franjas divididas. 
 
 
Este es el modelo estadístico- matemático, propuesto para dos factores y un diseño de 
bloques completos al azar. 
 
Siendo: 
 
Yijk = Variable de respuesta medida en la ijk - ésima unidad experimental 
μ = Media general 
βj = Efecto del j - ésimo bloque 
αi = Efecto del i - ésimo nivel del factor A. 
(αβ)ij = Efecto de la interacción entre el i-ésimo nivel del factor A con el j - ésimo bloque, 
o sea, es el error experimental asociado al factor A, tal que (αβ)ij ~ N (0, σ
2
1) e 
independientes, es utilizado como error(a). 
ρk = Efecto del k - ésimo nivel del factor B 
(ρβ)jk = Efecto de la interacción entre el k-ésimo nivel del factor A con el j - ésimo bloque, 
o sea, es el error experimental asociado al factor B, tal que (ρβ)jk ~ N (0, σ
2
2) e 
independientes, es utilizado como error(b). 
(αρ)ik = Efecto debido a la interacción del i-ésimo nivel del factor A con el k - ésimo nivel 
del factor B. 
(αβρ)ijk = Error experimental asociado a Yijk, tal que (αβρ)ijk ~ N (0, σ2) e 
independientes, es utilizado como término de error o residuo. 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
32 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Ejemplo: Video. 
Cuadro 16: Evaluación de cuatro tipos de surco y tres densidades de siembra, midiendo % Pol. 
 Bloque 
Tipo de surco 
Densidad de 
siembra 
I II III IV 
Surco Simple 
4 TSH 17.67 17.23 17.43 17.61 
6 TSH 17.31 17.6 17.05 16.91 
8 TSH 17.49 17.3 17.68 18.27 
Surco doble 
4 TSH 17.19 17.85 17.44 17.56 
6 TSH 17.21 17.26 16.71 17.52 
8 TSH 18.04 16.38 17.23 17.14 
surco base 
larga 
4 TSH 17.39 17.54 16.61 17.51 
6 TSH 17.39 17.67 16.77 17.61 
8 TSH 17.69 17.02 17.34 18.02 
surco base 
corta 
4 TSH 17.19 17.57 17.72 17.73 
6 TSH 16.78 17.57 17.79 18.27 
8 TSH 17.86 16.85 18.12 17.94 
Datos tomados de López, E. 2008. 
 
Para este caso se debe de considerar los errores de cada factor e indicarlos, pues es 
necesario para que al realizar la comparación de medias se utilice el error adecuado. 
 
 
Figura 19: Fuentes de variación para un diseño de franjas divididas. 
Franjas%20divididas.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
33 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Análisis de la varianza 
 
 
Variable N R² R² Aj CV 
% Pol 48 0.77 0.39 1.89 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor (Error) 
Modelo 6.47 29 0.22 2.06 0.0563 
Tipo de surco 0.68 3 0.23 1.25 0.3473 (Tipo de surco*Bloque) 
Densidad de siembra 0.28 2 0.14 0.36 0.7104 (Densidad de siembra*Bloqu.. 
Bloque 0.99 3 0.33 3.05 0.0554 
Tipo de surco*Densidad de .. 0.62 6 0.10 0.95 0.4869 
Tipo de surco*Bloque 1.62 9 0.18 1.66 0.1731 
Densidad de siembra*Bloque.. 2.29 6 0.38 3.52 0.0175 
Error 1.95 18 0.11 
Total 8.42 47 
 
 
Test:LSD Fisher Alfa=0.05 DMS=0.48936 
Error: 0.1085 gl: 18 
 Tipo de surco Densidad de siembra Medias n 
surco base corta 8 TSH 17.69 4 A 
Surco Simple 8 TSH 17.69 4 A B 
surco base corta 6 TSH 17.60 4 A B C 
surco base corta 4 TSH 17.55 4 A B C 
surco base larga 8 TSH 17.52 4 A B C 
Surco doble 4 TSH 17.51 4 A B C 
Surco Simple 4 TSH 17.49 4 A B C 
surco base larga 6 TSH 17.36 4 A B C 
surco base larga 4 TSH 17.26 4 A B C 
Surco Simple 6 TSH 17.22 4 A B C 
Surco doble 8 TSH 17.20 4 B C 
Surco doble 6 TSH 17.18 4 C 
Letras distintas indican diferencias significativas(p<= 0.05) 
 
 
 
Figura 20: Grafica resumen de la comparación de medias. 
s
u
rc
o
 b
a
s
e
 c
o
rt
a
:8
 T
S
H
S
u
rc
o
 S
im
p
le
:8
 T
S
H
s
u
rc
o
 b
a
s
e
 c
o
rt
a
:6
 T
S
H
s
u
rc
o
 b
a
s
e
 c
o
rt
a
:4
 T
S
H
s
u
rc
o
 b
a
s
e
 la
rg
a
:8
 T
S
H
S
u
rc
o
 d
o
b
le
:4
 T
S
H
S
u
rc
o
 S
im
p
le
:4
 T
S
H
s
u
rc
o
 b
a
s
e
 la
rg
a
:6
 T
S
H
s
u
rc
o
 b
a
s
e
 la
rg
a
:4
 T
S
H
S
u
rc
o
 S
im
p
le
:6
 T
S
H
S
u
rc
o
 d
o
b
le
:8
 T
S
H
S
u
rc
o
 d
o
b
le
:6
 T
S
H
Tipo de surco*Densidad de siembra
17.14
17.33
17.52
17.70
17.89
%
 P
o
l
A AB
ABC
ABC
ABC ABC
ABC
ABC
ABC
ABC
BC
C
A AB
ABC
ABC
ABC ABC
ABC
ABC
ABC
ABC
BC
C
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
34 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Análisis de correlación lineal simple. 
 
En este análisis se relacionan dos variables aleatorias. Para este ejemplo tomaremos como 
estadístico de prueba el coeficiente de correlación de Pearson, y se realizará una prueba de 
hipótesis para evaluar si el coeficiente de Pearson (ρ) es igual a cero, lo que indicaría una 
ausencia de correlación lineal. 
 
Ejemplo: Video. 
Cuadro 17: Peso de tallos y rendimiento de caña en Kg. 
peso del 
tallo Kg 
Rendimiento 
de caña Kg 
1.12 7.74 
1.21 8.02 
0.99 8.16 
1.02 8.46 
0.93 6.3 
1.14 10.01 
0.86 4.79 
1.03 7.04 
1.22 7.62 
1.17 7.54 
 
Se ingresan ambas variables en la casilla de variables a analizar. 
 
 
Figura 21: Ubicación de coeficiente de correlación. 
coeficiente%20de%20correlación.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
35 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
Figura 22: Selección del coeficiente de correlación de Pearson.Recordemos que se trabajará con el coeficiente de correlación de Pearson, por lo que se 
debe de seleccionar cuando InfoStat lo indique. 
 
 
Coeficientes de correlación 
 
Correlacion de Pearson: coeficientes\probabilidades 
 
 Rendimiento de caña peso del tallo Kg 
Rendimiento de caña 1.00 0.05 
peso del tallo Kg 0.62 1.00 
 
 
 
 
En la matriz podemos observar en la parte inferior de la diagonal conformada por unos, los 
coeficientes de correlación que nos indica el grado de asociación, donde un número 
negativo indica una asociación negativa, este valor se encuentra entre -1 y 1 y 0 indica que 
no existe una correlación lineal entre variables. En la parte superior de la diagonal se 
muestra el valor de la probabilidad (p) de la prueba de hipótesis realizada, al evaluar que el 
coeficiente de Pearson es igual a cero, se debe de tener en cuenta el valor de significancia 
con el que se desea trabajar, pues al trabajar con un nivel de significancia del 5%, se acepta 
la hipótesis alternativa (existe correlación entre ambas variables) si el valor de p≤ 0.05. 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
36 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Regresión Lineal 
 
 
Existen casos cuando se desea conocer la relación funcional que puede existir entre dos o 
más variables cuantitativas, en estos casos la regresión es muy útil. También un análisis de 
regresión nos puede servir para predecir o describir el comportamiento de una variable 
respecto al comportamiento de otra, que por su naturaleza es difícil la observación directa, 
por lo que con la ayuda de un modelo se puede entender lo anterior relacionando una o más 
de una variable. 
 
RL Simple 
 
Cuando se relaciona una variable dependiente o explicada con una variable independiente o 
explicativa realizamos un análisis de regresión simple, con la finalidad de generar un 
modelo que exprese el comportamiento de la variable dependiente respecto a la 
independiente. 
 
 
Tomado de López, E. 2008. 
 
a) El coeficiente de posición (α) o intercepto, indica la posición en la cual la recta 
corta el eje Y. Si la recta pasa por el origen, entonces α =0. En términos prácticos, indica el 
valor que asume la variable Y cuando la variable es X=0. En algunos casos se requiere que 
la recta corte en el origen, esto siguiendo la lógica de la variable explicada. 
 
b) El coeficiente de regresión lineal (β) o coeficiente angular de la regresión, 
determina la pendiente de la recta. Este coeficiente indica la variación en Y causada por la 
variación de una unidad en X. 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
37 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Supuestos del modelo de regresión 
 
1. El término de error ε es una variable aleatoria con media o valor esperado igual a cero, 
esto es, E(ε). Esto implica que como α y β son constantes, E(α )= α y E(β)=β. 
 
2. La varianza de ε representada por σ
2
, es igual para todos los valores de x. 
Homocedasticidad. Implicación: la varianza de y es igual a σ
2
, y es la misma para todos los 
valores de x. 
 
3. Los valores de ε son independientes. 
Implicación: el valor de ε para un determinado valor de x no se relaciona con el valor de ε 
para cualquier otro valor de x; así, el valor de y para determinado valor de x no se relaciona 
con el valor de y para cualquier otro valor de x. 
 
4. El término de error ε es una variable aleatoria con distribución normal. 
Implicación: como y es una función lineal de ε, y es también una variable aleatoria 
distribuida normalmente. 
 
La siguiente figura ilustra los supuestos del modelo y sus implicaciones: 
 
 
 
Tomado de López, E. 2008. 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
38 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
Ejemplo: Video. 
Cuadro 18: Datos de tres variables de 10 híbridos de caña de azúcar. 
Híbrido 
peso del 
tallo Kg 
Rendimiento 
de caña Kg 
Brix Kg 
1 1.12 7.74 0.9 
2 1.21 8.02 0.87 
3 0.99 8.16 0.92 
4 1.02 8.46 0.99 
5 0.93 6.3 0.58 
6 1.14 10.01 1.11 
7 0.86 4.79 0.53 
8 1.03 7.04 0.73 
9 1.22 7.62 0.87 
10 1.17 7.54 0.9 
Datos tomados del articulo Combining ability and yield component in five parent diallet cross in sugarcane, por el Dr. J. 
D. Miller. 
 
Se pide que se investigue la relación Rendimiento de caña en Kg (X) y Brix en Kg (Y). 
 
Es importante que tengamos en cuenta que al realizar el análisis de varianza, evaluamos la 
hipótesis de que β (la pendiente de la recta) es igual a cero, por lo que no existe relación 
entre ambas variables. 
 
 
Figura 23: Ubicación de la herramienta regresión lineal. 
 
RLS.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
39 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Es importante que recordemos al momento de indicar las variables a análisis, que la 
variable dependiente en este caso es Brix en Kg (Y), y la variable regresora es el 
rendimiento de caña en Kg (X). 
 
 
Figura 24: Diagnostico de la regresión lineal simple. 
En el cuadro de análisis de regresión lineal, en la pestaña diagnóstico debemos de indicar 
las graficas que deseamos como prueba de los supuestos y si deseamos se debe de indicar 
que la presencia de las bandas de confianza y predicción en el gráfico del modelo. 
 
Análisis de regresión lineal 
 
Variable N R² R² Aj ECMP AIC BIC 
Brix Kg 10 0.92 0.91 5.0E-03 -26.30 -25.40 
 
 
 
 
Coeficientes de regresión y estadísticos asociados 
 
Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows 
const -0.10 0.10 -0.33 0.13 -1.03 0.3326 
Rendimiento 0.12 0.01 0.09 0.15 9.54 <0.0001 82.02 
 
 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 0.26 1 0.26 91.03 <0.0001 
Rendimiento de caña 0.26 1 0.26 91.03 <0.0001 
Error 0.02 8 2.9E-03 
Total 0.29 9 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
40 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
 
 
En base al análisis de varianza se acepta la hipótesis alterna, donde se dice que β es distinto 
a 0, y por lo tanto la variable Y está explicada o relacionada con la variable X. 
 
Utilizando los coeficientes de los parámetros, se puede generar un modelo que prediga el 
comportamiento de la variable Brix Kg en función de rendimiento de caña en Kg. 
 
Y= -0.103 + 0.125X 
 
Donde: 
 
 Y= Kg Brix y X= Kg de caña. 
 
Y en base al coeficiente de determinación ajustado, se puede afirmar en un 91% de certeza 
que el modelo puede predecir la realidad. 
 
 
 
 
 
 
 
 
4.53 5.96 7.40 8.84 10.27
Rendimiento de caña 
0.31
0.56
0.82
1.07
1.33
B
ri
x
 K
g
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
41 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
RL Múltiple 
 
En este caso se relaciona una variable dependiente (Y), con dos o más variables 
independientes (X). El modelo que relaciona esta variable dependiente que debe de ser 
aleatoria y variables independientes que son fijas y predeterminadas, medidas sin error, se 
llama ecuación de regresión múltiple. 
 
 
 
Este modelo se diferencia de la regresión lineal simple, ya que la adición de una o más 
variables independientes, debe de contribuir significativamente a la predicción de la 
variable dependiente (Y), después de haber tomado en cuentala contribución de la variable 
independiente de la RLS. 
 
También es importante tener en cuenta un supuesto que se agrega a los de la RLS, este 
considera que dos variables independientes no debes de tener correlación entre ellas, pues 
al existir esta relación la variable dependiente es mejor explicada únicamente con una sola 
variable independiente al presentar un modelo más simple, a este supuesto se le llama 
multicolinalidad. 
 
Para realizar una RLM en InfoStat, se siguen los mismos pasos que para realizar una RLS, 
únicamente se agrega las variables independientes deseadas en la casilla de “Regresoras”. 
 
 
Ejemplo: Video. 
 
Con las variables del ejemplo anterior (RLS), realice un análisis de regresión lineal 
múltiple. 
 
El primer paso es el realizar una matriz de correlación, como ya se ha visto en incisos 
anteriores. 
 
 
Coeficientes de correlación 
 
Correlacion de Pearson: coeficientes\probabilidades 
 
 Brix Kg % Brix Rendimiento de caña 
Brix Kg 1.000 0.070 1.2E-05 
% Brix 0.595 1.000 0.331 
Rendimiento de caña 0.959 0.344 1.000 
 
 
Como se puede apreciar en la matriz anterior, se observa que existe correlación entre las 
variables Brix Kg y rendimiento de caña y Brix Kg y % Brix mayor a un 10% de 
significancia, por lo que son útiles en la elaboración de un modelo de RLM. También se 
observa que no existe correlación entre las variables de Rendimiento de caña y % Brix, por 
RLM.avi
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
42 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
lo que se cumple con el supuesto de multicolinalidad y ambas variables contribuyen a la 
predicción de la variable Brix Kg. 
 
 
Análisis de regresión lineal 
 
Variable N R² R² Aj ECMP AIC BIC 
Brix Kg 10 1.00 1.00 1.5E-04 -70.02 -68.80 
 
 
 
 
Coeficientes de regresión y estadísticos asociados 
 
 Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows 
const -0.74 0.03 -0.80 -0.68 -27.50 <0.0001 
Rendimiento de caña 0.11 1.5E-03 0.11 0.11 73.50 <0.0001 4729.69 
% Brix 0.05 1.8E-03 0.04 0.05 25.88 <0.0001 588.05 
 
 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 0.29 2 0.14 4184.19 <0.0001 
Rendimiento de caña 0.18 1 0.18 5402.93 <0.0001 
% Brix 0.02 1 0.02 669.63 <0.0001 
Error 2.4E-04 7 3.4E-05 
Total 0.29 9 
 
El modelo tomando en cuenta los coeficientes anteriores se presentaría de la siguiente 
manera: 
 
Y= -074 + 0.11X1 + 0.05X2 
 
Donde: 
Y= Brix Kg, X1= Rendimiento de caña y X2= % Brix.
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
42 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Bibliografía 
 
 
Anderson, E; Black, W; Hair, F; Tatham, R. (1999). Análisis Multivariado. Madrid. Prentice Hall Iberia. 
 
Hines, W; Montgomery, D. (1995). Probabilidades y estadística para ingenieria y administración. México. 
Compañía editorial continental, S.A. de C.V. México. 
 
InfoStat. (2009). InfoStat versión 2009. Grupo InfoStat, FCA, Universidad Nacional de Córdova, Argentina. 
 
Levin, R. (1981). Estadística para administradores. México. Prentice Hall. 
 
López, E. (2008). Diseño y análisis de experimentos, fundamentos y aplicaciones en agronomía. Guatemala. 
USAC. 
 
López, E. (2008). Elaboración de proyectos de investigación, notas de acompañamiento de curso. Guatemala. 
USAC. 
 
López, E. (2008). Estadística, con aplicaciones en agronomía y ciencias forestales. Guatemala. USAC. 
 
Martínez, A. (1988). Diseños experimentales: métodos y elementos de teoría. México. Trillas. 
 
Mendenhall, W; Scheaffer, R; Wackerly, D. (1986). Estadística matemática con aplicaciones. México. 
Iberoamérica. 
 
Pérez, O. (2002). Diplomado de estadística: experimentos factoriales. Santa Lucia Cotz. CENGICAÑA. 
 
Quemé, J. (2002). Análisis de regresión. Santa Lucía Cotz. CENGICAÑA. 
 
Quemé, J. (2002). Introducción al uso del ayudante de datos MST y MSTAT-C. Santa Lucía Cotz. 
CENGICAÑA. 
 
Quemé, J. (2002). Sitematización de una prueba de hipótesis, diseños completamente al azar, bloques 
completos al azar y prueba de medias. Santa Lucía Cotz. CENGICAÑA. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
43 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Anexos 
 
Cuadro 19: Resumen. Términos a considerar en la definición del modelo, en InfoStat. 
 
Diseño Términos del modelo. 
Diseño completamente 
al azar. DCA. Tratamiento 
(1)
Diseño completamente 
al azar con submuestreo 
DCAsm. Tratamiento 
 Repetición*Tratamiento>Muestreo 
Diseño de bloques 
completos al azar. DBCA. Bloque 
 Tratamiento 
(1)
Diseño de bloques completos 
al azar con submuestreo. 
DBCAsm. Bloque 
 Tratamiento 
 Bloque*Tratameinto>Muestreo 
Serie de experimentos 
con DBCA. Localidad\Localidad>Bloque 
 Localidad>Bloque 
 Tratamiento 
 Localidad*Tratamiento 
Arreglo combinatoria en 
DBCA. (Factorial) Bloque 
 Factor A 
 Factor B 
 Factor A*Factor B 
Parcelas divididas Bloque 
 Factor A\Factor A*Bloque 
 Factor A*Bloque 
 Factor B 
 Factor A*Factor B 
Franjas divididas Bloque 
 Factor A\Factor A*Bloque 
 Factor A*Bloque 
 Factor B\Factor B*Bloque 
 Factor B*Bloque 
 Factor A*Factor B 
 
(1) Cuando se definen modelos con submuestro es importante que tengamos en cuenta las distintas 
decisiones que debemos de tomar en el momento de aceptar o rechazar una hipótesis. InfoStat realiza 
de forma parcial el análisis de este modelo, por lo que se debe de seguir los siguientes pasos:
 
 
1. Prueba de hipótesis para evaluar la efectividad del muestreo. 
 
Ho: σ
2
e = 0 
Ha: σ
2
e > 0 
 
En este caso si se acepta la Ho, se dice que el muestreo no fue efectivo, en caso contrario, si se rechaza la Ho 
se dice que el muestreo fue efectivo. Para esto se debe realizar los siguientes cálculos: 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
44 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
Se considerar el cuadrado medio del error experimental (CMee) y el cuadrado medio del error del muestreo 
(CMem). Se debe de encontrar el valor F, para esto se realiza la relación CMee/CMem. Para realizar la toma de 
decisión de rechazar o aceptar la Ho, se puede estimar, en Excel, el valor p (probabilidad), para esto se utiliza 
la función DISTR.F donde se ingresa el grado de libertad del Error experimental (gl1), los grados de libertad 
del error de muestreo (gl2) y el valor F (CMee/CMem), el cual es nombrado en Excel por la letra “X”. 
 
Si el valor p estimado en Excel, es menor al nivel de significancia establecido, se rechaza la Ho, por lo que se 
dice que el muestreo fue efectivo. 
 
2. Prueba de hipótesis para evaluar si existe diferencia entre tratameintos, cuando el muestreo es 
efectivo 
 
La segunda hipótesis a evaluar, corresponde a la diferencia entre los tratamientos, donde: 
 
Ho: τ = τi (todos los tratamientos producen el mismo efecto) 
Ha: τ ≠ τi para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos distintos). 
 
En este caso, los valores de F y p utilizados en la toma de decisión de aceptar o rechazar la Ho, son los 
proporcionados por la salida de InfoStat, de igual forma el coeficiente de variación. 
 
2.1. Pruebade medias, cuando el muestreo es efectivo. 
 
Si el muestreo fue efectivo las prueba de medias se realiza de manera común, de igual forma como se presenta 
en la sección de diseño completamente al azar. 
 
3. Prueba de hipótesis para evaluar si existe diferencia entre tratamietnos, cuando el muestreo no 
es efectivo. 
 
Al no ser el muestreo efectivo, se debe de unir los errores del error experimental y el error de muestreo de la 
siguiente forma: 
 
 CMep= SCee+ SCem / glee+ glem 
Donde: 
 
CMep= Cuadrado medio del error ponderado 
SCee= Suma de cuadrados del error experimental 
SCem= Suma de cuadrados del error de muestreo 
glee= grados de libertad del error experimental 
glem= grados de libertad del error de muestreo 
 
Y el valor F (el valor F del tratameinto), se estima así: 
 
 F= CMTratamiento / CMep 
 
Para encontrar el valor p que se utiliza para realizar la toma de decisión respecto a la segunda hipótesis, 
relacionada al efecto de los tratamientos, se debe de seguir las instrucciones mencionadas anteriormente en el 
inciso 1. Y el valor del coeficiente de variación debe de encontrarse de la siguiente forma: 
 
 
 
 
 
 
 
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar. 
 
45 
CENGICAÑA Métodos estadísticos utilizados en la industria cañera. 
 
3.1. Prueba de medias, cuando el muestreo no es efectivo 
 
Para esto, se debe de indicar el error y los grados de libertad a utilizar (estimados previamente, de la forma 
explicada anteriormente en el inciso 3) en la comparación de medias, donde el error es el valor de CMep y los 
grados de libertad la suma de glee y glem. 
 
 
Figura 25: Indicación del error a utilizar en la comparación de medias