Logo Studenta

AplicModMixtosAgricForest

¡Este material tiene más páginas!

Vista previa del material en texto

1 
 
 
 
 
 
 
 
 
 
 
 
Aplicaciones de Modelos Mixtos en 
Agricultura y Forestería 
 
 
 
 
 
 
 
 
 
 
Dra. Mónica Balzarini (Univ. Nacional de Córdoba, Argentina) 
Dr. Raúl E. Macchiavelli (Universidad de Puerto Rico) 
Dr. Fernando Casanoves (CATIE, Costa Rica) 
 
 
 
 2 
Contenidos 
 
Introducción. ..................................................................................................................... 3 
Fundamentación ................................................................................................................................................... 3 
Revisión Conceptual ........................................................................................................................................... 4 
Tipos de Modelos Mixtos ................................................................................................................................. 11 
Módulo 1. Ejemplos de Motivación ................................................................................. 13 
1.1. Medidas Repetidas / Datos Longitudinales ......................................................................................... 13 
1.2. Curvas de Crecimiento ............................................................................................................................. 21 
1.3. Experimentos Multi-ambientales ............................................................................................................ 30 
1.4. Correlación Espacial en Ensayos a Campo ........................................................................................ 32 
Módulo 2. Introducción ................................................................................................... 37 
2.1 Modelo Lineal General de Efectos Mixtos / Conceptos Generales ................................................ 37 
2.2 Modelos Marginales versus Modelos Jerárquico ............................................................................... 45 
2.3 Modelos para la Estructura de Covarianza Residual (modelos de patrones de covarianza) .. 45 
2.4 Estimación de Covarianzas en Poblaciones Normales ..................................................................... 46 
2.5. Inferencia sobre componentes de varianza. ....................................................................................... 51 
2.6. Inferencia sobre Efectos Aleatorios. Mejor Predictor Lineal Insesgado (BLUP). ...................... 52 
2.7 Criterios de Bondad de Ajuste ................................................................................................................. 58 
Módulo 3: Modelación de Datos Normales .................................................................... 60 
3.1 Modelos para Datos Longitudinales. Aplicaciones en Agricultura. ............................................... 60 
3.2 Modelos Lineales para Curvas de Crecimiento. Aplicaciones en Forestería .............................. 77 
3.3 Modelos para Interacción. Aplicaciones en Fitomejoramiento ..................................................... 113 
3.4 Modelos de Correlación Espacial .......................................................................................................... 129 
Módulo 4. Ajuste de Modelos No-Lineales con Datos Normales o No-Normales ......... 148 
4.1. Modelo No Lineal de Curvas de Crecimiento con Coeficientes Aleatorios .............................. 148 
4.2. Modelo Lineal Generalizado Mixto. Ingredientes claves. ............................................................... 164 
4.3 Aplicaciones de Modelos Lineales Generalizados con otras distribuciones. ........................... 176 
Bibliografía ................................................................................................................... 188 
 3 
Introducción. 
 
Fundamentación 
 
La investigación en Agricultura y Forestería comúnmente presenta situaciones en 
las que es difícil utilizar los modelos lineales clásicos de análisis de varianza y regresión 
porque no se cumplen los supuestos de independencia, normalidad, igualdad de 
varianzas o incluso linealidad. La modelación de datos experimentales en el marco 
teórico de los modelos lineales y generalizados mixtos brinda la posibilidad de analizar 
datos con estructuras de dependencia, desbalances y falta de normalidad. Es así 
posible relajar los supuestos tradicionales del modelo lineal general y modelar, de 
manera flexible, estructuras complicadas de datos. Los modelos mixtos se adecúan 
bien en situaciones son comunes en Agricultura y Forestería, como por ejemplo cuando 
existe algún tipo de estructura de bloqueo de unidades experimentales que afecta las 
covarianzas entre observaciones. Ilustran este tipo de situación aquellos estudios 
donde el material experimental se evalúa en varios ensayos y por tanto es razonable 
asumir que existen correlaciones entre observaciones del mismo ensayo. La 
modelación en el marco de los modelos mixtos maneja estas correlaciones mediante la 
incorporación de variables aleatorias o mediante la modelación directa de la matriz de 
covarianzas residual. Diversas estrategias, bajo el mismo marco teórico permiten 
modelar variabilidad sobre y más allá de la componente usual asociada a los términos 
de error. 
Existen muchos beneficios que pueden obtenerse con el uso de modelos mixtos. 
En algunas situaciones se incrementa la precisión de las estimaciones. En otras se 
contempla mejor la estructura y se amplia el espacio de inferencia, sobre todo cuando 
la estructura de los datos es jerárquica. Este material de referencia se ha preparado 
para ejemplificar las estrategias de ajuste mediante el análisis de casos y los recursos 
computacionales que ofrece SAS versión 8 y posteriores (SAS Institute, 1998). Se 
presentan contenidos preliminares sobre aspectos relacionados al modelo mixto clásico 
y seguidamente ejemplos motivadores donde los modelos mixtos son particularmente 
útiles, incluyendo casos de medidas repetidas / datos longitudinales, curvas de 
crecimiento, experimentos multi-ambientales y de correlación espacial. Los ejemplos 
 4 
tratados están relacionados al área de la agricultura y la forestería. En esta sección 
introductoria se realiza una revisión conceptual del Modelo Lineal de Efectos Mixtos. En 
el Módulo 1 se presentan los ejemplos que serán tratados posteriormente mediante 
algún tipo de modelo mixto. En el Módulo 2 se introducen los conceptos teóricos más 
relevantes incluyendo la idea de modelos marginales y jerárquicos y los procesos de 
estimación para el caso de datos normales. El ajuste de modelos y la interpretación de 
resultados para los ejemplos de casos normales se realizan en el Módulo 3, mientras 
que en el Módulo 4 se hace referencia a aplicaciones para modelos no-lineales y para 
datos no-normales. El material tiene la finalidad de favorecer la conceptualización de la 
modelación estadística considerando las implicaciones prácticas de su uso. 
 
Revisión Conceptual 
 
Los modelos estadísticos mixtos permiten modelar la respuesta de un estudio 
experimental u observacional como función de factores o covariables cuyos efectos 
pueden considerarse tanto como constantes fijas o variables aleatorias. Cada modelo 
estadístico que contiene una media general, µ, es un modelo mixto por definición, ya 
que también contiene un término de error aleatorio, y por tanto contiene ambos tipos de 
efectos. Sin embargo, en la práctica, el nombre modelo mixto se reserva usualmente 
para cualquier modelo que contiene efectos fijos distintos a µ y efectos aleatorios 
diferentes a los errores aleatorios. En casos donde existen otros efectos más allá de µ y 
el término de error y todos son aleatorios, se llama al modelo como Modelo II para 
diferenciarlo del Modelo I donde todos los factores tienen efectos fijos. 
En general, un efecto es considerado como fijo si los niveles del factor asociado 
han sido arbitrariamente determinadospor el investigador mientras que se trata como 
aleatorio si los niveles en el estudio pueden ser considerados como una muestra 
aleatoria de una población de niveles para el factor, es decir existe una distribución de 
probabilidad asociada. Para decidir cuándo un conjunto de efectos va a ser tratado 
como fijo o aleatorio es importante analizar el contexto de los datos, es decir el 
ambiente desde el cual ellos provienen, la manera en la cual se obtuvieron y 
principalmente el espacio de inferencia. Si los niveles del factor en consideración no 
pueden considerarse como una muestra aleatoria de una población de niveles para ese 
 5 
factor, los efectos deberían considerarse fijos y la inferencia restringirse a los niveles 
del factor considerados en el estudio. Por el contrario, si se desea inferir para una 
población de efectos de un determinado factor, los efectos actualmente considerados 
en el estudio deberían tratarse como variables aleatorias. 
 
Situación 1: Modelos de efectos fijos. 
Consideremos un pequeño experimento diseñado para comparar a tratamientos 
(entiéndase existe un factor tratamiento de interés con a niveles) que incluye n 
unidades experimentales o repeticiones para cada tratamiento arregladas de acuerdo a 
un diseño completamente aleatorizado (cada tratamiento se asigna aleatoriamente a n 
unidades experimentales). Si yij representa la respuesta observada en la unidad j del 
tratamiento i, yij puede considerarse como una observación aleatoria de una población 
de observaciones bajo el tratamiento i, que podemos suponer tiene una distribución 
normal con media µi y varianza σ2. Luego, un posible modelo para yij podría ser: 
E(yij)= µi , 
donde E(.) representa el operador esperanza µi y es la respuesta esperada para una 
observación bajo el tratamiento i. En este modelo, llamado modelo de medias, cada µi 
es considerada como una constante. Dichas constantes (valores fijos) representan, en 
algún sentido, las magnitudes que se desean estimar y comparar. Por ejemplo, puede 
ser de interés estimar µi y µj, o µi-µj. Las constantes a estimar µi´s, con i=1,…,a, 
corresponden explícitamente a los a tratamientos incluidos en el experimento. Existen a 
tratamientos que son de interés y que por tanto han sido arbitrariamente seleccionados 
por el investigador para el experimento. El efecto del tratamiento i se define como τi=µi-
µ , donde µ es la media general de la variable respuesta, por lo que el modelo puede 
ser re-escrito como: 
E(yij)= µ + τi, 
que se conoce como modelo de efectos fijos. Los τi representan los efectos de 
tratamiento y son obviamente constantes. Si eij representa el valor de la desviación o 
diferencia entre yij y su valor esperado, término llamado error en yij, es posible modelar 
los datos observados como la suma de su valor esperado y un error aleatorio, 
 6 
yij = µi + eij o equivalentemente yij = µ + τi + eij . 
 
Conforme a las propiedades distribucionales de yij, y a la definición de eij, los términos 
de error son variables aleatorias con media cero, 
E(eij)=E[yij -E(yij)]=0 
a los cuales usualmente se les atribuye la siguiente estructura de varianzas y 
covarianzas: 
1. Cada eij tiene la misma varianza, σ2. 
2. Los eij son independientes e idénticamente distribuidos, con covarianza entre 
cualquier par de ellos igual a cero. 
 
Es esta distribución de probabilidades asociada con los términos de error la que 
provee los medios para hacer inferencias sobre las funciones de los µi que son de 
interés y, si se desea, sobre σ2. Cabe destacar entonces que la manera en que se 
obtienen los datos afecta la inferencia que se puede extraer desde ellos. En este 
ejemplo se ha descripto el proceso de muestreo pertinente a un modelo de efectos fijos. 
Los datos se consideraron como un conjunto posible de datos para estos a 
tratamientos, conjunto que podría ser obtenido si se repite el experimento. Cada 
repetición del experimento proporciona un muestra diferente de n unidades 
experimentales para cada una de los a tratamientos. Los errores “realizados” en el 
experimento conforman una muestra aleatoria de una población de términos de error 
con media cero, varianza σ2 y covarianzas cero. Los datos en este estudio proveen 
estimaciones de las medias de tratamiento y de diferencias entre ellas, la distribución 
de los términos de error provee las varianzas para estas estimaciones. Por ejemplo, la 
media muestral de las observaciones bajo el tratamiento i, iy , es un estimador de µi, 
con varianza σ2/n, y la diferencias de medias muestrales, i jy y− , un estimador de µi-µj 
con varianza 2σ2/n. En realidad, σ2 es desconocida y debe ser estimada. Debido a que 
los términos de error tienen todos la misma varianza, cada una de las varianzas 
muestrales es un estimador de σ2 con n-1 grados de libertad, por lo que el promedio de 
las varianzas muestrales es un estimador de σ2 con a(n-1) grados de libertad. Éste es el 
 7 
estimador usualmente preferido para estimar σ2 en las fórmulas de errores estándar de 
las medias de tratamiento o de sus combinaciones lineales a los fines de la inferencia, 
cuando los datos son balanceados. 
 
Para ilustrar algunos cálculos relacionados al modelo de efectos fijos, se presenta la 
Tabla 1, que contiene los rendimientos de frutas de 8 árboles antes y después de 
aplicar un tratamiento de herbicidas en los alrededores del árbol. 
 
Tabla 1. Rendimiento (cantidad de frutas) de 6 árboles bajo dos tratamientos: sin 
desmalezado (B) y con desmalezado (A) 
UE Trat A Trat B A-B Media 
1 20 12 8 16.0 
2 26 24 2 25.0 
3 16 17 -1 16.5 
4 29 21 8 25.0 
5 22 21 1 21.5 
6 24 17 7 20.5 
Media 22.83 18.67 4.17 20.75 
 
Supondremos en primera instancia que se tienen datos de dos tratamientos (A=con 
desmalezado y B=sin desmalezado) aplicados a 6 unidades experimentales. El modelo 
de análisis (Modelo A) y los cálculos correspondientes son: 
2
2
´ ´ ´ ´ ´ ´
2
~ (0, )
var( )
cov( , ) cov( , ) cov( , ) 0
22.83 20.75 2.08
18.67 20.75 2.08
4.16
( ) 2 ( / 6) 2 (19.42 / 6) 2.54
4.16 / 2.54 1.63, 0
ij j ij
ij
ij
ij i j j ij j i j ij i j
A
B
A B
A B
y t e
e N
y
y y t e t e e e
t
t
t t
EE t t
t p valor
µ
σ
σ
µ µ
σ
= + +
=
= + + + + = =
= − =
= − = −
− =
− = × = × =
= = − = .13
 
 
 8 
Se concluye por lo tanto que no hay suficiente evidencias para rechazar la 
hipótesis de igualdad de medias de tratamiento. 
El Modelo A no tiene en cuenta que las observaciones del tratamiento A y B se 
realizaron sobre la misma unidad experimental (árbol) y por ende están correlacionadas 
(datos pareados). El efecto de la unidad experimental puede ser incluido en la ecuación 
del modelo. Así el modelo no solo contempla la estructura de tratamientos sino también 
la de las unidades experimentales. Asumiendo el efecto de las UE como fijo, el modelo 
(Modelo B) y los cálculos correspondientes son: 
2
2
~ (0, )
var( ) , 7.88
4.16, ( ) 2 7.88 / 6 1.62, 0.05
ij i j ij
ij
ij
A B A B
y p t e
e N
y ahora
t t EE t t p valor
µ
σ
σ
= + + +
= →
− = − = × = − =
 
Las diferencias entre tratamientos resultan ahora marginalmente significativas. Una 
situación análoga se produce cuando hay más de dos tratamientos y ellos se aplican a 
un bloque de UE bajo un diseño en bloques completos al azar (DBCA). 
 
Situación 2. Modelo con efectos aleatorios 
Supongamos que existe un gran número de niveles para el factor tratamiento de interés 
y por tanto una población de efectos. Supongamos también que a niveles se 
seleccionaron aleatoriamente para ser incluidos en el experimento y que cada nivel del 
factor tratamiento se asignó aleatoriamente a n unidades experimentales 
(equivalentemente, que existen n observaciones aleatorias para cada uno de los a 
niveles del factor de interés). La selección aleatoria de niveles de tratamiento se realiza 
con el propósito de tratarlos como una representación de la poblaciónde efectos hacia 
la cual se pretende inferir. Si yij representa la respuesta observada en la unidad j del 
tratamiento i, un posible modelo para los datos es, 
E(yij)= µ + ai, 
donde µ es la media general de la variable respuesta y ai es el efecto del nivel i del 
factor de interés, ai=µi-µ. A pesar de que la expresión anterior es la misma que la 
correspondiente al modelo de efectos fijos, los supuestos subyacentes son diferentes 
 9 
debido a que los niveles en estudio del factor tratamiento representan una muestra 
aleatoria desde la población de niveles. La cantidad ai es la realización de una variable 
aleatoria “efecto de tratamiento”. Dado que las cantidades ai son variables aleatorias es 
necesario caracterizar su distribución de probabilidades. Comúnmente las cantidades ai 
se consideran independiente e idénticamente distribuidas, con esperanza cero y 
varianza 2aσ para todo i. No obstante, otros supuestos podrían adecuarse mejor a los 
datos, por ejemplo covarianza entre pares de efectos. 
Debido a que ai es una variable aleatoria, el modelo debe interpretarse como el 
valor esperado de yij cuando, la variable aleatoria a, “efecto de tratamiento”, asume el 
valor ai. Es decir E(yij)= µ + ai representa una esperanza condicional, la esperanza de la 
respuesta dado el nivel del factor de tratamiento observado. Una notación alternativa 
para el modelo de efectos aleatorios podría ser, 
E(yij | a = ai) = µ + ai , o simplemente E(yij | ai) = µ + ai. 
Tomando esperanza respecto a la variable ai, se tiene que E(yij ) = µ . Si definimos los 
términos de error como la diferencia entre la cantidad observada y la esperada, 
eij = yij - E(yij | ai) = yij - (µ + ai ) 
Se puede observar nuevamente que eij es una variable aleatoria. Debido a que las 
observaciones para cada tratamiento han sido obtenidas de la misma manera que en la 
situación 1, las propiedades distribucionales de los términos de error, eij, son similares. 
Comúnmente se adiciona el supuesto de que las variables aleatorias eij y ai se 
distribuyen independientemente, de manera tal que las observaciones marginalmente 
se distribuyen con esperanza µ y varianza Var(yij) = 2 2aσ σ+ . Es decir que, bajo este 
supuesto, la varianza de las respuestas es una suma de varianzas, una para cada 
efecto aleatorio. Generalmente interesa conocer la representación de cada una de ellas 
(componente de varianza) en la variabilidad total observada. 
Para ilustrar cálculos relacionados a un modelo mixto, se presenta un nuevo 
modelo (Modelo C) para los datos de la Tabla 1. Los efectos aleatorios en este modelo 
representan efectos relacionados a la estructura de UE más que a la estructura de 
tratamientos. El experimento descripto ahora tiene un diseño en bloques aleatorizado. 
El factor árbol se asocia a un efecto de bloque aleatorio. Los efectos aleatorios de árbol 
 10 
son variables aleatorias con media cero y varianza 2pσ . Las correlaciones entre 
observaciones derivadas de un mismo árbol son consideradas en forma implícita, 
mediante la adición de efectos aleatorios asociados a cada árbol. Los cálculos son: 
2 2
2 2
2´ ´ ´ ´ ´
~ (0, ) ~ (0, )
cada efecto aleatorio componente de varianza
var( )
0 ´
cov( , ) cov( , )
´
4.16, ( ) 2 7.88 / 6) 1.62,
ij i j ij
ij i p
ij p
ij i j i ij i i j
p
A B A B
y p t e
e N p N
y
i i
y y p e p e
i i
t t EE t t p valor
µ
σ σ
σ σ
σ
= + + +
→
= +
≠  = + + =  =  
− = − = × = − =
2 2
0.05
2 ( 7.88) 11.54p pCMUEσ σ= − → =
 
Los efectos de tratamiento y los errores estándares para la diferencia entre ellos (EE) 
son idénticos que en el modelo de efectos fijos (Modelo B) ya que sólo se usa 
información dentro de las UE para estimar efectos de tratamientos y no hay datos 
faltantes. Sin embargo, si los datos fuesen los de la Tabla 2 donde existe desbalance, 
algunos valores (por ejemplo el valor 22) brindan información para estimar el nivel de la 
UE pero no sobre diferencias entre tratamientos. Este hecho hace que los resultados 
obtenidos bajo un modelo de efectos fijos no sean los mismos que los derivados del 
modelo mixto. 
 
Tabla 2. Rendimiento (cantidad de frutas) de 8 árboles bajo dos tratamientos (sin 
desmalezado (B) y con desmalezado (A)). 
UE Trat A Trat B A-B Media 
1 20 12 8 16.0 
2 26 24 2 25.0 
3 16 17 -1 16.5 
4 29 21 8 25.0 
5 22 - - 22 
6 - 17 - 17 
Media 22.83 18.67 4.17 20.75 
 
 11 
En el modelo de efectos fijos, la diferencia entre medias de tratamientos se calcula 
solamente con la información dentro UE, razón por la cual participan solo las UE 1 a 4. 
Los cálculos correspondientes son: 
4.25, ( ) 10.12
var( ) 10.12(1/ 4 1/ 4) 5.06, 2.25
A B
A B
t t CMR ANAVA
t t EE
− = =
− = + = → 
 
Mientras que en el modelo que incluye el efecto aleatorio, se estiman las componentes 
de varianza por algún método, como por ejemplo REML, y la diferencia entre medias de 
tratamientos es estimada desde el modelo en 4.32 con EE=2.01. La diferencia se 
produce porque en la estimación bajo el Modelo C interviene información entre y dentro 
de UE. 
 
Tipos de Modelos Mixtos 
 
Bajo el marco general de los modelos mixtos se pueden considerar distintos tipos de 
modelos. Es importante recordar que en general los modelos mixtos se presentan como 
aquéllos que permiten modelar conjuntos de datos en los que las observaciones no son 
independientes. 
El tipo más simple de modelo mixto es el modelo de efectos aleatorios presentado en el 
ejemplo anterior. En ese modelo, para algunos efectos se asume que existe una 
distribución asociada que da origen a una fuente de variación distinta a la variación 
residual. Tales efectos se denominan efectos aleatorios. Los modelos de efectos 
aleatorios han sido ampliamente usados en agronomía, principalmente en aplicaciones 
relacionadas a mejoramiento genético animal y vegetal para estimar heredabilidades y 
predecir ganancia genética en programas de mejoramiento (Thompson, 1977). Se usan 
también en ensayos comparativos de rendimiento para estimar componentes de 
varianzas asociadas a la comparación de efectos de tratamiento conducidos a través de 
varias localidades y años, asumiendo que la interacción tratamiento×ambiente es 
aleatoria y que los efectos de tratamiento están contenidos dentro de la interacción 
aleatoria (Casanoves, 2004). Sin embargo, en otras circunstancias, los efectos que se 
permite varíen aleatoriamente están asociados a covariables en lugar de factores de 
 12 
clasificación. Por ejemplo, en un modelo de regresión Y sobre tiempo, se podría pensar 
que la pendiente de la regresión varía aleatoriamente entre los sujetos que aportan 
información para el ajuste de la regresión. Si se ajusta un modelo con el efecto de 
sujeto y la interacción sujeto×pendiente como aleatoria, el modelo mixto resultante se 
denomina modelo de coeficientes aleatorios. Por último, en algunas circunstancias la 
teoría de los modelos mixtos se usa para modelar directamente el patrón de correlación 
o covarianza residual. Los modelos mixtos también pueden, en la práctica, definirse con 
combinaciones de efectos aleatorios, efectos de coeficientes aleatorios y patrones de 
covarianza. La selección de uno u otro tipo de modelo depende del objetivo del análisis. 
 13 
Módulo 1. Ejemplos de Motivación 
 
En esta sección se mencionan algunos ejemplos para promover la discusión sobre el 
uso de modelos mixtos. En las primeras situaciones el modelo mixto aparece como una 
estrategia para contemplar las correlaciones entre observaciones provenientes de 
mediciones repetidas en el tiempo, ya sea con funciones lineales o no-lineales para la 
estructura de medias (medidas repetidas/datos longitudinales y curvas de crecimiento). 
El caso de los experimentos multiambientales, se introduce como referencia de 
situaciones donde la selección de un modelo mixto respecto a un modelo de efectos 
fijos es menos obvia, ya que dependede la interpretación que se hará de los datos, 
mientras que la situación referida al modelado de correlaciones espaciales en 
experimentos de campo introduce la necesidad del uso de modelos de patrones de 
covarianza. 
 
1.1. Medidas Repetidas / Datos Longitudinales 
Las medidas repetidas se obtienen cuando una respuesta se mide repetidamente sobre 
la misma unidad experimental o sujeto (árbol, parcela, familia, etc.). El término datos 
longitudinales hace referencia a una clase especial de medidas repetidas, i.e. aquéllas 
donde la respuesta se observa en varios momentos subsecuentes en tiempo sobre la 
misma unidad experimental, i.e. interesa investigar cambios en el tiempo de 
características que se miden repetidamente sobre un mismo sujeto. Para este tipo de 
datos nos interesa explorar tanto la variabilidad entre sujetos como la variabilidad 
correspondiente a observaciones dentro de sujetos. 
 
 14 
Ejemplo 1. Datos de semillas 
Estudio experimental donde se mide, durante 4 momentos, la biomasa de plántulas y el 
porcentaje de germinación en 5 cajas de 50 semillas pequeñas y 5 cajas de 50 semillas 
grandes de un arbusto. Es decir existe un número fijo de mediciones por sujeto (caja) y 
estas mediciones se toman en momentos equiespaciados en el tiempo. Los datos se 
encuentran en el archivo semillas.xls. Las Figuras 1 y 2 corresponden a los perfiles 
individuales para biomasa de plántulas y porcentaje de germinación, respectivamente. 
 
T1 T2 T3 T4
Tiempo
135,10
270,43
405,77
541,10
676,43
B
io
m
as
a 
(g
rs
.)
 
T1 T2 T3 T4
Tiempo
395,93
433,05
470,18
507,30
544,42
B
io
m
as
a 
(g
rs
.)
 
Figura 1. Perfiles individuales de biomasa aérea para plántulas provenientes de semillas 
pequeñas (a) y de semillas grandes (b). 
 
Es importante notar que: 1) existe una relación lineal entre biomasa y tiempo en el 
periodo estudiado, 2) la variabilidad entre unidades experimentales es alta, 3) la 
variabilidad dentro de unidades experimentales es relativamente menor. 
Sin embargo para el porcentaje de germinación de semillas grandes se tiene que: 1) 
existe una relación polinómica de orden posiblemente mayor a uno entre germinación y 
tiempo en el periodo estudiado, 2) la variabilidad entre unidades es alta, 3) la 
variabilidad dentro de unidades es también alta. 
 
 15 
T1 T2 T3 T4
Tiempo
0
25
50
75
100
G
er
m
in
ac
ió
n 
(%
)
 
Figura 2. Perfiles de porcentaje de germinación de unidades de semillas grandes. 
 
Frecuentemente, la variabilidad entre sujetos es mayor que la variabilidad dentro 
sujetos, y esto se refleja en la presencia de correlaciones positivas entre las 
observaciones repetidas sobre un mismo sujeto (i.e., dentro de la UE). 
 
Ejemplo 2. Datos de Cacao 
Un estudio experimental consistió en evaluar 56 híbridos de cacao. El diseño fue en 
bloques completos con 4 repeticiones. Cada unidad experimental consistió de 8 árboles 
hermanos. Se evaluó la producción de cacao (número total de mazorcas), obtenida a 
partir del conteo del número de frutos totales, frutos sanos, frutos afectados por hongos 
(TOTALES=sanos+afectados). La cosecha de mazorcas se realizó todos los meses 
durante 5 años consecutivos. En primera instancia interesa encontrar los mejores 
híbridos para la variable producción promedio de frutos sanos / ha. Además interesa 
detectar árboles individuales (dentro de los 8 de cada unidad experimental) que sean 
superiores respecto a la producción total de frutos sanos. Los datos se encuentran en el 
archivo cacao.ssd. Como una primera aproximación estos datos se modelarán como 
normales y se tratará de responder preguntas relacionadas a la respuesta en el tiempo, 
la relación de ésta con los hibridos y a la interacción de los hibridos y el tiempo. Si bien 
en el Ejemplo 1 la estructura de las UE sigue un DCA y la UE se corresponde con la 
 16 
unidad observacional, en el Ejemplo 2 la estructura de UE corresponde a la de un 
DBCA donde la UE es la parcela y el árbol constituye la unidad observacional. 
 
Ejemplo 3. Datos longitudinales vs. transversales (cross-sectional) 
Suponga que nos interesa estudiar la relación entre alguna respuesta Y y el tiempo. Un 
estudio transversal produce los datos de la Figura 3, sugiriendo una relación negativa 
entre Y y tiempo. 
 
Tiempo
 R
es
pu
es
ta
 Y
 
Figura 3. Diagrama de dispersión de Y vs. tiempo. 
 
Exactamente las mismas observaciones podrían haberse obtenido en un estudio 
longitudinal, con 2 mediciones por sujeto. La Figura 4 corresponde a esta situación y si 
bien sugiere una relación transversal negativa entre Y y tiempo, también evidencia una 
tendencia longitudinal positiva. 
 17 
Tiempo
R
es
pu
es
ta
 Y
 
Figura 4. Diagrama de dispersión de Y vs. tiempo. 
 
Los ejemplos anteriores muestran la existencia de una estructura de correlación entre 
observaciones de un mismo sujeto, también conocidas como correlaciones dentro de 
sujetos. Ésta no puede ignorarse en el análisis. Las aproximaciones estadísticas que 
permiten tener en cuenta la correlación son varias. Para dos medidas repetidas sobre la 
misma UE, el ejemplo clásico de análisis de datos correlacionados es el test t pareado. 
Por ejemplo, para la situación planteada en la sección de revisión conceptual (Tabla 1), 
una posibilidad podría ser analizar las diferencias entre tiempos (antes y después del 
tratamiento con herbicida). Estas diferencias se obtienen por una simple transformación 
lineal dentro de sujeto, i.e ∆i = YiA − YiB. La transformación reduce el número de 
observaciones a una por sujeto y permite así que se puedan aplicar técnicas clásicas 
de análisis como el test t, ya que los nuevos datos (los obtenidos de la transformación) 
no están correlacionados. De este modo el análisis de datos longitudinales se reduce al 
análisis de datos independientes. 
Una técnica estadística simple, en el caso de estudios que involucran más de dos 
mediciones por sujeto, es reducir el número de mediciones para el sujeto i, llevándolo 
de mi a 1. Por ejemplo, calculando el área bajo la curva (AUDC) o perfil en el tiempo. El 
estadístico AUDC constituye una medida de resumen para cada sujeto separadamente. 
 18 
Otras alternativas simples son: 1) análisis bajo cada momento en el tiempo 
separadamente, 2) análisis de puntos finales, 3) análisis de incrementos. 
La desventaja de las aproximaciones simples mencionadas es que en todas hay 
pérdida de información ya que no se analizan las tendencias de las medidas repetidas 
dentro de sujeto. El análisis de medidas repetidas/datos longitudinales permite distinguir 
diferencias entre sujetos de aquéllas existentes dentro de sujetos. 
Las mediciones repetidas sobre la misma unidad llevan a considerar la correlación entre 
observaciones. Al igual que en otros modelos ANOVA o regresión, podemos hacer esto 
en forma explícita, a través de la estimación de una matriz de covarianza, o en forma 
implícita, mediante la adición de efectos aleatorios en el modelo. 
Por ejemplo, para un modelo de ANOVA con efectos de grupo, tiempo y tiempo×grupo, 
ya sea éste bajo un DCA o un DBCA, considerar las correlaciones en forma explícita 
implica modelar la matriz de correlación (Σ) entre observaciones provenientes de un 
mismo sujeto. Distintos modelos de correlación pueden usarse. Por ejemplo, el modelo 
de correlación constante, i.e. ´( , ) ´i j i jcorr e e j jρ= ≠ o el modelo autorregresivo 
| ´ |
´( , ) ´
j j
ij ijcorr e e j jρ −= ≠ . El modelo menos parsimonioso es el modelo no estructurado, 
que no asume ningún patrón estructural en las correlaciones y estima las correlaciones 
entre todos los pares de observaciones, i.e. ´ , ´( , ) ´ij ij j jcorr e e j jρ= ≠ . Estos modelos de 
correlación dan origen a distintas estructuras de matrices de varianza y covarianza. Las 
estructuras más comunes en datos longitudinales igualmente espaciados son la de 
Simetría Compuesta(CS), Auto-regresiva de orden 1 (AR(1)) y Toeplitz (TOEP). En la 
primera se asume el modelo de correlación constante entre cualquier par de medidas 
repetidas dentro de la misma unidad; los elementos de Σ tienen la forma Σjj´ = σ2ρ. En la 
estructura de covarianza AR se asume un decaimiento exponencial de las 
correlaciones, los elementos de Σ tienen la forma Σjj´ = σ2ρ|j−j´|. En la estructura de 
covarianzas TOEP, los elementos de Σ tienen la forma Σjj´ = α|j−j´|, i.e. varianzas iguales 
y covarianzas iguales entre observaciones separadas por 1, 2,… momentos de tiempo 
(t). Las componentes de varianza usadas para modelar el patrón de la matriz de 
covarianzas dentro de sujeto pueden ser iguales (modelo homoscedástico) o diferentes 
(heteroscedástico). 
 19 
SAS incluye un importante número de estructuras de matrices de covarianza, por 
ejemplo para un vector de 3 elementos (por ejemplo 3 medidas repetidas dentro de 
cada sujeto), algunas de ellas y sus nombres en SAS se presentan a continuación: 
 
 
 20 
 
 21 
La otra alternativa (forma implícita) es usar un modelo de coeficientes aleatorios. La 
idea es modelar la relación entre Y y tiempo incorporando un efecto cuantitativo de 
tiempo como covariable y un efecto aleatorio de UE. Por ejemplo, para una relación 
lineal en el tiempo y asumiendo distintas pendientes entre grupos, el modelo es: 
. ( ) .
( ) diferencia pendiente sujeto respecto pendiente promedio
= diferencia ordenada sujeto respecto media general
ij k i ij i ij i
i
i
Y t s tiempo s tiempo e
s i
s i
µ β β
β
= + + + + +
= 
Los efectos de sujeto a nivel de ordenada y de pendiente están correlacionados dentro 
de cada sujeto. Es natural modelar la distribución conjunta de los efectos aleatorios. Por 
ejemplo, 
2
,
2
,
~ ( ) i s s s
i s s s
s
N
s
β
β β
σ σ
β σ σ
  
=   
    
0,G G 
 
Con datos normales ambas aproximaciones (formas explicita e implícita) son 
equivalentes. Sin embargo, con datos no normales o cuando el modelo es no lineal, los 
parámetros bajo estas dos estrategias son intrínsecamente diferentes y se interpretan 
como: 1) “parámetros promedios poblacionales” (modelos marginales), o 2) “parámetros 
sujeto-específicos” (modelos con efectos aleatorios de sujeto). 
 
1.2. Curvas de Crecimiento 
 
En la modelización de curvas de crecimiento, a diferencia de otras situaciones de 
mediciones repetidas donde el objetivo es comparar tratamientos a través de su perfil 
temporal, se persigue la estimación y predicción del crecimiento en función del tiempo. 
Distintos tipos de ecuaciones que explican el crecimiento en función del período de 
tiempo considerado son de interés. En Forestería se destacan los siguientes tipos: a) 
Crecimiento anual corriente: es el incremento de un elemento dentro de un año, b) 
Crecimiento periódico: es el crecimiento acumulado en un periodo de varios años, c) 
Crecimiento medio anual: es el tamaño alcanzado hasta un determinado momento en el 
tiempo dividido por la edad correspondiente. 
Cuando el crecimiento corriente o acumulado se expresa en función de la edad, en un 
dominio de tiempo suficientemente largo como para que se expresen las distintas 
 22 
etapas del crecimiento biológico de las especies, la función resultante rara vez es lineal 
en los parámetros de interés. Los incrementos acumulados como una función del 
tiempo generalmente muestran una curva sigmoidea. El punto de inflexión de esta 
curva de rendimiento coincide con el máximo de la curva de incremento corriente anual 
(curva de crecimiento), es decir que la primera derivada de la curva de rendimiento es 
la curva de incremento corriente anual. Si al crecimiento total se lo divide por la 
cantidad de años considerados se obtiene el incremento medio anual. La curva de 
incremento corriente y la de incremento medio se cortan en el máximo de crecimiento 
medio. Este punto de corte es importante porque indica el momento en que los árboles 
alcanzan la madurez biológica. 
La relación funcional puede ser especificada desde un punto de vista biológico 
(usualmente modelos no lineales) o empírico (en general funciones polinomiales). Los 
modelos no-lineales son modelos de regresión en los cuales los parámetros aparecen 
en forma no-lineal en la ecuación. Por ejemplo: 
( )
2
2 2 0 1 20 10 1
1 1 1, ,Y Y Yx x xxe
µ µ µβ β β β ββ ββ β
= = =
− + +++
 
( )( )
( )
0 0
0 0 1
32
1 1 2
exp exp , ,
1
1
Y Y Yx xe xe
β βµ β β β µ µ βββ β β
= − − + = =
−+ − + 
+ 
 
 
Debido a que el crecimiento está evaluado mediante mediciones obtenidas sobre un 
mismo individuo es importante modelar la estructura de correlación de las 
observaciones dentro de sujeto, ya sea para un modelo lineal o no-lineal. En Forestería 
la información disponible para cada sujeto (árbol) puede ser una serie de ancho de 
anillos de crecimiento leñoso obtenida desde una muestra dendrocronológica. En este 
caso el número de mediciones en cada sujeto varía ya que depende de la edad del 
árbol. Los modelos mixtos permiten contemplar dicho desbalance debido al proceso de 
estimación empleado. Las series de ancho de anillos generalmente son suavizadas 
para maximizar la tendencia debida al crecimiento biológico mediante la eliminación de 
variaciones posiblemente debidas al clima y a disturbios producidos en el bosque. Este 
tipo de filtrado de los datos previos al estudio del crecimiento biológico genera aun más 
 23 
dependencia entre las observaciones dentro de sujeto. Adicionalmente, en situaciones 
donde se modela el crecimiento de bosques, la varianza del término de error podría 
estar relacionada con la variable predictora. En modelos de regresión aplicados sobre 
rodales, donde el volumen del rodal es la variable dependiente y la edad se usa como 
predictora, por ejemplo, se podría notar una mayor variación de los volúmenes a 
edades menores que cuando el rodal está más establecido (variables respuestas no-
normales). 
Las características de la información disponible para modelar crecimiento en Forestería 
sugieren el uso de modelos que contemplen la alta variabilidad entre sujetos, 
desbalances y que además consideren que las curvas de crecimiento involucran 
variables relacionadas serialmente y generalmente no son lineales en sus parámetros. 
Numerosos estudios sobre estrategias de modelación para curvas de crecimiento se 
realizaron hasta el momento (Kshirsagar y Smith, 1995). El modelo lineal polinómico 
(Graybill, 1996) y otros modelos biológicos no lineales (Lee, 1982) en sus parámetros 
se utilizan en la modelación de curvas de crecimiento individual y poblacional. Para 
modelar curvas de crecimiento teniendo en cuenta la correlación serial pueden usarse 
las aproximaciones metodológicas presentadas en relación al análisis de medidas 
repetidas. Lindstrom y Bates (1990), consideraron que los métodos tradicionales, i.e. 
modelos fijos para el análisis de curvas de crecimiento poblacionales, donde la 
estructura de dependencia de los datos se puede considerar a través del ajuste de 
alguna estructura de covarianza a los términos de error, constituyen modelos 
marginales cuyo objetivo es ajustar un modelo general para la estructura promedio de la 
población de sujetos. Una aproximación alternativa es el uso de modelos específicos de 
sujeto, que proporcionan un modelo para cada individuo, pero donde la forma general 
del modelo es la misma para cada sujeto. Así, el crecimiento de cada sujeto podría ser 
modelado, por ejemplo con un modelo logístico, pero los parámetros del modelo van a 
variar de árbol a árbol. Estas variaciones pueden introducirse a través de la 
incorporación de efectos aleatorios propios para cada individuo. Al presente, los 
modelos no lineales marginales pueden ajustarse en SAS usando PROC GENMOD 
sólo si son linearizables (es decir, existe una transformación de las Y que permite 
 24 
escribir el modelo en forma lineal: éstaes la función de enlace). Los modelos no 
lineales mixtos pueden ajustarse en SAS usando PROC NLMIXED. 
 
Ejemplo 4. Datos de naranjo 
Suponga que se dispone de 7 mediciones de circunferencia (en mm) de 5 árboles de 
naranja. Los datos se encuentran el archivo naranjo.xls. La Figura 4 muestra los perfiles 
individuales de los 5 árboles. 
 
 
 
 
 
 
 
 
 
 
 
Figura 4. Crecimiento diametral (mm) de 5 árboles de naranjo. 
 
Un modelo plausible es el logístico: 
 
Como los datos son longitudinales, una manera de introducir la correlación en el modelo 
sería mediante efectos aleatorios. Para ello se podría asumir que la asíntota tiene un 
efecto aleatorio (observar que todos parecen empezar por el mismo valor, pero cada 
árbol pareciera alcanzar un tamaño diferente). La especificación del modelo sería: 
 
 
 
 
Crecimiento de árboles de naranja
0
50
100
150
200
250
100 300 500 700 900 1100 1300 1500
Días
T
ro
n
c
o
 (
m
m
)
A1
A2
A3
A4
A5
0
2
1
/1
βµ ββ
=
−+
Y xe
0
2
11
i
ij ij
ij
uY x
e
β εβ
β
+
= +
−
+
 25 
Ejemplo 5. Datos Quebracho 
La información disponible para cada sujeto (árbol) es una serie de ancho de anillos de 
crecimiento leñoso obtenida desde una muestra dendrocronológica. Se trabaja con una 
especie arbórea del Chaco árido argentino: quebracho blanco. Se dispone de 6 árboles. 
En este caso si bien las observaciones podrían pensarse como equiespaciadas o 
recolectadas en momentos fijos de tiempo (un anillo = un año de crecimiento), el 
número de mediciones en cada sujeto varía ya que depende de la edad del árbol. En la 
Figura 5 se presentan los incrementos radiales anuales observados y suavizados. 
 
ESPESORES DE ANILLOS OBSERVADOS Y SUAVIZADOS EN FUNCION DE LA EDAD. A. BLANCO
ARBOL 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0 10 20 30 40
EDAD (años)
ES
PE
SO
R
 D
E 
A
N
IL
LO
S 
(c
m
)
espesorani
espesoranisu
Fig. 1,21
ARBOL 2
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0 10 20 30 40 50 60 70
EDAD (años)
ES
PE
SO
R
 D
E 
A
N
IL
LO
S 
(c
m
)
espesorani
espesoranisu
Fig. 1,22
ARBOL 3
0
0.1
0.2
0.3
0.4
0.5
0.6
0 20 40 60 80 100
EDAD (años)
ES
PE
SO
R
 D
E 
A
N
IL
LO
S 
(c
m
)
espesorani
espesoranisu
Fig. 1,23
ARBOL 4
0
0.1
0.2
0.3
0.4
0.5
0.6
0 10 20 30 40 50 60
EDAD (años)
ES
PE
SO
R
 D
E 
A
N
IL
LO
S 
(c
m
)
espesorani
espesoranisu
Fig. 1,24
ARBOL 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0 10 20 30 40 50 60 70
EDAD (años)
ES
PE
SO
R
 D
E 
A
N
IL
LO
S 
(c
m
)
espesorani
espesoranisu
Fig. 1,25
ARBOL 6
0
0.2
0.4
0.6
0.8
1
1.2
0 20 40 60 80
EDAD (años)
ES
PE
SO
R
 D
E 
A
N
IL
LO
S 
(c
m
)
espesorani
espesoranisua
Fig. 1,26
 
Figura 5. Crecimiento del leño de Quebracho blanco en 6 árboles del Chaco Arido 
Argentino. 
 
 
 26 
Ejemplo 6. Modelos para volumen acumulado de tronco de árboles 
 
Schabenberger y Pierce (2002) presentan un conjunto de datos con el que construyen un 
modelo para predecir el volumen maderable de árboles en función del diámetro del tronco. 
Para ello usan árboles de álamo amarillo (“yellow poplar”, Liriodendron tulipifera L.) que se 
cortaron en varias secciones y se determina el volumen total acumulado de las distintas 
secciones (hasta llegar al diámetro superior que puede ser mercadeable, o hasta el extremo 
del árbol si se desea el volumen total). Los datos provenientes de los mismos árboles son 
dependientes (no solo por ser del mismo árbol, sino que los volúmenes se van acumulando). 
Burkhart expresó el volumen Vd hasta un diámetro de tronco d como el producto del 
volument total V0 y el cociente Rd entre el volumen mercadeable y el volumen total: 
 0d dV V R= 
Hasta los trabajos de Gregoire y Schabenberger (1996), estas ecuaciones se ajustaban 
sin tener en cuenta la correlación entre observaciones del mismo árbol. Estos autores 
usan modelos no lineales mixtos con un efecto aleatorio de árbol para inducir esta 
correlación. El conjunto YellowPoplarData.xls contiene medidas de 336 árboles. En la 
figura 6 se muestran los datos, y puede obervarse que los árboles varían mucho en 
volumen, principalmente debido a que hay mucha variabilidad en la altura. La figura 7 
muestra los mismos árboles, pero se grafican los volúmenes relativos 
0
.dV V Aquí se 
pueden apreciar diferencias en la forma de los perfiles de volumen. 
 
 27 
 
Figura 6. Perfiles de volumen acumulado para álamos amarillos graficados en función 
del diámetro complementario 1 / max( ).ij ij ijr d d= − Los árboles están agrupados en 9 
grupos de altura. (Tomado de Schabenberger y Pierce, 2001) 
 
 28 
 
Figura 7. Perfiles de volumen acumulados relativos para álamos amarillos graficados en 
función del diámetro complementario 1 / max( ).ij ij ijr d d= − Los árboles están agrupados 
en 9 grupos de altura. (Tomado de Schabenberger y Pierce, 2001) 
 
Estos autores desarrollan modelos para V0 y Rd con el objetivo de ajustar simultáneamente 
ambas cantidades y su producto teniendo en cuenta diferencias entre árboles respecto al 
tamaño de los árboles y la forma de los perfiles de volumen. La relación que usan para el 
volumen total es 
2
0 0 1 1000
i i
i i
D HV eβ β= + + 
en donde D es el diámetro a la altura del pecho (en pulgadas), y H es la altura del árbol (en 
pies). Se divide por 1000 para que las magnitudes de los coeficientes de regresión sean 
similares. 
 29 
Para Rd se requiere una función que crezca de 0 a 1, con 0dV V≤ . La ecuación que usaron 
fue 
( )2 3exp exp1000d
tR tβ β = − 
 
 
donde / .t d D= 
 30 
1.3. Experimentos Multi-ambientales 
Numerosos estudios en agricultura y forestería se conducen en varios ambientes. La 
característica de este tipo de experimentos es que en general, los ambientes elegidos, 
intentan representar una población relativamente mayor de ambientes. Dentro de cada 
ambiente se evalúan generalmente dos o más tratamientos bajo un cierto diseño 
experimental con o sin repeticiones. Cuando no existen repeticiones dentro de cada 
ambiente, a menudo los datos se analizan con un modelo de ANOVA para un DBCA 
(si todos los tratamientos están en todos los ambientes) o como un DBI en caso 
contrario donde los ambientes juegan el rol del bloque y esto se hace para contemplar 
la correlación entre observaciones dentro de un mismo ambiente. Los siguientes 
modelos de ANAVA representan potenciales modelos para experimentos multi-
ambientales. 
(Modelo A): 
(Modelo B): ; a ambiente
(Modelo C): ( )
(Modelo D): ( ) ( )
(Modelo Mixto): y ( ) aleatorios iid N(0,
ij i ij
ij i j ij
ijk i j ijk ijk
ijk i j ijk k ij ijk
j ij a
Y t e
Y t a e
Y t a ta e
Y t a ta b a e
a ta
µ
µ
µ
µ
σ
= + +
= + + + →
= + + + +
= + + + + +
2 2) N(0, )tay σ
 
 
En el Modelo A se ignora que los datos provienen de múltiplos ambientes, en el 
Modelo B se incorpora el efecto del ambiente pero se supone que éste no interactúa 
con los tratamientos; este modelo podría ajustarse tanto en situaciones con 
repeticiones dentro de ambiente como en casos donde existe una única observación 
para cada tratamiento por ambiente. Corresponde al modelo de un diseño en bloques, 
los efectos de ambiente (bloque) podrían ser considerados como fijos o aleatorios 
según los supuestos que se hagan respecto a los ambientes incorporados en el 
experimento. En el Modelo C se incorpora la interacción tratamiento×ambiente, se 
necesitan k>1 observaciones por tratamiento dentro de cada ambiente para poder 
estimar los parámetros relacionados a la interacción, este modelo seria apropiado para 
situaciones donde no existe estructura de las UE dentro de ambiente. El modelo D es 
parecido al Modelo C pero para situaciones donde existe un diseño en bloques dentro 
de cada ambiente. Los tres últimos modelos pueden ajsutarse como modelos mixtos si 
los efectos de ambiente (y/o tratamiento) se consideran como variables aleatorias; aquí 
 31 
se ha supuestoque los efectos de ambiente y por ende los efectos de la interacción 
tratamiento×ambiente son aleatorios. Este hecho convierte al modelo en un “Modelo 
Jerárquico” ya que los efectos de tratamiento quedan contenidos dentro de los efectos 
aleatorios de la interacción. 
Los principales objetivos de los experimentos multiambientales son: (1) comparar el 
desempeño de los tratamientos en base a dos tipos de inferencia: inferencia en sentido 
amplio (a través de los ambientes) e inferencia específica de ambiente y (2) estimar e 
interpretar los componentes de la interacción. Al ser la interacción aleatoria deben 
realizarse supuestos distribucionales para los efectos de interacción, e interpretarse 
que las diferencias entre tratamientos varían aleatoriamente a través de los ambientes. 
La inferencia de resultados se hará con respecto a la población de ambientes. La 
precisión de las estimaciones relacionadas a efectos de tratamientos será diferente en 
el modelo con interacción aleatoria respecto a los otros modelos. En general los 
errores estándares de las diferencias entre medias de tratamiento se incrementan en el 
modelo de efectos aleatorios para considerar que el espacio de inferencia se amplía. 
Es natural asumir que el conjunto de observaciones provenientes del mismo ambiente 
tenderá a estar correlacionada. Variables latentes asociadas con cada ambiente 
pueden causar dependencias entre las respuestas de los tratamientos o efectos de 
factores de interés observados en un mismo ambiente. Más aun, el comportamiento de 
los tratamientos a través de los ambientes puede generar un patrón estructurado de 
dependencias entre los términos de la interacción tratamiento×ambiente. Por ello, los 
modelos mixtos con efectos de interacción aleatorios han recibido particular atención, 
ya que permiten modelar la matriz de covarianza de medias de tratamiento dentro de 
ambiente. 
 
Ejemplo 8. Datos Mani. Interacción Genotipo×Ambiente 
La interacción Genotipo×Ambiente (G×A), i.e. la respuesta diferencial de diferentes 
genotipos a través de un rango de ambientes, es una característica universal 
relacionada a los seres vivos desde bacterias a plantas y humanos (Kang, 1998). El 
tema es de relevancia en agricultura y forestería, ya que especialmente, los principales 
caracteres de importancia agronómica-forestal y económica (como el rendimiento) 
 32 
están altamente influenciados por el ambiente mostrando variación continua. Debido a 
la omnipresencia de G×A en caracteres cuantitativos, las evaluaciones de genotipos se 
llevan a cabo en experimentos multiambientales. Los datos (mani.xls) que se usarán 
para la ejemplificación corresponden a peso de granos por parcela de un ensayo 
comparativo de rendimiento de maní, donde intervienen 10 genotipos (seis de ciclo 
largo –numerados del 1 al 6– y cuatro de ciclo corto –numerados del 7 al 11), evaluados 
a través de 15 ambientes, con 4 repeticiones en bloques completos dentro de cada 
ambiente. En la Tabla 4 se muestran las medias de genotipo en cada ambiente. En la 
modelización los datos se asumirán normales. Se pretende analizar la interacción G×A 
y predecir los efectos de interacción para inferir no sólo en sentido amplio sino también 
en sentido estricto (inferencia específica de ambiente) sobre el desempeño de 
genotipos. 
 
Tabla 4. Medias de rendimiento para 10 genotipos de maní evaluados en 15 ambientes. 
 
Amb 
Florman 
1 
Tegua 
2 
mf484 
3 
mf485 
4 
mf487 
5 
mf489 
6 
manf393 
7 
mf447 
8 
mf478 
9 
mf480 
10 
1 0.80 0.96 1.16 1.12 0.87 1.11 1.24 0.95 1.37 1.41 
2 2.17 2.04 1.08 0.58 1.52 0.86 1.57 1.29 2.15 3.27 
3 2.43 2.58 2.64 2.24 2.30 2.20 2.47 2.34 2.19 2.19 
4 2.71 2.26 2.14 1.88 1.72 2.18 1.77 1.61 2.15 2.04 
5 1.13 1.14 1.71 0.85 1.24 1.21 1.55 1.86 1.98 1.61 
6 3.08 3.22 3.05 2.90 2.94 2.57 2.90 2.59 2.36 2.43 
7 2.81 2.88 2.91 2.53 2.73 2.90 2.96 3.41 3.20 2.96 
8 1.74 1.73 2.86 2.13 1.60 2.29 2.16 1.44 2.20 0.95 
9 2.16 2.44 2.73 3.00 3.18 3.25 3.30 3.01 3.37 2.53 
10 4.29 4.21 4.45 4.46 4.24 4.03 3.55 3.84 3.53 3.22 
11 1.82 1.71 2.53 1.87 1.71 2.27 2.16 1.88 2.09 1.91 
12 5.33 4.93 5.57 5.43 4.99 4.67 4.69 4.16 4.70 3.57 
13 1.18 1.32 2.45 1.78 1.54 2.00 2.24 1.63 1.54 1.15 
14 4.39 4.40 4.28 3.77 4.17 4.75 4.13 3.79 4.33 3.72 
15 3.41 3.45 2.81 3.15 3.84 3.54 2.22 2.46 3.09 2.61 
 
 
1.4. Correlación Espacial en Ensayos a Campo 
 
Las dependencias espaciales entre parcelas de ensayos de campo es un fenómeno 
común en agricultura. En especial, la existencia correlación espacial positiva, i.e. 
 33 
tendencia de observaciones que están en parcelas cercanas a ser más parecidas que 
las que están más lejos. 
Llamaremos matriz de correlación a ( ) { }Corr Corrij=δ , donde ( )Corr Corr ;ij i je e= es la 
correlación espacial entre los errores asociados a las parcelas i y j y ijd a la distancia 
entre la parcela i y la parcela j. La correlación entre los errores asociados a las parcelas i 
y j será función de la distancia entre ellas y de un vector de parámetros desconocidos δ. 
Asumiremos que e, el vector de errores de parcelas constituye un proceso estacionario 
de segundo orden, i.e., las correlaciones entre dos parcelas dependen sólo del vector de 
distancia. Luego, la función de correlación es la misma para todos los pares de parcelas 
que se encuentran a igual distancia en una dirección dada. Si además se supone que la 
función de correlación no depende de la dirección, el modelo de correlación espacial es 
llamado isotrópico (procesos invariantes a rotaciones sobre el origen). Los modelos de 
correlación espacial se llaman anisotrópicos cuando se asume que la función de 
correlación no sólo depende de la magnitud de la distancia sino también de la dirección. 
Por otro lado, se dice que un proceso es separable cuando se pueden tener funciones 
distintas en direcciones distintas y la función de correlación resultante está dada por el 
producto de la función de correlación en cada una de las dimensiones. En los casos de 
arreglos rectangulares de n parcelas en F filas y C columnas (n=F×C) importan 
generalmente sólo 2 direcciones (procesos bidimensionales). Smith et al. (2001) citan 
que el supuesto de separabilidad es computacionalmente conveniente y razonable para 
el proceso de tendencia espacial bidimensional asociado a las parcelas de los ensayos a 
campo (Martin, 1990; Cullis y Gleeson, 1991). Para un proceso bidimensional separable, 
la matriz de varianzas y covarianzas puede expresarse como el producto de las 
correlaciones por filas y por columnas. 
Zimmerman y Harville (1991) dan ejemplos usados en aplicaciones geoestadísticas que 
incluyen el modelo exponencial como modelo para la función de correlación. Para una 
única dimensión (modelo isotrópico) la función de correlación exponencial es exp( / )ijd δ− 
o también comúnmente expresada como ( )exp pijdδ− , para algún p>0, siendo ijd la 
distancia entre las parcelas i y j, y δ un parámetro desconocido. SAS llama a este 
 34 
modelo exponencial isotrópico, si p=1 (modelo con un único parámetro) y modelo 
Gaussiano si p=2 (Figura 6). El modelo con p=1 es de particular importancia para 
ensayos a campo. Los modelos de varianza-covarianza asociados pueden ser 
homogéneos o heterogéneos según los supuestos realizados sobre las varianzas. 
 
Figura 6. Función de correlación exponencial (izquierda) y gaussiana (derecha) 
 
Ejemplo 9. Datos ECR. Correlación espacial. 
Con el fin de mejorar la comparación de medias de tratamiento tomando en cuenta la 
correlación de parcelas dentro de ensayo tanto como la heterogeneidad de varianza 
residual entre ensayos de un ECR multiambiental, se analizarán modelos mixtos 
alternativos. Los datos de rendimiento (kg granos/parcela) en el archivo ecrmani.xls 
corresponden aun ECR de maní, que involucra tres localidades y que dentro de cada 
localidad se condujo según un DBCA con un número variable de cultivares de maní. El 
objetivo del análisis será ajustar, además del DBCA, distintos modelos que incorporen 
correlación espacial a nivel de los términos de error y que contemplen la posibilidad de 
que las estructuras de varianza y covarianza (tanto a nivel de correlaciones como a nivel 
de varianza residual) sean heterogéneas entre ambientes. La heterogeneidad de los 
componentes de varianza residual en ensayos multi-ambientales es bastante frecuente 
ya que los experimentos conducidos en diferentes ambientes pueden tener distinta 
precisión. Por ello se deberá modelar la correlación espacial junto a la heterogeneidad 
residual entre ensayos. 
 35 
Ejemplo 10. Datos papaya. Modelación de Proporciones. 
Los datos en el archivo papaya.xls provienen de un experimento realizado en la 
temporada 2000-2001 en Isabela, Puerto Rico. Se usaron 5 repeticiones para cada uno 
de cuatro tratamientos (suelo sin malezas, suelo con malezas, suelo cubierto con 
plástico negro y suelo cubierto con plástico plateado) aplicados a plantas de papaya en 
un diseño completamente aleatorizado. Cada unidad experimental (parcela) consistió 
de 20 plantas de papaya, y se evaluó cada planta quincenalmente para verificar si tenía 
o no síntoma de una virosis (ring spot virus) (se debe destacar que una vez que la 
planta muestra síntomas, sigue mostrando síntomas hasta la cosecha final). Nos 
interesa el progreso en el tiempo de la proporción de plantas afectadas (curva de 
progreso de enfermedad, Campbell y Madden, 1993). En la Figura 7 se muestran las 
observaciones y los ajustes a las cuatro curvas comúnmente usadas para estudiar el 
progreso de una enfermedad en fitopatología. En la modelización se debería tener en 
cuenta la correlación entre observaciones de una misma UE y que además de tener un 
modelo no-lineal, la variable de interés es no-normal (proporción de plantas afectadas). 
 
 
Figura 8. Curvas de progreso de proporción de plantas afectadas 
Control
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
40 60 80 100 120 140
dds
D
is
ea
se
 In
d
ex Y
Logistic
Gompertz
Exponential
Monomol
Weeds
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
40 60 80 100 120 140
dds
D
is
ea
se
 in
d
ex
Y
Logistic
Gompertz
Exponential
Monomol
PC
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
40 60 80 100 120 140
dds
D
is
ea
se
 in
de
x Y
Logistic
Gompertz
Exponential
Monomol
PP
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
40 60 80 100 120 140
dds
D
is
ea
se
 In
de
x Y
Logistic
Gompertz
Exponential
Monomol
 36 
Ejemplo 11. Datos arce. 
La poda de árboles que interfieren con líneas eléctricas en el campo y en la ciudad es 
un problema que cuesta mucho dinero a las compañías de electricidad. La necesidad 
de poda periódica depende del crecimiento de la especie y de la distancia mínima a la 
línea eléctrica requerida. Por ejemplo, Ontario Hydro poda cerca de medio millón de 
árboles al año, a un costo de $25 /árbol. 
En este estudio (datos de F. Camacho, Toronto, publicados en Can. J. of Statistics, 
Sep. 1995), se compararon reguladores de crecimiento para controlar el crecimiento de 
los árboles de arce plateado sin que se observen síntomas de daño. Se probaron 
Paclobutrazol (PP 333, (2RS, 3RS - 1 -(4-chlorophenyl) - 4,4 - dimethyl - 2 - (1,2,4-
triazol-l-yl) pentan - 3- ol) y Flurprimidol (EL-500, (alpha - (1-methylethyl) - alpha - [4-
(trifluromethoxyl) phenyl] - 5- pyrimidine - methanol). Ambos reguladores se han usado 
para controlar el rebrote excesivo en varias especies cuando se aplica en aspersión 
foliar, inyección en el suelo e inyección en el tronco. 
El propósito de este estudio es investigar la longitud de los brotes terminales, la longitud 
de los entrenudos y el número de entrenudos en árboles de arce plateado (silver maple) 
luego de aplicaciones de PP333 y de EL500 por inyección al tronco. Se usaron árboles 
de arce plateado de 12 años de edad con tallos múltiples que crecían en Wesleyville, 
Ontario. Los árboles se inyectaron en el tronco con soluciones de metanol y EL500 o 
PP333 en dos dosis diferentes (20 g/L y 4 g/L). El volumen de la solución inyectada en 
cada árbol se determinó a partir del diámetro del árbol usando la fórmula vol(mL) = 
(dbh)*(dbh)*.492. Se usaron dos tratamientos control: uno sin inyectar y otro inyectado 
con metanol. Se usaron 10 árboles escogidos aleatoriamente para cada uno de los 6 
tratamientos. Antes de la inyección, todos los árboles se podaron haciendo que su 
altura se redujera aproximadamente un tercio. En enero de 1987, 20 meses después 
del tratamiento, entre 6 y 8 ramas se sacaron aleatoriamente de los dos tercios 
inferiores del dosel de cada árbol. Cada rama se llevó al laboratorio y se registró la 
longitud de cada brote terminal, su número de entrenudos y la longitud de cada uno de 
estos entrenudos. El objetivo será el análisis de solamente analizaremos la variable 
número de entrenudos (archivo arce.xls). 
 37 
Módulo 2. Introducción 
 
2.1 Modelo Lineal General de Efectos Mixtos / Conceptos Generales 
Comenzaremos definiendo el modelo lineal de efectos fijos para luego extender 
dicha definición al caso del modelo lineal mixto. El modelo lineal es ampliamente 
utilizado en la experimentación agrícola y forestal para analizar la variabilidad de 
observaciones (respuestas) realizadas sobre características de importancia 
agronómica, en función de una o más variables predictoras o factores. Todos los 
modelos lineales de efectos fijos pueden ser especificados de la forma general: 
 
1 1 2 2
2
i
...
Var(e )= .
i i i p ip iy x x x eµ β β β
σ
= + + + + +
 
 
Por ejemplo, en el Modelo B de la sección de introducción, ij i j ijy p t eµ= + + + , el 
subíndice i señala que el resultado ha sido obtenido desde la i-ésima UE y el subíndice j 
denota un resultado proveniente del tratamiento j. Los términos β de la forma general 
corresponden a p1, p2, p3, p4, p5 y p6 y también a t1 y t2; éstos son constantes dado el 
tamaño de los efectos de UE y tratamiento. Los términos x de la forma general, asumen 
los valores 1 ó 0 y son usados para indicar a qué UE y a qué tratamiento corresponde la 
observación yi; por ejemplo si y3 fue observada sobre la unidad 1 bajo el tratamiento B, 
entonces los x correspondientes a la UE 1 y al Tratamiento B serán 1 y los restantes 
cero. En notación matricial, el modelo lineal general tiene la forma: 
 
= +y Xβ e 
 
donde y es un vector de observaciones, X es una matriz de diseño, β es el vector de 
parámetros (o efectos fijos) y e es el vector de errores, definido como 
( )E= − = −e y y y Xβ . El ejemplo anterior es un caso típico del modelo de ANOVA, 
donde los términos x representan a factores de clasificación (efectos categóricos) y por 
tanto la matriz X será una matriz de ceros y unos. Cuando los términos x representan 
 38 
covariables (medidas en una escala cuantitativa) en vez de que factores, se tiene el 
modelo clásico de regresión lineal y en ese caso la matriz X contiene los valores de las 
variables regresoras para cada observación. Para modelar efectos categóricos se 
requieren varios parámetros mientras que el efecto de una covariable puede modelarse 
sólo con un parámetro. Los modelos que tienen ambos factores y covariables se 
denominan modelos de análisis de covarianza (ANCOVA). 
Utilizando el procedimiento de mínimos cuadrados ordinarios, se puede estimar el 
vector de parámetros β resolviendo las ecuaciones normales ´ ´=X Xβ X y . La solución 
está dada por ˆ ( ´ ) ´−=β X X X y , donde ( ´ )−X X es una inversa generalizada de ´X X 
(Searle, 1971). Para hallar una estimación del vector de parámetros, no hace falta hacer 
suposiciones distribucionales sobre el vector e . Si se asumen los supuestos del modelo 
de muestreo ideal, i.e. términos de error independientes y normalmente distribuidoscon 
media 0 y varianza 2σ , entonces, la matriz de covarianzas de β̂ , utilizada para realizar 
inferencia estadística sobre β , es 2 ( ´ )σ −X X . 
Extendiendo el modelo lineal general presentado anteriormente a situaciones donde se 
incorporan efectos aleatorios se tiene el modelo lineal general mixto. La ecuación 
matricial para el modelo lineal mixto es: 
= + +y Xβ Zu e 
donde y , X , β y e representan las mismas entidades del modelo de efectos fijos y los 
nuevos componentes son: 1) Z que representa una segunda matriz de diseño de 
dimensión nxq (matriz especificada exactamente en la misma forma que X , excepto 
que no incluye una columna para el término constante) y que asocia cada observación 
a los efectos aleatorios correspondientes y 2) el vector qx1 u de elementos aleatorios ( 
efectos o coeficientes) que usualmente se asume distribuido N ( 0 ,G ). Sobre el vector 
e se supone distribución N ( 0 , R ), y este vector e es definido como: 
 
( | ) ( )E= − = − +e y y u y Xβ Zu 
Dado que la esperanza del vector aleatorio u es 0 , en el modelo lineal mixto, el valor 
esperado de una observación es la esperanza incondicional de la media de y (es decir 
promediada sobre todos los posibles valores de u ): 
 39 
 
( ) ( )E E= + =y Xβ Zu Xβ 
 
Es decir, los niveles observados de un efecto aleatorio son una muestra aleatoria de la 
población de niveles y la esperanza incondicional es la media de y sobre toda esa 
población. Por otro lado, la esperanza condicional de y dado u es: 
 
( | )E = +y u Xβ Zu 
 
esperanza que representa la media de y para el subconjunto específico de niveles del 
efecto aleatorio observados en el experimento. 
La matriz R es modelada como 2σ=R I cuando se considera que los términos de error 
(generalmente asociados a la UE) son independientes y tienen la misma varianza 2σ . 
Los términos aleatorios u se suponen independientes de los términos aleatorios e . 
Resumiendo los supuestos usuales sobre la esperanza y la varianza de las 
componentes aleatorias, se tiene que: 
 
E    =   
   
u 0
e 0 
Var    =   
   
u G 0
e 0 R 
 
Cuando se asume distribución normal para el vector de observaciones, la función de 
densidad (verosimilitud) queda completamente determinada por el vector de valores 
esperados y la matriz de varianzas y covarianzas. La matriz de varianzas y covarianzas 
de y (incondicional o promedio para la población de efectos aleatorios) está dada por: 
( ) ( )
( ) ´ ( )
´
V V
V V
= = + +
= +
= +
y V Xβ Zu e
Z u Z e
ZGZ R 
Los supuestos clásicos de independencia y homogeneidad de varianzas para los 
términos aleatorios del modelo lineal general (muestreo ideal) se flexibilizan en el marco 
 40 
del modelo mixto general. La inclusión de efectos aleatorios produce observaciones 
correlacionadas. Tanto la estructura de correlaciones como la presencia de varianzas 
heterogéneas pueden ser especificadas a través de la modelación de las matrices de 
covarianza G y/o R . A través de G y R es posible modelar correlaciones entre 
efectos de tratamiento, entre parcelas experimentales ocasionadas por la distribución 
espacial y/o temporal de las mismas en el campo y/o considerar diferentes precisiones 
de ensayos cuando se combinan experimentos. 
 
Estructura de Covarianzas: Modelo de efectos aleatorios 
Para un modelo con q efectos aleatorios, la matriz G de dimensión qxq es una matriz 
diagonal cuando se asume que los efectos aleatorios no están correlacionados. Por 
ejemplo, para un experimento multi-ambiental con 3 ambientes cuyos efectos son 
tratados como aleatorios y 2aσ representa la componente de varianza asociada a la 
variación entre ambientes, se tiene para G la siguiente forma: 
2
2
2
0 0
0 0
0 0
a
a
a
σ
σ
σ
 
 
=  
 
 
G
 
 
Si la interacción tratamiento×ambiente también es aleatoria y hay dos tratamientos, 
entonces G tiene la siguiente forma: 
 
2
2
2
2
2
2
2
2
2
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
a
a
a
ta
ta
ta
ta
ta
ta
σ
σ
σ
σ
σ
σ
σ
σ
σ
 
 
 
 
 
 
 =
 
 
 
 
 
  
 
G
 
 41 
 
Dado que los errores no están correlacionados R tiene la siguiente forma: 
2
2
2
2
2
2
2
2
2
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
σ
σ
σ
σ
σ
σ
σ
σ
σ
 
 
 
 
 
 
 =
 
 
 
 
 
  
 
R
 
 
La matriz de varianza-covarianzas entre observaciones, dada por 
( ) ´V = +y ZGZ R tiene un primer término donde se especifican las covarianzas debidas 
a los efectos aleatorios. Si hay 4 observaciones en el primer ambiente (dos para un 
tratamiento y dos para el otro tratamiento), dos en el segundo (uno para cada 
tratamiento) y 3 en el tercero (dos para un tratamiento y una para otro), pero el modelo 
sólo considera el efecto de ambiente aleatorio, se tendrá: 
2 2 2 2
2 2 2 2
2 2 2 2
2 2 2 2
' 2 2
2 2
2 2 2
2 2 2
2 2 2
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
a a a a
a a a a
a a a a
a a a a
a a
a a
a a a
a a a
a a a
σ σ σ σ
σ σ σ σ
σ σ σ σ
σ σ σ σ
σ σ
σ σ
σ σ σ
σ σ σ
σ σ σ
 
 
 
 
 
 
 =
 
 
 
 
 
  
 
ZGZ
 
 
 42 
2 2 2 2 2
2 2 2 2 2
2 2 2 2 2
2 2 2 2 2
2 2 2
2 2 2
2 2 2 2
2 2 2 2
2 2 2 2
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
a a a a
a a a a
a a c a
a a a a
a a
a a
a a a
a a a
a a a
σ σ σ σ σ
σ σ σ σ σ
σ σ σ σ σ
σ σ σ σ σ
σ σ σ
σ σ σ
σ σ σ σ
σ σ σ σ
σ σ σ σ
 +
 
+ 
 +
 
+ 
 = +
 
+ 
 + 
 +
  + 
V
 
 
resultando en una matriz diagonal en bloques con tamaños de bloques 
correspondientes al número de observaciones para cada categoría del efecto aleatorio; 
covarianzas entre observaciones provenientes del mismo ambiente igual a la 
componente de varianza entre ambientes y varianzas (sobre la diagonal) igual a la 
suma de las componentes de varianza de ambiente y residual. 
Si ambos, los efectos de ambiente y de la interacción, son considerados como 
aleatorios, y se mantienen los supuestos para los errores, estas matrices tienen la 
siguiente forma: 
2 2 2 2 2 2
2 2 2 2 2 2
2 2 2 2 2 2
2 2 2 2 2 2
2 2 2
2 2 2
2 2 2 2 2
2 2 2 2 2
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0
a ta a ta a a
a ta a ta a a
a a a ta a ta
a a a ta a ta
a ta a
a a ta
a ta a ta a
a ta a ta a
σ σ σ σ σ σ
σ σ σ σ σ σ
σ σ σ σ σ σ
σ σ σ σ σ σ
σ σ σ
σ σ σ
σ σ σ σ σ
σ σ σ σ σ
+ +
+ +
+ +
+ +
′ = +
+
+ +
+ +
ZGZ
2 2 2 20 0 0 0 0 a a a taσ σ σ σ
 
 
 
 
 
 
 
 
 
 
 
 
  + 
 
 43 
2 2 2 2
2 2 2 2
2 2 2 2
2 2 2 2
2
2
2 2 2
2 2 2
2 2
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
c ct c c
c ct c c
c c c ct
c c c ct
c
c
c ct c
c ct c
c c
θ σ σ σ σ
σ σ θ σ σ
σ σ θ σ σ
σ σ σ σ θ
θ σ
σ θ
θ σ σ σ
σ σ θ σ
σ σ θ
 +
 
+ 
 +
 
+ 
 =
 
 
 + 
 +
  
 
V
 
 
Se puede observar que V sigue siendo una matriz diagonal en bloques pero con una 
estructura algo más complicada. La componente de varianza de la interacción se suma 
a los términos de covarianza para observaciones obtenidas dentro de un mismo 
ambiente pero que a la vez también reciben el mismo tratamiento. 
 
Estructura de Covarianzas: Modelo de coeficientes aleatorios 
La estructura de covarianza en los modelos de coeficientes aleatorios es inducida por 
los coeficientes aleatorios. Este concepto se ilustra con un ejemplo que involucra dos 
tratamientos en un experimento con medidas repetidas donde participan 3 sujetos, el 
primero observado4 veces, el segundo 2 y el tercero 3 veces en el tiempo. Si se ajusta 
un modelo con los efectos de sujeto y de la interacción sujeto×tiempo con coeficientes 
aleatorios, 
0 0 1 1ij ij ij ijY b t b t eβ β= + + + + 
La matriz Z contiene los valores ijt que representan el tiempo j en el que el sujeto i es 
observado (por ejemplo días): 
 
 44 
11
12
13
14
21
22
31
32
33
1 0 0 0 0
1 0 0 0 0
1 0 0 0 0
1 0 0 0 0
0 0 1 0 0
0 0 1 0 0
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
t
t
t
t
t
t
t
t
t
 
 
 
 
 
 
 =
 
 
 
 
 
  
 
Z
 
 
Como en el modelo de efectos aleatorios se supone que los errores no están 
correlacionados, R no cambiará respecto al ejemplo anterior. Sin embargo, en el 
modelo de coeficientes aleatorios, los efectos de sujeto (interceptos) se encuentran 
correlacionados con los efectos aleatorios de pendientes (es decir las pendientes 
individuales varían aleatoriamente). La correlación ocurre sólo entre coeficientes del 
mismo sujeto mientras que los coeficientes correspondientes a diferentes sujetos no se 
encuentran correlacionados. Así la matriz G es, 
 
2
,
2
,
2
,
2
,
2
,
2
,
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
p p pt
p pt pt
p p pt
p pt pt
p p pt
p pt pt
σ σ
σ σ
σ σ
σ σ
σ σ
σ σ
 
 
 
 
=  
 
 
 
 
 
G 
 
donde 2pσ , 
2
ptσ representan las componentes de varianza asociadas a la variación 
entre sujetos o UE y entre pendientes, y ,p ptσ es la covarianza entre los coeficientes 
aleatorios. La matriz 'ZGZ será también una matriz diagonal en bloques con elementos 
,i jkv donde 
2 2
, ,( )i jk p ij jk p pt ij jk ptv t t t tσ σ σ= + + + . 
 45 
1,11 1,12 1,13 1,14
1,12 1,22 1,23 1,24
1,13 1,23 1,33 1,34
1,14 1,24 1,34 1,44
2,11 2,12
2,12 2,22
3,11 3,12 3,13
3,12 3,22 3,23
3,13 3,23 3,
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
v v v v
v v v v
v v v v
v v v v
v v
v v
v v v
v v v
v v v
='ZGZ
33
 
 
 
 
 
 
 
 
 
 
 
 
  
 
 
 
 
2.2 Modelos Marginales versus Modelos Jerárquico 
El modelo mixto lineal general puede ser re-escrito como un modelo jerárquico (o 
modelo condicional): 
| ~ ( , )
~ ( , )
N
N
+y u Xβ Zu R
u 0 G
 
Es decir existe un modelo para y dado u más un modelo para u . Esto sugiere que 
existen supuestos específicos sobre la dependencia de la media y la estructura de 
covarianza sobre las covariables en X y Z . La media marginal es Xβ y la estructura 
de covarianza es V = ZGZ´ + R . Es decir que el modelo implicado para la distribución 
marginal o incondicional de Y es ( )N Xβ,ZGŹ + R . Esta relación entre ambos modelos 
no se puede aplicar en general, y depende de propiedades de la distribución normal 
multivariada y de la linealidad del modelo. 
 
2.3 Modelos para la Estructura de Covarianza Residual (modelos de 
patrones de covarianza) 
En los modelos anteriores donde la matriz de covarianza residual R es modelada como 
múltiplo de la identidad, subyace el supuesto de independencia condicional, i.e 
condicionando sobre los u , los elementos en y son independientes. Sin embargo, hay 
muchas situaciones en las que no hay evidencias para adicionar efectos aleatorios, las 
componentes de varianza asociada a dichos efectos es pequeña o los efectos 
aleatorios no son interpretables en relación al problema, el supuesto de independencia 
 46 
condicional es poco realista. Una alternativa es modelar las correlaciones entre 
observaciones directamente a través de R de manera que éstas reflejen la estructura 
particular de los datos. Es decir, las correlaciones no son inducidas a partir de la 
incorporación de efectos aleatorios sino que se selecciona un modelo de correlación 
para R que ajuste a los datos. Los patrones en R pueden especificarse mediante el 
uso de variables de bloqueo (por ejemplo sujetos) de manera tal que las observaciones 
dentro de un mismo nivel de una variable de bloqueo se encuentran correlacionadas. 
Por ejemplo R podría estar compuesta de submatrices iR que representan bloques de 
R conteniendo covarianzas entre observaciones del sujeto i. 
Es importante notar que también podría ajustarse patrones de covarianza en G , para 
indicar que los efectos aleatorios se encuentran correlacionados. Por ejemplo, en un 
experimento con medidas repetidas donde para cada sujeto hay t tiempos de medición 
y en cada tiempo se realizan varias medidas (por ejemplo, altura, diámetro y volumen 
de copa). Entonces será importante modelar no sólo las correlaciones entre tiempos 
dentro de sujetos, sino también las correlaciones entre variable realizadas sobre un 
sujeto en cada tiempo. 
 
2.4 Estimación de Covarianzas en Poblaciones Normales 
Las estimaciones por mínimos cuadrados generalizados pueden usarse para estimar 
los efectos fijos del modelo mixto. Estas estimaciones se obtienen minimizando 
1−(y - Xβ)'V (y - Xβ) (Searle et al., 1992). El estimador del vector de efectos fijos β es: 
1 1ˆ ( ´ ) ´− − −=β X V X X V y . Si todas las componentes de varianza en V son conocidas este 
estimador es el mejor estimador lineal insesgado (BLUE) y se corresponde con el 
estimador máximo verosímil. En la práctica del análisis de datos experimentales V 
usualmente es desconocida y se reemplaza por su estimador ˆˆ ˆ´= +V ZGZ R . Si se 
puede asumir que u y e tienen distribución normal, la mejor aproximación para la 
estimación se logra con métodos basados en máxima verosimilitud. Los métodos de 
estimación más usados son máxima verosimilitud (ML) y máxima verosimilitud 
restringida (REML). 
 47 
En ML el vector conteniendo todas las componentes de varianza, digamos ξ, se obtiene 
a partir de la maximización de la función de verosimilitud ( , ( ))MLL L ξ β ξ=

con respecto a 
ξ. La función de verosimilitud, L, mide la verosimilitud de los parámetros del modelo 
dados los datos y se define usando la función de densidad de las observaciones, en 
este caso la función normal. En modelos donde las observaciones se suponen 
independientes (por ejemplo el modelo de efectos fijos) la función de verosimilitud es 
simplemente el producto de las funciones de densidad para cada observación. En los 
modelos mixtos las observaciones no se suponen independientes, por ello la función de 
verosimilitud se basa en la función de densidad multivariada de las observaciones. 
Como los efectos aleatorios tienen valor esperado igual a cero y por ende no afectan la 
media marginal, para la estimación ML en poblaciones normales la función de 
verosimilitud se basa en la distribución normal multivariada con vector de media y 
matriz de covarianza V y la maximización se realiza sobre el logaritmo de dicha 
función, log(L): 
( ) ( )
( ) ( )
1
1/ 21/ 2
1exp
2
(2 ) n
L
π
− ′
  =
y - Xβ V y - Xβ
V
 
 
( ) ( )11log( ) log
2
1 log(2 )
2
L k
k n π
− ′= − +  
= −
V y - Xβ V y - Xβ
 
 
La estimación β (ξ)

 del vector de parámetros fijos será denotada como MLβ

. Los 
vectores MLξ

 y MLβ

 pueden también obtenerse desde la maximización de ( )MLL L= θ con 
respecto a θ , siendo θ el vector de todos los parámetros del modelo; es decir 
maximizando la verosimilitud con respecto a ξ y β simultáneamente. El método clásico 
se basa en el concepto de maximizar la función log(L) con respecto a los parámetros de 
covarianza y tratando los efectos fijos como constantes. Una vez que se obtienen los 
estimadores de los parámetros de la estructura de covarianza, se obtienen las 
 48 
estimaciones de efectos fijos considerando los parámetros de covarianza como fijos. 
Este método tiene el efecto de producir estimadores de los parámetros de la estructura 
de covarianza con sesgo negativo. El sesgo es mayor cuando el número de grados de 
libertad usados para estimar las componentes de varianza es menor. 
 
Estimador REML 
El simple ejemplo del estimador ML de la varianza

Continuar navegando