Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 Aplicaciones de Modelos Mixtos en Agricultura y Forestería Dra. Mónica Balzarini (Univ. Nacional de Córdoba, Argentina) Dr. Raúl E. Macchiavelli (Universidad de Puerto Rico) Dr. Fernando Casanoves (CATIE, Costa Rica) 2 Contenidos Introducción. ..................................................................................................................... 3 Fundamentación ................................................................................................................................................... 3 Revisión Conceptual ........................................................................................................................................... 4 Tipos de Modelos Mixtos ................................................................................................................................. 11 Módulo 1. Ejemplos de Motivación ................................................................................. 13 1.1. Medidas Repetidas / Datos Longitudinales ......................................................................................... 13 1.2. Curvas de Crecimiento ............................................................................................................................. 21 1.3. Experimentos Multi-ambientales ............................................................................................................ 30 1.4. Correlación Espacial en Ensayos a Campo ........................................................................................ 32 Módulo 2. Introducción ................................................................................................... 37 2.1 Modelo Lineal General de Efectos Mixtos / Conceptos Generales ................................................ 37 2.2 Modelos Marginales versus Modelos Jerárquico ............................................................................... 45 2.3 Modelos para la Estructura de Covarianza Residual (modelos de patrones de covarianza) .. 45 2.4 Estimación de Covarianzas en Poblaciones Normales ..................................................................... 46 2.5. Inferencia sobre componentes de varianza. ....................................................................................... 51 2.6. Inferencia sobre Efectos Aleatorios. Mejor Predictor Lineal Insesgado (BLUP). ...................... 52 2.7 Criterios de Bondad de Ajuste ................................................................................................................. 58 Módulo 3: Modelación de Datos Normales .................................................................... 60 3.1 Modelos para Datos Longitudinales. Aplicaciones en Agricultura. ............................................... 60 3.2 Modelos Lineales para Curvas de Crecimiento. Aplicaciones en Forestería .............................. 77 3.3 Modelos para Interacción. Aplicaciones en Fitomejoramiento ..................................................... 113 3.4 Modelos de Correlación Espacial .......................................................................................................... 129 Módulo 4. Ajuste de Modelos No-Lineales con Datos Normales o No-Normales ......... 148 4.1. Modelo No Lineal de Curvas de Crecimiento con Coeficientes Aleatorios .............................. 148 4.2. Modelo Lineal Generalizado Mixto. Ingredientes claves. ............................................................... 164 4.3 Aplicaciones de Modelos Lineales Generalizados con otras distribuciones. ........................... 176 Bibliografía ................................................................................................................... 188 3 Introducción. Fundamentación La investigación en Agricultura y Forestería comúnmente presenta situaciones en las que es difícil utilizar los modelos lineales clásicos de análisis de varianza y regresión porque no se cumplen los supuestos de independencia, normalidad, igualdad de varianzas o incluso linealidad. La modelación de datos experimentales en el marco teórico de los modelos lineales y generalizados mixtos brinda la posibilidad de analizar datos con estructuras de dependencia, desbalances y falta de normalidad. Es así posible relajar los supuestos tradicionales del modelo lineal general y modelar, de manera flexible, estructuras complicadas de datos. Los modelos mixtos se adecúan bien en situaciones son comunes en Agricultura y Forestería, como por ejemplo cuando existe algún tipo de estructura de bloqueo de unidades experimentales que afecta las covarianzas entre observaciones. Ilustran este tipo de situación aquellos estudios donde el material experimental se evalúa en varios ensayos y por tanto es razonable asumir que existen correlaciones entre observaciones del mismo ensayo. La modelación en el marco de los modelos mixtos maneja estas correlaciones mediante la incorporación de variables aleatorias o mediante la modelación directa de la matriz de covarianzas residual. Diversas estrategias, bajo el mismo marco teórico permiten modelar variabilidad sobre y más allá de la componente usual asociada a los términos de error. Existen muchos beneficios que pueden obtenerse con el uso de modelos mixtos. En algunas situaciones se incrementa la precisión de las estimaciones. En otras se contempla mejor la estructura y se amplia el espacio de inferencia, sobre todo cuando la estructura de los datos es jerárquica. Este material de referencia se ha preparado para ejemplificar las estrategias de ajuste mediante el análisis de casos y los recursos computacionales que ofrece SAS versión 8 y posteriores (SAS Institute, 1998). Se presentan contenidos preliminares sobre aspectos relacionados al modelo mixto clásico y seguidamente ejemplos motivadores donde los modelos mixtos son particularmente útiles, incluyendo casos de medidas repetidas / datos longitudinales, curvas de crecimiento, experimentos multi-ambientales y de correlación espacial. Los ejemplos 4 tratados están relacionados al área de la agricultura y la forestería. En esta sección introductoria se realiza una revisión conceptual del Modelo Lineal de Efectos Mixtos. En el Módulo 1 se presentan los ejemplos que serán tratados posteriormente mediante algún tipo de modelo mixto. En el Módulo 2 se introducen los conceptos teóricos más relevantes incluyendo la idea de modelos marginales y jerárquicos y los procesos de estimación para el caso de datos normales. El ajuste de modelos y la interpretación de resultados para los ejemplos de casos normales se realizan en el Módulo 3, mientras que en el Módulo 4 se hace referencia a aplicaciones para modelos no-lineales y para datos no-normales. El material tiene la finalidad de favorecer la conceptualización de la modelación estadística considerando las implicaciones prácticas de su uso. Revisión Conceptual Los modelos estadísticos mixtos permiten modelar la respuesta de un estudio experimental u observacional como función de factores o covariables cuyos efectos pueden considerarse tanto como constantes fijas o variables aleatorias. Cada modelo estadístico que contiene una media general, µ, es un modelo mixto por definición, ya que también contiene un término de error aleatorio, y por tanto contiene ambos tipos de efectos. Sin embargo, en la práctica, el nombre modelo mixto se reserva usualmente para cualquier modelo que contiene efectos fijos distintos a µ y efectos aleatorios diferentes a los errores aleatorios. En casos donde existen otros efectos más allá de µ y el término de error y todos son aleatorios, se llama al modelo como Modelo II para diferenciarlo del Modelo I donde todos los factores tienen efectos fijos. En general, un efecto es considerado como fijo si los niveles del factor asociado han sido arbitrariamente determinadospor el investigador mientras que se trata como aleatorio si los niveles en el estudio pueden ser considerados como una muestra aleatoria de una población de niveles para el factor, es decir existe una distribución de probabilidad asociada. Para decidir cuándo un conjunto de efectos va a ser tratado como fijo o aleatorio es importante analizar el contexto de los datos, es decir el ambiente desde el cual ellos provienen, la manera en la cual se obtuvieron y principalmente el espacio de inferencia. Si los niveles del factor en consideración no pueden considerarse como una muestra aleatoria de una población de niveles para ese 5 factor, los efectos deberían considerarse fijos y la inferencia restringirse a los niveles del factor considerados en el estudio. Por el contrario, si se desea inferir para una población de efectos de un determinado factor, los efectos actualmente considerados en el estudio deberían tratarse como variables aleatorias. Situación 1: Modelos de efectos fijos. Consideremos un pequeño experimento diseñado para comparar a tratamientos (entiéndase existe un factor tratamiento de interés con a niveles) que incluye n unidades experimentales o repeticiones para cada tratamiento arregladas de acuerdo a un diseño completamente aleatorizado (cada tratamiento se asigna aleatoriamente a n unidades experimentales). Si yij representa la respuesta observada en la unidad j del tratamiento i, yij puede considerarse como una observación aleatoria de una población de observaciones bajo el tratamiento i, que podemos suponer tiene una distribución normal con media µi y varianza σ2. Luego, un posible modelo para yij podría ser: E(yij)= µi , donde E(.) representa el operador esperanza µi y es la respuesta esperada para una observación bajo el tratamiento i. En este modelo, llamado modelo de medias, cada µi es considerada como una constante. Dichas constantes (valores fijos) representan, en algún sentido, las magnitudes que se desean estimar y comparar. Por ejemplo, puede ser de interés estimar µi y µj, o µi-µj. Las constantes a estimar µi´s, con i=1,…,a, corresponden explícitamente a los a tratamientos incluidos en el experimento. Existen a tratamientos que son de interés y que por tanto han sido arbitrariamente seleccionados por el investigador para el experimento. El efecto del tratamiento i se define como τi=µi- µ , donde µ es la media general de la variable respuesta, por lo que el modelo puede ser re-escrito como: E(yij)= µ + τi, que se conoce como modelo de efectos fijos. Los τi representan los efectos de tratamiento y son obviamente constantes. Si eij representa el valor de la desviación o diferencia entre yij y su valor esperado, término llamado error en yij, es posible modelar los datos observados como la suma de su valor esperado y un error aleatorio, 6 yij = µi + eij o equivalentemente yij = µ + τi + eij . Conforme a las propiedades distribucionales de yij, y a la definición de eij, los términos de error son variables aleatorias con media cero, E(eij)=E[yij -E(yij)]=0 a los cuales usualmente se les atribuye la siguiente estructura de varianzas y covarianzas: 1. Cada eij tiene la misma varianza, σ2. 2. Los eij son independientes e idénticamente distribuidos, con covarianza entre cualquier par de ellos igual a cero. Es esta distribución de probabilidades asociada con los términos de error la que provee los medios para hacer inferencias sobre las funciones de los µi que son de interés y, si se desea, sobre σ2. Cabe destacar entonces que la manera en que se obtienen los datos afecta la inferencia que se puede extraer desde ellos. En este ejemplo se ha descripto el proceso de muestreo pertinente a un modelo de efectos fijos. Los datos se consideraron como un conjunto posible de datos para estos a tratamientos, conjunto que podría ser obtenido si se repite el experimento. Cada repetición del experimento proporciona un muestra diferente de n unidades experimentales para cada una de los a tratamientos. Los errores “realizados” en el experimento conforman una muestra aleatoria de una población de términos de error con media cero, varianza σ2 y covarianzas cero. Los datos en este estudio proveen estimaciones de las medias de tratamiento y de diferencias entre ellas, la distribución de los términos de error provee las varianzas para estas estimaciones. Por ejemplo, la media muestral de las observaciones bajo el tratamiento i, iy , es un estimador de µi, con varianza σ2/n, y la diferencias de medias muestrales, i jy y− , un estimador de µi-µj con varianza 2σ2/n. En realidad, σ2 es desconocida y debe ser estimada. Debido a que los términos de error tienen todos la misma varianza, cada una de las varianzas muestrales es un estimador de σ2 con n-1 grados de libertad, por lo que el promedio de las varianzas muestrales es un estimador de σ2 con a(n-1) grados de libertad. Éste es el 7 estimador usualmente preferido para estimar σ2 en las fórmulas de errores estándar de las medias de tratamiento o de sus combinaciones lineales a los fines de la inferencia, cuando los datos son balanceados. Para ilustrar algunos cálculos relacionados al modelo de efectos fijos, se presenta la Tabla 1, que contiene los rendimientos de frutas de 8 árboles antes y después de aplicar un tratamiento de herbicidas en los alrededores del árbol. Tabla 1. Rendimiento (cantidad de frutas) de 6 árboles bajo dos tratamientos: sin desmalezado (B) y con desmalezado (A) UE Trat A Trat B A-B Media 1 20 12 8 16.0 2 26 24 2 25.0 3 16 17 -1 16.5 4 29 21 8 25.0 5 22 21 1 21.5 6 24 17 7 20.5 Media 22.83 18.67 4.17 20.75 Supondremos en primera instancia que se tienen datos de dos tratamientos (A=con desmalezado y B=sin desmalezado) aplicados a 6 unidades experimentales. El modelo de análisis (Modelo A) y los cálculos correspondientes son: 2 2 ´ ´ ´ ´ ´ ´ 2 ~ (0, ) var( ) cov( , ) cov( , ) cov( , ) 0 22.83 20.75 2.08 18.67 20.75 2.08 4.16 ( ) 2 ( / 6) 2 (19.42 / 6) 2.54 4.16 / 2.54 1.63, 0 ij j ij ij ij ij i j j ij j i j ij i j A B A B A B y t e e N y y y t e t e e e t t t t EE t t t p valor µ σ σ µ µ σ = + + = = + + + + = = = − = = − = − − = − = × = × = = = − = .13 8 Se concluye por lo tanto que no hay suficiente evidencias para rechazar la hipótesis de igualdad de medias de tratamiento. El Modelo A no tiene en cuenta que las observaciones del tratamiento A y B se realizaron sobre la misma unidad experimental (árbol) y por ende están correlacionadas (datos pareados). El efecto de la unidad experimental puede ser incluido en la ecuación del modelo. Así el modelo no solo contempla la estructura de tratamientos sino también la de las unidades experimentales. Asumiendo el efecto de las UE como fijo, el modelo (Modelo B) y los cálculos correspondientes son: 2 2 ~ (0, ) var( ) , 7.88 4.16, ( ) 2 7.88 / 6 1.62, 0.05 ij i j ij ij ij A B A B y p t e e N y ahora t t EE t t p valor µ σ σ = + + + = → − = − = × = − = Las diferencias entre tratamientos resultan ahora marginalmente significativas. Una situación análoga se produce cuando hay más de dos tratamientos y ellos se aplican a un bloque de UE bajo un diseño en bloques completos al azar (DBCA). Situación 2. Modelo con efectos aleatorios Supongamos que existe un gran número de niveles para el factor tratamiento de interés y por tanto una población de efectos. Supongamos también que a niveles se seleccionaron aleatoriamente para ser incluidos en el experimento y que cada nivel del factor tratamiento se asignó aleatoriamente a n unidades experimentales (equivalentemente, que existen n observaciones aleatorias para cada uno de los a niveles del factor de interés). La selección aleatoria de niveles de tratamiento se realiza con el propósito de tratarlos como una representación de la poblaciónde efectos hacia la cual se pretende inferir. Si yij representa la respuesta observada en la unidad j del tratamiento i, un posible modelo para los datos es, E(yij)= µ + ai, donde µ es la media general de la variable respuesta y ai es el efecto del nivel i del factor de interés, ai=µi-µ. A pesar de que la expresión anterior es la misma que la correspondiente al modelo de efectos fijos, los supuestos subyacentes son diferentes 9 debido a que los niveles en estudio del factor tratamiento representan una muestra aleatoria desde la población de niveles. La cantidad ai es la realización de una variable aleatoria “efecto de tratamiento”. Dado que las cantidades ai son variables aleatorias es necesario caracterizar su distribución de probabilidades. Comúnmente las cantidades ai se consideran independiente e idénticamente distribuidas, con esperanza cero y varianza 2aσ para todo i. No obstante, otros supuestos podrían adecuarse mejor a los datos, por ejemplo covarianza entre pares de efectos. Debido a que ai es una variable aleatoria, el modelo debe interpretarse como el valor esperado de yij cuando, la variable aleatoria a, “efecto de tratamiento”, asume el valor ai. Es decir E(yij)= µ + ai representa una esperanza condicional, la esperanza de la respuesta dado el nivel del factor de tratamiento observado. Una notación alternativa para el modelo de efectos aleatorios podría ser, E(yij | a = ai) = µ + ai , o simplemente E(yij | ai) = µ + ai. Tomando esperanza respecto a la variable ai, se tiene que E(yij ) = µ . Si definimos los términos de error como la diferencia entre la cantidad observada y la esperada, eij = yij - E(yij | ai) = yij - (µ + ai ) Se puede observar nuevamente que eij es una variable aleatoria. Debido a que las observaciones para cada tratamiento han sido obtenidas de la misma manera que en la situación 1, las propiedades distribucionales de los términos de error, eij, son similares. Comúnmente se adiciona el supuesto de que las variables aleatorias eij y ai se distribuyen independientemente, de manera tal que las observaciones marginalmente se distribuyen con esperanza µ y varianza Var(yij) = 2 2aσ σ+ . Es decir que, bajo este supuesto, la varianza de las respuestas es una suma de varianzas, una para cada efecto aleatorio. Generalmente interesa conocer la representación de cada una de ellas (componente de varianza) en la variabilidad total observada. Para ilustrar cálculos relacionados a un modelo mixto, se presenta un nuevo modelo (Modelo C) para los datos de la Tabla 1. Los efectos aleatorios en este modelo representan efectos relacionados a la estructura de UE más que a la estructura de tratamientos. El experimento descripto ahora tiene un diseño en bloques aleatorizado. El factor árbol se asocia a un efecto de bloque aleatorio. Los efectos aleatorios de árbol 10 son variables aleatorias con media cero y varianza 2pσ . Las correlaciones entre observaciones derivadas de un mismo árbol son consideradas en forma implícita, mediante la adición de efectos aleatorios asociados a cada árbol. Los cálculos son: 2 2 2 2 2´ ´ ´ ´ ´ ~ (0, ) ~ (0, ) cada efecto aleatorio componente de varianza var( ) 0 ´ cov( , ) cov( , ) ´ 4.16, ( ) 2 7.88 / 6) 1.62, ij i j ij ij i p ij p ij i j i ij i i j p A B A B y p t e e N p N y i i y y p e p e i i t t EE t t p valor µ σ σ σ σ σ = + + + → = + ≠ = + + = = − = − = × = − = 2 2 0.05 2 ( 7.88) 11.54p pCMUEσ σ= − → = Los efectos de tratamiento y los errores estándares para la diferencia entre ellos (EE) son idénticos que en el modelo de efectos fijos (Modelo B) ya que sólo se usa información dentro de las UE para estimar efectos de tratamientos y no hay datos faltantes. Sin embargo, si los datos fuesen los de la Tabla 2 donde existe desbalance, algunos valores (por ejemplo el valor 22) brindan información para estimar el nivel de la UE pero no sobre diferencias entre tratamientos. Este hecho hace que los resultados obtenidos bajo un modelo de efectos fijos no sean los mismos que los derivados del modelo mixto. Tabla 2. Rendimiento (cantidad de frutas) de 8 árboles bajo dos tratamientos (sin desmalezado (B) y con desmalezado (A)). UE Trat A Trat B A-B Media 1 20 12 8 16.0 2 26 24 2 25.0 3 16 17 -1 16.5 4 29 21 8 25.0 5 22 - - 22 6 - 17 - 17 Media 22.83 18.67 4.17 20.75 11 En el modelo de efectos fijos, la diferencia entre medias de tratamientos se calcula solamente con la información dentro UE, razón por la cual participan solo las UE 1 a 4. Los cálculos correspondientes son: 4.25, ( ) 10.12 var( ) 10.12(1/ 4 1/ 4) 5.06, 2.25 A B A B t t CMR ANAVA t t EE − = = − = + = → Mientras que en el modelo que incluye el efecto aleatorio, se estiman las componentes de varianza por algún método, como por ejemplo REML, y la diferencia entre medias de tratamientos es estimada desde el modelo en 4.32 con EE=2.01. La diferencia se produce porque en la estimación bajo el Modelo C interviene información entre y dentro de UE. Tipos de Modelos Mixtos Bajo el marco general de los modelos mixtos se pueden considerar distintos tipos de modelos. Es importante recordar que en general los modelos mixtos se presentan como aquéllos que permiten modelar conjuntos de datos en los que las observaciones no son independientes. El tipo más simple de modelo mixto es el modelo de efectos aleatorios presentado en el ejemplo anterior. En ese modelo, para algunos efectos se asume que existe una distribución asociada que da origen a una fuente de variación distinta a la variación residual. Tales efectos se denominan efectos aleatorios. Los modelos de efectos aleatorios han sido ampliamente usados en agronomía, principalmente en aplicaciones relacionadas a mejoramiento genético animal y vegetal para estimar heredabilidades y predecir ganancia genética en programas de mejoramiento (Thompson, 1977). Se usan también en ensayos comparativos de rendimiento para estimar componentes de varianzas asociadas a la comparación de efectos de tratamiento conducidos a través de varias localidades y años, asumiendo que la interacción tratamiento×ambiente es aleatoria y que los efectos de tratamiento están contenidos dentro de la interacción aleatoria (Casanoves, 2004). Sin embargo, en otras circunstancias, los efectos que se permite varíen aleatoriamente están asociados a covariables en lugar de factores de 12 clasificación. Por ejemplo, en un modelo de regresión Y sobre tiempo, se podría pensar que la pendiente de la regresión varía aleatoriamente entre los sujetos que aportan información para el ajuste de la regresión. Si se ajusta un modelo con el efecto de sujeto y la interacción sujeto×pendiente como aleatoria, el modelo mixto resultante se denomina modelo de coeficientes aleatorios. Por último, en algunas circunstancias la teoría de los modelos mixtos se usa para modelar directamente el patrón de correlación o covarianza residual. Los modelos mixtos también pueden, en la práctica, definirse con combinaciones de efectos aleatorios, efectos de coeficientes aleatorios y patrones de covarianza. La selección de uno u otro tipo de modelo depende del objetivo del análisis. 13 Módulo 1. Ejemplos de Motivación En esta sección se mencionan algunos ejemplos para promover la discusión sobre el uso de modelos mixtos. En las primeras situaciones el modelo mixto aparece como una estrategia para contemplar las correlaciones entre observaciones provenientes de mediciones repetidas en el tiempo, ya sea con funciones lineales o no-lineales para la estructura de medias (medidas repetidas/datos longitudinales y curvas de crecimiento). El caso de los experimentos multiambientales, se introduce como referencia de situaciones donde la selección de un modelo mixto respecto a un modelo de efectos fijos es menos obvia, ya que dependede la interpretación que se hará de los datos, mientras que la situación referida al modelado de correlaciones espaciales en experimentos de campo introduce la necesidad del uso de modelos de patrones de covarianza. 1.1. Medidas Repetidas / Datos Longitudinales Las medidas repetidas se obtienen cuando una respuesta se mide repetidamente sobre la misma unidad experimental o sujeto (árbol, parcela, familia, etc.). El término datos longitudinales hace referencia a una clase especial de medidas repetidas, i.e. aquéllas donde la respuesta se observa en varios momentos subsecuentes en tiempo sobre la misma unidad experimental, i.e. interesa investigar cambios en el tiempo de características que se miden repetidamente sobre un mismo sujeto. Para este tipo de datos nos interesa explorar tanto la variabilidad entre sujetos como la variabilidad correspondiente a observaciones dentro de sujetos. 14 Ejemplo 1. Datos de semillas Estudio experimental donde se mide, durante 4 momentos, la biomasa de plántulas y el porcentaje de germinación en 5 cajas de 50 semillas pequeñas y 5 cajas de 50 semillas grandes de un arbusto. Es decir existe un número fijo de mediciones por sujeto (caja) y estas mediciones se toman en momentos equiespaciados en el tiempo. Los datos se encuentran en el archivo semillas.xls. Las Figuras 1 y 2 corresponden a los perfiles individuales para biomasa de plántulas y porcentaje de germinación, respectivamente. T1 T2 T3 T4 Tiempo 135,10 270,43 405,77 541,10 676,43 B io m as a (g rs .) T1 T2 T3 T4 Tiempo 395,93 433,05 470,18 507,30 544,42 B io m as a (g rs .) Figura 1. Perfiles individuales de biomasa aérea para plántulas provenientes de semillas pequeñas (a) y de semillas grandes (b). Es importante notar que: 1) existe una relación lineal entre biomasa y tiempo en el periodo estudiado, 2) la variabilidad entre unidades experimentales es alta, 3) la variabilidad dentro de unidades experimentales es relativamente menor. Sin embargo para el porcentaje de germinación de semillas grandes se tiene que: 1) existe una relación polinómica de orden posiblemente mayor a uno entre germinación y tiempo en el periodo estudiado, 2) la variabilidad entre unidades es alta, 3) la variabilidad dentro de unidades es también alta. 15 T1 T2 T3 T4 Tiempo 0 25 50 75 100 G er m in ac ió n (% ) Figura 2. Perfiles de porcentaje de germinación de unidades de semillas grandes. Frecuentemente, la variabilidad entre sujetos es mayor que la variabilidad dentro sujetos, y esto se refleja en la presencia de correlaciones positivas entre las observaciones repetidas sobre un mismo sujeto (i.e., dentro de la UE). Ejemplo 2. Datos de Cacao Un estudio experimental consistió en evaluar 56 híbridos de cacao. El diseño fue en bloques completos con 4 repeticiones. Cada unidad experimental consistió de 8 árboles hermanos. Se evaluó la producción de cacao (número total de mazorcas), obtenida a partir del conteo del número de frutos totales, frutos sanos, frutos afectados por hongos (TOTALES=sanos+afectados). La cosecha de mazorcas se realizó todos los meses durante 5 años consecutivos. En primera instancia interesa encontrar los mejores híbridos para la variable producción promedio de frutos sanos / ha. Además interesa detectar árboles individuales (dentro de los 8 de cada unidad experimental) que sean superiores respecto a la producción total de frutos sanos. Los datos se encuentran en el archivo cacao.ssd. Como una primera aproximación estos datos se modelarán como normales y se tratará de responder preguntas relacionadas a la respuesta en el tiempo, la relación de ésta con los hibridos y a la interacción de los hibridos y el tiempo. Si bien en el Ejemplo 1 la estructura de las UE sigue un DCA y la UE se corresponde con la 16 unidad observacional, en el Ejemplo 2 la estructura de UE corresponde a la de un DBCA donde la UE es la parcela y el árbol constituye la unidad observacional. Ejemplo 3. Datos longitudinales vs. transversales (cross-sectional) Suponga que nos interesa estudiar la relación entre alguna respuesta Y y el tiempo. Un estudio transversal produce los datos de la Figura 3, sugiriendo una relación negativa entre Y y tiempo. Tiempo R es pu es ta Y Figura 3. Diagrama de dispersión de Y vs. tiempo. Exactamente las mismas observaciones podrían haberse obtenido en un estudio longitudinal, con 2 mediciones por sujeto. La Figura 4 corresponde a esta situación y si bien sugiere una relación transversal negativa entre Y y tiempo, también evidencia una tendencia longitudinal positiva. 17 Tiempo R es pu es ta Y Figura 4. Diagrama de dispersión de Y vs. tiempo. Los ejemplos anteriores muestran la existencia de una estructura de correlación entre observaciones de un mismo sujeto, también conocidas como correlaciones dentro de sujetos. Ésta no puede ignorarse en el análisis. Las aproximaciones estadísticas que permiten tener en cuenta la correlación son varias. Para dos medidas repetidas sobre la misma UE, el ejemplo clásico de análisis de datos correlacionados es el test t pareado. Por ejemplo, para la situación planteada en la sección de revisión conceptual (Tabla 1), una posibilidad podría ser analizar las diferencias entre tiempos (antes y después del tratamiento con herbicida). Estas diferencias se obtienen por una simple transformación lineal dentro de sujeto, i.e ∆i = YiA − YiB. La transformación reduce el número de observaciones a una por sujeto y permite así que se puedan aplicar técnicas clásicas de análisis como el test t, ya que los nuevos datos (los obtenidos de la transformación) no están correlacionados. De este modo el análisis de datos longitudinales se reduce al análisis de datos independientes. Una técnica estadística simple, en el caso de estudios que involucran más de dos mediciones por sujeto, es reducir el número de mediciones para el sujeto i, llevándolo de mi a 1. Por ejemplo, calculando el área bajo la curva (AUDC) o perfil en el tiempo. El estadístico AUDC constituye una medida de resumen para cada sujeto separadamente. 18 Otras alternativas simples son: 1) análisis bajo cada momento en el tiempo separadamente, 2) análisis de puntos finales, 3) análisis de incrementos. La desventaja de las aproximaciones simples mencionadas es que en todas hay pérdida de información ya que no se analizan las tendencias de las medidas repetidas dentro de sujeto. El análisis de medidas repetidas/datos longitudinales permite distinguir diferencias entre sujetos de aquéllas existentes dentro de sujetos. Las mediciones repetidas sobre la misma unidad llevan a considerar la correlación entre observaciones. Al igual que en otros modelos ANOVA o regresión, podemos hacer esto en forma explícita, a través de la estimación de una matriz de covarianza, o en forma implícita, mediante la adición de efectos aleatorios en el modelo. Por ejemplo, para un modelo de ANOVA con efectos de grupo, tiempo y tiempo×grupo, ya sea éste bajo un DCA o un DBCA, considerar las correlaciones en forma explícita implica modelar la matriz de correlación (Σ) entre observaciones provenientes de un mismo sujeto. Distintos modelos de correlación pueden usarse. Por ejemplo, el modelo de correlación constante, i.e. ´( , ) ´i j i jcorr e e j jρ= ≠ o el modelo autorregresivo | ´ | ´( , ) ´ j j ij ijcorr e e j jρ −= ≠ . El modelo menos parsimonioso es el modelo no estructurado, que no asume ningún patrón estructural en las correlaciones y estima las correlaciones entre todos los pares de observaciones, i.e. ´ , ´( , ) ´ij ij j jcorr e e j jρ= ≠ . Estos modelos de correlación dan origen a distintas estructuras de matrices de varianza y covarianza. Las estructuras más comunes en datos longitudinales igualmente espaciados son la de Simetría Compuesta(CS), Auto-regresiva de orden 1 (AR(1)) y Toeplitz (TOEP). En la primera se asume el modelo de correlación constante entre cualquier par de medidas repetidas dentro de la misma unidad; los elementos de Σ tienen la forma Σjj´ = σ2ρ. En la estructura de covarianza AR se asume un decaimiento exponencial de las correlaciones, los elementos de Σ tienen la forma Σjj´ = σ2ρ|j−j´|. En la estructura de covarianzas TOEP, los elementos de Σ tienen la forma Σjj´ = α|j−j´|, i.e. varianzas iguales y covarianzas iguales entre observaciones separadas por 1, 2,… momentos de tiempo (t). Las componentes de varianza usadas para modelar el patrón de la matriz de covarianzas dentro de sujeto pueden ser iguales (modelo homoscedástico) o diferentes (heteroscedástico). 19 SAS incluye un importante número de estructuras de matrices de covarianza, por ejemplo para un vector de 3 elementos (por ejemplo 3 medidas repetidas dentro de cada sujeto), algunas de ellas y sus nombres en SAS se presentan a continuación: 20 21 La otra alternativa (forma implícita) es usar un modelo de coeficientes aleatorios. La idea es modelar la relación entre Y y tiempo incorporando un efecto cuantitativo de tiempo como covariable y un efecto aleatorio de UE. Por ejemplo, para una relación lineal en el tiempo y asumiendo distintas pendientes entre grupos, el modelo es: . ( ) . ( ) diferencia pendiente sujeto respecto pendiente promedio = diferencia ordenada sujeto respecto media general ij k i ij i ij i i i Y t s tiempo s tiempo e s i s i µ β β β = + + + + + = Los efectos de sujeto a nivel de ordenada y de pendiente están correlacionados dentro de cada sujeto. Es natural modelar la distribución conjunta de los efectos aleatorios. Por ejemplo, 2 , 2 , ~ ( ) i s s s i s s s s N s β β β σ σ β σ σ = 0,G G Con datos normales ambas aproximaciones (formas explicita e implícita) son equivalentes. Sin embargo, con datos no normales o cuando el modelo es no lineal, los parámetros bajo estas dos estrategias son intrínsecamente diferentes y se interpretan como: 1) “parámetros promedios poblacionales” (modelos marginales), o 2) “parámetros sujeto-específicos” (modelos con efectos aleatorios de sujeto). 1.2. Curvas de Crecimiento En la modelización de curvas de crecimiento, a diferencia de otras situaciones de mediciones repetidas donde el objetivo es comparar tratamientos a través de su perfil temporal, se persigue la estimación y predicción del crecimiento en función del tiempo. Distintos tipos de ecuaciones que explican el crecimiento en función del período de tiempo considerado son de interés. En Forestería se destacan los siguientes tipos: a) Crecimiento anual corriente: es el incremento de un elemento dentro de un año, b) Crecimiento periódico: es el crecimiento acumulado en un periodo de varios años, c) Crecimiento medio anual: es el tamaño alcanzado hasta un determinado momento en el tiempo dividido por la edad correspondiente. Cuando el crecimiento corriente o acumulado se expresa en función de la edad, en un dominio de tiempo suficientemente largo como para que se expresen las distintas 22 etapas del crecimiento biológico de las especies, la función resultante rara vez es lineal en los parámetros de interés. Los incrementos acumulados como una función del tiempo generalmente muestran una curva sigmoidea. El punto de inflexión de esta curva de rendimiento coincide con el máximo de la curva de incremento corriente anual (curva de crecimiento), es decir que la primera derivada de la curva de rendimiento es la curva de incremento corriente anual. Si al crecimiento total se lo divide por la cantidad de años considerados se obtiene el incremento medio anual. La curva de incremento corriente y la de incremento medio se cortan en el máximo de crecimiento medio. Este punto de corte es importante porque indica el momento en que los árboles alcanzan la madurez biológica. La relación funcional puede ser especificada desde un punto de vista biológico (usualmente modelos no lineales) o empírico (en general funciones polinomiales). Los modelos no-lineales son modelos de regresión en los cuales los parámetros aparecen en forma no-lineal en la ecuación. Por ejemplo: ( ) 2 2 2 0 1 20 10 1 1 1 1, ,Y Y Yx x xxe µ µ µβ β β β ββ ββ β = = = − + +++ ( )( ) ( ) 0 0 0 0 1 32 1 1 2 exp exp , , 1 1 Y Y Yx xe xe β βµ β β β µ µ βββ β β = − − + = = −+ − + + Debido a que el crecimiento está evaluado mediante mediciones obtenidas sobre un mismo individuo es importante modelar la estructura de correlación de las observaciones dentro de sujeto, ya sea para un modelo lineal o no-lineal. En Forestería la información disponible para cada sujeto (árbol) puede ser una serie de ancho de anillos de crecimiento leñoso obtenida desde una muestra dendrocronológica. En este caso el número de mediciones en cada sujeto varía ya que depende de la edad del árbol. Los modelos mixtos permiten contemplar dicho desbalance debido al proceso de estimación empleado. Las series de ancho de anillos generalmente son suavizadas para maximizar la tendencia debida al crecimiento biológico mediante la eliminación de variaciones posiblemente debidas al clima y a disturbios producidos en el bosque. Este tipo de filtrado de los datos previos al estudio del crecimiento biológico genera aun más 23 dependencia entre las observaciones dentro de sujeto. Adicionalmente, en situaciones donde se modela el crecimiento de bosques, la varianza del término de error podría estar relacionada con la variable predictora. En modelos de regresión aplicados sobre rodales, donde el volumen del rodal es la variable dependiente y la edad se usa como predictora, por ejemplo, se podría notar una mayor variación de los volúmenes a edades menores que cuando el rodal está más establecido (variables respuestas no- normales). Las características de la información disponible para modelar crecimiento en Forestería sugieren el uso de modelos que contemplen la alta variabilidad entre sujetos, desbalances y que además consideren que las curvas de crecimiento involucran variables relacionadas serialmente y generalmente no son lineales en sus parámetros. Numerosos estudios sobre estrategias de modelación para curvas de crecimiento se realizaron hasta el momento (Kshirsagar y Smith, 1995). El modelo lineal polinómico (Graybill, 1996) y otros modelos biológicos no lineales (Lee, 1982) en sus parámetros se utilizan en la modelación de curvas de crecimiento individual y poblacional. Para modelar curvas de crecimiento teniendo en cuenta la correlación serial pueden usarse las aproximaciones metodológicas presentadas en relación al análisis de medidas repetidas. Lindstrom y Bates (1990), consideraron que los métodos tradicionales, i.e. modelos fijos para el análisis de curvas de crecimiento poblacionales, donde la estructura de dependencia de los datos se puede considerar a través del ajuste de alguna estructura de covarianza a los términos de error, constituyen modelos marginales cuyo objetivo es ajustar un modelo general para la estructura promedio de la población de sujetos. Una aproximación alternativa es el uso de modelos específicos de sujeto, que proporcionan un modelo para cada individuo, pero donde la forma general del modelo es la misma para cada sujeto. Así, el crecimiento de cada sujeto podría ser modelado, por ejemplo con un modelo logístico, pero los parámetros del modelo van a variar de árbol a árbol. Estas variaciones pueden introducirse a través de la incorporación de efectos aleatorios propios para cada individuo. Al presente, los modelos no lineales marginales pueden ajustarse en SAS usando PROC GENMOD sólo si son linearizables (es decir, existe una transformación de las Y que permite 24 escribir el modelo en forma lineal: éstaes la función de enlace). Los modelos no lineales mixtos pueden ajustarse en SAS usando PROC NLMIXED. Ejemplo 4. Datos de naranjo Suponga que se dispone de 7 mediciones de circunferencia (en mm) de 5 árboles de naranja. Los datos se encuentran el archivo naranjo.xls. La Figura 4 muestra los perfiles individuales de los 5 árboles. Figura 4. Crecimiento diametral (mm) de 5 árboles de naranjo. Un modelo plausible es el logístico: Como los datos son longitudinales, una manera de introducir la correlación en el modelo sería mediante efectos aleatorios. Para ello se podría asumir que la asíntota tiene un efecto aleatorio (observar que todos parecen empezar por el mismo valor, pero cada árbol pareciera alcanzar un tamaño diferente). La especificación del modelo sería: Crecimiento de árboles de naranja 0 50 100 150 200 250 100 300 500 700 900 1100 1300 1500 Días T ro n c o ( m m ) A1 A2 A3 A4 A5 0 2 1 /1 βµ ββ = −+ Y xe 0 2 11 i ij ij ij uY x e β εβ β + = + − + 25 Ejemplo 5. Datos Quebracho La información disponible para cada sujeto (árbol) es una serie de ancho de anillos de crecimiento leñoso obtenida desde una muestra dendrocronológica. Se trabaja con una especie arbórea del Chaco árido argentino: quebracho blanco. Se dispone de 6 árboles. En este caso si bien las observaciones podrían pensarse como equiespaciadas o recolectadas en momentos fijos de tiempo (un anillo = un año de crecimiento), el número de mediciones en cada sujeto varía ya que depende de la edad del árbol. En la Figura 5 se presentan los incrementos radiales anuales observados y suavizados. ESPESORES DE ANILLOS OBSERVADOS Y SUAVIZADOS EN FUNCION DE LA EDAD. A. BLANCO ARBOL 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 10 20 30 40 EDAD (años) ES PE SO R D E A N IL LO S (c m ) espesorani espesoranisu Fig. 1,21 ARBOL 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 10 20 30 40 50 60 70 EDAD (años) ES PE SO R D E A N IL LO S (c m ) espesorani espesoranisu Fig. 1,22 ARBOL 3 0 0.1 0.2 0.3 0.4 0.5 0.6 0 20 40 60 80 100 EDAD (años) ES PE SO R D E A N IL LO S (c m ) espesorani espesoranisu Fig. 1,23 ARBOL 4 0 0.1 0.2 0.3 0.4 0.5 0.6 0 10 20 30 40 50 60 EDAD (años) ES PE SO R D E A N IL LO S (c m ) espesorani espesoranisu Fig. 1,24 ARBOL 5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 10 20 30 40 50 60 70 EDAD (años) ES PE SO R D E A N IL LO S (c m ) espesorani espesoranisu Fig. 1,25 ARBOL 6 0 0.2 0.4 0.6 0.8 1 1.2 0 20 40 60 80 EDAD (años) ES PE SO R D E A N IL LO S (c m ) espesorani espesoranisua Fig. 1,26 Figura 5. Crecimiento del leño de Quebracho blanco en 6 árboles del Chaco Arido Argentino. 26 Ejemplo 6. Modelos para volumen acumulado de tronco de árboles Schabenberger y Pierce (2002) presentan un conjunto de datos con el que construyen un modelo para predecir el volumen maderable de árboles en función del diámetro del tronco. Para ello usan árboles de álamo amarillo (“yellow poplar”, Liriodendron tulipifera L.) que se cortaron en varias secciones y se determina el volumen total acumulado de las distintas secciones (hasta llegar al diámetro superior que puede ser mercadeable, o hasta el extremo del árbol si se desea el volumen total). Los datos provenientes de los mismos árboles son dependientes (no solo por ser del mismo árbol, sino que los volúmenes se van acumulando). Burkhart expresó el volumen Vd hasta un diámetro de tronco d como el producto del volument total V0 y el cociente Rd entre el volumen mercadeable y el volumen total: 0d dV V R= Hasta los trabajos de Gregoire y Schabenberger (1996), estas ecuaciones se ajustaban sin tener en cuenta la correlación entre observaciones del mismo árbol. Estos autores usan modelos no lineales mixtos con un efecto aleatorio de árbol para inducir esta correlación. El conjunto YellowPoplarData.xls contiene medidas de 336 árboles. En la figura 6 se muestran los datos, y puede obervarse que los árboles varían mucho en volumen, principalmente debido a que hay mucha variabilidad en la altura. La figura 7 muestra los mismos árboles, pero se grafican los volúmenes relativos 0 .dV V Aquí se pueden apreciar diferencias en la forma de los perfiles de volumen. 27 Figura 6. Perfiles de volumen acumulado para álamos amarillos graficados en función del diámetro complementario 1 / max( ).ij ij ijr d d= − Los árboles están agrupados en 9 grupos de altura. (Tomado de Schabenberger y Pierce, 2001) 28 Figura 7. Perfiles de volumen acumulados relativos para álamos amarillos graficados en función del diámetro complementario 1 / max( ).ij ij ijr d d= − Los árboles están agrupados en 9 grupos de altura. (Tomado de Schabenberger y Pierce, 2001) Estos autores desarrollan modelos para V0 y Rd con el objetivo de ajustar simultáneamente ambas cantidades y su producto teniendo en cuenta diferencias entre árboles respecto al tamaño de los árboles y la forma de los perfiles de volumen. La relación que usan para el volumen total es 2 0 0 1 1000 i i i i D HV eβ β= + + en donde D es el diámetro a la altura del pecho (en pulgadas), y H es la altura del árbol (en pies). Se divide por 1000 para que las magnitudes de los coeficientes de regresión sean similares. 29 Para Rd se requiere una función que crezca de 0 a 1, con 0dV V≤ . La ecuación que usaron fue ( )2 3exp exp1000d tR tβ β = − donde / .t d D= 30 1.3. Experimentos Multi-ambientales Numerosos estudios en agricultura y forestería se conducen en varios ambientes. La característica de este tipo de experimentos es que en general, los ambientes elegidos, intentan representar una población relativamente mayor de ambientes. Dentro de cada ambiente se evalúan generalmente dos o más tratamientos bajo un cierto diseño experimental con o sin repeticiones. Cuando no existen repeticiones dentro de cada ambiente, a menudo los datos se analizan con un modelo de ANOVA para un DBCA (si todos los tratamientos están en todos los ambientes) o como un DBI en caso contrario donde los ambientes juegan el rol del bloque y esto se hace para contemplar la correlación entre observaciones dentro de un mismo ambiente. Los siguientes modelos de ANAVA representan potenciales modelos para experimentos multi- ambientales. (Modelo A): (Modelo B): ; a ambiente (Modelo C): ( ) (Modelo D): ( ) ( ) (Modelo Mixto): y ( ) aleatorios iid N(0, ij i ij ij i j ij ijk i j ijk ijk ijk i j ijk k ij ijk j ij a Y t e Y t a e Y t a ta e Y t a ta b a e a ta µ µ µ µ σ = + + = + + + → = + + + + = + + + + + 2 2) N(0, )tay σ En el Modelo A se ignora que los datos provienen de múltiplos ambientes, en el Modelo B se incorpora el efecto del ambiente pero se supone que éste no interactúa con los tratamientos; este modelo podría ajustarse tanto en situaciones con repeticiones dentro de ambiente como en casos donde existe una única observación para cada tratamiento por ambiente. Corresponde al modelo de un diseño en bloques, los efectos de ambiente (bloque) podrían ser considerados como fijos o aleatorios según los supuestos que se hagan respecto a los ambientes incorporados en el experimento. En el Modelo C se incorpora la interacción tratamiento×ambiente, se necesitan k>1 observaciones por tratamiento dentro de cada ambiente para poder estimar los parámetros relacionados a la interacción, este modelo seria apropiado para situaciones donde no existe estructura de las UE dentro de ambiente. El modelo D es parecido al Modelo C pero para situaciones donde existe un diseño en bloques dentro de cada ambiente. Los tres últimos modelos pueden ajsutarse como modelos mixtos si los efectos de ambiente (y/o tratamiento) se consideran como variables aleatorias; aquí 31 se ha supuestoque los efectos de ambiente y por ende los efectos de la interacción tratamiento×ambiente son aleatorios. Este hecho convierte al modelo en un “Modelo Jerárquico” ya que los efectos de tratamiento quedan contenidos dentro de los efectos aleatorios de la interacción. Los principales objetivos de los experimentos multiambientales son: (1) comparar el desempeño de los tratamientos en base a dos tipos de inferencia: inferencia en sentido amplio (a través de los ambientes) e inferencia específica de ambiente y (2) estimar e interpretar los componentes de la interacción. Al ser la interacción aleatoria deben realizarse supuestos distribucionales para los efectos de interacción, e interpretarse que las diferencias entre tratamientos varían aleatoriamente a través de los ambientes. La inferencia de resultados se hará con respecto a la población de ambientes. La precisión de las estimaciones relacionadas a efectos de tratamientos será diferente en el modelo con interacción aleatoria respecto a los otros modelos. En general los errores estándares de las diferencias entre medias de tratamiento se incrementan en el modelo de efectos aleatorios para considerar que el espacio de inferencia se amplía. Es natural asumir que el conjunto de observaciones provenientes del mismo ambiente tenderá a estar correlacionada. Variables latentes asociadas con cada ambiente pueden causar dependencias entre las respuestas de los tratamientos o efectos de factores de interés observados en un mismo ambiente. Más aun, el comportamiento de los tratamientos a través de los ambientes puede generar un patrón estructurado de dependencias entre los términos de la interacción tratamiento×ambiente. Por ello, los modelos mixtos con efectos de interacción aleatorios han recibido particular atención, ya que permiten modelar la matriz de covarianza de medias de tratamiento dentro de ambiente. Ejemplo 8. Datos Mani. Interacción Genotipo×Ambiente La interacción Genotipo×Ambiente (G×A), i.e. la respuesta diferencial de diferentes genotipos a través de un rango de ambientes, es una característica universal relacionada a los seres vivos desde bacterias a plantas y humanos (Kang, 1998). El tema es de relevancia en agricultura y forestería, ya que especialmente, los principales caracteres de importancia agronómica-forestal y económica (como el rendimiento) 32 están altamente influenciados por el ambiente mostrando variación continua. Debido a la omnipresencia de G×A en caracteres cuantitativos, las evaluaciones de genotipos se llevan a cabo en experimentos multiambientales. Los datos (mani.xls) que se usarán para la ejemplificación corresponden a peso de granos por parcela de un ensayo comparativo de rendimiento de maní, donde intervienen 10 genotipos (seis de ciclo largo –numerados del 1 al 6– y cuatro de ciclo corto –numerados del 7 al 11), evaluados a través de 15 ambientes, con 4 repeticiones en bloques completos dentro de cada ambiente. En la Tabla 4 se muestran las medias de genotipo en cada ambiente. En la modelización los datos se asumirán normales. Se pretende analizar la interacción G×A y predecir los efectos de interacción para inferir no sólo en sentido amplio sino también en sentido estricto (inferencia específica de ambiente) sobre el desempeño de genotipos. Tabla 4. Medias de rendimiento para 10 genotipos de maní evaluados en 15 ambientes. Amb Florman 1 Tegua 2 mf484 3 mf485 4 mf487 5 mf489 6 manf393 7 mf447 8 mf478 9 mf480 10 1 0.80 0.96 1.16 1.12 0.87 1.11 1.24 0.95 1.37 1.41 2 2.17 2.04 1.08 0.58 1.52 0.86 1.57 1.29 2.15 3.27 3 2.43 2.58 2.64 2.24 2.30 2.20 2.47 2.34 2.19 2.19 4 2.71 2.26 2.14 1.88 1.72 2.18 1.77 1.61 2.15 2.04 5 1.13 1.14 1.71 0.85 1.24 1.21 1.55 1.86 1.98 1.61 6 3.08 3.22 3.05 2.90 2.94 2.57 2.90 2.59 2.36 2.43 7 2.81 2.88 2.91 2.53 2.73 2.90 2.96 3.41 3.20 2.96 8 1.74 1.73 2.86 2.13 1.60 2.29 2.16 1.44 2.20 0.95 9 2.16 2.44 2.73 3.00 3.18 3.25 3.30 3.01 3.37 2.53 10 4.29 4.21 4.45 4.46 4.24 4.03 3.55 3.84 3.53 3.22 11 1.82 1.71 2.53 1.87 1.71 2.27 2.16 1.88 2.09 1.91 12 5.33 4.93 5.57 5.43 4.99 4.67 4.69 4.16 4.70 3.57 13 1.18 1.32 2.45 1.78 1.54 2.00 2.24 1.63 1.54 1.15 14 4.39 4.40 4.28 3.77 4.17 4.75 4.13 3.79 4.33 3.72 15 3.41 3.45 2.81 3.15 3.84 3.54 2.22 2.46 3.09 2.61 1.4. Correlación Espacial en Ensayos a Campo Las dependencias espaciales entre parcelas de ensayos de campo es un fenómeno común en agricultura. En especial, la existencia correlación espacial positiva, i.e. 33 tendencia de observaciones que están en parcelas cercanas a ser más parecidas que las que están más lejos. Llamaremos matriz de correlación a ( ) { }Corr Corrij=δ , donde ( )Corr Corr ;ij i je e= es la correlación espacial entre los errores asociados a las parcelas i y j y ijd a la distancia entre la parcela i y la parcela j. La correlación entre los errores asociados a las parcelas i y j será función de la distancia entre ellas y de un vector de parámetros desconocidos δ. Asumiremos que e, el vector de errores de parcelas constituye un proceso estacionario de segundo orden, i.e., las correlaciones entre dos parcelas dependen sólo del vector de distancia. Luego, la función de correlación es la misma para todos los pares de parcelas que se encuentran a igual distancia en una dirección dada. Si además se supone que la función de correlación no depende de la dirección, el modelo de correlación espacial es llamado isotrópico (procesos invariantes a rotaciones sobre el origen). Los modelos de correlación espacial se llaman anisotrópicos cuando se asume que la función de correlación no sólo depende de la magnitud de la distancia sino también de la dirección. Por otro lado, se dice que un proceso es separable cuando se pueden tener funciones distintas en direcciones distintas y la función de correlación resultante está dada por el producto de la función de correlación en cada una de las dimensiones. En los casos de arreglos rectangulares de n parcelas en F filas y C columnas (n=F×C) importan generalmente sólo 2 direcciones (procesos bidimensionales). Smith et al. (2001) citan que el supuesto de separabilidad es computacionalmente conveniente y razonable para el proceso de tendencia espacial bidimensional asociado a las parcelas de los ensayos a campo (Martin, 1990; Cullis y Gleeson, 1991). Para un proceso bidimensional separable, la matriz de varianzas y covarianzas puede expresarse como el producto de las correlaciones por filas y por columnas. Zimmerman y Harville (1991) dan ejemplos usados en aplicaciones geoestadísticas que incluyen el modelo exponencial como modelo para la función de correlación. Para una única dimensión (modelo isotrópico) la función de correlación exponencial es exp( / )ijd δ− o también comúnmente expresada como ( )exp pijdδ− , para algún p>0, siendo ijd la distancia entre las parcelas i y j, y δ un parámetro desconocido. SAS llama a este 34 modelo exponencial isotrópico, si p=1 (modelo con un único parámetro) y modelo Gaussiano si p=2 (Figura 6). El modelo con p=1 es de particular importancia para ensayos a campo. Los modelos de varianza-covarianza asociados pueden ser homogéneos o heterogéneos según los supuestos realizados sobre las varianzas. Figura 6. Función de correlación exponencial (izquierda) y gaussiana (derecha) Ejemplo 9. Datos ECR. Correlación espacial. Con el fin de mejorar la comparación de medias de tratamiento tomando en cuenta la correlación de parcelas dentro de ensayo tanto como la heterogeneidad de varianza residual entre ensayos de un ECR multiambiental, se analizarán modelos mixtos alternativos. Los datos de rendimiento (kg granos/parcela) en el archivo ecrmani.xls corresponden aun ECR de maní, que involucra tres localidades y que dentro de cada localidad se condujo según un DBCA con un número variable de cultivares de maní. El objetivo del análisis será ajustar, además del DBCA, distintos modelos que incorporen correlación espacial a nivel de los términos de error y que contemplen la posibilidad de que las estructuras de varianza y covarianza (tanto a nivel de correlaciones como a nivel de varianza residual) sean heterogéneas entre ambientes. La heterogeneidad de los componentes de varianza residual en ensayos multi-ambientales es bastante frecuente ya que los experimentos conducidos en diferentes ambientes pueden tener distinta precisión. Por ello se deberá modelar la correlación espacial junto a la heterogeneidad residual entre ensayos. 35 Ejemplo 10. Datos papaya. Modelación de Proporciones. Los datos en el archivo papaya.xls provienen de un experimento realizado en la temporada 2000-2001 en Isabela, Puerto Rico. Se usaron 5 repeticiones para cada uno de cuatro tratamientos (suelo sin malezas, suelo con malezas, suelo cubierto con plástico negro y suelo cubierto con plástico plateado) aplicados a plantas de papaya en un diseño completamente aleatorizado. Cada unidad experimental (parcela) consistió de 20 plantas de papaya, y se evaluó cada planta quincenalmente para verificar si tenía o no síntoma de una virosis (ring spot virus) (se debe destacar que una vez que la planta muestra síntomas, sigue mostrando síntomas hasta la cosecha final). Nos interesa el progreso en el tiempo de la proporción de plantas afectadas (curva de progreso de enfermedad, Campbell y Madden, 1993). En la Figura 7 se muestran las observaciones y los ajustes a las cuatro curvas comúnmente usadas para estudiar el progreso de una enfermedad en fitopatología. En la modelización se debería tener en cuenta la correlación entre observaciones de una misma UE y que además de tener un modelo no-lineal, la variable de interés es no-normal (proporción de plantas afectadas). Figura 8. Curvas de progreso de proporción de plantas afectadas Control -0.2 0 0.2 0.4 0.6 0.8 1 1.2 40 60 80 100 120 140 dds D is ea se In d ex Y Logistic Gompertz Exponential Monomol Weeds -0.2 0 0.2 0.4 0.6 0.8 1 1.2 40 60 80 100 120 140 dds D is ea se in d ex Y Logistic Gompertz Exponential Monomol PC -0.2 0 0.2 0.4 0.6 0.8 1 1.2 40 60 80 100 120 140 dds D is ea se in de x Y Logistic Gompertz Exponential Monomol PP -0.2 0 0.2 0.4 0.6 0.8 1 1.2 40 60 80 100 120 140 dds D is ea se In de x Y Logistic Gompertz Exponential Monomol 36 Ejemplo 11. Datos arce. La poda de árboles que interfieren con líneas eléctricas en el campo y en la ciudad es un problema que cuesta mucho dinero a las compañías de electricidad. La necesidad de poda periódica depende del crecimiento de la especie y de la distancia mínima a la línea eléctrica requerida. Por ejemplo, Ontario Hydro poda cerca de medio millón de árboles al año, a un costo de $25 /árbol. En este estudio (datos de F. Camacho, Toronto, publicados en Can. J. of Statistics, Sep. 1995), se compararon reguladores de crecimiento para controlar el crecimiento de los árboles de arce plateado sin que se observen síntomas de daño. Se probaron Paclobutrazol (PP 333, (2RS, 3RS - 1 -(4-chlorophenyl) - 4,4 - dimethyl - 2 - (1,2,4- triazol-l-yl) pentan - 3- ol) y Flurprimidol (EL-500, (alpha - (1-methylethyl) - alpha - [4- (trifluromethoxyl) phenyl] - 5- pyrimidine - methanol). Ambos reguladores se han usado para controlar el rebrote excesivo en varias especies cuando se aplica en aspersión foliar, inyección en el suelo e inyección en el tronco. El propósito de este estudio es investigar la longitud de los brotes terminales, la longitud de los entrenudos y el número de entrenudos en árboles de arce plateado (silver maple) luego de aplicaciones de PP333 y de EL500 por inyección al tronco. Se usaron árboles de arce plateado de 12 años de edad con tallos múltiples que crecían en Wesleyville, Ontario. Los árboles se inyectaron en el tronco con soluciones de metanol y EL500 o PP333 en dos dosis diferentes (20 g/L y 4 g/L). El volumen de la solución inyectada en cada árbol se determinó a partir del diámetro del árbol usando la fórmula vol(mL) = (dbh)*(dbh)*.492. Se usaron dos tratamientos control: uno sin inyectar y otro inyectado con metanol. Se usaron 10 árboles escogidos aleatoriamente para cada uno de los 6 tratamientos. Antes de la inyección, todos los árboles se podaron haciendo que su altura se redujera aproximadamente un tercio. En enero de 1987, 20 meses después del tratamiento, entre 6 y 8 ramas se sacaron aleatoriamente de los dos tercios inferiores del dosel de cada árbol. Cada rama se llevó al laboratorio y se registró la longitud de cada brote terminal, su número de entrenudos y la longitud de cada uno de estos entrenudos. El objetivo será el análisis de solamente analizaremos la variable número de entrenudos (archivo arce.xls). 37 Módulo 2. Introducción 2.1 Modelo Lineal General de Efectos Mixtos / Conceptos Generales Comenzaremos definiendo el modelo lineal de efectos fijos para luego extender dicha definición al caso del modelo lineal mixto. El modelo lineal es ampliamente utilizado en la experimentación agrícola y forestal para analizar la variabilidad de observaciones (respuestas) realizadas sobre características de importancia agronómica, en función de una o más variables predictoras o factores. Todos los modelos lineales de efectos fijos pueden ser especificados de la forma general: 1 1 2 2 2 i ... Var(e )= . i i i p ip iy x x x eµ β β β σ = + + + + + Por ejemplo, en el Modelo B de la sección de introducción, ij i j ijy p t eµ= + + + , el subíndice i señala que el resultado ha sido obtenido desde la i-ésima UE y el subíndice j denota un resultado proveniente del tratamiento j. Los términos β de la forma general corresponden a p1, p2, p3, p4, p5 y p6 y también a t1 y t2; éstos son constantes dado el tamaño de los efectos de UE y tratamiento. Los términos x de la forma general, asumen los valores 1 ó 0 y son usados para indicar a qué UE y a qué tratamiento corresponde la observación yi; por ejemplo si y3 fue observada sobre la unidad 1 bajo el tratamiento B, entonces los x correspondientes a la UE 1 y al Tratamiento B serán 1 y los restantes cero. En notación matricial, el modelo lineal general tiene la forma: = +y Xβ e donde y es un vector de observaciones, X es una matriz de diseño, β es el vector de parámetros (o efectos fijos) y e es el vector de errores, definido como ( )E= − = −e y y y Xβ . El ejemplo anterior es un caso típico del modelo de ANOVA, donde los términos x representan a factores de clasificación (efectos categóricos) y por tanto la matriz X será una matriz de ceros y unos. Cuando los términos x representan 38 covariables (medidas en una escala cuantitativa) en vez de que factores, se tiene el modelo clásico de regresión lineal y en ese caso la matriz X contiene los valores de las variables regresoras para cada observación. Para modelar efectos categóricos se requieren varios parámetros mientras que el efecto de una covariable puede modelarse sólo con un parámetro. Los modelos que tienen ambos factores y covariables se denominan modelos de análisis de covarianza (ANCOVA). Utilizando el procedimiento de mínimos cuadrados ordinarios, se puede estimar el vector de parámetros β resolviendo las ecuaciones normales ´ ´=X Xβ X y . La solución está dada por ˆ ( ´ ) ´−=β X X X y , donde ( ´ )−X X es una inversa generalizada de ´X X (Searle, 1971). Para hallar una estimación del vector de parámetros, no hace falta hacer suposiciones distribucionales sobre el vector e . Si se asumen los supuestos del modelo de muestreo ideal, i.e. términos de error independientes y normalmente distribuidoscon media 0 y varianza 2σ , entonces, la matriz de covarianzas de β̂ , utilizada para realizar inferencia estadística sobre β , es 2 ( ´ )σ −X X . Extendiendo el modelo lineal general presentado anteriormente a situaciones donde se incorporan efectos aleatorios se tiene el modelo lineal general mixto. La ecuación matricial para el modelo lineal mixto es: = + +y Xβ Zu e donde y , X , β y e representan las mismas entidades del modelo de efectos fijos y los nuevos componentes son: 1) Z que representa una segunda matriz de diseño de dimensión nxq (matriz especificada exactamente en la misma forma que X , excepto que no incluye una columna para el término constante) y que asocia cada observación a los efectos aleatorios correspondientes y 2) el vector qx1 u de elementos aleatorios ( efectos o coeficientes) que usualmente se asume distribuido N ( 0 ,G ). Sobre el vector e se supone distribución N ( 0 , R ), y este vector e es definido como: ( | ) ( )E= − = − +e y y u y Xβ Zu Dado que la esperanza del vector aleatorio u es 0 , en el modelo lineal mixto, el valor esperado de una observación es la esperanza incondicional de la media de y (es decir promediada sobre todos los posibles valores de u ): 39 ( ) ( )E E= + =y Xβ Zu Xβ Es decir, los niveles observados de un efecto aleatorio son una muestra aleatoria de la población de niveles y la esperanza incondicional es la media de y sobre toda esa población. Por otro lado, la esperanza condicional de y dado u es: ( | )E = +y u Xβ Zu esperanza que representa la media de y para el subconjunto específico de niveles del efecto aleatorio observados en el experimento. La matriz R es modelada como 2σ=R I cuando se considera que los términos de error (generalmente asociados a la UE) son independientes y tienen la misma varianza 2σ . Los términos aleatorios u se suponen independientes de los términos aleatorios e . Resumiendo los supuestos usuales sobre la esperanza y la varianza de las componentes aleatorias, se tiene que: E = u 0 e 0 Var = u G 0 e 0 R Cuando se asume distribución normal para el vector de observaciones, la función de densidad (verosimilitud) queda completamente determinada por el vector de valores esperados y la matriz de varianzas y covarianzas. La matriz de varianzas y covarianzas de y (incondicional o promedio para la población de efectos aleatorios) está dada por: ( ) ( ) ( ) ´ ( ) ´ V V V V = = + + = + = + y V Xβ Zu e Z u Z e ZGZ R Los supuestos clásicos de independencia y homogeneidad de varianzas para los términos aleatorios del modelo lineal general (muestreo ideal) se flexibilizan en el marco 40 del modelo mixto general. La inclusión de efectos aleatorios produce observaciones correlacionadas. Tanto la estructura de correlaciones como la presencia de varianzas heterogéneas pueden ser especificadas a través de la modelación de las matrices de covarianza G y/o R . A través de G y R es posible modelar correlaciones entre efectos de tratamiento, entre parcelas experimentales ocasionadas por la distribución espacial y/o temporal de las mismas en el campo y/o considerar diferentes precisiones de ensayos cuando se combinan experimentos. Estructura de Covarianzas: Modelo de efectos aleatorios Para un modelo con q efectos aleatorios, la matriz G de dimensión qxq es una matriz diagonal cuando se asume que los efectos aleatorios no están correlacionados. Por ejemplo, para un experimento multi-ambiental con 3 ambientes cuyos efectos son tratados como aleatorios y 2aσ representa la componente de varianza asociada a la variación entre ambientes, se tiene para G la siguiente forma: 2 2 2 0 0 0 0 0 0 a a a σ σ σ = G Si la interacción tratamiento×ambiente también es aleatoria y hay dos tratamientos, entonces G tiene la siguiente forma: 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a a a ta ta ta ta ta ta σ σ σ σ σ σ σ σ σ = G 41 Dado que los errores no están correlacionados R tiene la siguiente forma: 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 σ σ σ σ σ σ σ σ σ = R La matriz de varianza-covarianzas entre observaciones, dada por ( ) ´V = +y ZGZ R tiene un primer término donde se especifican las covarianzas debidas a los efectos aleatorios. Si hay 4 observaciones en el primer ambiente (dos para un tratamiento y dos para el otro tratamiento), dos en el segundo (uno para cada tratamiento) y 3 en el tercero (dos para un tratamiento y una para otro), pero el modelo sólo considera el efecto de ambiente aleatorio, se tendrá: 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ' 2 2 2 2 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a a a a a a a a a a a a a a a a a a a a a a a a a a a a a σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ = ZGZ 42 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a a a a a a a a a a c a a a a a a a a a a a a a a a a a a σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ + + + + = + + + + + V resultando en una matriz diagonal en bloques con tamaños de bloques correspondientes al número de observaciones para cada categoría del efecto aleatorio; covarianzas entre observaciones provenientes del mismo ambiente igual a la componente de varianza entre ambientes y varianzas (sobre la diagonal) igual a la suma de las componentes de varianza de ambiente y residual. Si ambos, los efectos de ambiente y de la interacción, son considerados como aleatorios, y se mantienen los supuestos para los errores, estas matrices tienen la siguiente forma: 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a ta a ta a a a ta a ta a a a a a ta a ta a a a ta a ta a ta a a a ta a ta a ta a a ta a ta a σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ σ + + + + + + + + ′ = + + + + + + ZGZ 2 2 2 20 0 0 0 0 a a a taσ σ σ σ + 43 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 c ct c c c ct c c c c c ct c c c ct c c c ct c c ct c c c θ σ σ σ σ σ σ θ σ σ σ σ θ σ σ σ σ σ σ θ θ σ σ θ θ σ σ σ σ σ θ σ σ σ θ + + + + = + + V Se puede observar que V sigue siendo una matriz diagonal en bloques pero con una estructura algo más complicada. La componente de varianza de la interacción se suma a los términos de covarianza para observaciones obtenidas dentro de un mismo ambiente pero que a la vez también reciben el mismo tratamiento. Estructura de Covarianzas: Modelo de coeficientes aleatorios La estructura de covarianza en los modelos de coeficientes aleatorios es inducida por los coeficientes aleatorios. Este concepto se ilustra con un ejemplo que involucra dos tratamientos en un experimento con medidas repetidas donde participan 3 sujetos, el primero observado4 veces, el segundo 2 y el tercero 3 veces en el tiempo. Si se ajusta un modelo con los efectos de sujeto y de la interacción sujeto×tiempo con coeficientes aleatorios, 0 0 1 1ij ij ij ijY b t b t eβ β= + + + + La matriz Z contiene los valores ijt que representan el tiempo j en el que el sujeto i es observado (por ejemplo días): 44 11 12 13 14 21 22 31 32 33 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 t t t t t t t t t = Z Como en el modelo de efectos aleatorios se supone que los errores no están correlacionados, R no cambiará respecto al ejemplo anterior. Sin embargo, en el modelo de coeficientes aleatorios, los efectos de sujeto (interceptos) se encuentran correlacionados con los efectos aleatorios de pendientes (es decir las pendientes individuales varían aleatoriamente). La correlación ocurre sólo entre coeficientes del mismo sujeto mientras que los coeficientes correspondientes a diferentes sujetos no se encuentran correlacionados. Así la matriz G es, 2 , 2 , 2 , 2 , 2 , 2 , 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 p p pt p pt pt p p pt p pt pt p p pt p pt pt σ σ σ σ σ σ σ σ σ σ σ σ = G donde 2pσ , 2 ptσ representan las componentes de varianza asociadas a la variación entre sujetos o UE y entre pendientes, y ,p ptσ es la covarianza entre los coeficientes aleatorios. La matriz 'ZGZ será también una matriz diagonal en bloques con elementos ,i jkv donde 2 2 , ,( )i jk p ij jk p pt ij jk ptv t t t tσ σ σ= + + + . 45 1,11 1,12 1,13 1,14 1,12 1,22 1,23 1,24 1,13 1,23 1,33 1,34 1,14 1,24 1,34 1,44 2,11 2,12 2,12 2,22 3,11 3,12 3,13 3,12 3,22 3,23 3,13 3,23 3, 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 v v v v v v v v v v v v v v v v v v v v v v v v v v v v v ='ZGZ 33 2.2 Modelos Marginales versus Modelos Jerárquico El modelo mixto lineal general puede ser re-escrito como un modelo jerárquico (o modelo condicional): | ~ ( , ) ~ ( , ) N N +y u Xβ Zu R u 0 G Es decir existe un modelo para y dado u más un modelo para u . Esto sugiere que existen supuestos específicos sobre la dependencia de la media y la estructura de covarianza sobre las covariables en X y Z . La media marginal es Xβ y la estructura de covarianza es V = ZGZ´ + R . Es decir que el modelo implicado para la distribución marginal o incondicional de Y es ( )N Xβ,ZGŹ + R . Esta relación entre ambos modelos no se puede aplicar en general, y depende de propiedades de la distribución normal multivariada y de la linealidad del modelo. 2.3 Modelos para la Estructura de Covarianza Residual (modelos de patrones de covarianza) En los modelos anteriores donde la matriz de covarianza residual R es modelada como múltiplo de la identidad, subyace el supuesto de independencia condicional, i.e condicionando sobre los u , los elementos en y son independientes. Sin embargo, hay muchas situaciones en las que no hay evidencias para adicionar efectos aleatorios, las componentes de varianza asociada a dichos efectos es pequeña o los efectos aleatorios no son interpretables en relación al problema, el supuesto de independencia 46 condicional es poco realista. Una alternativa es modelar las correlaciones entre observaciones directamente a través de R de manera que éstas reflejen la estructura particular de los datos. Es decir, las correlaciones no son inducidas a partir de la incorporación de efectos aleatorios sino que se selecciona un modelo de correlación para R que ajuste a los datos. Los patrones en R pueden especificarse mediante el uso de variables de bloqueo (por ejemplo sujetos) de manera tal que las observaciones dentro de un mismo nivel de una variable de bloqueo se encuentran correlacionadas. Por ejemplo R podría estar compuesta de submatrices iR que representan bloques de R conteniendo covarianzas entre observaciones del sujeto i. Es importante notar que también podría ajustarse patrones de covarianza en G , para indicar que los efectos aleatorios se encuentran correlacionados. Por ejemplo, en un experimento con medidas repetidas donde para cada sujeto hay t tiempos de medición y en cada tiempo se realizan varias medidas (por ejemplo, altura, diámetro y volumen de copa). Entonces será importante modelar no sólo las correlaciones entre tiempos dentro de sujetos, sino también las correlaciones entre variable realizadas sobre un sujeto en cada tiempo. 2.4 Estimación de Covarianzas en Poblaciones Normales Las estimaciones por mínimos cuadrados generalizados pueden usarse para estimar los efectos fijos del modelo mixto. Estas estimaciones se obtienen minimizando 1−(y - Xβ)'V (y - Xβ) (Searle et al., 1992). El estimador del vector de efectos fijos β es: 1 1ˆ ( ´ ) ´− − −=β X V X X V y . Si todas las componentes de varianza en V son conocidas este estimador es el mejor estimador lineal insesgado (BLUE) y se corresponde con el estimador máximo verosímil. En la práctica del análisis de datos experimentales V usualmente es desconocida y se reemplaza por su estimador ˆˆ ˆ´= +V ZGZ R . Si se puede asumir que u y e tienen distribución normal, la mejor aproximación para la estimación se logra con métodos basados en máxima verosimilitud. Los métodos de estimación más usados son máxima verosimilitud (ML) y máxima verosimilitud restringida (REML). 47 En ML el vector conteniendo todas las componentes de varianza, digamos ξ, se obtiene a partir de la maximización de la función de verosimilitud ( , ( ))MLL L ξ β ξ= con respecto a ξ. La función de verosimilitud, L, mide la verosimilitud de los parámetros del modelo dados los datos y se define usando la función de densidad de las observaciones, en este caso la función normal. En modelos donde las observaciones se suponen independientes (por ejemplo el modelo de efectos fijos) la función de verosimilitud es simplemente el producto de las funciones de densidad para cada observación. En los modelos mixtos las observaciones no se suponen independientes, por ello la función de verosimilitud se basa en la función de densidad multivariada de las observaciones. Como los efectos aleatorios tienen valor esperado igual a cero y por ende no afectan la media marginal, para la estimación ML en poblaciones normales la función de verosimilitud se basa en la distribución normal multivariada con vector de media y matriz de covarianza V y la maximización se realiza sobre el logaritmo de dicha función, log(L): ( ) ( ) ( ) ( ) 1 1/ 21/ 2 1exp 2 (2 ) n L π − ′ = y - Xβ V y - Xβ V ( ) ( )11log( ) log 2 1 log(2 ) 2 L k k n π − ′= − + = − V y - Xβ V y - Xβ La estimación β (ξ) del vector de parámetros fijos será denotada como MLβ . Los vectores MLξ y MLβ pueden también obtenerse desde la maximización de ( )MLL L= θ con respecto a θ , siendo θ el vector de todos los parámetros del modelo; es decir maximizando la verosimilitud con respecto a ξ y β simultáneamente. El método clásico se basa en el concepto de maximizar la función log(L) con respecto a los parámetros de covarianza y tratando los efectos fijos como constantes. Una vez que se obtienen los estimadores de los parámetros de la estructura de covarianza, se obtienen las 48 estimaciones de efectos fijos considerando los parámetros de covarianza como fijos. Este método tiene el efecto de producir estimadores de los parámetros de la estructura de covarianza con sesgo negativo. El sesgo es mayor cuando el número de grados de libertad usados para estimar las componentes de varianza es menor. Estimador REML El simple ejemplo del estimador ML de la varianza
Compartir