Logo Studenta

Analisis-de-sobrevida-como-herramienta-estadistica-en-el-manejo-integrado-de-acaros-fitofagos

¡Este material tiene más páginas!

Vista previa del material en texto

repositorio.uptc@uptc.edu.corepositorio.uptc@uptc.edu.co
Artículo No. 9
Análisis de sobrevida como herramienta
estadística en el manejo integrado de ácaros
fitófagos
ANÁLISIS DE SOBREVIDA COMO HERRAMIENTA
ESTADÍSTICA EN EL MANEJO INTEGRADO DE ÁCAROS
FITÓFAGOS
Especialización en Estadística
, Yeny Liliana Casas Méndez1,a, Eduardo Dávila1,b
1Escuela de Posgrados, Seccional Duitama, Universidad Pedagógica y Tecnológica de Colombia, Duitama,
Colombia
2Escuela de Matemáticas y Estadísticia, Seccional Duitama, Universidad Pedagógica y Tecnológica de
Colombia, Duitama, Colombia
Resumen
Los análisis de sobrevida comprenden un conjunto de técnicas para analizar el tiempo de seguimiento
hasta la ocurrencia de un evento de interés, observado parcial o totalmente. El enfoque de este artículo
se da desde el punto de vista agronómico, para dar sustento estadístico a la sexta herramienta usada
en el manejo integrado de ácaros MIA. Se realizó una comparación entre dos tratamientos, un activador
de defensas y un control sin aplicación, sobre un cultivo de rosas variedad Charlotte, para lograr cuatro
objetivos básicos: ajustar las curvas de supervivencia con el estimador Kaplan-Meier, realizar la prueba
de Log-Rank para inferir sobre la diferencia entre los tratamientos, identificar un modelo paramétrico
estadístico apropiado y determinar el efecto de vulnerabilidad por cluster mediante riesgos de Cox, para
los datos obtenidos por conglomerados. Se logró establecer diferencias significativas ente los tiempos de
supervivencia, estimando un factor de acortamiento de vida, para el inductor de defensa, del 65% respecto
al control.
Palabras clave: Tetranychus urticae, herbivoría, profilaxis, Distribución Weibull, modelamiento.
Abstract
Survival analysis covers a sort of techniques to analyze the time until an event, observed totally or
partially. This article is focused from an agronomical point of view, to give a statistical support to the
sixth tool used in the integrated pest management of mites MIA. There was performed a comparison
among two treatments, a defence activator and a control, applied in a Charlotte flower crop to achieve
four basic objectives: to fit the survivor curves with the Kaplan-Meier estimator, to perform the Log-Rank
test to infer about the difference among the treatments, to identify an appropriate statistical parametric
model and to determine the cluster vulnerability effect through Cox risks, to celltrap-based clustered
data. It was possible to find significative differences between survival times, estimating a shorting life
factor, to the self-defense enforcer, by 65% regarding the control.
Key words: Tetranychus urticae, herbivory, prophylaxis, Weibull distribution, modeling.
1. Introducción
Los análisis de sobrevida se pueden aplicar en campos como salud, finanzas, academia, ciencias sociales y
biología. Desde el punto de vista ecológico y agronómico, el objetivo es mantener las plagas presentes en los
aEstudiante de Especialización en Estadística. E-mail: yeny.casas@uptc.edu.co
bDocente Tutor. E-mail: jedavilas@unal.edu.co
PCJUPITER
Rectángulo
cultivos en niveles que no afecten económica ni ambientalmente las producciones. En este estudio se propone
un método estadístico para la aplicación de la sexta herramienta del manejo integrado (Dávila 2015).
Los métodos tradicionales para el análisis de productos se basan en eficacias corregidas como Henderson y
Tilton o en métodos no paramétricos como Mann-Whitney, que evalúan porcentajes de mortalidad o comparan
la heterogeneidad de muestras ordinales. Por otra parte, el análisis de varianza o el método de desvíos, puede
llevar a inferencias erradas en la aplicación de la sexta herramienta del manejo integrado de plagas.
Es necesario entender que la muerte de la plaga se da de manera progresiva en el tiempo cuando se
usan herramientas profilacticas, que buscan alterar el comportamiento o la supervivencia de los herbívoros.
Como lo enuncia (Crawley 2007), se debe analizar los resultados de experimentos de sobrevida no como una
proporción de muertes sino teniendo en cuenta los patrones de mortalidad. Así mismo, se debe aclarar que
en los análisis de sobrevida, para revisar la sexta herramienta del MIA, no se interpreta como en estudios
clínicos donde se busca determinar el aumento del tiempo de vida con el tratamiento; en el caso del MIA, se
trata de acortar el tiempo de vida para que la población de ácaros no prolifere.
Los objetivos trazados para este artículo fueron identificar el factor de acortamiento de vida de la población
de ácaros sometidos a un tratamiento profiláctico, identificar un modelo estadístico que se ajuste a los datos,
realizar una comparación de las curvas de sobrevida usando el estimador de Kaplan-Meier y verificar la
vulnerabilidad de efectos aleatorios en cluster experimentales (bloques).
2. Referente Conceptual
2.1. Generalidades
En ésta sección se trabaja a partir de preguntas fundamentales sobre la teoría necesaria para desarrollar
un análisis de sobrevida.
(a) ¿Qué son los ácaros y en qué consiste el manejo integrado de ácaros (MIA)?
Los ácaros son una clase taxonómica de artrópodos que se pueden encontrar en prácticamente cualquier
ambiente, tanto terrestre como acuático, y pueden clasificarse en tres grupos en función de sus hábitos
alimenticios: fitófagos, depredadores, y saprófagos - micófagos (Garcia-Marí, 1994). La especie Tetrany-
chus urticae es capaz de alimentarse de más de 150 especies vegetales de interés agrícola, es considerada
una de las plagas más resistentes a los acaricidas existentes en el mercado, por lo que su presencia es una
amenaza para los cultivos.
El MIA consiste en incluir herramientas compatibles para mantener poblaciones a niveles que no impacten
económicamente las producciones en ciertos tipos de cultivos, contiene seis herramientas enunciadas por
(Dávila 2015) así: control químico, control cultural, control biológico, monitoreo de plaga y benéficos,
normas regulatorias y el manejo de la resistencia y la tolerancia del hospedero; esta última, aprovecha
la capacidad de todo vegetal de producir sus propias defensas en caso de asedio por plagas. Hoy (2011)
plantea que la tolerancia es la habilidad de la planta para reparar o soportar el daño causado por el
ácaro.
(b) ¿Qué aspectos se deben considerar para realizar un análisis de sobrevida?
En primer lugar, se debe aclarar que la variable respuesta “T” es de tipo aleatorio, donde
T := tiempo que transcurre entre el comienzo de seguimiento del individuo hasta el evento de interés.
En el caso del MIA, el evento de interés es la muerte del ácaro. En segundo lugar, se debe hacer precisión
que existen tres tipos de curvas de sobrevida según (Crawley 2007). Las de Tipo I, se caracterizan porque
al inicio de la edad la tasa de mortalidad es baja, las de Tipo II la probabilidad de muerte es independiente
de la edad y en las de Tipo III la tasa de mortalidad es mayor al inicio de la vida, pero luego logra una
mayor probabilidad de supervivencia (ver Figura 1).
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
Figura 39: Curvas de Sobrevida. Fuente Crawley (2007).
.
(c) ¿Qué significa la censura en un análisis de supervivencia?
La censura ocurre cuando no se conoce el tiempo de muerte de todos los individuos, algunos pueden
abandonar el estudio por diferentes factores. Según (Moore 2016), se puede clasificar en censura por
derecha, también conocida como de tipo I y se presenta cuando al finalizar el periodo de observación aún
no ha ocurrido la muerte. La censura por izquierda, se presenta cuando el evento que se desea observar ha
ocurrido en algún tiempo t0 desconocido antes de finalizar el estudio. Finalmente, la censura aleatoria se
produce cuando en el transcurso del estudio algunas unidades experimentan otros sucesos independientes
que provocan la salida de los individuos del estudio (veáse Figura 2).
Figura 40: Tipos de censura.
.
(d) ¿Cómo estimar la probabilidad de supervivenciaen un periodo de tiempo determinado?
La literatura sugiere el método de Kaplan-Meier (KM), que estima la probabilidad de estar libre del
suceso en un tiempo t. (Hernández 2010) afirma “es uno de los métodos no paramétricos más utilizados
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
para estimar la función de riesgo con datos no agrupados en presencia de censura”. Se define como:
Ŝ(t) =
∏
i;t≤t
n(ti)− d(ti)
n(ti)
=
∏
i;t≤t
1− d(ti)
n(ti)
, (29)
donde n(ti) es el número de individuos en riesgo y d(ti) es el número de muertes (o de ocurrencia del
evento de interés) en el momento ti.
La varianza del estimador KM se obtiene a través de la fórmula de (Greenwood 1926):
V (ŜKM (t)) = Ŝ
2
KM (t) ∗
∑
ti≤t
d(ti)
n(ti)[n(ti)− d(ti)]
. (30)
El KM es el estimador no paramétrico máximo verosímil de la función de riesgo, y es usado en datos
censurados a derecha. Además (Borges, 2005) indica que el intervalo de confianza del 95 %, sin utilizar
ninguna transformación, se obtiene mediante la expresión:
ŜKM (t)± 1.96ee(ŜKM (t)), (31)
donde ee(ŜKM (t)) es el error estándar del estimador KM, y se calcula obteniendo la raíz cuadrada de su
varianza.
(e) ¿Cómo comprobar la diferencia de curvas de sobrevida?
El test de Log-Rank es usado para someter a prueba de hipótesis de igualdad de curvas de sobrevida.
Esta técnica corresponde a una chi-cuadrado, donde se realiza una comparación entre lo observado y
lo esperado, bajo supuesto de independencia. Éste método compara la sobrevida de grupos e incluye el
periodo de observación. Un contraste de hipótesis que se puede usar es, para 0 < t <∞:
H0 : S1(t) = S0(t)
Ha : S1(t) < S0(t),
donde S1(t) es la función de sobrevida del tratamiento evaluado y S0(t) es la función del tratamiento
control.
(f) ¿Cómo se caracterizan los modelos de supervivencia?
Los Modelos de Supervivencia se caracterizan mediante variables aleatorias no negativas (T ≥ 0), donde
T es el tiempo de falla o de supervivencia, al que se asocian las siguientes funciones básicas.
X FUNCIÓN DE SUPERVIVENCIA (Probabilidad de supervivencia).
Describe y muestra la proporción de individuos que comienzan en el tiempo t0 hasta algún tiempo t,
y (Borges 2005) la define como la probabilidad de que una persona sobreviva (no le ocurra el evento
de interés) al menos hasta el tiempo t. Está definida por:
S(t) = P (T ≥ t), 0 < t <∞
S(t) = 1− F (t).
Donde F (t) es la función de distribución acumulada (CDF).
Si se asume que el tiempo, desde el inicio del estudio hasta la ocurrencia del evento, se puede
considerar como una variable aleatoria T , se puede obtener la función asociada que represente la
probabilidad P (T > t), para 0 < t <∞.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
(Arribalzaga 2007) afirma que “es la probabilidad de que un individuo sobreviva desde la fecha de
entrada en el estudio hasta un tiempo t, cuyos valores describen la supervivencia global de toda la
población analizada”.
X FUNCIÓN DE DENSIDAD DE PROBABILIDAD.
Describe la fracción de todas las muertes de una cohorte inicial y que puede ocurrir en un instante
de tiempo t. El tiempo de supervivencia T tiene una función de densidad de probabilidad dada por:
f(t) =
−dS(t)
dt
=
dF (t)
dt
.
X FUNCIÓN DE RIESGO:
(Arribalzaga 2007) dice que es “la probabilidad de que a un individuo que está siendo observado en
el tiempo t, le suceda el evento de interés”. La función de riesgo describe la forma en que cambia
la tasa de ocurrencia de un evento de interés con el paso del tiempo, siendo no negativa, se denota
como H(t). (Borges 2005) plantea que la función de riesgo acumulada es:
H(t) =
∫ t
0
h(u)du = −logS(t),
y de ella se puede obtener la función de sobrevida mediante la relación:
S(t) = e
∫ t
0
h(u)du = e−H(t).
Rebasa (2005) afirma que esta función es más adecuada para describir la dinámica del proceso es-
tudiado, debido a que sus valores dan una aproximación a la tasa de incidencia del evento.
(Smith 2002) indica las siguientes relaciones básicas entre la función de sobrevida, la función de
riesgo y la función de distribución acumulada, de una variable aleatoria T :
S(t) = P (T ≥ t) =
∫ ∞
t
f(u)du,
esto es:
S(t) = 1− F (t).
Sea f(t) la función de densidad de probabilidad de la variable aleatoria T , se tiene que:
h(t) = limδt→0
p(t < T ≤ t+ δt)
δt
=
F ′(t)
S(t)
=
f(t)
S(t)
,
donde S(t) es una función no creciente tal que S(0) = 1, y S(t) = 0, cuando t→∞; esta función se
puede representar mediante gráficas denominadas curvas de supervivencia; estas gráficas permiten
hacer comparaciones para describir el comportamiento a lo largo del tiempo de dos o más trata-
mientos, aunque se deben hacer validaciones mediante pruebas estadísticas formales.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
X FUNCIÓN DE VIDA MEDIA RESIDUAL.
Esta función se denota por mrl (esperanza de tiempo de vida restante, por sus siglas en inglés)
mean residual life, y está definida por:
mrl(t) = E(T − t|T > t)
En general, las relaciones entre las cuatro funciones para la variable aleatoria se resume en la Tabla 33
adaptada de (Klein 1997).
Tabla 33: Resumen de funciones de sobrevida.
FUNCIÓN VARIABLE DISCRETA VARIABLE CONTÍNUA
Función de supervivencia
S(t) =
∑
tj>t
f(tj) S(t) =
∫∞
t
f(t)dt = exp
{
−
∫ t
0
h(u)du
}
=
∏
t>tj
(1− h(tj)) S(t) = exp {−H(t)} = mrl(0)mrl(t) exp
[
−
∫ t
0
du
mrl(u)
]
Función de densidad
f(t) = S(tj)− S(tj+1) f(tj) = − ddtS(t) = h(t)S(t)
= h(tj)S(tj+1) =
(
d
dtmrl(t) + 1
) ( mrl(0)
mrl(t)2
)
exp
[
−
∫ t
0
du
mrl(u)
]
Función de riesgo h(tj) =
f(tj)
S(tj−1)
h(t) = − ddt ln |S(t)| =
f(t)
S(t)
=
[
d
dtmrl(t)+1
mrl(t)
]
Función de vida residual
mrl =
(ti+1−t)S(t)+
∑
j≥i+1 (tj+1−tj)
S(t) mrl(t) =
∫∞
t
S(u)du
S(t)
para ti ≤ t < ti+1 =
∫∞
t
(u−t)f(u)du
S(t)
La revisión bibliográfica sugiere que en estudios de sobrevida, donde se desee realizar alguna predicción
sobre la población objeto de estudio, es necesario identificar el modelo que mejor se ajuste a los datos
mediante comparación de los desvíos residuales con respecto a la Distribución Exponencial, que es el-
modelo estándar de evaluación. La propiedad fundamental de dicha distribución es la independencia del
evento de interés; es decir, poseer información de la sobrevivencia de determinado tiempo no modifica la
probabilidad de que sobreviva t unidades más y se caracteriza mediante las siguientes funciones:
• Función de sobrevida: ésta muestra la proporción de individuos desde la etapa inicial y que
todavía están vivos en el tiempo t; está dada por:
S(t) = e
−t
µ ,
• Función de densidad: es la probabilidad de morir en un intervalo de tiempo pequeño entre un
tiempo t y t + δt, la cual disminuye exponencialmente y es denotado por:
f(t) =
e
−t
µ
µ
,
Donde µ, t > 0; además, la fracción 1µ indica que los individuos inician a morir desde el primer
intervalo.
• Función de riesgo: Es equivalente a la tasa de muerte instantánea y resulta recíproca al tiempo
medio de la muerte y está dada por:
h(t) =
f(t)
S(t)
=
e
−t
µ
µe
−t
µ
=
1
µ
.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
En cuanto al modelamiento paramétrico para sobrevida, (Godoy 2009) afirma que “la selección de un
modelo paramétrico usualmente se determina mediante la función de riesgo”, porque permite determinar
las características que el modelo debe seguir según avanza el tiempo, en muchas circunstancias el riesgo
de muerte aumenta con la edad, la existencia de varios modelos permite escoger el más adecuado de
acuerdo a la necesidad. (Crawley 2007) sugiere, entre otras, las distribuciones paramétricas presentadas
en la Tabla 34:
Tabla 34: Funciones de riesgo para algunas distribuciones conocidas.
Distribución Riesgo
Exponencial h(t) = λ t ≥ 0, λ >0
Weibull αλ(λt)α−1 t ≥ 0, α, λ >0
Lognormal r(t) = f(t)S(t) t > 0
Log-Logística e
λktk−1
1+eλtk
t ≥ 0, α, λ > 0
Según (Moore 2016) la distribución Weibull tiene las siguientes funciones:
•Función de sobrevida: S(t) = eλtα donde λ > 0 es el parámetro de escala y α > 0 es el parámetro
de forma.
• Función de densidad: f(t) = αλeα−1eλtα .
• Función de riesgo: h(t) = αλeα−1.
(g) ¿Cómo determinar la vulnerabilidad de clusters mediante modelos de efectos mixtos?
Los modelos semiparamétricos permiten realizar un análisis de sobrevida en el sentido de que evalúan
el efecto de covariables sobre la función de riesgo. Es el caso del modelo de riesgos proporcionales de
(Cox 1972), que es un modelo de regresión para diferentes variables registradas en cada sujeto y no solo
la relación entre la tasa de falla y el tiempo. (Hernández 2010), afirma que se trata de calcular la tasa
de mortalidad como una función del tiempo y de un determinado conjunto de variables explicativas o
covariables. Se presenta como:
λ(t;Xi) = λ0(t)ri(t),
donde λ(t;Xi) corresponde a la función de riesgo, ri(T ) se interpreta como el riesgo relativo en el momento
t, y λ0(t) es la función de riesgo basal, que corresponde al riesgo de un individuo que tiene como valor
en todos los predictores 0, el cual sería el individuo de referencia según (Boj de Val 2017). La regresión
de Cox además de considerar si se produce o no un efecto, tiene en cuenta el tiempo que ha tardado en
producirse, su uso está indicado cuando la variable independiente X(efecto) sea de tipo dicotómico y esté
relacionada con la supervivencia de un grupo de sujetos. (Martínez 2008).
En 1972 Cox publicó el artículo “Regression model and life tables (Modelos de regresión y tablas de
vida)”, es muy citado en estudios de tipo científico, la regresión de Cox se utiliza cuando la variable
dependiente esté relacionada con la supervivencia de los individuos y se desee averiguar simultáneamente
el efecto independiente de una serie de factores sobre ésta; permite afirmar que la supervivencia puede
ser más ventajosa siguiendo un determinado tratamiento. La ecuación de la regresión de Cox es:
ln(λt) = a+ b1x1 + b2x2 + · · ·+ bpxp,
donde λ depende del tiempo, xi son covariables; a, bi son los coeficientes de la regresión para i =
1, 2, 3, ..., p.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
2.2. Estimación De La Función De Supervivencia Mediante Paquete Estadístico R
El paquete estadístico R es un lenguaje computacional formal, de carácter libre, diseñado para ser utilizado
en la manipulación y análisis de datos. Para el presente estudio es necesario instalar la librería “survival”,
con ella se puede trabajar con objetos de la forma surv, y según (Crawley 2007) se analizan datos con o sin
censura. Las funciones usadas en el paquete se encuentran citadas por (Borges 2005) y se relacionan así:
• La función Surv para datos que presentan censura por derecha.
• La función surfit permite obtener estimación de la función de sobrevida utilizando el método Kaplan
Meier y permite estimar la función de sobrevida para modelos de Cox.
• La función survreg permite ajustar modelos de regresión paramétricos.
3. Metodología
El enfoque de este trabajo es de tipo cuantitativo y la investigación es comparativa, se usan los datos
obtenidos en un seguimiento realizado en el invernadero de rosas variedad Charlotte, ubicado en el Centro de
Bio-Sistemas de la Universidad Jorge Tadeo Lozano. En ese estudio se seleccionaron dos camas y se tomaron
al azar 20 tallos de cada una, los cuales se demarcaron con cinta plástica de colores, de cada tallo se seleccionó
un foliolo del tercio medio, que fue infestado con 5 ácaros adultos (Tetranychus urticae) provenientes de una
población resistente a acaricidas. La prueba fue realizada desde el 05 de Noviembre de 2014 con una duración
de 15 días. El producto evaluado fue KlingQuel Raíces, la frecuencia de evaluación fue diaria, bajo un diseño
experimental completamente al azar, el número de réplicas por tratamiento fue de 20, la unidad de evaluación
fue una pinza trampa sobre el foliolo de rosa, donde se ubicaron 5 ácaros (cluster) veáse Figura 41. Los ácaros
que quedaron vivos finalizado el ensayo de campo fueron censurados, se designó 0 para el dato censurado y 1
para los datos sin censurar, la unidad de estudio es el ácaro y la celda se usa como bloque (efecto aleatorio)
en el componente sistemático del modelo. Toda la programación se hizo en el paquete estadístico R de libre
distribución.
Figura 41: Pinza trampa experimental
4. Resultados
4.1. Descripción de los datos:
El análisis de sobrevida se llevó a cabo en una muestra de 200 ácaros Tetranichus urticae. En este caso
se eligió un cultivo de rosas variedad Charlotte, se evaluó la sexta herramienta del MIA, que corresponde a
la resistencia y tolerancia del hospedero; esta supone que la planta produzca sus propias defensas una vez
es activada con la aplicación del producto KlingQuel Raices, de la empresa TALEX. La variable respuesta
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
queda definida por: T= “Tiempo a la muerte de un caro adulto proveniente de una poblacin resistente
a acaricidas químicos”.
La base de datos corresponde a una tabla de 200 x 4, la cual contiene el seguimiento hecho en un periodo
de 15 días a dos tratamientos denominados T0 = Tratamiento control y T1= Tratamiento KlingQuel Raices,
cada tratamiento contiene 100 ácaros distribuidos en 20 trampas, ubicadas en una planta, dentro de cada
una 5 ácaros; el T1 corresponde a un activador biológico, que estimula la producción de defensas en la planta.
Según estructura planteada por (Díaz 2015), la información se resume en la Tabla 35:
Tabla 35: Descripción general del experimento.
La unidad sobre la cual se registra el evento Ácaros fitófagos (Tetranychus Urticae)
Evento de interés Muerte del ácaro en un tiempo t
Variable respuesta
U= Tiempo al evento de censura.
T ∗= Tiempo a la muerte.
T = Min(T ∗, U)
=I[T*<U]
Tiempo Origen del Evento Día en que la planta es activada defensivamente contra la plaga.
Final del Estudio 15 días después de iniciado el tratamiento.
La escala de medida del tiempo hasta el evento {1, 2, · · · , 15}
Tipo de Censura Tipo I (a derecha)
La censura es a derecha, pues en la última evaluación no ha ocurrido el evento (muerte del ácaro) en
algunas unidades de observación.
Los datos de supervivencia suelen presentarse en la forma (ti, δi) donde ti es el tiempo de observación y
δi = 0 si la observación no ha ocurrido (censurada) y δi = 1 cuando se observa la ocurrencia del evento de
interés (no censurado). En el caso particular, el arreglo se presenta en la Tabla 36.
Tabla 36: Censura por Tratamientos.
Censura/tratamiento Tratamiento control Tratamiento KlingQuel Raices Total
δi = 0 83 24 107
δi = 1 17 76 93
Total 100 100 200
Se observa que hay 83 datos censurados en el tratamiento control; es decir, el evento no ocurrió, pues 83
ácaros de 100 no murieron en los 15 días de seguimiento. En el tratamiento KlingQuel Raices hay 24 datos
censurados; es decir, solo 24 ácaros de 100 llegaron vivos al día 15.
4.2. Estimador Kaplan-Meier:
Para estimar la función de sobrevida se usa el método de Kaplan-Meier, el cual se puede calcular de forma
general o por tratamiento. En primer lugar se obtuvo la información general (Tabla 37).
Tabla 37: Estimaciones de Kaplan - Meier para la población total
N Eventos Mediana 0.95LCL 0.95UCL
200 93 NA 15 NA
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
Lo que indica que de las 200 observaciones se presentaron 93 eventos de interés, es decir la muerte de los
ácaros durante el periodo de observación. En cuanto a la mediana, ésta no aparece debido a que al terminar
el periodo de seguimiento no ha ocurrido el 50% de las muertes.
En la Tabla 38 se presenta los cálculos de la función de sobrevida sin covariables.
Tabla 38: Sobrevida general por método de Kaplan-Meier
Días N. Riesgo N. Eventos Sobrevida Error est Inferior 95% CI Superior 95% CI
1 200 1 0.995 0.00499 0.985 1.000
4 199 2 0.985 0.00860 0.968 1.000
6 197 7 0.950 0.01541 0.920 0.981
8 190 8 0.9100.02024 0.871 0.951
12 182 41 0.705 0.03225 0.645 0.771
14 139 3 0.690 0.03273 0.629 0.757
15 136 31 0.533 0.03541 0.467 0.607
Se identifica que en la primera medición (día 1) para los 200 individuos en riesgo, se produce solo un
evento, lo que da una probabilidad de vida del 99,5%. También es importante ver que hay mayor cantidad
de muertes en el día 12. En el último día quedan 136 individuos en riesgo y se presentan 31 muertes. En la
Figura 42 se presenta la curva de estimación puntual y los intervalos de confianza.
Figura 42: Estimador Kaplan - Meier para el total de la población. Fuente la Autora.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
En la Tabla 39 se presentan las estimaciones de Kaplan-Meier para tratamiento (T1) y Control (T0).
Tabla 39: Estimaciones de Kaplan-Meier por tratamiento
Tratamiento Ácaros Eventos Mediana 0.95LCL 0.95UCL
T1:
KlingQuel Raices
100 76 13 12 15
To:
Control
100 17 NA NA NA
Se observa que en el tratamiento KlingQuel Raices se presentan 76 muertes del total de la muestra,
mientras que en el tratamiento control solo se presentan 17 eventos.
Es de interés conocer de forma más detallada lo que sucede con cada uno de los tratamientos, es así como
en las Tablas 40 y 41 se presentan las estimaciones KM para cada grupo.
Tabla 40: Estimaciones Kaplan-Meier para KlingQuel Raices (T1)
Día N.riesgo N.eventos Sobrevida Error stand Inferior 95% CI Superior 95% CI
1 100 1 0.99 0.00995 0.971 1
4 99 2 0.97 0.01706 0.937 1
6 97 4 0.93 0.02551 0.881 0.981
8 93 7 0.86 0.03470 0.795 0.931
12 86 36 0.5 0.05000 0.411 0.608
14 48 2 0.479 0.05004 0.39 0.588
15 46 24 0.229 0.04264 0.159 0.33
Para los ácaros alimetados sobre plantas activadas en defensa (T1) se observa que de los 100 individuos
en riesgo, en el primer día solo ocurre un evento y la supervivencia es del 99.5%; la mayor mortalidad se
da en el día 12, mientras que para el último día se presentan 24 eventos de interés y la supervivencia es de
22.9% al finalizar el estudio.
Tabla 41: Estimaciones Kaplan-Meier para el tratamiento control (T0)
Día N.riesgo N.eventos Sobrevida Error stand inferior 95% CI superior 95% CI
6 100 3 0.97 0.0171 0.937 1
8 97 1 0.96 0.0196 0.922 0.999
12 96 5 0.91 0.0286 0.856 0.968
14 91 1 0.90 0.0300 0.843 0.961
15 90 7 0.83 0.0376 0.76 0.907
Para las arañas alimentadas en plantas testigo (Tabla 41) se observa que de los 100 ácaros en riesgo, las
muertes se presentan desde el día 6, con una supervivencia del 97%; el último día quedan en riesgo 90 ácaros,
se producen 7 eventos de interés y la supervivencia es del 83% de la muestra, siendo este último día el de
mayor proporción de muertes en el tratamiento control.
En la Figura 43 se puede hacer la comparación de los tratamientos, donde se observa que a partir del día
8 las curvas empiezan a separarse de forma importante.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
Figura 43: Curvas de supervivencia por tratamiento. Fuente la Autora
Al realizar una revisión del mismo tiempo, para los dos tratamientos, se identifica que desde el día 12 se
presenta un efecto significativo en el cambio de supervivencia por el efecto del tratamiento (T1); es decir, a
partir de ese momento se acorta significativamente el tiempo de vida respecto al tratamiento control (T0),
para la muestra evaluada en la variedad Charlotte, bajo condiciones de laboratorio de la universidad Jorge
Tadeo Lozano.
4.3. Prueba de Log-Rank:
Estadísticamente es necesario establecer la diferencia entre las curvas de sobrevida mediante el test de
Log- Rank. Las hipótesis a docimar, para todo 0 < t <∞, son:
H0 : S1(t) = S0(t)
Ha : S1(t) < S0(t).
Tabla 42: Prueba Log-Rank
Tratamiento N Frecuencia Observada Frecuencia Esperada (O-E)^2/E (O-E)^2/V
T1: KlingQuel Raices 100 76 39.8 33.1 71.4
To: Control 100 17 53.2 24.7 71.4
chi-cuadrado= 71.4 con un grado de libertad, p-valor <0.0001
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
En la Tabla 42 se presentan las estadísticas para la prueba. Esto indica que las diferencias entre ambas
curvas son significativas (p-valor <0.0001), luego se rechaza la hipótesis nula (Ho) de igualdad entre curvas
de sobrevida, con lo que se infiere que hay efecto del tratamiento en el tiempo de vida de los ácaros.
4.4. Modelamiento paramétrico:
Para efectos de desición de uso de la sexta herramienta del manejo integrado de ácaros, se debe predecir
el factor de acortamiento de vida. Para ello se realiza la selección del modelo paramétrico, atendiendo la
sugerencia hecha por Crawley (2007) mediante el criterio de mínimo desvío residual.
Se tiene en cuenta las distribuciones exponencial, Weibull, log-normal y log-logístic, la comparación se
realiza mediante análisis de desvíos (ANDEVA). Esta técnica de análisis consiste, según (Blanco 2001), en
partir la variación total en partes atribuibles a fuentes reconocidas (como tratamientos y bloques) y al
error experimental; el criterio aceptado en este caso fue la comparación con la distribución exponencial, los
resultados se presentan en la Tabla 43.
Tabla 43: Tabla ANDEVA
Modelo G.L Resid -2*LL G.L Prueba Desviación Pr(>Chi) AIC
1 Exponencial 198 764.3654 NA NA NA 768.37
2 Weibull 197 619.1953 1 145.1701224 1.971370e-33 625.2
3 Lognormal 197 669.9062 1 94.45914 2.50E-22 675.42
4 Log-logistic 197 637.8750 0 126.4903 2.40E-29 643.88
Se realiza la elección por los criterios de mayor diferencia de desvíos y menor criterio de información de
Akaike (AIC), encontrando que la distribución Weibull es el modelo más apropiado para el tipo de datos,
respecto a los otros modelos evaluados. Las estimaciones se presentan en la tabla 44.
Tabla 44: Estimación para el modelo Weibull
Valor Error estandar z p-valor
(Intercept) 3.101 0.0678 45.77 0.00e+00
T1(KlingQuel Raices) -0.438 0.0721 -6.08 21e-09
Log(scale) -1.463 0.0949 -15.41 1.40e-53
Escala= 0.232
Distribución Weibull
Log-verosimilitud (modelo)= -309.6
Log-verosimilitud (nula)= -342.9
Chisq= 66.62 con 1 grado de libertad, p-valor= 3.3e-16
Número de Newton-Raphson
Iteraciones: 7
n= 200
Según el modelo Weibull se tienen las siguientes estimaciones, en la reparametrización sugerida por (Moore
2016):
µ̂0 = 3.101,
σ̂ = 0.232,
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
α̂ =
1
σ̂
=
1
0.232
= 4.31,
λ̂0 = e
−µ̂0 = e−3.101 = 0.7333,
Ŝ0(t) = e
−(0.733t)4.31 .
4.5. Discusión de resultados:
(a) Un interrogante en el modelamiento de los datos ha sido el efecto de vulnerabilidad por los conglomerados
en cada pinza trampa, donde se agrupan cinco ácaros. Para inferir si hay o no efecto de clusters, la pinza
trampa se consideró como un efecto aleatorio y se procedió a analizar su importancia en el modelo. Para
esta fase se siguió este procedimiento:
• Ajustar el modelo de Cox de efectos mixtos con el componente sistemático:
η = Xβ + Zγ.
Donde β = β0 + β1 representan el vector de parametros asociado a los efectos fijos, γ representa el
vector de parametros para los efectos aleatorios, siendo X y Z matrices de diseño apropiadas.
• Ajustar el modelo de Cox para efectos fijos con:
η = Xβ
.
• Construir el estadístico de razón de verosimilitudes, entre los dos modelos anteriores, y realizar la
prueba χ2.
En las tablas 45 y 46 se presentan las salidas del programa R para los modelos mixto y de efectos fijos,
respectivamente.
Tabla 45: Efectos mixtos
Estimaciones por máxima verosimilitud para modelo de Cox de efectos mixtos.
eventos, n=93, 200
Iteraciones = 5 27 Nulo Integrado Ajustado
Log-verosimilitud -466.429 -428.5649 -428.5594
Chi-cuadrado Grados de libertad p-valor AIC BIC
Log-vero integrado 75,73 2.00 0 71.73 66.66
Log-vero ajustado 75.74 1.01 0 73.72 71.17
Model: Surv(TIEMPO,CENSURA)∼TRAT+(1|REP)
Coeficientes fijos
coef exp(coef) se(coef) z P
T1 (KlingQuel Raices) 2.02971 7.611878 0.2713588 7.48 7.4e^-14
Efectos aleatorios
Grupo Variable Desviación estandar Varianza
REP Intercept 9.036988e-038.166715e-05
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
Tabla 46: Efectos Fijos
Estimaciones por máxima verosimilitud para modelo de Cox de efectos fijos.
n= 200 Número de eventos=93
T1 (KlingQuel Raices)
Coef exp(coef) se(coef) z Pr(>|z|)
2.02971 7.611878 0.2713588 7.48 7.4e^-14 ***
Signif.codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05
T1 (KlingQuel Raices
exp(coef) exp(-coef) Lower 0.95 Upper 0.95
7.612 0.1314 4.472 12.96
Concordancia = 0.734 (se = 0.031)
R-cuadrado = 0.315 (maximo posible=0.991)
Verosimilitud = 75.73 con 1 Grado de libertad p-valor = 0
Prueba de Wald = 55.95 com 1 Grado de libertad p-valor =7.45e-14
Prueba Long Rank = 75.86 con 1 Grado de libertad p = 0
Result.Coxph$loglik
-466.4290 -428.5633
La estadística de verosimilitud es: G2 = 2 ∗ (−428.5649 + 428.5633) = −0.0016 lo cual bajo H0 sigue una
distribución χ21, que con un p− valor = 0.9999 lleva a tomar la desición de no considerar significativo el
efecto aleatorio, asociado a los cluster de vulnerabilidad generados por las pinzas trampa.
(b) Con respecto a la estimación KM, es importatne resaltar que las curvas empiezan a ser estadísticamente
diferentes a partir del día 12, donde el intervalo de confianza para el testigo I.C.T0−12 = (0.856, 0.958)
no se traslapa con el del tratamiento I.C.T1−12 = (0.411, 0.608)
(c) El factor de acortamiento de vida para el modelo paramétrico de Weibull es eα̂ = 0.645. El valor negativo
del exponente (α̂ = −0.438) indica que hay acortamiento de la esperanza de vida en (T1) con respecto
al control (T0). Esto, en la práctica implica que si un ácaro, alimentandose en plantas no tratadas con
KlingQuel Raices, tiene una expectativa de vida de 100 días, aquellos que se alimenten en plantas tratadas
solo tendrán un tiempo de vida promedio de 64,5 días aún cuando provengan de una población resistente
a acaricidas químicos.
(d) Finalmente, es importante recalcar que la mayor censura en los ácaros del tratamiento control (83 cen-
surados), en comparación con la inducción defensiva en rosas (17 censuras), ya es un indicativo de una
espectativa de vida menor al usar la sexta herramienta del MIA.
5. Conclusiones y recomendaciones
Finalizado el análisis se concluye:
• Las curvas de supervivencia son estadísticamente diferentes, esto implica que al activar la planta de-
fensivamente ésta, a través de su metabolismo, provoca una disminución en la población de ácaros en
el cultivo de rosas.
• Se observa que las curvas de sobrevida empiezan a ser estadísticamente diferentes a partir del día 12.
• Se evidencia que el tratamiento KlingQuel Raices, con respecto al tratamiento control, posee un factor
de acortamiento de vida del ácaro de eα̂ = 0.645 (64, 5 %).
Con lo anterior se recomienda:
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888
• Incluir el produto KlingQuel Raices en los progamas de manejo integrado de ácaros como heramienta
de activación defensiva.
• Se propone considerar un tiempo de ensayo igual o superior al tiempo necesario para alcanzar el 50%
de la mortalidad, en el total de la muestra analizada. Para el caso de 200 ácaros debería sostenerse el
ensayo hasta que hayan muerto al menos 100 individuos.
• Comparar los resultados obtenidos con otros modelos paramétricos, tanto frecuentistas como Bayesia-
nos.
Referencias Bibliográficas
Arribalzaga, E. (2007), ‘Interpretación de las curvas de supervivencia. rev chilena cir [serie en internet]. 2007
feb [citado 4 abr 2010]; 59 (1):[aprox. 7 p.]’.
Boj del Val, E. (2017), El modelo de regresión de cox, Master’s thesis, Universidad de Barcelona.
Crawley, M. J. (2007), ‘Survival analysis’, The R Book, Second Edition pp. 869–892.
Dávila, E. (2015), ‘Asedio de ácaros por inducción de metabilismo secundario vegetal: la sexta herramienta
del manejo integrado’, XLII Congreso Sociedad Colombiana Entomología SOCOLEN .
E., B. P. R. (2005), ‘Análisis de sobrevida utilizando el lenguaje r. simposio de estadística.’, Simposio de
estadística. Paipa Colombia. .
Godoy, A. (2009), ‘Introducción al análisis de supervivencia con r’, Trabajo Especial de Grado, Facultad de
Ciencias, Universidad Nacional Autónoma de México, México .
Greenwood, M. (1926), ‘Reports on public health and medical subjects’, The errors of sampling of the
survivorship tables. London: HM Stationery Office .
Hernández, D. A. M. (2010), AnÁlisis estadÍstico de datos de tiempos de fallo en r, Master’s thesis, University
of Granada, Spain.
*http://masteres.ugr.es/moea/pages/tfm0910/analisisestadisticodedatosdetiemposdefalloenr/!
Hoy, M. A. (2011), Agricultural acarology: introduction to integrated mite management, Vol. 7, CRC press,
Florida.
Kaplan, E. L. y Meier, P. (1958), ‘Nonparametric estimation from incomplete observations’, Journal of the
American statistical association 53(282), 457–481.
Klein, J. y Moeschberger, M. (2013), Survival Analysis: Techniques for Censored and Truncated Data, Sta-
tistics for Biology and Health, Springer New York.
*https://books.google.com.co/books?id=_2DaBwAAQBAJ
Kleinbaum, D. G. y Klein, M. (2005), ‘Competing risks survival analysis’, Survival Analysis: A self-learning
text .
Liu, X. (2012), Survival analysis: models and applications, John Wiley & Sons.
Martínez-González, M. Á., Alonso, Á. y Fidalgo, J. L. (2008), ‘¿ qué es una hazard ratio? nociones de análisis
de supervivencia’, Medicina clínica 131(2), 65–72.
Moore, D. F. (2016), Applied Survival Analysis Using R, Springer.
P., R. (2005), ‘Conceptos básicos de análisis de supervivencia.’, Corporación Sanitaria Parc Tauli. Sabadell.
Barcelona. España. .
Smith, P. J. (2002), Analysis of failure and survival data, CRC Press.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

Otros materiales