Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Nacional Autónoma de México Facultad de Ciencias Modelos Matématicos de Epidemia: Autómatas Celulares y Cadenas de Markov T E S I S QUE PARA OBTENER EL TÍTULO DE: MATEMÁTICO PRESENTA: JOSÉ ADRIÁN ORDÓÑEZ GÓMEZ DIRECTOR DE TESIS: PEDRO EDUARDO MIRAMONTES VIDAL 2012 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. 1. Datos del alumno Ordóñez Gómez José Adrián 56898867 Universidad Nacional Autónoma de México Facultad de Ciencias Matemáticas 304595039 2. Datos del tutor Dr. Pedro Eduardo Miramontes Vidal 3. Datos del sinodal 1 Dr. Germinal Cocho Gil 4. Datos del sinodal 2 Dra. Natalia Bárbara Mantilla Beniers 5. Datos del sinodal 3 Dra. Maŕıa de Lourdes Esteva Peralta 6. Datos del sinodal 4 Dr. José de Jesús Galaviz Casas 7. Datos del trabajo escrito Modelos Matemáticos de Epidemia: Autómatas Celulares y Cadenas de Markov 84 p 2012 Agradecimientos Al Dr. Pedro Eduardo Miramontes Vidal por la dirección de la tesis, al Dr. Ricardo Mansilla Corona ya que su art́ıculo fue la inspiración para la rea- lización de esta tesis y a los demás miembros del jurado por sus acertados comentarios, revisiones y aportaciones: Dr. Germinal Cocho Gil, Dra. Na- talia Bárbara Mantilla Beniers, Dra. Maria de Lourdes Esteva Peralta y Dr. José de Jesús Galaviz Casas. A la Facultad de de Ciencias y a todos los profesores que me impartieron clases. A mi padre José Domingo Ordóñez Alcocer, a mi madre Adriana Gómez Rosales, a mi hermano José Domingo Ordóñez Gómez y a toda mi familia por todo su cariño, apoyo y comprensión. A mi novia Lourdes Yanine Esquivel Hernández por todo su apoyo y consejos que me brindó. A mis amigos por su compañia y buenos consejos. Índice general 1. Introducción 3 2. Modelos de ecuaciones diferenciales SI, SIS y SIR 7 2.1. Modelo SI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2. Modelo SIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.3. Modelo SIR . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3. Modelo de epidemia mediante autómatas celulares 19 3.1. Autómata celular . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.1.1. Definición de autómata celular . . . . . . . . . . . . . . 20 3.1.2. Modelado y uso de autómatas celulares . . . . . . . . . 23 3.1.3. Ejemplos de autómatas celulares . . . . . . . . . . . . . 23 3.2. Autómata celular de cambio de sitio . . . . . . . . . . . . . . . 26 3.3. Modelo de contagio de la rabia en zorros . . . . . . . . . . . . 27 3.3.1. Reglas que rigen el autómata . . . . . . . . . . . . . . 27 3.3.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.4. Autómata que modela una epidemia en humanos . . . . . . . 35 3.4.1. Reglas que rigen al autómata . . . . . . . . . . . . . . 35 3.4.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . 37 4. Modelo de epidemia con cadenas de Markov 45 4.1. Cadenas de Markov en tiempo discreto . . . . . . . . . . . . . 45 4.1.1. Cadena de nacimiento y muerte . . . . . . . . . . . . . 52 4.2. Modelo de epidemia con CMTD . . . . . . . . . . . . . . . . . 55 4.2.1. Modelo SI . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.2.2. Modelo SIS . . . . . . . . . . . . . . . . . . . . . . . . 56 4.3. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.4. Cadenas de Markov en tiempo continuo . . . . . . . . . . . . . 62 1 2 ÍNDICE GENERAL 4.5. Procesos de nacimiento y muerte . . . . . . . . . . . . . . . . 64 4.6. Modelo de epidemia con CMTC . . . . . . . . . . . . . . . . . 71 4.6.1. Modelo SI . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.6.2. Modelo SIS . . . . . . . . . . . . . . . . . . . . . . . . 73 4.7. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5. Conclusiones 79 Caṕıtulo 1 Introducción Una epidemia es la aparición de una enfermedad que se propaga durante un tiempo en una región geográfica, y que afecta simultáneamente a un importante número de personas. El estudio de las epidemias constituye un problema relevante ya que es de suma importancia detenerlas, para reducir los daños que ocasionan en distintas regiones geográficas. El objetivo principal de esta tesis es mostrar distintas formas de mo- delar una epidemia, ya sea de manera determinista o estocástica. En cada uno de estos modelos se desarrollarán resultados que nos ayudan a la mejor comprensión de las epidemias. Una de las primeras aportaciones para el modelado de una epidemia es el modelo realizado por Kermack y McKendrick [2], en el cual se plantea un sistema de ecuaciones diferenciales. Este modelo también es conocido como el modelo SIR, ya que contempla tres estados en los cuales un individuo puede estar: susceptible, infectado y recuperado (inmune), este modelo ha servido como base para otros modelos de epidemiológicos. Aunque este modelo no tiene solución anaĺıtica se pueden hacer diversas aproximaciones mediante métodos cualitativos y númericos. Además existen otras variantes de este modelo que sirven para los diversos tipos de epidemias y que tienen solución anaĺıtica. Uno de los modelos planteados en esta tesis se desarrolla mediante el uso de autómatas celulares. Los autómatas celulares son una herramienta matemática que sirve para simular diferentes fenómenos naturales, con la caracteŕıstica de que existan entes que interactúen unos con otros, ya sea de manera determinista o con una función de probabilidad dada. Algunos ejemplos de modelaje mediante autómatas celulares pueden ser: el tráfico, las 3 4 CAPÍTULO 1. INTRODUCCIÓN epidemias, las reproducciones celular, los terremotos, los incendios, etcétera. La teoŕıa de los autómatas celulares se inicia a finales de la década de 1940 cuando John Von Neuman intentando dar explicación a ciertos fenómenos biológicos, escribe su libro [5], continuando el trabajo que desarrolló Stanislaw Ulam en su art́ıculo “red infinita”, donde explicaba cómo simular el fenómeno de crecimiento de un cristal. Luego, en 1970, John Horton Conway da a conocer su autómata celular “El juego de la vida” [6]. Cabe mencionar que en esa época los autómatas celulares llegaron a tener una gran popularidad. En 1983 Stephen Wolfram publica su art́ıculo “Cellular Automata” [7], en el cual se examina a la naturaleza y sus propiedades utilizando la teoŕıa de los autómatas celulares. En el año 2002 Wolfram [8] desarrolló una gran cantidad de autómatas celulares en diversos art́ıculos y publicá su libro A New Kind Of Science [8], donde mostró lo útil que pueden llegar a ser los autómatas celulares para diversos campos cient́ıficos. Uno de los primeros autómatas celulares que se desarrollaron para simular una epidemia simula un caso muy sencillo de ésta, ya que en él, lo único que se plantea es la probabilidad de infección condicionada a que uno de los vecinos de la celda esté infectado y no toma en cuenta otros factores importantes como la movilidad del hospedero, lo cual se tratará en esta tesis. Otra manera de simular una epidemia es mediante el uso de las cadenas de Markov. Las cadenas de Markov son un proceso estocástico (discreto o continuo) cuya caracteŕıstica principal es que la probabilidad de que ocurra un evento únicmente dependede su pasado inmediato. Una de las cadenas de Markov más conocidas es el proceso de nacimiento y muerte los cuales se encargan de modelar el número de habitantes en una población. El proceso de nacimiento y muerte lo utilizaremos para modelar el número de habitantes infectados en una población. En el segundo caṕıtulo de esta tesis se desarrollará el modelo de ecuaciones diferenciales propuesto por Kermack y McKendrick [2], el modelo SIR, aśı como variaciones de este modelo (SI y SIS). Como ya se ha mencionado anteriormente, este modelo es de gran importancia en el estudio de epidemias, ya que se ha utilizado como base para desarrollar otros modelos, que sirven para distintos tipos de epidemia, y utilizando diferentes herramientas matemáticas para hacer mejores aproximaciones a una epidemia real. Estos modelos serán utilizados a lo largo de la tesis tanto para desarrollar distintos modelos como para compararlos con otros. En el tercer caṕıtulo de la tesis modelaremos una epidemia mediante 5 autómatas celulares, aqui el principal objetivo es desarrollar el modelo de epidemias utilizando la movilidad como un factor importante, ya que el modelo SIR de ecuaciones de ecuaciones diferenciales no contempla la movilidad humana. En el tercer caṕıtulo definiremos lo que es un autómata celular para tener un mejor entendimiento de éstos, aśı como de las partes que los conforman. También se hablará de las herramnientas que se necesitan para modelar algún problema con autómatas celulares y de los diferentes tipos de usos que se les puede dar. Al final de esta sección se darán distintos ejemplos básicos de simulaciones mediante autómatas celulares. En esta tesis las reglas que rigen al autómata fueron tomadas de art́ıculos realizados por Nino Boccara [9], Ricardo Mansilla y José L. Gutierrez [14], en los cuales se toma en cuenta el factor de la movilildad del ser humano para volver más cercano a la realidad el modelo de epidemias. Primero nos enfocaremos en el modelo realizado por Boccara [9], sobre la difusión de la rabia en zorros, este modelo nos ayudará a para el entendimiento de la importancia del factor de movilidad en una epidemia. La movilidad humana constituye un factor importante para el desarrollo de una epidemia a nivel global y local, ya que, como se verá en este trabajo, puede facilitar que las epidemias se propaguen más rápido a lugares lejanos de donde se originó. Como lo realizado en los trabajos de Mansilla y Gutiérrez [14], supondremos que el humano se mueve mediante de acuerdo a patrones fijos, es decir, que se mueve a su lugar de trabajo, estudio, etcétera y después regresa a su lugar de origen (es decir su casa), ya que por lo regular la movilidad del ser humano se rige por rutinas. Los desplazamientos del ser humano los modelaremos mediante los autómatas de cambio de sitio. En el cuarto caṕıtulo de esta tesis modelaremos la epidemia mediante cadenas de Markov tanto discretas como cont́ınuas. En estos modelos se tratará a los individuos de la población de manera conjunta. Estos modelos para ser desarrollados toman en cuenta al modelo SI y SIS de ecuaciones diferenciales. En la primera parte del cuarto caṕıtulo definiremos las cadenas de Markov en tiempo discreto y se verán sus propiedades, las cuales nos servirán para comprender el modelo epidemiológico. Posteriormente se desarrollará el modelo de epidemias mediante cadenas de Markov en tiempo continuo, primero se definirá una cadena de Markov en tiempo continuo, después nos enfocaremos en el caso particular de cadenas 6 CAPÍTULO 1. INTRODUCCIÓN de vida y muerte para aśı poder asociarlos al modelo de epidemias. Para estos modelos se tomó como referencia el modelo planteado por Linda J. S. Allen [15]. Caṕıtulo 2 Modelos de ecuaciones diferenciales SI, SIS y SIR En este caṕıtulo presentaremos los modelos de ecuaciones diferenciales propuestos por Kermack y McKendrick [2]. En estos modelos los individuos de una población se dividen en compartimentos según su estado con respecto a la enfermedad. El modelo SI solamente contempla dos estados: susceptible e infectado; el individuo pasa del estado susceptible al estado de infectado. El modelo SIS contempla los mismos dos estados del modelo SI, pero en lo que difieren es en que el modelo SIS es un modelo ćıclico, ya que después de estar en estado infectado el individuo regresa al estado susceptible, esto es debido a que los recuperados de la enfermedad pierden la inmunidad. El modelo SIR contempla tres estados susceptible, infectado y recuperado. Cada uno de ellos modela distintos tipos de epidemia y la selección de uno de estos modelos depende de las caracteŕısticas de la enfermedad. Para los primeros dos modelos resolveremos las ecuaciones diferenciales que los conforman, que se dan en [3], y desarrollaremos propiedades de estos; para el tercer modelo únicamente trabajaremos propiedades [4] ya que no existe una solución anaĺıtica para el sistema de ecuaciones diferenciales, que les corresponde. 7 8 CAPÍTULO 2. MODELOS DE ECUACIONES DIFERENCIALES 2.1. Modelo SI El modelo SI plantea una población en la cual los individuos se pueden encontrar en dos diferentes estados, susceptibles S(t) e infectados I(t). En este modelo, si un individuo se encuentra en el estado de infectado, se queda en este estado. El modelo SI se usa para enfermedades crónicas, por ejemplo el herpes. El modelo SI está descrito por la siguiente ecuación diferencial: dI(t) dt = α(N − I(t))I(t) (2.1) donde α > 0, es la tasa de infección, N¿0 es el total de individuos de la población, N es constante y con condiciones iniciales I(0) = i0 > 0. En este modelo se considera que cualquier par de individuos tiene la misma probabildad de entrar en contacto uno con otro y el número de individuos infectados incrementará de a acuerdo al número de individuos infectados, número de individuos susceptibles y la tasa de infección, de la siguiente manera α(N − I(t))I(t). Para calcular la solución de I(t) notamos que es una ecuación diferencial separable; pues dI (N − I)I = αdt 2.1. MODELO SI 9 Integrando utilizando el método de fracciones parciales: ⇒ ∫ dI (N − I)I = ∫ αdt ⇒ 1 N ∫ dI N − I + 1 N ∫ dI I = αt+ C ⇒ −1 N ln(N − I) + 1 N ln(I) = αt+ C ⇒ 1 N ln( I N − I ) = αt+ C ⇒ ( I N − I ) 1 N = eαtK ⇒ I N − I = eαNtK ⇒ I = eαNtK(N − I) ⇒ I = eαNtKN − eαNtKI ⇒ I + eαNtKI = eαNtKN ⇒ I(1 + eαNtK) = eαNtKN ⇒ I = e αNtKN (1 + eαNtK) Tomando en cuenta la condición inicial I(0) = i0 calcularemos el valor de la constante K: i0 = eαN(0)KN (1 + eαN(0)K) ⇒ i0 = KN (1 +K) ⇒ i0(1 +K) = KN ⇒ i0 = K(N − i0) ⇒ K = i0 N − i0 Sustituyendo K en la solución de I(t) tenemos que: I(t) = NeαNti0 N − i0 + i0eαNt 10 CAPÍTULO 2. MODELOS DE ECUACIONES DIFERENCIALES Figura 2.1: Gráfica de I(t) con tasa de infección α = 0.123 y N = 125000. Observando la gráfica de la figura 2.1 nos resulta interesante calcular el tiempo t� en el cual I(t�) = N − �, aśı podemos aproximar el tiempo en el cual todos los individuos de la población estan infectados. Igualando la función I(t) a N − �: N − � = Ne αNt�i0 N − i0 + i0eαNt� N − � Ni0 = eαNt� N − i0 + i0eαNt� eαNt� = (N − �)(N − io) + (N − �)eαNt� Nio eαNt�(1− N − � N ) = (N − �)(N − io) Nio eαNt�( � N ) = (N − �)(N − io) Nio eαNt� = (N − �)(N − io) �io t� = 1 αN ln( (N − �)(N − io) �io ) (2.2) En la gráfica de la figura 2.2 tomamos t� como función de α para observar la relación que existe entre ellas. 2.2. MODELO SIS 11 Figura 2.2: Gráfica de α contra la aproximación al tiempo en el cual todos los individuos se encuentran enfermos N = 1000, � = 0.5 , i0 = 1. 2.2. Modelo SIS El modelo SIS plantea una población fija en la cual los individuos se pueden encontrar en dos diferentes estados, susceptiples S(t) e infectados I(t). En este modelo todo infectado regresa al estado de susceptible. El modelo SIS se usa para enfermedades que suelen ser recurrentesdado que los individuos no generan inmunidad ante estas, por ejemplo la gripe. El modelo SIS es descrito por las siguientes ecuaciones diferenciales: dS dt = −βSI + γI (1) dI dt = βSI − γI (2) se puede notar que: 0 = dS dt + dI dt integrando, N = S(t) + I(t) (3) sujeto a las condiciones iniciales I(0) = i0 > 0 y S(0) = s0 > 0. Donde β > 0 es la tasa de infección, γ > 0 es la tasa de recuperación y N > 0 representa el número total de la población el cual es constante. 12 CAPÍTULO 2. MODELOS DE ECUACIONES DIFERENCIALES En este modelo se considera que cualquier par de individuos tiene la misma probabildad de entrar en contacto uno con otro. El número de individuos infectados incrementará de a acuerdo al número de individuos infectados, número de individuos susceptibles y la tasa de infección, de la siguiente manera βS(t)I(t). Los individuos infectados se recuperarán de acuerdo a la tasa de recuperación y el número de individuos infectados, de la siguiente manera γI. Para calcular la solución de este sistema de ecuaciones diferenciales primero despejamos S(t) de la ecuación 3 S(t) = N − I(t) (4) sustituyendo en 4 en 2 dS dt = β(N − I)I − γI dS dt = βNI − βI2 − γI dS dt = −(−βN + γ)I − βI2 (5) Notamos que 5 es una ecuación diferencial de Bernoulli, dy dx +P (x)y = Q(x)yα donde el factor integrante es µ(x) = e ∫ P (x)dx: dS dt + (−βN + γ)I = −βI2 donde P (t) = −βN + γ, Q(t) = −β y α = 2. Se hace el cambio de variable y = 1 I ⇒ dI dt = −dy dt 1 y2 ⇒ −dy dt 1 y2 + 1 y (−βN + γ) = −β 1 y2 Multiplicando por −y2 ⇒ dy dt + y(βN − γ) = β (6) 2.2. MODELO SIS 13 El factor integrante es: µ(t) = e ∫ P (t)dt = e ∫ (βN−γ)dt = e(βN−γ)t Multiplicando (6) por el factor integrante, tenemos que: dy dt e(βN−γ)t + y(βN − γ)e(βN−γ)t = βe(βN−γ)t ⇒ (ye(βN−γ)t)′ = βe(βN−γ)t integrando de ambos lados, ye(βN−γ)t = ∫ βe(βN−γ)tdt+ C ⇒ ye(βN−γ)t = β βN − γ e(βN−γ)t + C ⇒ y = β βN − γ + Ce−(βN−γ)t Sustituyendo y = 1 I 1 I = β βN − γ + Ce−(βN−γ)t ⇒ I = βN − γ β + C(βN − γ)e−(βN−γ)t (7) Tomando en cuenta la condición inicial I(0) = i0 calcularemos el valor de la constante C: i0 = βN − γ β + C(βN − γ)e−(βN−γ)(0) ⇒ i0 βN − γ = 1 β + C(βN − γ) ⇒ βN − γ i0 − β = C(βN − γ) ⇒ (βN − γ)− βi0 i0(βN − γ) = C 14 CAPÍTULO 2. MODELOS DE ECUACIONES DIFERENCIALES Sustituyendo C en 7 tenemos que: I(t) = βN − γ β + ( (βN−γ)−βi0 i0(βN−γ) )(βN − γ)e −(βN−γ)t (8) Para calcular la solución de S(t) sustituimos 8 en 4, S(t) = N − βN − γ β + ( (βN−γ)−βi0 i0(βN−γ) )(βN − γ)e −(βN−γ)t (9) Figura 2.3: Gráfica de S(t) (azul) e I(t) (rojo) con parámetros β = 0.00083, α = 0.33333 y N = 1000 En la gráfica de la figura 2.3 se observa el comportamiento de S(t) e I(t) y podemos notar que, a partir de cierto tiempo, el valor de I(t) se mantiene constante, por lo cual nos interesa calcular ese valor. Una manera de calcularlo es observando ĺımt→∞ I(t), es decir: limt→∞ βN − γ β + ( (βN−γ)−βi0 i0(βN−γ) )(βN − γ)e −(βN−γ)t (10) Observamos que: limt→∞e −(βN−γ)t = { 0 si βN − γ ≥ 0, ∞ si βN − γ < 0. 2.3. MODELO SIR 15 ⇒ limt→∞I(t) = { βN−γ β si βN − γ ≥ 0, 0 si βN − γ < 0. Con este resultado podemos calcular el número de personas enfermas al que tenderá nuestra población a partir de las tasas de infección y recuperación y el número total de la población. También con este resultado si conocemos el número de personas enfermas al que nuestra población está tendiendo, denominémosle I∞(t), y la duración de la enfermedad, aproximamos la tasa de recuperación como γ = 1 d donde de d es la duración de la enfermedad, despejando β de la ecuación de S∞ podemos calcular la tasa de infección de la siguiente manera: β = γ N − I∞(t) . 2.3. Modelo SIR El modelo SIR plantea una población fija en la cual los individuos se pueden encontrar en tres diferentes estados, susceptibles S(t), infectados I(t) y recuperados R(t), el estado de recuperado indica que el individuo ya generó inmunidad a la enfermedad y que nunca pierde. El modelo SIR se usa para enfermedades en el cual el individuo genera inmunidad. El modelo SIR está dado por las siguientes ecuaciones diferenciales: dS dt = −βSI dI dt = βSI − αI dR dt = αI sumando todas las ecuaciones tenemos que: 0 = dS dt + dI dt + dR dt integrando, N = S(t) + I(t) +R(t) (3) 16 CAPÍTULO 2. MODELOS DE ECUACIONES DIFERENCIALES sujeto a las condiciones iniciales I(0) = i0 > 0 y S(0) = s0 > 0 y R(0) ≥ 0. Donde β > 0 es la tasa de infección, α > 0 es la tasa de recuperación y N representa el número total de la población el cual es constante. Para este modelo no existe solución anaĺıtica por lo cual sólo daremos aproximaciones númericas, como se muestra en la figura 2.4, el cual se obtuvo utilizando R project. Sin embargo, de este modelo podemos sacar conclusiones importantes, las cuales nos ayudarán en el estudio de las epidemias. Figura 2.4: Gráfica del modelo SIR con parámetros β = 0.0007, α = 0.1, s0 = 999 e i0 = 1 Primero notemos que el número de individuos en estado susceptible disminuye siempre que existan individuos en estado infeccioso, esto es debido a que dS dt < 0 siempre que I(t) > 0. El número de individuos en estado recuperado aumenta siempre que existan individuos en estado infeccioso, ya que dR dt > 0 cuando I(t) > 0. En el caso en que I(t) = 0 ambas funciones se mantienen constantes. Los valores de equilibrio son: (ĺımt→∞ S(t), 0, N − (ĺımt→∞ S(t)) El número de infectados aumentará si α β > S(t) y disminuirá si α β < S(t) ya que: dI dt = βSI − αI = (βS − α)I Notemos que dI dt > 0 si βS − α > 0 ⇒ α β > S(t), y dI dt < 0 si βS − α < 0 ⇒ α β < S(t). Para calcular el número máximo de individuos infecciosos notemos que: 2.3. MODELO SIR 17 dI dt = 0 si: (βS − α)I = 0 ⇔ βS − α = 0 ⇔ α β = S, por lo tanto si tmax = S −1(α β ) entonces I(tmax) es el número máximo de infecciosos. Dividiendo dI dt entre dS dt tenemos que: dI dS = (βS − α)I −βSI = βS − α −βSI = −1 + α βS ⇒ dI = −1 + α βS dS, integrando: I = −S + α β ln(S) + C. Utilizando las condiciones iniciales I(0) = i0 y S(0) = s0 para calcular el valor de C: C = i0 + s0 − α β ln(s0). Sustituyendo el valor de C y tmax en I(t) tenemos que: I(tmax) = −S(S−1( α β )) + α β ln(S(S−1( α β ))) + i0 + s0 − α β ln(s0) I(tmax) = − α β + α β ln( α β ) + i0 + s0 − α β ln(s0). 18 CAPÍTULO 2. MODELOS DE ECUACIONES DIFERENCIALES Figura 2.5: Gráfica I(tmax) en función de β con α = 1 3 , i0 = 1 y s0 = 500 De esta manera ya podemos saber el número máximo de infectados en una epidemia de tipo SIR, esto es de gran ayuda ya que dada esta información se puede prever el número de recursos que la población necesitará a lo largo de la epidemia. Denotemos a R0 = α β . Este número es conocido como el número reproductivo básico, como hemos visto anteriormente este número determina cuando en la epidemia se empieza a disminuir el número de infectados hasta llegar a cero. Una manera de aproximar este número conociendo el número inicial y final de susceptibles, utilizando el hecho de que limt→∞I(t) = 0, sustituimos S∞ = limt→∞S(t): 0 = −S∞ + α β ln(S∞) + i0 + s0 − α β ln(s0) ⇒ α β = N − S∞ ln( s0 S∞ ) . Caṕıtulo 3 Modelo de epidemia mediante autómatas celulares Una epidemia es la aparición de una enfermedad que se propaga durante un tiempo en una región geográfica, y que afecta simultáneamente a un importante número de personas. Si una enfermedad se difunde hacia otras regiones geográficas se convierte en pandemia, por eso los autómatas celulares que se desarrollaron en este trabajo simulan una población en una determinada región geográfica. Se han creado muchos modelos matemáticos para modelar el esparcimien- to de las enfermedades. En los últimos estudios se ha descubierto [14] que un factor importante para comprender la difusión de las epidemias en hu- manos es la movilidad humana y se ha observado que los humanos se rigen por patronesde movimiento de su lugar de trabajo a su casa [10]. En esta parte de la tesis nuestro objetivo fundamental es ver el comportamiento de las epidemias tomando en cuenta la movilidad humana, la cual será modelada mediante autómatas de cambio de sitio. Este modelo se utiliza bajo la hipótesis de que la especie en la cual se desarrolla la epidemia no se mueve aleatoriamente, si no más bien mediante un comportamiento periódico, por ejemplo los humanos nos movemos a nuestro trabajo, la escuela, etcétera y luego regresamos a nuestros hogares. En la primera parte de este caṕıtulo daremos una introducción al modelado utilizando autómatas celulares. Desarrollaremos la definición de autómata celular. Al final de esta sección presentamos varios ejemplos básicos del modelaje mediante autómatas celulares. Desarrollamos una introducción acerca de la movilidad humana que, como antes se ha mencionado, es un 19 20 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES factor importante para la difusión de epidemias. Luego explicaremos cómo es que se modela el autómata de cambio de sitio que es con el cual simularemos la movilidad en la difusión de enfermedades. En la siguiente sección nos enfocaremos en un autómata celular que simula cómo es que se esparce la rabia en poblaciones de zorros, ya que aunque los zorros son animales territoriales, la enfermedad de la rabia hace que pierdan el instinto de territorialidad y la enfermedad se propague de manera menos homogénea en el lugar donde se encuentra. Este autómata celular utiliza autómatas de cambio de sitio, para aśı, llevar este autómata al caso humano de difusión de enfermedades planteado por Mansilla y Gutiérrez [14]. 3.1. Autómata celular El modelaje mediante un autómata es una representación discreta del espacio en tiempo discreto de un sistema de muchos entes que interactúan localmente, es decir que interactúan con los que les rodean. En esta parte de la tesis hablaremos de temas básicos para el entendimiento y modelación de los autómatas celulares, se definirá lo que es un autómata celular, se explicará detalladamente cada uno de los elementos que lo conforman, aśı como las diferentes maneras de modelarlos. Después se hablará del modelado mediante autómatas celulares, los elementos que se necesitan para modelar mediante un autómata celular. También se hablará de las aplicaciones con autómatas celulares. En la última parte de esta sección se darán varios ejemplos básicos de autómatas celulares, hablando detalladamente de las partes que conforman los autómatas celulares en cada uno de estos. 3.1.1. Definición de autómata celular Primero definiremos lo que es una autómata de estado finito: Un autómata finito (AF) o mquina de estado finito es un modelo computacional que realiza cómputos en forma automática sobre una entrada para producir una salida, el cual esta conformado por cinco elementos: 1. Q es un conjunto finito de estados en el cual el autómata se puede encontrar. 2. Σ es un alfabeto finito. 3.1. AUTÓMATA CELULAR 21 3. q0 ∈ Q es el estado inicial. 4. δ : Q× Σ es una función de transición. 5. F ⊆ Q es un conjunto de estados finales o de aceptación. Un autómata celular está conformado de cuatro elementos: 1. Ret́ıcula o arreglo N -dimensional: Un arreglo de puntos, llamados celdas, que caen dentro de ĺıneas de forma regular. Es decir es el espacio en el cual interactúan los autómatas de estado finito. Existen varios tipos de ret́ıcula: a) Frontera abierta: Todas las celdas fuera de la ret́ıcula se les considera con un valor fijo del espacio de estados. b) Frontera periódica: Las celdas que se encuentran en alguno de los extremos de la ret́ıcula son vecinos de las células que se encuentran en su extremo opuesto. c) Frontera reflectora: Las celdas fuera de la ret́ıcula reflejan los valores que se encuentran dentro de ella. d) Sin frontera: La ret́ıcula va creciendo respecto a como las celdas dentro de la ret́ıcula van interactuando con las de afuera. 2. Vecindad: Son las celdas más cercanas que interactúan con la celda central. Existen dos tipos de vecindad en una ret́ıcula bidimensional: a) Vecindad de Von Neumman: Considera los cuatro vecinos ortogo- nales a la célula central(norte, sur, este y oeste). Figura 3.1: Vecindad de Von Neumann 22 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.2: Vecindad de Moore b) Vecindad de Moore: Considera los cuatro vecinos ortogonales y también los cuatro vecinos diagonales (norte, sur, este, oeste, noreste, noroeste, sureste, suroeste). 3. Espacio de estados: Conjunto finito de enteros del cual cada celda de nuestro autómata celular tomará un valor en cada unidad de tiempo. 4. Regla de evolución: Son las reglas que determinan el estado de la celda basado en la configuración de la vecindad. Es decir, es lo que determina en nuestro sistema cómo va a evolucionar cada celda del autómata celular. Un autómata celular es una ret́ıcula con un autómata de estado finito en cada sitio o célula del arreglo bidimensional. Cada autómata de estado finito toma como entradas los estados de las células de una región local finita K dentro del arreglo (vecindad). Aśı, se puede definir un autómata celular Λ como: Λ = {R,E,Φ, V } Donde R es la ret́ıcula, E es el espacio de estados, Φ es la función de transición( Φ : En→E) y V es el tipo de vecindad que tiene cada célula. Los autómatas celulares se pueden clasificar en cuatro tipos, dependiendo de su evolución en el tiempo [8]: ? Clase I: La evolución lleva a todas las células del autómata a tender a un estado estacionario. ? Clase II: La evolución lleva a estructuras periódicas. ? Clase III: La evolución lleva a estructuras caóticas que no contienen ningun patrón aparente. ? Clase IV: La evolución lleva a estructuras complejas. 3.1. AUTÓMATA CELULAR 23 3.1.2. Modelado y uso de autómatas celulares La herramientas que se utilizan para el modelaje con autómatas celulares son: 1. Una matriz para representar la ret́ıcula, en la cual cada entrada de la matriz representa una célula por medio del estado en el cual se encuentra la célula. 2. Una función que cambiará los valores de cada célula de la matriz dependiendo de los valores que tienen las células de su vecindad conforme a las reglas de evolución del autómata. La función sera aplicada repetidaamente, cada repetición representa una unidad de tiempo. 3.1.3. Ejemplos de autómatas celulares En esta sección veremos unos ejemplos clásicos de los autómatas celulares, aśı como cada una de las partes que los conforman. Juego de la vida Como ya se mencionó antes el “El Juego de la Vida” fue desarrollado en 1970 por John Horton Conway. Este autómata celular está constituido de la siguiente manera: ? Una ret́ıcula con frontera abierta. ? Vecindad de Moore. ? El espacio de estados contiene dos estados: célula viva y célula muerta. ? La regla de evolución es: ∗ Una célula muerta que tenga como vecinas tres células vivas al turno siguiente se convierte en célula viva. ∗ Una célula viva que tenga como vecinas cuatro o mas células vivas muere por “sobrepoblación”. ∗ Una célula viva que tenga como vecinas una o ninguna célula viva muere por “soledad”. 24 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES ∗ Una célula viva que tenga como vecinas 2 o 3 células vivas se mantendrá viva en el siguiente turno. Las células vivas se representarán en blanco y las células muertas se re- presentarán en negro. El desarrollo de este autómata depende de la configuración inicial de las células vivas, debido a esto se han encontrado diversas estructuras de la evolución de éste autómata. Figura 3.3: Juego de la vida t = 0, t = 20, t = 50, t = 100 Incendio Este autómata celular simula un bosque en el que existe una probabilidad p de que se incendie un árbol por causas naturales y luego se propague dicho incendio. Este autómata celular seconstituye de la siguiente manera: ? Una ret́ıcula de frontera periódica. ? Vecindad de Moore. 3.1. AUTÓMATA CELULAR 25 ? El espacio de estados es: espacio vaćıo, árbol, árbol en llamas. ? La regla de transición es: ∗ Un espacio vaćıo con probabilidad q se convierte en árbol. ∗ Un árbol se convierte en árbol en llamas con probabilidad p ∗ Si un árbol tiene por lo menos un vecino en estado “árbol en llamas” se convierte en árbol en llamas. ∗ Si un árbol está en llamas en el siguiente turno se convierte en espacio vaćıo. Los árboles se representarán con color verde, los árboles en llamas con color rojo y el espacio vaćıo con color café. Al principio del desarrollo de este autómata se puede apreciar cómo los árboles crecen en toda la ret́ıcula, luego se empiezan a generar incendios y éstos empiezan a esparcirse y a desaparecer los árboles después, vuelven a crecer los árboles y otra vez se repite el proceso. Figura 3.4: Autómata incendio t = 0, t = 30, t = 50 Epidemia Este autómata celular modela el caso más sencillo de una epidemia en donde no existe movimiento de las células, solamente se transmite la enfermedad entre células en la vecindad de una que se encuentra enferma. Este autómata celular se consitituye de la siguiente manera: ? Una ret́ıcula de frontera periódica. 26 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES ? Vecindad de Von Neumann. ? El espacio de estados es: susceptible, infeccioso, inmune. ? La regla de transición es: ∗ Si el estado de la célula es susceptible y tiene algún vecino en estado infeccioso entonces con probabilidad p (probabilidad de contagio) la célula cambia su estado a infeccioso. ∗ Si el estado de la célula es infeccioso durante 7 unidades de tiempo se mantendrá en estado infeccioso y luego se convertirá a estado inmune. ∗ Si su estado es inmune se mantendrá inmune durante ocho unidades de tiempo y después regresa a estado susceptible. Los suceptibles se representaran mediante el color rosa, infecciosos me- diante el color verde e inmunes mediante el color blanco. En este autómata se aprecia cómo la enfermedad va evolucionando a lo largo de la ret́ıcula. Figura 3.5: Autómata epidemia t = 10, t = 30, t = 50 3.2. Autómata celular de cambio de sitio El autómata celular de cambio de sitio lo utilizaremos para darle más realismo a los modelos con respecto al movimiento de los individuos los cuales se encuentran en la ret́ıcula. El autómata de cambio de sitio contiene dos tipos de reglas: 3.3. MODELO DE CONTAGIO DE LA RABIA EN ZORROS 27 1. Regla de evolución. 2. Regla de transporte La regla de evolución es la que determina el comportamiento local de cada célula en el proceso de transmisión, es decir cómo se va a comportar cada célula con respecto a cada uno de sus vecinos en cada paso. La regla de transporte es la que describe cómo se va a realizar el movimiento de los individuos en cada momento. 3.3. Modelo de contagio de la rabia en zorros En este modelo la población de zorros está dividida en tres tipos: susceptibles, latentes (son aquellos que ya fueron contagiados por rabia pero todav́ıa no presentan śıntomas de la enfermedad) e infectados aquellos que ya presentan los śıntomas de la enfermedad). En estos modelos suponemos que los zorros son animales territoriales y que los zorros rabiosos pierden su sentido de orientación. La rabia se transmite a través de mordedura o contacto directo de mucosas o heridas con saliva del animal infectado. 3.3.1. Reglas que rigen el autómata El autómata celular Λ se rige de la siguiente manera: ? Una ret́ıcula de frontera periódica ? Vecindad de Moore ? El espacio de estados es: vaćıo, susceptible, latente y rabioso. El espacio de estados se representará E = {0, 1, 2, 3} donde el 0 representa a las células vaćıas, el 1 a los zorros susceptible, el 2 a las zorros en latencia y el 3 a los zorros rabiosos. ? La regla de transición es: Este autómata está conformado por un autómata de cambio de sitio aśı que contiene dos tipos de reglas de transición: 1. Regla de evolución: 28 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES a) Cada susceptible tiene probabilidad b de tener una cŕıa en un espacio vaćıo de su vecindad. b) Cada susceptible tiene probabilidad d de morir de causas na- turales. c) Cada susceptible que tenga al menos un zorro rabioso en su vecindad tiene probabilidad pi de convertirse en infectado, si hay k zorros rabiosos en su vecindad tiene probabilidad 1− (1− pi)k de convertirse en zorro infectado. d) Cada latente tiene probabilidad d de morir de causas natura- les. e) Cada latente tiene probabilidad pr de convertirse en rabioso. f ) Cada rabioso tiene probabilidad dr de morir de la enfermedad. g) Cada zorro sin importar en que estado esté, si z denota el número de zorros en su vecindad, tiene probabilidad dl ∗ z de morir por falta de comida, donde dl es la probabilidad que tiene cada zorro de morir a falta de comida. 2. Regla de transporte: Al tiempo t, se seleccionará un zorro rabioso aleatoriamente para moverlo a alguna de sus celdas inmediatas. Si el lugar está vaćıo el zorro se moverá, de lo contrario se quedará en el mismo sitio. Este proceso de selección de zorro se repetirá m ∗NR(t) ∗ L2 donde m representa el promedio de movimiento tentativo por zorro rabioso, NR(t) es la densidad de zorros en la ret́ıcula al tiempo t y L la longuitud de la ret́ıcula. En nuestra regla de transporte los zorros susceptibles no se mueven debido a que los zorros son animales territoriales y por el contrario los zorros con rabia se mueven siguiendo un movimiento errático. También podemos notar que algunos zorros con rabia se moverán más que otros en cada paso e inclusive habrá algunos de ellos que no se muevan ya que pueden no ser seleccionados. 3.3.2. Resultados En las simulaciones el tamaño de la ret́ıcula es de 210 × 210. Al inicar el autómata la configuración inicial está dada de manera aleatoria con 3.3. MODELO DE CONTAGIO DE LA RABIA EN ZORROS 29 densidades iniciales de zorros susceptibles de 0.6, zorros infectados de 0.005 y zorros rabiosos de 0.005. Los zorros rabiosos sólo se localizarán en un disco de radio 10 alrededor del centro de la ret́ıcula. Los resultados presentados son promedios de 10 simulaciones por cada variación de parámetros. Para esta primera parte, las simulaciones presentan los siguientes parámetros b =0.01 , d =0.001 , pi=0.8 , pr =0.05 , dr =0.1 , dl =0.01 y el parámetro m (el movimiento promedio del zorro con rabia por unidad de tiempo) lo variaremos para hacer comparaciones, m ∈ [0, 1]. Figura 3.6: Simulación con m=0.1 a los tiempos t=100, t=400, t=800, t=1600 Como se puede apreciar en la figura 3.6, para valores pequeños de m los zorros con rabia van infectando a los susceptibles muy lentamente, la difusión de la enfermedad en la ret́ıcula también es lento y además conforme van avanzando los zorros con rabia alrededor de la ret́ıcula la mayor parte de los zorros susceptibles no logran ser infectados. Conforme la m va aumentando su valor (ver figura 3.7) la difusión de la enfermedad al interior de la ret́ıcula es más rápida y se observa un número menor de zorros con vida por donde los zorros rabiosos ya han pasado. Para valores grandes de m (ver figura 3.8), la velocidad de difusión de la enfermedad es aún más rápida, y a su paso de la enfermedad solamente 30 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.7: Simulación con m=0.4 a los tiempos t=100, t=400, t=800, t=1600 sobreviven pocos zorros, y son los que se encargarán de repoblar la ret́ıcula. Se pueden presentar dos casos: el primero es que, debido al alto capacidad de movimiento de los zorros rabiosos la enfermedad sea capaz de perdurar o por el mismo motivo, debido al alto capacidad de movimiento, los zorros sobrevivientes sólo se encuentren muy cercanos al centro de la ret́ıcula y los zorros con rabia esparcidos a las orillas de laret́ıcula siendo incapaces de contagiar a los zorros del centro y la enfermedad desaparezca. El segundo caso es más frecuente en cuanto m va aumentando. La figura 3.9 es una comparación del número de muertos por causa natural y el número de muertos por rabia con m =0.3, en ella podemos apreciar que, conforme el tiempo va transcurriendo, el número de muertes naturales va disminuyendo y el número de muertes por rabia se incrementa, esto es debido a que la rabia se empieza a propagar en la ret́ıcula y el número de zorros rabiosos aumenta , lo que hace que disminuya el número de zorros susceptibles y sean más los zorros que mueren por rabia. Para valores grandes de tiempo se puede apreciar cómo el número de muertes por rabia disminuye y el número de muertes por causa natural vuelve a incrementarse por arriba del número de muertes por rabia. Esto nos indica que la zoonosiz está cesando. La figura 3.10 muestra la gráfica del número de contagiados al tiempo t 3.3. MODELO DE CONTAGIO DE LA RABIA EN ZORROS 31 Figura 3.8: Simulación con m=0.9 a los tiempos t=100, t=400, t=800, t=1600. comparando distintos valores de m (0.2, 0.4, 0.7), en esta gráfica se puede apreciar que, a valores más grandes de m, el desarrollo de la enfermedad en la réticula es más rápido y las curvas van teniendo colas más pesadas. Se puede apreciar que el proceso de contagio es muy similar para distintos valores de m, lo único que vaŕıa es la velocidad con la que se desarrolla el proceso. El número máximo de contagiados también va aumentando conforme la m aumenta, pero también la velocidad con la que el número de contagiados disminuye. Se intentó ajustar las curvas del número de contagiados y el número de muertos por rabia al tiempo t mediante el modelo de series de tiempo Box- Jenkins pero se encontraron muchas dificultades. Las observaciones tienden a ser muy volátiles, aún aśı los modelos que se sugeŕıan para modelarlas mostraban un alto grado de correlación entre los datos, lo cual niega las hipótesis de dicho modelo. Debido a esto, se optó por modelarlas mediante un alisamiento exponen- cial Holt-Winter [11]. Existen tres tipos de modelos los cuales estan constiui- dos de la siguiente manera: Sea xt una serie de tiempo, st el valor del alisamiento al tiempo t. 32 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.9: Compración de número promedio de muertos naturales (rojo) y por causa de la rabia (verde) Figura 3.10: Promedio del número de contagiados m=0.2 (rojo), m=0.3 (verde), m=0.7 (azul) 1. Alisamiento exponencial simple: s1 = x0 st = αxt−1 + (1− α)st−1 donde α es el factor de suavizamiento 0 < α < 1. 2. Alisamiento exponencial doble: Este modelo se aplica cuando existe una tendencia en los datos observados. En este modelo se añade bt que va a ser la estimación de la tendencia al tiempo t, el valor Ft se va encargar de las predicciones a partir del tiempo t para toda m > 0. 3.3. MODELO DE CONTAGIO DE LA RABIA EN ZORROS 33 s1 = x0 b0 = x1 − x0 st = αxt−1 + (1− α)st−1 bt = β(st − st−1) + (1− β)bt−1 Ft+m = st +mbt donde β es el factor de alisamiento de la tendencia 0 < β < 1 y con respecto a la definición F1 = s0 + b0. 3. Alisamiento exponencial triple: Este modelo se aplica cuando en los datos observados existen ciclos. En este modelo se añade ct que se va a encargar de modelar la parte ćıclica que presenta el modelo. s0 = x0 st = α xt−1 Ct−L + (1− α)Ft−1 bt = β(st − st−1) + (1− β)bt−1 ct = γ xt st + (1− γ)ct−L Ft+m = (st +mbt)ct−L+(m−1(modL)) b0 = 1 L (xL+1−x1 L + ... + xL+L−xL L ) Ajustando las estimaciones para los primeros ci para i = 1, 2, 3, ..., L y sea N el número de ciclos que se presenta en la serie, entonces: ci = 1 N ∑N j=1 xL(j−1)+i Aj Aj = ∑L k=1 xL(j−1)+k L donde γ es el factor de cambio de periodo y L es la longitud del ciclo. Los valores de α, β y γ son propuestos pero existen diversos métodos para escoger los valores de α, β y γ de manera que se minimize la media de los errores al cuadrado, el cual es considerado como el mejor ajuste que se puede hacer utilizando este modelo. 34 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.11: Alisamiento exponencial m=0.1, ajustados (amarillo), observa- dos (verde). Descartamos el valor γ de nuestro modelo debido a que no tiene un comportamiento periódico a través del tiempo y el valor de β debido a que no existe una tendencia, debido a esto se utilizamos el suavizamiento exponencial simple y ajustamos las series de tiempo utilizando el valor de α que minimiza la media de los errores al cuadrado (un método para encontrar este α es utilizando el algoritmo de Marquardt [12]). El cálculo de α se obtuvo utilizando el programa R project. El resultado se puede apreciar en la figura 3.11. Las gráficas de la figura 3.12 muestran el comportamiento del parámetro α en relación con el parámetro m respecto al número de contagiados y el número de muertos de rabia al tiempo t. En ambos casos se aprecia un comportamiento creciente, lo que nos indica que el alisamiento de los datos es mayor conforme aumenta m. El modelo de autómata celular de rabia en zorros lo realizé en Java Version 6.0 y el código está a disposición de quien lo solicite. En este modelo aporté el análisis del autómata celular para distintos valores de m, en particular la la relación de este parámetro con la serie de tiempo del número de contagiados y el número de muertos por rabia para al final llevar a cabo la relación de este parámetro con el parámetro del alisamiento exponencial. 3.4. AUTÓMATA QUE MODELA UNA EPIDEMIA EN HUMANOS 35 Figura 3.12: Comparación de α con respecto a m 3.4. Autómata que modela una epidemia en humanos El modelo mostrado en esta parte de la tesis está basado en la hipótesis de que los humanos tienen un movimiento periódico, fundada en que por lo regular se mueven de su casa a su lugar de trabajo y luego regresan a sus casas. Primordialmente nos enfocaremos en comparar nuestro modelo de autómata celular con modelos de ecuaciones diferenciales ordinarias , para valores grandes del parámetro de movimiento de los individuos. 3.4.1. Reglas que rigen al autómata El autómata celular Λ se constituye de la siguiente manera: ? Una ret́ıcula de frontera abierta. ? Vecindad de Moore. ? El espacio de estados es: vaćıo, susceptible, y enfermo. El espacio de estados se representará E = {0, 1, 2} donde el 0 representa a las células vaćıas, el 1 a las células de la clase susceptible y 2 a la células de la clase enferma. 36 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES ? La regla de transición es: Este autómata celular está conformado por un autómata celular de cambio de sitio aśı que contiene dos tipos de reglas. 1. Regla de contagio: a) Si el individuo es susceptible y no contiene vecinos enfermos permanecerá en estado susceptible. b) Si el individuo tiene un vecino enfermo entonces con probabi- lidad de contagio p se enferma. Por lo tanto si tiene k vecinos enfermos la probabilidad de contagio es 1− (1− p)k ya que: P [ contagio si tiene k vecinos enfermos ] = P [ solamente uno de los vecinos lo contagie ] = 1− P [ningun vecino lo contagie ] Como los vecinos son indepedientes entonces 1−P [ningun vecino lo contagie ] = 1−P [el vecino 1 no lo contagie]∗ ... ∗ P [el vecino k no lo contagie] = 1− (1− p)k 2. Regla de transporte: Sea Ω = {0, 1, 2}Λ el conjunto de elementos de la forma a(i,j) donde a ∈ E y (i, j) es la posición en la ret́ıcula, es decir que Ω es el conjunto de todas las posibles configuraciones sobre la ret́ıcula. Sea τ : Ω→ Ω una función que satisface las siguientes condiciones: a) Si a(i0,j0) 6= 0 una de las siguientes condiciones se cumple: a1) τ(a(i0,j0)) = 0 a2) τ(a(i0,j0)) = a(i0,j0) b) Para todo x1, x2 pertenecientes a la ret́ıcula tales que x1 6= x2 y ax1 , ax2 6= 0, entonces τ(ax1) 6= τ(ax2) La función τ es la regla de transporte. Sea �p : Ω → Ω la función que representa a la reglade contagio. El autómata celular funcionará de la siguiente manera: π = τ−1 ◦ �p ◦ τ ◦ �p La interpretación de las reglas del autómata de cambio de sitio es la siguiente: 3.4. AUTÓMATA QUE MODELA UNA EPIDEMIA EN HUMANOS 37 ? Regla de contagio: cualquier individuo susceptible y que tenga k vecinos enfermos en cada paso tiene probabilidad 1 − (1 − p)k de cambiar su estado a enfermo. ? Regla de transporte: la condición a) quiere decir que toda celda ocupada se puede mover a un elemento vaćıo de la ret́ıcula o permanecer en su mismo sitio (considerando a los individuos de la población que se quedan en su casa, como son las personas de edad avanzada, quienes trabajan en casa, etcétera.). Por otra parte la condición b) significa que dos elementos no vaćıos de la población no se pueden mover a un mismo sitio. La función π es la regla que simulará el movimiento periódico del ser humano. Primero se aplicará la regla de contagio, luego el individuo se moverá a otro sitio aplicando la regla de transporte, estando en su nuevo sitio se le vuelve a aplicar la regla de contagio para después regresar a su sitio de origen utilizando la imagen inversa de la regla de transporte. Otro factor importante que tomaremos en cuenta es la distancia máxima que un individuo se puede mover, la cual es conocida como la longitud media de camino y la denotaremos como λ. Sea X ∈ Ω, denotaremos a O(X) como el subconjunto de la ret́ıcula con celdas no vaćıas, O(X) = {x ∈ Λ| ax 6= 0}. N(X) como el número de celdas de O(X) y p(x, τ(x)) la distancia euclidiana de la celda no vaćıa al lugar donde fue transportado por τ . Denotaremos: λ = 1 N(X) ∑ x∈O(X) p(x, τ(x)) Para la regla de transporte utilizaremos una distribución uniforme entonces: λ ≈ dmax+dmin 2 Como la distancia mı́nima es cero entonces λ ≈ dmax 2 . Notemos que ya definida una función τ el valor de λ ya está dado. 3.4.2. Resultados En las simulaciones, el tamaño de la ret́ıcula es de 500 × 500. En la configuración inicial del autómata celular se encuentra un único enfermo al centro de la ret́ıcula y los susceptibles se encuentran distribuidos como 38 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES los cuadros negros de un tablero de ajedrez, es decir que la población de la ret́ıcula es de 500×500 2 = 125, 000 individuos. Se utilizan diversos valores de los parámetros p y λ varian para hacer distintas comparaciones. Los resultados que se presentan son promedios de 10 simulaciones por cada variación de parámetro. Primero nos fijaremos en valores grandes de λ comparando las simula- ciones con las ecuaciones del modelo SI. dI(t) dt = αI(t)S(t) = αI(t)(125000− I(t)) (3.1) con condición inicial I(0) = 1 (3.2) Figura 3.13: Simulación con parámetro p = 0.051 y λ = 250 tiempo t = 10, t = 30, t = 50 Como se puede apreciar en la figura 3.13 la enfermedad va esparciéndose a través de toda la ret́ıcula, hay un comportamiento en el cual cualquier individuo se puede infectar en cualquier tiempo t ya que los individuos se pueden desplazar a cualquier punto de la ret́ıcula, es por eso la asociación de la simulación del autómata con el modelo SI ya que en este no se presenta ningún factor de movilidad que influya en la evolución de la epidemia. En la figura 3.14 se muestran las gráficas del número de infectados comparando distintos valores de p dejando fijo el parámetro λ con lo cual se puede observar cómo el proceso de la epidemia evoluciona más rápido conforme p se incrementa. En la figura 3.15 se muestra el ajuste de los datos de la simulación con probabilidad p = 0050 con la solución anaĺıtica del problema de Cauchy para la ecuación del modelo SI con parámetro α = 0,285. El distanciamiento 3.4. AUTÓMATA QUE MODELA UNA EPIDEMIA EN HUMANOS 39 Figura 3.14: Número de infectados al tiempo t p = 0.030 (verde), p = 0.040 (azul), p = 0.050 (morado). Figura 3.15: Número de infectados con λ = 250 y p = 0.050 (punteado), y la solución anaĺıtica del problema de Cauchy con α = 0.285 medio de los datos de la simulación con la solución a la ecuación del modelo SI es de 534. En la figura 3.16 se muestra la gráfica de la relación que hay entre el parámetro de probabilidad de contagio p del modelo de autómata celular con la tasa de contagio α del modelo SI, en la cual podemos notar que en su mayor parte tiene un comportamiento creciente. Ahora, tomando valores pequeños de λ podemos observar (figura 3.17) cómo se crea un frente de individuos contagiados, que va creciendo a través del tiempo hasta cubrir completamente toda la réticula. Este comportamiento nos indica que los individuos que se encuentran más distanciados del centro (donde se encuentra el primer infectado al tiempo 0) tienen menor probabilidad de contagiarse al iniciar la simulación y esta probabilidad va aumentando conforme el tiempo avanza. Para distintos valores de λ podemos observar (figura 3.18)que si, los 40 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.16: α vs p Figura 3.17: Simulación con parámetro p = ,051 y λ = 25 tiempo t = 10, t = 30, t = 50 valores de λ son más pequeños, la evolución de la enfermedad es más lenta. Esto nos indica que, en poblaciones donde los individuos tienen un rango mayor de desplazamiento, el número de infectados en una epidemia crece más rápido comparado con las poblaciones donde los indidividuos tienen un rango menor de desplazamiento. En la siguiente parte modificaremos el modelo introduciendo la condición de que la enfermedad tiene un duración d, en las simulaciones realizadas tomamos d = 4 , tras lo cual el enfermo vuelve a ser susceptible (Modelo SIS). Como se puede observar en la gráfica de la figura 3.20, existe un valor T tal que para ciertos valores de t ∈ [0, T ] la función I(t) es estrictamente creciente, y para los t > T la función I(t) se mantiene alrededor de una constante H. Este fenómeno se puede observar en la gráfica de la figura 3.19, 3.4. AUTÓMATA QUE MODELA UNA EPIDEMIA EN HUMANOS 41 Figura 3.18: Numero de infectados con distintos valores de λ (7 (morado), 25 (verde), 50 (azul)) donde el número de contagiados al tiempo t se mantiene constante, es decir hay un equilibrio entre el número de contagiados al tiempo t y el número de individuos que se recuperan. Figura 3.19: Número de contagiados al tiempo t (azul), Número de enfermos al tiempo t (verde) En la figura 3.20 se encuentran las gráficas del número de enfermos al tiempo t para distintos valores del parámetro λ y con una misma probabilidad de contagio p. Observemos que, entre más grande es λ, el valor de T va disminuyendo y se encuentra muy poca variación o ninguna en el valor de H. Este fenómeno se puede observar más claramente en la gráfica de la figura 3.21 donde se comparan el valor de λ contra el valor de T y se observa que el valor de T va disminuyendo conforme el valor de λ aumenta y al final de las curvas se puede apreciar cómo al valor de λ vuelve a incrementar, esto nos indica que existe una mayor filtración de la enfermedad para valores medios de λ ya que ahi es donde alcanza su mı́nimo. La curva de arriba corresponde a p = 007 la de enmedio p = 01 y la de abajo a p = 015. 42 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.20: Número de enfermos λ = 7 (verde), λ = 40 (azul), λ = 150 (morado) con p = 0,07 Figura 3.21: λ vs T Al variar el parámetro p y fijar el parámetro λ, se observa (figura 3.22) que el valor de T disminuye y el valor de H aumenta conforme el valor de p va creciendo. Tomando a λ = 250 podemos ajustar las simulaciones obtenidas del autómata celular al modelo SIS de ecuaciones diferenciales utilizando la fórmula obtenida en la sección (2.2): β = γ N − I∞(t) , donde el valor de I∞(t) se sustituye con el valor aproximado de H y γ = 1 d (d es el número de d́ıas que dura la enfermedad). En la figura 3.23 se puede ver el ajuste de la simulación con el modelo de ecuaciones diferenciales SIS, en el cual observamosque la simulación se aproxima muy bien al modelo SIS. 3.4. AUTÓMATA QUE MODELA UNA EPIDEMIA EN HUMANOS 43 Figura 3.22: Número de enfermos p = 0.07 (verde), p = 0.1 (morado), p = 0.15 (azul) con λ = 40 Figura 3.23: Ajuste de la simulación con p=.1 al modelo SIS con β = 6.361323 ∗ 10−6 y α = 1 4 En la gráfica de la figura 3.24 se compara el valor de p, utilizado en la simulación del autómata celular, con el valor β correspondiente al modelo epidemiológico tipo SIS con valor de α = 1 4 para 10 valores de p distintos. El modelo de autómata celular de la epidemia en humanos lo realizé en Java Version 6.0 y el código está a disposición de quien lo solicite. Los resultados presentados en su mayoŕıa feueron reproducidos del art́ıculo de Mansilla y Gutiérrez con una la ret́ıcula de mayor tamao, para esta tesis se utilizó una población mas grande, esto nos lleva a tener una mejor aproximación del comportamiento de una epidemia para poblaciones grandes. También es un aporte de este trabajo el estudio de la relación que existe entre el parámetro β del modelo SIS y la probabilidad de contagio, aśı como la comparación gráfica del número de infectados a lo largo del tiempo para 44 CAPÍTULO 3. EPIDEMIA MEDIANTE AUTÓMATAS CELULARES Figura 3.24: p vs β distintos valores de p (figura 3.22). Caṕıtulo 4 Modelo de epidemia con cadenas de Markov En este caṕıtulo nos enfocaremos en desarrollar dos distintas maneras de modelar una epidemia utilizando como herramienta principal las cadenas de Markov. En el primer modelo utilizaremos cadenas de Markov en tiempo discreto y en el segundo modelo cadenas de Markov en tiempo continuo. En la primera sección de este caṕıtulo plantearemos la teoŕıa correspondi- ente con las cadenas de Markov en tiempo discreto [19], para emplearla en el modelo de epidemia. Expresaremos los modelos SI y SIS de epidemiológicos mediante cadenas de Markov en tiempo discreto primero explicando su ma- triz de transición, para después desarrollar sus propiedades. Al final de esta sección mostraremos los resultados de las simulaciones de estos modelos. En la segunda sección plantearemos la teoŕıa relacionada con las cadenas de Markov a tiempo continuo [18] enfocándonos principalmente en cadenas de vida y muerte y a partir de ah́ı empezaremos con la construcción del modelo de epidemia. Para este modelo nos enfocaremos en la construcción del modelo SI y SIS. Al final de esta sección se presentarán las simulaciones obtenidas con estos modelos. 4.1. Cadenas de Markov en tiempo discreto Consideremos el proceso estocástico {Xn}, donde Xn es una variable aleatoria que toma valores en un espacio de estados finito o numerable ε, donde n (n = 0, 1, 2,... ) representa el tiempo. 45 46 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV Una cadena de Markov en tiempo discreto es un proceso estocástico para cual dado el presente, el pasado no tiene influencia en el futuro. En palabras más formales: Definición 1. Una cadena de Markov en tiempo discreto es un proceso estocástico {Xn}∞n=0 tal que: P [Xn = in|X0 = i0, ..., Xn−1 = in−1] = P [Xn = in|Xn−1 = in−1], donde ik ∈ ε el espacio de estados finito o numerable. Definición 2. Se dice que una Cadena de Markov es homogénea si: P [Xn = j|Xn−1 = i] = P [X1 = j|X0 = i]. En esta sección trabajaremos con cadenas de Markov homogéneas.Las probabilidades condicionales P [Xn = j|Xn−1 = i] son llamadas las probabilidades de transición. Definición 3. Sea Xn , n ≥ 0, una cadena de Markov con espacio de estados ε. La función de transición pxy, con x, y ∈ ε es definida como: pxy = P [X1 = y|X0 = x]. Como las probabilidades son no negativas y como el proceso debe moverse a algún estado tenemos que: pxy ≥ 0 y ∑ y pxy = 1 donde x, y ∈ ε. (4.1) Dado que la cadena de Markov es homogénea tenemos que: P [Xn = y|X0 = x0, ..., Xn−1 = x] = P [Xn = y|Xn−1 = x] = pxy. (4.2) Esto quiere decir que, si la cadena de Markov se encuentra en estado x al tiempo n− 1, entonces no importa cómo llegó a x, tiene probabilidad pxy de estar en el estado y en el siguiente paso. 4.1. CADENAS DE MARKOV EN TIEMPO DISCRETO 47 Definición 4. Sea P la matriz de transición en la cual aij = pij, donde aij es la entrada del i-ésimo renglón y la j-ésima columna, 0 ≤ i, j ≤ n es decir: p00 p01 ... p0n p10 p11 ... p1n . . ... . . . ... . . . ... . pn0 pn1 ... pnn Para el desarrollo de distribuciones conjuntas de una cadena de Markov primero definiremos la distribución inicial. Definición 5. La distribución inicial de una cadena de Markov esta definida por: πo(x) = P [X0 = x] donde x ∈ ε, (4.3) y es tal que: π0(x) ≥ 0 y ∑ x π0(x) = 1 para todo x ∈ ε. (4.4) El siguiente teorema nos servirá para el cálculo de distribuciones conjuntas en una cadena de Markov: Teorema 1. Sea {Xn} una cadena de Markov homogénea y π0(x0) su distribución inicial, entonces tenemos que: P (X0 = x0, X1 = x1, ..., Xn = xn) = π0(x0) ∗ px0x1 ∗ ... ∗ pxn−1xn (4.5) para todo n ≥ 0 y xi ∈ ε. Demostración. Por inducción. Caso n=1. P.D. P (X0 = x0, X1 = x1) = π0(x0) ∗ px0x1 Por probabilidad condicional tenemos que: P (X0 = x0, X1 = x1) = P (X0 = x0) ∗ P (X1 = x1|X0 = x0) = π0(x0)px0x1 . Suponemos el caso n = k: P (X0 = x0, X1 = x1, ..., Xk = xk) = π0(x0) ∗ px0x1 ∗ ... ∗ pxk−1xk . P.D. Caso n = k + 1: 48 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV P (X0 = x0, X1 = x1, ..., Xk = xk, Xk+1 = xk+1) = π0(x0) ∗ px0x1 ∗ ... ∗ pxk−1xk ∗ pxkxk+1 . Utilizando la definición de probabilidad condicional tenemos que: P (X0 = x0, ..., Xk+1 = xk+1) = P (X0 = x0, ..., Xk = xk)P (Xk+1 = xk+1|X0 = x0, ..., Xk = xk) Por el caso base de inducción tenemos que: = π0(x0) ∗ px0x1 ∗ ... ∗ pxk−1xk ∗ pxkxk+1 ∗ P (Xk+1 = xk+1|X0 = x0, X1 = x1, ..., Xk = xk) Lo que, dado que {Xn} propiedad de Markov: π0(x0) ∗ px0x1 ∗ ... ∗ pxk−1xk ∗ pxkxk+1 ∗ P (Xk+1 = xk+1|Xk = xk) = π0(x0) ∗ px0x1 ∗ ... ∗ pxk−1xk ∗ pxkxk+1 . (4.6) Ahora denotaremos la función de transición en n − pasos como pnij, que es la probabilidad de que un proceso que se encuentra en el estado i en un momento dado después de n transiciones se encuentre en el estado j, es decir: pnij = P [Xn = i|X0 = j] n ≥ 0 y i, j ∈ ε. (4.7) Para el cálculo de estas probabilidades utilizaremos las ecuaciones de Chapman-Kolmogorov [19]: pn+mij = ∑ k∈ε pnikp m kj para todo n,m ≥ 0 y i, j ∈ ε. (4.8) Este resultado se obtiene de la siguiente manera: pn+mij = P [Xn+m = j|X0 = i] = ∑ k∈ε P [Xn+m = j,Xn = k|X0 = i] = ∑ k∈ε P [Xn+m = j|Xn = k,X0 = i] ∗ P [Xn = k|X0 = i] = ∑ k∈ε P [Xn+m = j|Xn = k] ∗ P [Xn = k|X0 = i] = ∑ k∈ε P [Xm = j|X0 = k] ∗ P [Xn = k|X0 = i] = ∑ k∈ε pnikp m kj. 4.1. CADENAS DE MARKOV EN TIEMPO DISCRETO 49 De esta manera podemos calcular pnij de la siguiente forma: pnij = ∑ k∈ε pik1p n−1 k1j = ∑ k1∈ε ∑ k2∈ε pik1pk1k2p n−2 k2j . . . = ∑ k1∈ε ∑ k2∈ε ... ∑ kn−1∈ε pik1pk1k2 ...pkn−1j. (4.9) Si denotamos como P (n) la matriz de transición en n pasos este resultado se puede interpretar de la siguiente manera: P (n) = P n donde P es la matriz de transición para un solo paso. Conociendo pnij podemos calcular la función de densidad P [Xn = j], P [Xn = j] = ∑ k∈ε P [Xn = j,X0 = k] = ∑ k∈ε P [X0 = k]P [Xn = j|X0 = k] = ∑ k∈ε π0(x0)p n kj. A continuación definiremos los tiempos de paro que nos servirán para calcular la probabilidad de que nuestro proceso llegue por primera vez a un conjunto del espacio de estados dado. Definición 6. Sea A un subconjunto de ε. El tiempo de paro TA de A ⊂ � está definido por TA = min{n > 0|Xn ∈ A}, (4.10) si Xn /∈ A para todo n > 0 diremos que TA =∞. 50 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV En palabras más sencillas TA denota el primer tiempo positivo en el cual la cadena llega al conjunto de estados A. Denotaremos P [Tj = n|X0 = i] = Pi[Tj = n]. Para el cálculo de estas probabilidades observemos que: Pi[Tj = 1] = pij, (4.11) para n = 2 tenemos: Pi[Tj = 2] = ∑ k 6=j P [X2 = j,X1 = k|X0 =i] = ∑ k 6=j P [X2 = j|X1 = k,X0 = i]P [X1 = k|X0 = i] utilizando la propiedad de Markov: Pi[Tj = 2] = ∑ k 6=j pkjpik, para el caso n = k + 1 tenemos que: Pi[Tj = k + 1] = ∑ h6=j P [Xk+1 = j,Xk 6= j, ..., X2 6= j,X1 = h, |X0 = i] utilizando probabilidad condicional: Pi[Tj = k + 1] = ∑ h6=j P [Xk+1 = j,Xk 6= j, ..., X2 6= j, |X1 = h,X0 = i]P [X1 = h|X0 = i] utilizando la propiedad de Markov: Pi[Tj = k + 1] = ∑ h6=j Ph[Tj = k]pih. Conociendo Pi[Tj = k] podemos obtener otro método para calcular p n ij. Teorema 2. Sean i, j ∈ ε y n ≥ 1 entonces pnij = n∑ m=1 Pi[Tj = m]p n−m jj . (4.12) 4.1. CADENAS DE MARKOV EN TIEMPO DISCRETO 51 Demostración Primero notemos que los conjuntos {Xn = y, Ty = m} son ajenos para 1 ≤ m ≤ n. Sea {Xk}nk=1 ∈ {Xn = y, Ty = l} ∩ {Xn = y, Ty = h} tal que 1 ≤ h, l ≤ n y h 6= l , como {Xk}nk=1 ∈ {Xn = y, Ty = l} sabemos que para todo k ≤ l Xk 6= y y Xl = y, también como {Xk}nk=1 ∈ {Xn = y, Ty = h} sabemos que para todo k ≤ h Xk 6= y y Xh = y. Luego entonces h = l lo cual es una contradicción, ya que hab́ıamos supuesto que h 6= l. Por lo tanto {Xn = y, Ty = l} ∩ {Xn = y, Ty = h} = ∅. De aqúı podemos observar que {Xn = y} = ∪nm=1{Xn = y, Ty = m}. De esta descomposición, de {Xn = y} en conjuntos ajenos, utilizando los tiempos de paro observamos que: pnij = P [Xn = j|X0 = i] = n∑ m=1 P [Xn = j, Ty = m|X0 = i] = n∑ m=1 Pi[Tj = m]P [Xn = j|Tj = mX0 = i] = n∑ m=1 Pi[Tj = m]P [Xn = j|X0 = i,X1 6= j, ..., Xm−1 6= j,Xm = j] = n∑ m=1 Pi[Tj = m]P [Xn = j|Xm = j] = n∑ m=1 Pi[Tj = m]p n−m jj . Un estado i ∈ ε se dice que es absorbente si pii = 1. Teorema 3. Si a es un estado absorbente entonces pnia = Pi[Ta ≤ n]. Demostración Como a es un estado absorbente sabemos que pkaa = 1 para todo k ≥ 1, en particular sabemos que pn−maa = 1 para 1 ≤ m ≤ n, utilizando la fórmula 52 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV del teorema anterior tenemos que: pnia = n∑ m=1 Pi[Ta = m]p n−m aa = n∑ m=1 Pi[Ta = m] = Pi[Ta ≤ n]. 4.1.1. Cadena de nacimiento y muerte Consideremos una cadena de Markov con espacio de estados ε = {0, 1, 2, 3, ...} o ε = {0, 1, 2, 3, ..., d}, con función de transición: pij = qi si j = i− 1, ri si j = i, pi si j = i+ 1, 0 en otro caso, (4.13) donde qi, ri, pi son números no negativos tales que qi + ri + pi = 1 y q0 = 0. En caso de que el espacio de estados sea finito pd = 0. Se le conoce como cadena de nacimiento y muerte ya que sirve para modelar una población en la cual cuando tiene i habitantes con probabilidad qi se muere un individuo, con probabilidad pi nace un nuevo individuo y con probabilidad ri el número de habitantes se queda igual. Supondremos que pi, qi > 0 para 0 < i < d. Tomémonos a, b ∈ ε.Nuestro objetivo principal será calcular: u(i) = Pi[Ta < Tb] para a < i < b, (4.14) donde u(a) = 1 y u(b) = 0. Primero notemos que: u(k) = Pk[Ta < Tb] = P [Ta < Tb|X0 = k] = ∑ j∈ε P [Ta < Tb, X1 = j|X0 = k], 4.1. CADENAS DE MARKOV EN TIEMPO DISCRETO 53 por definición de probabilidad condicional tenemos: u(k) = ∑ j∈ε P [Ta < Tb|X1 = j,X0 = k]P [X1 = j|X0 = k], y por propiedad de Markov: u(k) = ∑ j∈ε P [Ta < Tb|X1 = j]P [X1 = j|X0 = k], por otro lado, sabemos que si nos encontramos en el estado k solamente existen probabilidades positivas de ir a k − 1, k y k + 1, entonces u(k) = k+1∑ j=k−1 P [Ta < Tb|X1 = j]P [X1 = j|X0 = k], = u(k − 1)qk + u(k)rk + u(k + 1)pk sustituimos rk = 1− pk − qk, u(k) = u(k − 1)qk + u(k)(1− pk − qk) + u(k + 1)pk ⇒ 0 = u(k − 1)qk − u(k)pk − u(k)qk + u(k + 1)pk ⇒ 0 = −pk(u(k)− u(k + 1)) + qk(u(k − 1)− u(k)) ⇒ pk(u(k)− u(k + 1)) = qk(u(k − 1)− u(k)) ⇒ (u(k + 1)− u(k)) = qk pk (u(k)− u(k − 1)) Definimos γ0 = 1 y γk = q1...qk p1...pk , 0 < k < d. Entonces (u(k + 1)− u(k)) = γk γk−1 (u(k)− u(k − 1)), 54 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV sustituyendo (u(k)− u(k − 1)) = γk−1 γk−2 (u(k − 1)− u(k − 2)) tenemos que: (u(k + 1)− u(k)) = γk γk−1 γk−1 γk−2 (u(k − 1)− u(k − 2)), . . . (u(k + 1)− u(k)) = γkγk−1...γa+1 γk−1γk−2...γa (u(a+ 1)− u(a)), ⇒ (u(k)− u(k + 1)) = γk γa (u(a)− u(a+ 1)). (4.15) Sumando la ecuación 4.13 en k = a, ..., b− 1, u(a)−u(a+1)+u(a+1)−u(a+2)...+u(b−2)−u(b) = γa γa (u(a)−u(a+1))+...+γb−1 γa (u(a)−u(a+1)) Utilizando el hecho de que u(a) = 1 y u(b) = 0, 1 = ∑b−1 k=a γk γa (u(a)− u(a+ 1)) ⇒ 1∑b−1 k=a γk = 1 γa (u(a)− u(a+ 1)) (4.16) despejando de la ecuación 4.13 el término 1 γa (u(a)−u(a+1)) y sustituyéndolo en 4.14, 1∑b−1 k=a γk = 1 γy (u(y)− u(y + 1)), ⇒ γk∑b−1 k=a γk = u(y)− u(y + 1). (4.17) Sumando la ecuación 4.15 en k = i, ..., b− 1 tenemos que:∑b−1 k=i γk∑b−1 k=a γk = u(i)− u(i+ 1) + ... + u(b− 1)− u(b), utilizando el hecho de que u(b) = 0, u(i) = ∑b−1 k=i γk∑b−1 k=a γk . 4.2. MODELO DE EPIDEMIA CON CMTD 55 Por lo tanto Pi[Ta < Tb] = ∑b−1 k=i γk∑b−1 k=a γk donde a < i < b. (4.18) Y también de 4.16 obtenemos que: Pi[Tb < Ta] = 1− Pi[Ta < Tb] = 1− ∑b−1 k=i γk∑b−1 k=a γk = ∑b−1 k=a γk − ∑b−1 k=i γk∑b−1 k=a γk = ∑i−1 k=a γk∑b−1 k=a γk . (4.19) 4.2. Modelo de epidemia con CMTD En esta sección desarrollaremos los modelos SI y SIS como cadenas de nacimiento y muerte, basándonos en su expresión como ecuaciones diferenciales. 4.2.1. Modelo SI La función de transición del modelo SI con cadenas de Markov la asociaremos con la función de transición de la cadena de nacimiento y muerte, suponiendo que cada nacimiento equivale a un nuevo infectado. En este modelo no habrá muertes ya que los infectados no pueden regresar al estado susceptible. Como se mencionó en el caṕıtulo 2, la ecuación diferencial que corresponde al modelo SI es: dI(t) dt = α(N − I(t))I(t), por consiguiente, al modelo SI con cadenas de Markov le asociaremos la función de transición: pij = P [Xt+∆t = j|Xt = i] = 1− α(N − i)i∆t si j = i, α(N − i)i∆t si j = i+ 1, 0 en otro caso, (4.20) 56 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV donde ∆t representa la unidad de tiempo y es lo suficientemente pequeño para que (βi(N − i))∆t < 1. 4.2.2. Modelo SIS La función de transición del modelo SIS con cadenas de Markov la asociaremos con la función de transición de la cadena de nacimiento y muerte, donde cada nacimiento significa que existe un nuevo infectado y cada muerte significa que un infectado regresa al estado susceptible. El modelo SIS está descrito por las siguientes ecuaciones diferenciales: dS dt = −βSI + γI, dI dt = βSI − γI, por consiguiente al modelo SIS con cadenas de Markov le asociaremos la función de transición: pij = P [Xt+∆t = j|Xt = i] = γi∆t si j = i− 1, 1− (βi(N − i) + γi)∆t si j = i, βi(N − i)∆t si j = i+ 1, 0 si j > i+ 1 o j < i− 1 (4.21) donde ∆t representa la unidad de tiempo y es lo suficientemente pequeño para que (βi(N − i) + γi)∆t < 1. Observándolo como cadena de nacimiento y muerte tenemos que que pi, qi > 0, entonces podemos calcular la probabilidad de que empezando con un infectado, se llegue primero al estado 0 (donde no existe ningun infectado) que al estado n(donde existen n individuos infectados), mediante la ecuación 4.18: P1[T0 < Tn] = ∑n−1 k=1 γk∑n−1 k=0 γk (4.22) 4.2. MODELO DE EPIDEMIA CON CMTD 57 Primero observemos que:∑n−1 k=1 γk∑n−1 k=0 γk = ∑n−1 k=1 γk + γ0 − γ0∑n−1 k=0 γk = ∑n−1 k=0 γk − γ0∑n−1 k=0 γk = 1− 1∑n−1 k=0 γk (4.23) Ahora calcularemos el valor de γi: γi = q1q2...qi p1p2...pi = γ1∆tγ2∆t...γ(i− 1)∆tγi∆t β1(N − 1)∆tβ2(N − 2)∆t...βi(N − i)∆t = (∆tγ)i1 ∗ 2 ∗ ...(i− 1) ∗ i (∆tβ)i1(N − 1)2(N − 2)...i(N − i) = (γ)i (β)i(N − 1)(N − 2)...(N − i) = (γ)i(N − (i− 1))! (β)i(N − 1)(N − 2)...(N − i)(N − (i− 1))! = (γ)i(N − (i− 1))! (β)i(N − 1)! Sustituyendo γi en 4.23: P1[T0 < Tn] = 1− 1∑n−1 k=0 γk = 1− 1∑n−1 k=0= (γ)k(N−(k−1))! (β)k(N−1)! = 1− (N − 1)!∑n−1 k=0 (γ)k(N−(k−1))! (β)k . (4.24) Y de este resultado también podemos obtener la probabilidad de que se 58 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV llegue primero al estado n antes de llegar al estado 0. P1[Tn< T0] = 1− P1[T0 < Tn] = 1− (1− (N − 1)!∑n−1 k=0 (γ)k(N−(k−1))! (β)k ) = (N − 1)!∑n−1 k=0 (γ)k(N−(k−1))! (β)k . (4.25) 4.3. Resultados Para el modelo SI las simulaciones se realizaron con el de población de N = 500, ∆t = 1 500 y con un solo individuo infectado al inicio. Los resultados presentados son el promedio de 10 simulaciones por cada valor del parámetro α. Se tomó un valor de N pequeño ya que los cálculos de los resultados que mostraremos a continuación se vuelven complicados de calcular para N grande, aunque las simulaciones se realizan de manera inmediata para cualquier N , ya que utilizaremos los resultados teóricos vistos en la sección anterior y muchos de ellos contienen la operación factorial. En la figura 4.1 se muestran gráficas que comparan el resultado de las simulaciones del modelo SI con cadenas de Markov, en tiempo discreto, y el modelo SI de ecuaciones diferenciales para distintos valores de α. Se puede observar que los promedios las simulaciones siguen un desarrollo muy similar al modelo de ecuaciones diferenciales. En lo único en que difieren es que en el modelo de cadenas de Markov en tiempo discreto todos los individuos quedan infectados en mayor tiempo que el modelo de ecuaciones diferenciales. También se computó utilizando el teorema 3, la ecuación 4.8 y un programa realizado en Java, la probabilidad de que el tiempo de paro de todos los individuos se encuentren en estado infectado sea menor o igual al tiempo en el que todos los individuos se encuentran infectados en el modelo SI de ecuaciones diferenciales calculado mediante la fórmula 2.1, el cual denominaremos como tiempo de convergencia. Los resultados obtenidos se muestran en el cuadro 4.1 . En la gráfica 4.2 se muestra la comparación de la esperanza del tiempo de paro al estado N y el tiempo de convergencia a N del modelo de ecuaciones diferenciales para distintos valores de α. En esta gráfica podemos apreciar cómo los valores son muy similares, pero los valores de la esperanza siempre son mayores a los valores del modelo de ecuaciones diferenciales. 4.3. RESULTADOS 59 Figura 4.1: Comparación de simulaciones (verde) y modelo de ecuaciones diferenciales (azul) para el modelo SI con α = 0.1, 0.3, 0.5. Para las simulaciones del modelo SIS con cadenas de Markov el tamaño de la población es de N = 100, ∆t = 1 100 , γ = 0.25 e i0 = 1. Los resultados presentados son el promedio de 10 simulaciones por cada varición de parámetro β. Al igual que en el modelo SI con cadenas de Markov se tomo un N muy pequeño debido a que los cálculos se dificultan para N grandes. En la figura 4.3 se muestran diversas simulaciones comparadas con el modelo SIS de ecuaciones diferenciales para distintos valores de α. En esta gráfica podemos observar que el modelo SIS de ecuaciones diferenciales y el modelo SIS con cadenas de Markov se estabilizan en el mismo lapso, también observamos que el modelo de cadenas de Markov se estabiliza alrededor del número al que converge el modelo de ecuaciones diferenciales. En la figura 4.4 se presentan también los resultados del calculó de la probabilidad de que la epidemia se extinga. En esta gráfica podemos observar que antes de β = 0.003 la P1[T0 <∞] ≈ 1, esto concuerda con el valor que se 60 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV Cuadro 4.1: Probabilidad de llegar al estado N antes del tiempo de convergencia α k=Tiempo de convergencia P1[TN ≤ k] .1 131 .8487 .2 65 .8488 .3 43 .8382 .4 32 .8271 .5 26 .8028 .6 21 .8029 .7 18 .8493 .8 16 .8276 .9 14 .8389 Figura 4.2: Comparación de la esperanza del tiempo de paro al estado N (azul) y tiempo de convergencia del modelo SI de ecuaciones diferenciales con � = 0.5 (rojo) necesita para que en el modelo de ecuaciones diferenciales exista una epidemia (βN − γ > 0), y en β = 0.0051 P1[T0 < ∞] ≈ 0.5 . Además se muestra la gráfica de la E1[T0]. Estos valores se aproximaron mediante un programa en Java y utilizando el teorema 3 y la ecuación 4.8. En la figura 4.5 se muestran dos gráficas, la primera nos muestra la P1[T0 < TN ], la probabilidad de que ningún individuo este infectado antes de que todos los individuos esten infectados, para distintos valores de α, dondeN es el estado correspondiente todos los individuos se quedan infectados, en esta gráfica podemos observar como para valores de β ≤ 0.005 la P [T0 < TN ] = 1. En la segunda gráfica P1[T0 < TC ] , la probabilidad de que ningún individuo 4.3. RESULTADOS 61 Figura 4.3: Comparación de simulaciones (verde) y modelo de ecuaciones diferenciales (rojo) para el modelo SIS con β = 0.004, 0.007, 0.009. este infectado antes de que C individuos esten infectados, donde C es el estado correspondiente al número de infectados al que converge el modelo SIS de ecuaciones diferenciales, al comparar estas dos gráficas podemos observar que las probabilidades de llegar al estado cero antes que al estado N son más altas que las probabilidades de llegar al estado cero antes que al estado C. Las simulaciones del modelo de epidemia para cadenas de Markov en tiempo discreto fueron desarrolladas mediante un programa que realizé en Java Version 6.0 y el código está a disposición de quien los solicite. Mis análisis permitieron vincular la teoŕıa de las cadenas de nacimiento y muerte con los modelos de epidemiológicos planteados por Allen [15], para aśı obtener resultados que son temas de interés en el tema de las epidemias. Todos los resultados presentados, sin tomar en cuenta la parte teórica, son aportaciones propias para los modelos de epidemia con cadenas de Markov a tiempo discreto. 62 CAPÍTULO 4. EPIDEMIA CON CADENAS DE MARKOV Figura 4.4: En la gráfica de la izquierda se muestra P1[T0 <∞] y en la gráfica de la izquierda se muestra E1[T0] Figura 4.5: En la gráfica de la izquierda se muestra P1[T0 < TN ] y en la gráfica de la derecha se muestra P1[T0 < TC ]. 4.4. Cadenas de Markov en tiempo continuo Consideremos un proceso estocástico en tiempo continuo {Xt}, t ≥ 0 y cque toma valores enteros no negativos. Al igual que en el caso discreto, una cadena de Markov en tiempo continuo es un proceso estocástico en el cual dado el presente, el pasado no influye en el futuro. Definición 7. Se dice que un proceso estocástico {Xt} t ≥ 0 es una cadena de Markov en tiempo continuo si para todo s, t ≥ 0 e i, j, x(u) ≥ 0 enteros no negativos con 0 ≤ u < s se cumple que: P [X(t+s) = j|X(s) = i, X(u) = x(u), 0 ≤ u < s] = P [X(t+s) = j|X(s) = i]. Definición 8. Se dice que una cadena de Markov en tiempo continuo es homogénea si para todo s, t ≥ 0 se cumple que: P [X(t+ s) = j|X(s) = i] = P [X(t) = j|X(0) = i]. En esta sección trabajaremos con cadenas de Markov homogéneas. 4.4. CADENAS DE MARKOV EN TIEMPO CONTINUO 63 Definamos la variable aleatoria Ti la cual denota la cantidad de tiempo en el que el proceso se queda en el estado i antes de moverse a otro estado. Suponiendo que el proceso empieza en X(0) = i notamos que: P [Ti > s+ t|Ti > s] = P [Ti > s+ t|X(k) = i 0 ≥ k ≥ s], utilizando la propiedad de Markov: P [Ti > s+ t|Ti > s] = P [Ti > s+ t|X(s) = i], como la cadena Markov es homogénea: P [Ti > s+ t|Ti > s] = P [Ti > t|X(0) = i] P [Ti > s+ t|Ti > s] = P [Ti > t] Esto nos indica que la variable aleatoria Ti tiene pérdida de memoria (P [Ti > s + t] = P [Ti > t]), la única variable aleatoria continua que tiene la propiedad de pérdida de memoria es la distribución exponencial. Por lo tanto Ti ∼ exp(λ). De este resultado obtenemos otra manera de definir a las cadenas de Markov continuas mediante Ti: Definición 9. Una cadena de Markov en tiempo continuo es un proceso estocástico cuyo tiempo de permanencia en un estado antes de hacer una transición a otro estado se distribuye exponencialmente con media 1 vi . Cuando el proceso abandona el estado i entra al estado j con probabilidad Pij. Estas probabilidades deben satisfacer lo siguiente: Pii = 0 y ∑ j Pij = 1, para todo i. (4.26) Esta definición nos permite ver
Compartir