Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
SEGUNDA PARTE: ESTADÍSTICA DESCRIPTIVA. 6. ESCALA CUALITATIVA La información recabada durante las investigaciones estadísticas proviene de observaciones individuales, y éstas casi siempre han de ser resumidas de alguna manera antes de que se les pueda utilizar. Resumir datos cualitativos es relativamente simple. Sólo hay que contar el número de observaciones según cada característica o combinación de éstas, y representarlas como proporciones o razones. Los datos cuantitativos también pueden resumirse mediante este procedimiento, siempre y cuando se agrupen los valores de la variable en dos o más categorías. PROPORCIONES Para calcular una proporción se divide la frecuencia absoluta de la categoría que se está analizando entre el total de individuos identificados con la variable de estudio. Lo anterior se representa mediante la fórmula: ( ) /p a a b a N= ÷ + = (6,1) Donde p representa la proporción, a es el número de elementos con la característica de interés y b el número de elementos sin la característica de interés. Hay que notar que a + b es el total del universo (N). Ejemplo explicativo 6-1 ---------------------------------------------------------------------------------- Considérese la serie del cuadro 6-1, en la cual se presentan algunas características de 20 niños de 1 a 4 años que fallecieron ahogados en su hogar en la Zona Metropolitana de Guadalajara. Esta serie de datos puede resumirse, mediante el uso de proporciones, tal como se muestra en el cuadro 6-2. Cuadro 6-1. Características de 20 niños, de 1 a 4 años de edad, ahogados en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. i Sexo Depósito i Sexo Depósito 1 Masculino Aljibe 11 Femenino Aljibe 2 Masculino Balde/tina 12 Masculino Olla 3 Masculino Olla 13 Masculino Pozo de agua 4 Femenino Aljibe 14 Masculino Otro 5 Femenino Balde/tina 15 Masculino Aljibe 6 Masculino Aljibe 16 Masculino Aljibe 7 Masculino Pozo de agua 17 Masculino Balde/tina 8 Masculino Aljibe 18 Femenino Aljibe 9 Femenino Aljibe 19 Masculino Otro 10 Masculino Otro 20 Masculino Otro Con formato: Normal Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Cuadro 6-2. Características 20 niños, de niños de 1 a 4 años de edad, ahogados en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. Variable Frecuencia Proporción Sexo Masculino 15 15 ÷ 20 = 0.75 Femenino 5 5 ÷ 20 = 0.25 Depósito Aljibe 9 9 ÷ 20 = 0.45 Balde/tina 3 3 ÷ 20 = 0.15 Olla 2 2 ÷ 20 = 0.10 Pozo de agua 2 2 ÷ 20 = 0.10 Otro 4 4 ÷ 20 = 0.20 ------------------------------------------------------------------------------------------------------------------ La interpretación de las proporciones puede ser un poco confusa para el principiante. Por ello, se acostumbra multiplicarlas por 100 para expresarlas como porcentaje, y se especifican mediante el símbolo “%”. Así, para calcular un porcentaje basta dividir el número de individuos en cada categoría entre el total del grupo y multiplicar el resultado por 100. En el Ejemplo explicativo 6-1 los porcentajes serían: 0.75 × 100 = 75% varones, 0.25 × 100 = 25% mujeres, 0.45 × 100 = 45% ahogados en aljibes, 0.15 × 100 = 15% en baldes/tinas, 0.10 × 100 = 10% en ollas, 0.10 × 100 = 10% en pozos de agua, y 0.20 × 100 = 20% en otros depósitos de agua. El uso de proporciones tiene varias ventajas. En primer lugar, permiten comparar con facilidad dos o más series cuyos totales son diferentes, pues éstos quedan convenientemente reducidos a la unidad (o a 100 en el caso de porcentajes). En segundo lugar, a través de las proporciones se puede asumir la probabilidad de que un evento ocurra. En el ejemplo anterior, existe una probabilidad de 0.75 (o 75%) de que el sexo de un niño ahogado en el hogar sea masculino. Cómo hacerlo en Epi Info, 6-1. ------------------------------------------------------------------------- Llame el programa Epi Info 7 y haga click en la opción “Classic” de “Analyze Data” (figura 6-1). Figura 6-1. Menú de Epi Info 7. Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Normal sangría, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Fuente: +Cuerpo (Calibri), Sin subrayado, Color de fuente: Automático Con formato: Fuente: +Cuerpo (Calibri), Sin subrayado, Color de fuente: Automático Con formato: Fuente: +Cuerpo (Calibri), Sin subrayado, Color de fuente: Automático Con formato: Ejemplo Cuando se muestre la ventana de “Analysis” haga click en “Read” (el comando lo podrá encontrar en el extremo superior de las opciones de comando). El programa le mostrará la ventana de “Read”. En ella, primero haga click en la opción “Data Type” y seleccione la opción “Microsoft Access 2002-2003 (.mbd)” * . Luego haga click en “Data Source” y busque en el disco de datos que acompaña al libro el archivo “Bioestadistica_3ra.MDB” (en la imagen de este ejemplo la carpeta donde se encuentra el archivo es “I:\Cursos\Bioestadistica\Libro 3ra Edicion\bases\”, y esto seguramente será diferente dependiendo de la unidad de memoria y la carpeta en que guarde el archivo); Cuando lo encuentre selecciónelo. A continuación haga click en “Bio3_06a”. En ese momento la ventana “Read” se mostrará tal como se aprecia en la figura 6-2. Continúe haciendo click en el botón “OK”. Figura 6-2. Pantalla de “Analysis” mostrando la ventana de “Read” con las selecciones “Microsoft Access 2002-2003 (.mbd)”, “Bioestadistica_3ra.MDB” y “Bio3_06a”. Notará que en el cuadro de “Epi Info” se apreciará el texto que se muestra en la figura 6-3. * Para los ejemplos de Epi Info 7 de esta edición hemos preferido utilizar el formato de datos de Epi Info 2000 de tal manera que los datos puedan ser leídos tanto en la versión 7 de Epi Info como en la anterior de Epi Info 2000 para Windows. Figura 6-3. Mensaje que se muestra en la ventana después de llamar los datos en “Analysis” de Epi Info 7. Para obtener las frecuencias y los porcentajes correspondientes de una variable haga click en “Frequencies” (el comando lo podrá encontrar en la mitad de la pantalla en la lista de comandos), en el apartado “Statistics”]. En la ventana de diálogo que se despliega seleccione “DEPOSITO” en la opción “Frequency of”. En ese momento la ventana deberá observarse como en la Figura 6-4. Figura 6-4. Ventana de diálogo para la frecuencia de DEPOSITO según la tabla de datos 06a$. Al hacer click con el ratón en “OK” podrá observar en la ventana de resultados (Figura 6-5) los siguientes elementos: 1. Categorías de la variable DEPOSITO. 2. Frecuencias absolutas de las categorías listadas. 3. Porcentaje de cada categoría en relación al total. 4. Porcentajes acumulados. 5. Gráfica de barras horizontales. 6. Intervalos de confianza del 95% para los porcentajes de la frecuencia de cada categoría. Este tema será tratado más adelante, el en Capítulo 16. Figura 6-5. Frecuencias de las categorías de la variable DEPOSITO, según la tabla de datos 06a$. ------------------------------------------------------------------------------------------------------------------ Uso de las proporciones en Epidemiología Las proporciones son muy utilizadas en la práctica de la epidemiología, de tal manera que algunos usos específicos de estas tienen nombres propios,como es el caso de la prevalencia, la incidencia acumulada, la sensibilidad y la especificidad. Estas la describiremos más adelante, pero antes de hacerlo es necesario que aclaremos algunos elementos del proceso salud-enfermedad que se toman en cuenta para la estimación de la frecuencia de la enfermedad. La frecuencia de la enfermedad en bioestadística Típicamente la enfermedad es considerada un estado adverso de salud que caracteriza a un individuo durante un periodo. Ejemplos de enfermedad son: demencia, tuberculosis, alcoholismo, infección de vías urinarias, Diabetes Mellitus, etc. En la figura 6-6 esto se presenta de manera gráfica. Inicia la enfermedad (Evento) Duración de la enfermedad (Estado) Figura 6-6. Secuencia salud-enfermedad-salud en un sujeto. Aunque por lo general se piensa en la enfermedad como un estado, también es posible concebirla como un evento. El inicio de un estado de enfermedad es un evento que ocurre en un punto específico del tiempo. Tal es el caso del cambio de sujeto sano a enfermo de Diabetes Mellitus, hipertensión arterial, cáncer de cérvix, etc. Prevalencia La prevalencia cuantifica la proporción de individuos en la población que tienen algún estado de enfermedad en un instante específico del tiempo, y proporciona una estimación de la probabilidad de que un individuo se encuentre enfermo en algún punto del tiempo. La fórmula para calcular la prevalencia (p) es: número de casos con la enfermedad en un punto específico del tiempo P total de la población en el mismo grupo y punto específico de tiempo = (6,2) Este “punto” puede referirse a un día específico en el calendario, a la edad del sujeto estudiado o a un momento en el curso del tiempo a partir de un evento. Para facilitar la lectura del cociente anterior, se acostumbra multiplicar el resultado por una constante que puede ser 100, 1 000, 10 000 u otra cantidad, con la finalidad de no utilizar fracciones pequeñas al expresar prevalencias. Ejemplo explicativo 6-2 ---------------------------------------------------------------------------------- Con frecuencia, los servicios de medicina familiar están interesados en conocer la prevalencia de pacientes enfermos de diabetes en la comunidad donde brindan el servicio médico. Para obtener esa información, el epidemiólogo ordena a su equipo que visite y registre toda la población que cubre su unidad. Como resultado de su investigación encuentra que en una población de 4 550 habitantes se identificaron 228 sujetos diabéticos. Así, la prevalencia de diabetes en esa población es de 228/4 550 = 0.05, o 5.0/100 habitantes. ------------------------------------------------------------------------------------------------------------------ Eliminado: ¶ Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Código de campo cambiado Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Título 5, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Incidencia acumulada En contraste con la prevalencia, la incidencia cuantifica el número de eventos de enfermedad que se desarrollan en la población de individuos en riesgo durante un intervalo específico de tiempo. La incidencia acumulada (IA) es la proporción de personas que adquieren la enfermedad durante un periodo específico, y se calcula como: número de casos nuevos de enfermedad durante un período de tiempo IA total de la población en riesgo al inicio del período de estudio = (6,3) Esta medida de frecuencia proporciona un estimado de la probabilidad de que un individuo tomado al azar en una población en riesgo (susceptible) desarrolle la enfermedad durante un periodo específico. A esta probabilidad también se le conoce como riesgo. El periodo de observación es arbitrario y depende de las características evolutivas de la enfermedad. Al igual que con la prevalencia, la IA puede multiplicarse por una constante para facilitar su lectura e interpretación. Antes de continuar es necesario señalar que una persona se encuentra “en riesgo” de una enfermedad cuando es biológicamente posible que desarrolle la enfermedad en un futuro inmediato. “En riesgo” significa que el sujeto es susceptible a la enfermedad. En otras palabras, que la probabilidad de que desarrolle una enfermedad no es igual a cero. En términos epidemiológicos, “en riesgo” no significa “en mayor riesgo” en relación con otra persona. Razones frecuentes de que alguien no se encuentre en riesgo son: • La persona tiene la enfermedad. Alguien que sufra de Diabetes Mellitus no se encuentra en riesgo de desarrollarla nuevamente. • La persona ha adquirido inmunidad. Un niño que ya enfermó de sarampión no lo padecerá de nuevo. • La persona no tiene la capacidad biológica de desarrollar la enfermedad. Los varones nunca sufrirán cáncer uterino. • Durante algún tiempo de vida la persona fue susceptible de desarrollar la enfermedad, pero ésta fue abolida por algún procedimiento particular. La mujer a la que se le ha practicado histerectomía no puede desarrollar cáncer uterino. Ejemplo explicativo 6-3 ---------------------------------------------------------------------------------- Si se toma una cohorte de 12 sujetos y se le observa durante cinco años (sin que sus elementos se pierdan para el estudio y sin que dejen de estar en riesgo durante el periodo del estudio) y de ellos cinco desarrollan la enfermedad, entonces la IA será 5/12 = 0.42 en cinco años. En otras palabras, si se toma un individuo de los observados al inicio del estudio, la probabilidad de que en el transcurso de cinco años desarrolle la enfermedad es de 0.42, o 42/100. ------------------------------------------------------------------------------------------------------------------ La prevalencia y la incidencia son dos aspectos de un mismo fenómeno. Para entenderlas hay que poner atención a la figura 6-7, en la cual se representa a 13 sujetos en observación durante cinco años. Al inicio del estudio todos los sujetos se encuentran sanos y todos ellos tienen el riesgo (son susceptibles) de contraer la enfermedad. Se debe convenir que en esa figura la cruz representa el inicio de la Con formato: Título 5, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Normal sangría, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Nor 1, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Conformato: Fuente: (Predeterminado) +Cuerpo (Calibri), Español (España - alfab. tradicional) Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números enfermedad, o “evento”; que la línea gruesa representa el tiempo durante el cual el sujeto está enfermo, o “estado”; y el cuadro representa el momento en que el sujeto sale del estudio porque muere. Si se hace un corte después de un año de observación se encuentra que en ese “punto específico de tiempo” existen dos enfermos entre los 13 sujetos observados. Así, la prevalencia es igual a 2/13 = 0.15, mientras que la incidencia acumulada desde el inicio del estudio es 2/13 = 0.15 en un año. En este caso, la prevalencia y la incidencia son semejantes, pero no siempre tiene que ser así, ya que para el cuarto año han fallecido cuatro sujetos y sólo quedan nueve, de los cuales tres están enfermos. Por tanto, la prevalencia es de 3/9 = 0.33, mientras que la incidencia acumulada es de 7/13 = 0.54 en cuatro años. 1 3 5 7 9 11 13 0 1 2 3 4 5 sujeto sano en observación inicia la enfermedad sujeto enfermo en observación defunción Tiempo de observación del grupo Sujeto ( )i Figura 6-7. Eventos y estados de enfermedad en un grupo de sujetos. Sensibilidad y especificidad La sensibilidad y la especificidad son dos proporciones que nos permiten medir la validez de un instrumento de medición en relación a un criterio de clasificación, y se definen de la siguiente manera: • Sensibilidad.- Es la probabilidad de clasificar correctamente a aquellos que tienen la característica de interés. • Especificidad.- Es la probabilidad de clasificar correctamente a aquellos que no tienen la característica de interés. Para su cálculo procedemos de la siguiente manera: Código de campo cambiado Con formato: Título 5, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números 1. Mediante un procedimiento de clasificación “perfecto” (generalmente conocido como “gold standard” o “estándar de oro”) los sujetos son clasificados según presenten la característica o no la presenten (en términos clínicos, generalmente se clasifican como enfermos y no enfermos). 2. Luego, estos mismos sujetos con clasificados mediante un instrumentos menos perfecto (aunque más sencillo, económico o menos invasivo) en dos grupos según presenten la característica o no la presenten (en términos clínicos, generalmente se clasifican como “positivos” o “negativos” a la prueba). Uno esperaría que todos aquellos que tienen la característica (según se medió con el “estándar de oro”) resulten “positivos”, y que aquellos que no tienen la característica (según se midió con el “estándar de oro”) resulten “negativos” 3. Dado que el segundo criterio de clasificación es imperfecto, algunos sujetos que realmente presentan la característica (según el “estándar de oro”) serán clasificados incorrectamente como que no la tienen (o “negativos”), mientras que algunos que realmente no presentan la característica (según el “estándar de oro”) serán clasificados incorrectamente como que sí la tienen (o “positivos”). 4. Para el cálculo de la sensibilidad y la especificidad, generalmente, acomodamos los datos según el cuadro 6-3. Clasificación con el “estándar de oro” Prueba alternativa Presente Ausente Positivo a b Ausente c d a + c b + d Cuadro 6-3. Arreglo de datos para el cálculo de sensibilidad y especificidad. 5. Concluimos nuestro cálculo con las dos fórmulas que se muestran a continuación. Sensibilidad = + a a c Especificidad = + d b d Es necesario notar que cuando la sensibilidad es perfecta, el 100% de los que fueron clasificados con la característica mediante el “estándar de oro” también son clasificados mediante el segundo criterio de clasificación. Cuando eso no ocurre la sensibilidad es menor al 100%. Lo mismo ocurre con la especificidad para los que fueron clasificados por el “estándar de oro” sin la característica. Ejemplo explicativo 6-4 ---------------------------------------------------------------------------------- Supongamos que tenemos interés en evaluar la validez de una prueba diagnóstica que es más rápida y económica que el “estándar de oro”. Para hacerlo seleccionamos dos grupos: uno de enfermos u otro de no enfermos: ambos clasificados mediante el uso del “estándar de oro”. Las frecuencias cada categoría se muestran en el cuadro 6-4. Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Cuadro 6-4. Arreglo de datos ficticios para el cálculo de sensibilidad y especificidad. Clasificación con el “estándar de oro” Prueba alternativa Enfermo Sano Positivo 85 10 Negativo 15 190 100 200 Para los datos que se muestran en el cuadro 6-2, la sensibilidad de la prueba alternativa sería 85/100 = 0.85, o 85%, y la especificidad de la prueba alternativa sería de 190/200 = 0.95, o 95%. ------------------------------------------------------------------------------- RAZONES Cuando la serie que se está examinando consta sólo de dos categorías, o el interés de la investigación se dirige únicamente a dos categorías, se pueden utilizar las razones para resumir la información. Para ello, se divide la totalidad de individuos que tengan una característica (de preferencia el grupo de mayor tamaño) entre el grupo que tenga la otra característica. De esta manera, y a diferencia de las proporciones, las lecturas del numerador no se incluyen en el denominador. Su fórmula es: R a b= ÷ (6,4) En la que R representa la razón, a simboliza el número de elementos con la característica de interés y b el número de elementos con una característica diferente. Hay que notar que a + b no necesariamente son el total del universo. Ejemplo explicativo 6-5. --------------------------------------------------------------------------------- Continuando con el Ejemplo explicativo 6-1, la serie de datos puede resumirse, mediante el uso de razones, de la siguiente manera: 1. Según el sexo del niño (cuadro 6-2), por cada niña que se asfixia por inmersión en el hogar hay tres niños que sufren ese accidente mortal. En este ejemplo a = 15, b = 5 y a ÷ b = 3 es la razón. Cuadro 6-5. Sexo de niños de 1 a 4 años de edad ahogados en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. Sexo Frecuencia Razón Masculino 15 15 ÷ 5 = 3 Femenino 5 2. Según el depósito en que se ahogó (cuadro 6-6), por cada menor que se asfixia por inmersión en un balde o tina, hay tres que pierden la vida en un aljibe. En este ejemplo, a = 9, b = 3, a ÷ b = 3 es la razón. Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Fuente: (Predeterminado) +Cuerpo (Calibri), Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (España - alfab. tradicional) Con formato: Fuente: (Predeterminado) +Cuerpo (Calibri), Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (España - alfab. tradicional) Con formato: Fuente: (Predeterminado) +Cuerpo (Calibri), Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (España - alfab. tradicional)Con formato: Fuente: (Predeterminado) +Cuerpo (Calibri), Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (España - alfab. tradicional) Con formato: Fuente: (Predeterminado) +Cuerpo (Calibri), 12 pto, Sin subrayado, Color de fuente: Automático, Español (España - alfab. tradicional) Cuadro 6-6. Depósito de agua en que niños de 1 a 4 años de edad se ahogaron en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. Depósito Frecuencia Razón Aljibe 9 9 ÷ 3 = 3 Balde/tina 3 ------------------------------------------------------------------------------------------------------------------ Densidad de incidencia Para el cálculo de una razón no siempre se utiliza información de dos grupos diferentes. También podemos utilizar en el numerador y el denominador información procedente de un mismo grupo, pero de diferente naturaleza. Tal es el caso de la densidad de incidencia (DI) en la que el numerador es semejante a la incidencia acumulada pero el denominador es la suma del tiempo que cada individuo ha permanecido en observación (“tiempo persona”) y en riesgo de enfermar. Su fórmula está dada por número de casos nuevos de enfermedad durante un período de tiempo DI= total de tiempo-persona de observación (6,5) Al presentar la densidad de incidencia es esencial que se especifique la unidad de tiempo; esto es, si la tasa representa el número de casos por día-persona, mes- persona, año-persona, o alguna otra medida de tiempo-persona. La densidad de incidencia nos habla del cambio potencial instantáneo del estado de enfermedad de una población en una unidad de tiempo. A diferencia de la incidencia acumulada que es una proporción y puede interpretarse como una probabilidad, la densidad de incidencia dirige su atención al número de eventos que se presentan en una unidad de tiempo (y de manera inversa al tiempo que transcurre entre evento y evento). Esto se gráfica en la Figura 6-8, donde el tiempo persona en riesgo se refiere al tiempo acumulado que tuvieron que acumular los sujetos en estudio para registrar los eventos de interés. 1 3 5 7 9 11 13 0 1 2 3 4 5 Tiempo de observación del grupo Sujeto ( )i Tiempo persona en riesgo Con formato: Ejem. normal Con formato: Fuente: (Predeterminado) +Cuerpo (Calibri), 12 pto, Español (España - alfab. tradicional) Con formato: Fuente: +Cuerpo (Calibri), Negrita, Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (alfab. internacional) Con formato: Fuente: +Cuerpo (Calibri), Negrita, Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (alfab. internacional) Con formato: Fuente: +Cuerpo (Calibri), Negrita, Sin Cursiva, Sin subrayado, Color de fuente: Automático, Español (alfab. internacional) Con formato: Normal sangría Código de campo cambiado Figura 6-8. Tiempo persona de observación correspondiente a población en riesgo. Ejemplo explicativo 6-6. ---------------------------------------------------------------------------------- En una unidad de terapia intensiva están interesados en conocer la incidencia de muertes en pacientes que ingresan con infarto de miocardio. Después de 10 días se han registrado los datos del cuadro 6-7. Cuadro 6-7. Pacientes con infarto de miocardio observados en terapia intensiva Paciente i Tiempo de observación en días a partir del ingreso hasta la alta de terapia intensiva Motivo de egreso 1 9 defunción 2 5 mejoría 3 3 mejoría 4 3 defunción 5 1 defunción Con los datos anteriores no es posible calcular una incidencia acumulada, ya que los periodos de observación no son los mismos en todos los sujetos, pero se puede calcular una densidad de incidencia. Para ello, se toma el total de eventos de interés observados (tres defunciones) y se les divide entre el tiempo-persona observado durante el cual se presentaron esos eventos (21 días-persona). Así, la densidad de incidencia es 3 ÷ 21 = 0.143 días-persona –1 , o 0.143 defunciones por cada día de estancia acumulada por el grupo. ---------------------------------------------------------------------- LA COMPARACIÓN DE GRUPOS Con frecuencia, en el campo de las ciencias de la salud se tiene la necesidad de comparar grupos entre sí. Cuando el tamaño de los grupos a comparar es idéntico es posible valerse de frecuencias absolutas. Sin embargo, lo más frecuente es que los grupos sean diferentes en cuanto al tamaño del grupo en estudio. En estas ocasiones el uso de frecuencias relativas (proporciones o razones) facilita la comparación mediante una simple sustracción. Es preciso notar que cuando las frecuencias relativas (proporciones o razones) de dos grupos son iguales, la diferencia es de cero, mientras que cuando son diferentes el resultado es mayor o menor que cero. Ejemplo explicativo 6-7. --------------------------------------------------------------------------------- Supóngase que se sospecha y existe interés en probar la hipótesis de que en una escuela secundaria los alumnos varones se lesionan más frecuentemente que sus compañeras. Para ello, se observa a los estudiantes durante un año escolar y al final de él se encuentra que el número de lesionados es semejante para ambos grupos: 15 lesionados en el transcurso del año. Estas frecuencias absolutas son de valor, pero pueden conducir a errores graves de interpretación; por ejemplo, si de 300 alumnos que estudian en el plantel sólo 100 fueran varones. En este caso, el uso de una proporción permitirá evaluar la frecuencia con que se presentan las lesiones según el sexo. De esta manera, la incidencia de lesionados en el grupo de varones es de 15/100 = 0.15, mientras que para las mujeres tan sólo es de 15/200 = 0.08, por lo que Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejem. normal, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Fuente: +Cuerpo (Calibri), 12 pto, Sin subrayado, Color de fuente: Automático, Español (España - alfab. tradicional), Superíndice Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números la diferencia sería de 0.15 - 0.08 = 0.07. Lo anterior indicaría que en esa escuela los varones se accidentan más que las mujeres. -------------------------------------------------------- Riesgo Atribuible En epidemiología a esta diferencia se le conoce como riesgo atribuible (RA), y proporciona información acerca del efecto absoluto de la exposición o exceso de riesgo de la característica de interés en aquellos que pertenecen a un grupo con una característica específica (expuestos) en comparación con aquellos que no la tienen (no expuestos). Ayuda a responder a la pregunta: (si se ha inferido que la exposición causa la enfermedad) entre las personas expuestas, ¿qué cantidad de la característica de interés (quizá una enfermedad) se debe a la exposición? Esta medida se define como la diferencia entre la incidencia de los expuestos y los no expuestos, y se calcula mediante: e o I I− (6,6) Donde Ie es la incidencia de expuestos (medida como incidencia acumulada o como densidad de incidencia), mientras que Io es la incidencia de no expuestos (medida también como incidencia acumulada o como densidad de incidencia). Dos prevalencias también pueden compararse mediante la sustracción, aunque el resultado se conoce como diferencia de prevalenciasy no como riesgo atribuible. Riesgo Relativo La razón también es un instrumento útil para comparar dos grupos. Para su interpretación se debe tomar en cuenta el grupo a comparar (el numerador) en referencia con el grupo de comparación (el denominador). Cuando ambos grupos son iguales, el resultado siempre es igual a uno. Así, 9 ÷ 9 = 3 ÷ 3 = 1 indica que el grupo a comparar es igual al grupo de comparación o referencia. En otras palabras, por cada elemento en el grupo a comparar existe otro en el grupo de comparación. Cuando el numerador es mayor que el denominador, como en 9 ÷ 3 = 3, el resultado siempre será mayor a 1. Si éste es el caso, el resultado indica cuántos elementos (y fracción de ellos) en el grupo a comparar existen por cada elemento en el grupo de referencia. Por otra parte, si el numerador es menor que el denominador, 3 ÷ 9 = 0.33, el resultado expresa qué fracción de un elemento, en el grupo a comparar, existe por cada elemento en el grupo de comparación. En epidemiología a este cociente se le conoce como riesgo relativo (RR), y estima la magnitud de una asociación entre exposición y enfermedad e indica la probabilidad del grupo expuesto de desarrollar la enfermedad en relación con aquellos que no están expuestos. Ayuda a responder a la pregunta: ¿la exposición causa la enfermedad? Esta medida se define como el cociente de la incidencia de los expuestos entre la incidencia los no expuestos, y se calcula mediante: e o I I (6,7) En la cual Ie es la incidencia de expuestos (medida como incidencia acumulada o como densidad de incidencia) e Io es la incidencia de no expuestos (medida también como incidencia acumulada o como densidad de incidencia). Dos prevalencias también Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Título 4, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Normal pueden compararse mediante una razón, aunque el resultado se conoce como razón de prevalencias y no como riesgo relativo. Una interpretación alternativa del riesgo relativo consiste en restar 1 al resultado (cociente) y multiplicarlo por 100. De esta manera, el resultado se interpreta como el porcentaje que el grupo a comparar se encuentra por arriba o por abajo en relación con el grupo de referencia. Cuando los grupos son idénticos, el resultado es igual a 0% [(1 - 1) × 100 = 0%]. Si el numerador es mayor que el denominador, el resultado es superior a 0% [(3 – 1) × 100 = 200%], mientras que lo contrario resulta en un valor negativo [(0.33 – 1) × 100 = –67%]. Si se toma al grupo de comparación como 100%, el resultado mediante el procedimiento anterior indica, de manera porcentual, en qué magnitud porcentual el grupo a comparar se encuentra por arriba o por abajo del grupo de referencia. Ejemplo explicativo 6-8. ---------------------------------------------------------------------------------- La comparación de grupos que realizamos mediante la diferencia de proporciones en el Ejemplo explicativo 6-7 también puede efectuarse mediante una razón entre proporciones, donde 0.15 ÷ 0.08 = 1.88 nos indica que existen 1.88 hombres lesionados por cada mujer lesionada, o también que existen 88% más hombres lesionados que mujeres lesionadas. ------------------------------------------------------------------- Tablas de contingencia Las tablas de contingencia son arreglos ordenados de frecuencias que se acomodan en celdas definidas por columnas y renglones. Las frecuencias presentadas de esta manera facilitan algunos procedimientos estadísticos utilizados frecuentemente, como son el cálculo de riesgo atribuible, riesgo relativo, chi-cuadrada y prueba exacta de Fisher, por mencionar cuatro de los más frecuentes. La tabla de contingencia más utilizada es la conocida como 2 x 2, que consiste en una tabla con dos hileras y dos columnas donde los sujetos se clasifican según dos criterios, cada uno de los cuales ocurre en dos niveles. Una tabla de este tipo se presenta en el Cuadro 6-8. Cuadro 6-8. Tabla de contingencia 2 x 2. Criterio de efecto Si No Total Criterio de Si a b a + b exposición No c d c + d Total a + c b + d a + b + c + d Ejemplo explicativo 6-9. --------------------------------------------------------------------------------- Las frecuencias del Ejemplo explicativo 6-7 pueden presentarse en una tabla de contingencia 2 x 2. El cuadro 6-9 nos muestra los datos en una tabla de este tipo. Cuadro 6-9. Frecuencias observadas según el ejercicio explicativo 6-7. Lesionados Si No Total Hombres 15 85 100 Mujeres 15 185 200 Con formato: Normal sangría, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Título 4 Con formato: Normal sangría Con formato: Ejemplo Total 30 300 300 A partir de este arreglo, la incidencia de lesiones en hombres se puede calcular mediante a/(a+b) = 15/100, mientras que la incidencia de lesiones en mujeres sería igual c/(c+d) = 15/200. ----------------------------------------------------------------------------------- Odds Ratio El riesgo relativo supone que el muestreo en la población ha sido realizado de manera aleatoria, y que posteriormente los sujetos han sido clasificados según dos variables dicotómicas (diseño transversal analítico), o bien que los grupos muestreados han sido formados atendiendo a su nivel de exposición (diseño de cohortes). En Epidemiología es frecuente que los grupos a comparar sean formados a partir de la condición de enfermedad que se desea estudiar (diseño de casos y controles). En estas circunstancias, no es factible estimar el riesgo relativo de manera directa (para una explicación más completa consulte algún libro de Epidemiología). No obstante, cuando se puede mantener el supuesto de que la frecuencia de la enfermedad que se estudia está por debajo del 10%, se puede utilizar una aproximación al riesgo relativo conocida como odds ratio. Cuando las frecuencias al comparar dos grupos se presentan en un cuadro 2 x 2 semejante al mostrado en el cuadro 6-8 el odds ratio se puede calcular utilizando la fórmula siguiente: Odds ratio ad bc ϕ= = (6,8) Ejemplo explicativo 6-10. -------------------------------------------------------------------------------- Al utilizar las frecuencias que se presentan en el cuadro 6-9 el odds ratio será igual a 15 x 185/15 x 85 = 2 775 x 1 275 = 2.18, que nos sugiere que existen 2.18 hombres lesionados por cada mujer lesionada. El resultado no es igual al calculado con el riesgo relativo en el Ejemplo explicativo 6-8 (de 1.88), pero es una buena aproximación cuando el diseño de muestreo no nos permite calcularlo, y los dos resultados se aproximarán en la medida en que el fenómeno estudiado sea más raro. ------------------- La expresión odds ratio ha sido traducida al español de diferentes formas entre las que se pueden mencionar “razón de productos cruzados”, “razón de momios”, “oportunidad relativa” y “razón de posibilidades” sin que se hubiera llegado a definir un consenso. Cómo hacerlo en Epi Info, 6-2. ------------------------------------------------------------------------- Epi Info 7 brinda varias alternativas para comparar dos grupos mediante Riesgos relativos, Riegos atribuibles y Odds Ratio. 1. Cuando estamos interesados en una variable independiente o factor de riesgo y una variable dependiente, ambas dicotómicas (tabla 2 x 2), utilizamos la orden Tables” tal como se muestra a continuación. En Epi Info 7 abra el archivo Bioestadistica_3ra y seleccione la tabla Bio3_06b † . Después de seleccionar la† Si tiene dificultad para encontrar la tabla de datos Bio3_06b revise la sección “Cómo hacerlo en Epi Info, 6-1” en este mismo capítulo. Con formato: Fuente: +Cuerpo (Calibri), Negrita, Sin subrayado, Color de fuente: Automático Con formato: Fuente: +Cuerpo (Calibri), Negrita, Sin subrayado, Color de fuente: Automático Código de campo cambiado Con formato: Normal tabla de datos haga click en “OK”. Para continuar haga click en “Tables”, en el apartado “Statistics” de la lista de comandos. En la ventana de diálogo que se despliega seleccione “H_ARTER” en “Exposure Variable” y “BAJO_PES” en “Outcome Variable”. En ese momento la ventana deberá observarse como en la Figura 6-7. Figura 6-7. Ventana de diálogo para la taba de Hipertensión Arterial (H_ARTERIAL) y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_06b Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la ventana de resultados (Figura 6-8). 1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila (Row%) y columna (Col%). 2. Un gráfico que muestra visualmente el peso que cada celda tiene en la tabla 2 x 2. 3. Odds Ratio, según dos procedimientos, y sus intervalos de confianza (el tema de los intervalos de confianza para estimaciones con variables cualitativas será tratado más adelante, en el Capítulo 16. 4. Razón de Riesgos, o Riego Relativo (Risk Ratio), y sus intervalos de confianza. 5. Diferencia de Riegos (Risk Difference), o Riego Atribuible, y sus intervalos de confianza. 6. Test estadísticos de Chi cuadrado (tema que será tratado en el Capítulo 15) 7. Cálculos de probabilidad mediante la aproximación a la distribución de la binomial y la Prueba Exacta de Fisher. Figura 6-8. Frecuencias para la taba de Hipertensión Arterial (H_ARTERIAL) y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b 2. Cuando estamos interesados en una variable independiente o factor de riesgo con más de dos categorías y una variable dependiente dicotómica (tabla r x 2) también utilizamos la orden “Tables”, pero los resultados que se muestran son un poco diferentes a los de una tabla 2 x 2 tal como se muestra a continuación. Utilizando la tabla Bio3_06b, haga click en “Tablas” [“Tables”]. En la ventana de diálogo “TABAQUISMO” en “Exposure Variable” y “BAJO_PESO” en “Outcome Variable”. Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la ventana de resultados (Figura 6-9). 1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila (Row%) y columna (Col%). 2. No se muestra gráfico. 3. No se muestran estadísticos de riesgo. 4. Test estadístico de Chi cuadrado (tema que será tratado en el Capítulo 15) Figura 6-9. Frecuencias para la taba de Tabaquismo (TABAQUISMO) y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b 3. Cuando estamos interesados en comparar dos grupos mediante un análisis de riesgo, y ya tenemos las frecuencias en una tabla de contingencia (como es el caso de la Figura 6-9) utilizamos la opción “Tables (2 x 2, 2 , n)” que se encuentra en el menú colgante de StatCalc del menú principal de Epi Info 7 (Figura 6-10). Al hacer click observará que se abre la ventana que se muestra en la Figura 6-11. Figura 6-10. Menú colgante que muestra las opciones de Utilidades [“Utilities”] Figura 6-11. Pantalla de la opción “Tables (2 x 2, 2 x n)” de Statcalc. Asumamos que en relación a la variable TABAQUISMO, el código “0” corresponde a “no fumadoras”, el 1 a “fumadoras pasivas” y el código 2 a “fumadoras activas”, y que tenemos interés en comparar el riesgo de las “fumadoras activas” con el de las “no fumadoras”. Para realizar los cálculos solamente tecle los números que correspondan a cada celda, tal como se aprecia en la figura 6-11. Observe que hemos ubicado los valores del grupo 2 de TABAQUISMO (el de mayor consumo de cigarrillos) en el renglón de expuestos, y al grupo 0 de TABAQUISMO (el que no consume cigarrillos) en el renglón de no expuestos. Al completar los números las cuatro celdas podrá encontrar las estimaciones de Odds Ratio y Riego Relativo (con sus respectivos intervalos de confianza), tres cálculos de Chi Cuadrado y de la Prueba Exacta de Fisher. Dependiendo del diseño de muestreo el usuario tendrá de decidir si estos resultados con adecuados o no para el análisis. StatCalc no proporciona una estimación de Riesgo Atribuible. Para estimar el riesgo del siguiente nivel de exposición tecle los números de la exposición 1 a TABAQUISMO en el renglón de exposición, y los de exposición 0 a TABACO en el renglón de no expuestos. Los resultados se pueden presentar en forma tabular, tal como se muestran en el Cuadro 6-10 donde los códigos han sido cambiados por las categorías correspondientes. Utilizamos los valores de Riesgo Relativo o de Odds Ratio cuando el diseño de estudio lo permita. Los intervalos de confianza serán tratados en el Capítulo 16, pero aquí podremos comentar que los mismos se anotan en la siguiente columna, dejando en blanco el espacio que corresponde al grupo de referencia (las no fumadoras en este ejemplo) Cuadro 6-10. Bajo peso al nacer Riesgo Relativo IC 95% Tabaquismo Si No No 26 82 1.0 Si, pasivo 38 92 1.2 0.8 a 1.9 Si, fumadora de cigarrillos 70 92 1.8 1.2 a 2.6 ------------------------------------------------------------------------------------------------------------------ CAMBIO PORCENTUAL El cambio porcentual es un cociente, cuyo numerador se constituye con el cambio entre dos momentos y el denominador es un periodo base. Su fórmula es: P A P A A cambio porcentual 100 1 100 x x x x x − = = − (6,9) Donde xA representa el valor en el periodo anterior y xP el valor en el periodo posterior. El cambio porcentual permite expresar numéricamente el cambio cuantitativo observado entre dos momentos, tomando como referencia el valor observado en el periodo anterior. Ejemplo explicativo 6-10. -------------------------------------------------------------------------------- Los datos que se presentan en el Cuadro 6-11 corresponden al número de casos de hepatitis viral notificados a la Secretaría de Salud; la primera columna corresponde al año de notificación y la segunda al número de casos notificados. En la tercera columna se señala el cambio porcentual del número de notificaciones de cada año comparándolo con el anterior. Cuadro 6-11. Casos de hepatitis viral notificadas en México, 1994-1997. Año Casos reportados Cambio Porcentual 1994 16 918 1995 7 083 (7,083-16,918)/16,918*100 =-58.13% 1996 14 181 (14,181-7,083)/ 7,083*100 = 100.21% 1997 26 824 (26,824-14,181)/ 14,181*100 = 89.15% Fuente: Epidemiología, 1996;13(2):3. Epidemiología, 1997;14(2):4. Epidemiología, 1998;15(2):4. Si esto se quisiera expresar en palabras, se diría: en 1994 se reportaron 16 918 casos; para el año siguiente (1995) el número de casos notificados disminuyó en 58.13%; para 1996 se observó un incremento de 100.21% en relación con 1995; y para 1997 nuevamente se observó un incremento, pero sólo de 89.15% en relación con el año anterior. ----------------------------------------------------------------------------------------------------- DATOS AGRUPADOS Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un arreglo ordenado donde los valores se agrupan en intervalos de clase que señalan los valores que deben incluirse en la tabulación, y son definidos por sus límites inferior y superior de clase. Los intervalos de clase no deben traslaparse y son consecutivos, por lo que el límite superior de clase de un intervalo es el límite inferior de clase del siguiente. Para la elaboración de un arreglo ordenado se procede de la siguiente manera: 1. Definir el número de intervalos de clase. Se recomienda que el númerode intervalos no sea menor de 5, ni mayor de 15. Generalmente, el número de Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Código de campo cambiado Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejemplo, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Ejem. normal, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Nor 1, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números observaciones determina el de intervalos: mientras más observaciones más intervalos. La siguiente fórmula es útil para definirlos 1 3.322(log )nk = + (6,10) Donde k corresponde al número de intervalos de clase y n es el número de observaciones que se quieren agrupar. El resultado es una orientación y el investigador podrá cambiarlo según convenga a su presentación. 2. Definir la amplitud de cada intervalo de clase. Generalmente todos los intervalos que se presentan tienen la misma amplitud, aunque no es obligatorio sea así. Algunas tabulaciones tienen intervalos que muestran amplitudes de diferente magnitud. Por ejemplo, en el campo de la salud los menores de 10 años suelen agruparse en menores de 1 año, de 1 a 4 años y de 5 a 10 años. Cuando se desea que todos los intervalos tengan la misma amplitud, éstos se determinan dividiendo el rango (valor superior menos valor inferior) entre k, o número de intervalos de clase. El resultado debe ser tomado como una aproximación y deberá modificarse en beneficio de la tabulación de datos. 3. Contar el número de observaciones cuyos valores son incluidos en cada intervalo de clase. Un cuadro que presenta los intervalos de clase y la frecuencia de observaciones que corresponde a cada intervalo es conocido como distribución de frecuencia. A partir de una distribución de frecuencia podemos obtener una distribución de frecuencia acumulada, una distribución de frecuencia relativa o una distribución de frecuencia relativa acumulada. Ejemplo explicativo 6-11. -------------------------------------------------------------------------------- Cuando el interés se encuentra en describir datos cuantitativos, tales como los mostrados en el cuadro 6-12 referentes a las tallas de un grupo de niños, podemos proceder de la siguiente manera: primero se decide cuántos intervalos de clase hemos de utilizar utilizando la fórmula 6,10, mediante la cual se obtiene k = 1+3.322(log(100)) = 7.644. Optamos por redondear el número de intervalos de clase a siete (pero también podríamos redondearlo a ocho). A continuación se calcula de qué amplitud será cada intervalo de clase dividiendo el rango 156-107=49 entre 7 resultando 49/7=7. Para definir los límites inferiores de clase empezamos con 107 al primero, y a los siguientes les sumamos 7 hasta que superemos el valor máximo de nuestra serie de datos. El límite superior de cada intervalo de clase debe ser menor al límite inferior de siguiente intervalo, tal como se muestra en el Cuadro 6-12. A continuación tabulamos los datos del Cuadro 6-11 y los registramos en el Cuadro 6-12. Con formato: Nor 1, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Con formato: Justificado, Interlineado: Mínimo 12 pto, Ajustar espacio entre texto latino y asiático, Ajustar espacio entre texto asiático y números Cuadro 6-11. Tallas de un grupo de 100 niños. i talla i talla i talla i talla i talla 1 107 21 122 41 128 61 133 81 139 2 107 22 123 42 128 62 134 82 139 3 114 23 123 43 128 63 134 83 140 4 116 24 123 44 128 64 134 84 140 5 116 25 123 45 128 65 134 85 140 6 117 26 124 46 129 66 134 86 140 7 117 27 124 47 129 67 135 87 141 8 117 28 124 48 129 68 135 88 142 9 118 29 124 49 129 69 135 89 143 10 119 30 124 50 129 70 136 90 144 11 119 31 125 51 130 71 136 91 146 12 120 32 126 52 130 72 136 92 146 13 120 33 126 53 131 73 136 93 147 14 121 34 126 54 131 74 136 94 147 15 121 35 126 55 131 75 137 95 148 16 121 36 126 56 131 76 137 96 148 17 122 37 127 57 132 77 137 97 148 18 122 38 127 58 132 78 137 98 149 19 122 39 127 59 132 79 138 99 153 20 122 40 128 60 133 80 138 100 156 Para describir mediante frecuencias relativas la serie de datos, solo falta calcular los porcentajes correspondientes a cada intervalo de clase. Cuadro 6-12. Distribución de tallas de un grupo de 100 niños. Intervalo de clase Límite inferior Límite superior Frecuencia Porcentaje 107 113 2 2.0 114 120 11 11.0 121 127 26 26.0 128 134 27 27.0 135 141 21 21.0 142 148 10 10.0 149 155 2 2.0 156 160 1 1.0 100 100.0 Cómo hacerlo en Epi Info, 6-3. ------------------------------------------------------------------------- En Epi Info para Windows abra el archivo Bioestadistica_3ra y seleccione la tabla Bio3_06c. Después de seleccionar la tabla de datos haga click en “OK”. Antes de agrupar los datos primero tiene que definir una nueva variable. Para hacerlo haga click con el mouse en “Define” (en el bloque de “Variables” de la ventana de comandos). Cuando aparezca la ventana de diálogo escribimos el nombre de la variable a definir (“GRUPOS”), y marcamos la opción estándar, tal como se aprecia en la Figura 6-12. Para ejecutar la orden sólo hacemos click con el mouse en “OK”. Con formato: Ejemplo Con formato: Normal sangría Figura 6-12. Venta de opciones de la orden “Define”. Continuamos agrupando los datos de la variable talla en la nueva variable (“GRUPOS”) que hemos definido. Para hacerlo haga click con el mouse en “Recode” (también en el bloque de “Variables” de la ventana de comandos. En la ventana de diálogo que se muestra en la Figura 6-14A primero defina la variable de origen, tal como se muestra en la ventanita “From”. Luego defina la variable destino, como se muestra en la ventanita “To”. Por último, defina los límites inferiores y superiores de cada intervalo de clase, así como el código de cada agrupación (evite utilizar el 0 en el valor recodificado). Para cambiar de celda al definir estos tres valores utilice el mouse (haciendo “click” en el espacio correspondiente. Al terminar de recodificar la ventana de diálogo deberá verse como la que se muestra en la Figura 6-14B. Para ejecutar la orden sólo haga click con el mouse en ““OK”. A B Figura 6-12. Ventana de la orden Recodificar [“Recode”] Para obtener las frecuencias agrupadas sólo haga click en Frequencies” (ver la sección “Cómo hacerlo en Epi Info, 6-1” al principio de este capítulo), seleccione “GRUPOS” en “Frequency of” y haga click con el mouse en ““OK” para ejecutar la orden. ---------------- EJERCICIOS Ejercicio A Observe el cuadro 6-13. Los datos que contiene se refieren a las características de 40 niños recién nacidos y sus madres. Los datos están en la tabla Ejer_06a del archivo Bioestadistica_3ra. Con formato: Normal centro Con formato: Normal centro Cuadro 6-13. Características de 40 niños recién nacidos. i (identificación progresiva) Bajo peso del niño al nacer Sexo del recién nacido Exposición de la madre al humo de tabaco durante el embarazo Consumo de alcohol por la madre durante el embarazo1 no femenino fumadora pasiva no 2 no femenino fumadora pasiva si 3 si femenino fumadora activa no 4 no masculino fumadora pasiva no 5 no femenino fumadora pasiva no 6 no masculino fumadora activa no 7 si femenino fumadora activa no 8 si femenino fumadora pasiva no 9 no masculino fumadora pasiva si 10 no masculino no no 11 no femenino fumadora activa no 12 si femenino fumadora pasiva si 13 no femenino fumadora activa si 14 no masculino no no 15 no femenino no no 16 si masculino fumadora pasiva si 17 no femenino no no 18 no femenino fumadora pasiva si 19 no masculino fumadora activa si 20 no femenino fumadora activa si 21 no masculino no si 22 si masculino fumadora activa si 23 no femenino fumadora pasiva no 24 no masculino fumadora activa no 25 no femenino no no 26 no masculino no si 27 no masculino fumadora pasiva no 28 si masculino fumadora activa no 29 si masculino fumadora activa no 30 no masculino fumadora activa no 31 no masculino fumadora activa no 32 no femenino fumadora pasiva si 33 si femenino no no 34 no femenino fumadora activa si 35 no masculino no no 36 no masculino no si 37 no masculino fumadora activa no 38 no femenino fumadora pasiva si 39 no femenino fumadora activa si 40 si femenino no si Ejercicio A1. Suponga que los datos fueron registrados durante todo un año de estancia en una comunidad del país y le interesa presentarlos ante sus colegas. A partir de esos datos llene el Cuadro 6-14 considerando los cuarenta registros como el total. Cuadro 5-14. Variables Frecuencia Porcentaje Bajo peso al nacer Si No Sexo del RN Femenino Masculino Exposición al tabaco Fumadora activa Fumadora pasiva No Consumo de alcohol Si No Ejercicio A2. Al estar preparando su presentación le surge el interés de explorar la relación que existe entre tres de las variables (sexo del recién nacido, tabaco y alcohol) con el bajo peso. Para poder hacerlo presenta los datos en el siguiente Cuadro 6-15. Cuadro 6-15. Variables Niños con bajo peso % (de renglón) Niños sin bajo peso % (de renglón) Sexo del RN Femenino Masculino Exposición al tabaco Fumadora activa Pasiva No Consumo de alcohol Si No Ejercicio A3. A partir del cuadro 6-15 Ud. decide hacer varias comparaciones para identificar las características asociadas con el bajo peso al nacer. Para hacer las comparaciones llene el Cuadro 6-16 con los valores de Riesgo Atribuible y Riesgo Relativo considerando las siguientes categorías como los valores de referencia: sexo masculino, no exposición al tabaco durante el embarazo y no consumo del alcohol durante el embarazo. Cuadro 6-16. Variables Riesgo Atribuible Riesgo Relativo Sexo del RN Femenino Masculino (grupo de referencia) 0.0 1.0 Exposición al tabaco Fumadora activa Fumadora pasiva No (grupo de referencia) 0.0 1.0 Consumo de alcohol Si No (grupo de referencia) 0.0 1.0 Ejercicio B El administrador de una clínica de atención médica ha registrado los números de consultas que se presentan en el Cuadro 6-17. A partir de esos datos ayúdele a calcular los cambios porcentuales que la clínica ha registrado durante los años señalados, y preséntelos en el cuadro 6-17. Cuadro 6-17. Año Casos reportados Cambio Porcentual 1999 10 785 2000 9 279 2001 10 642 2002 15 193 REFERENCIAS Daniel WW: Bioestadística. Base para el análisis en las ciencias de la salud, 3ra. edición. México: Limusa, Noriega Editores, 1987. Kleinbaum DG, Kupper LL, Morgenstern H: Epidemiologic Research. 1ra. edición. Van Nostrand Reinhold. New York, 1982. Koepsell T, Weill N, Swanson M: Apuntes del curso de Epidemiología 512. Washington, Universidad de Washington, Seattle, 1991. Martín-Moreno JM, Banegas JR. Sobre la traducción del término inglés odds ratio como oportunidad relativa. Salud Pública de México 1997;39:72-74. Tapia JA, Nieto FJ. Razón de posibilidades: una propuesta de traducción de la expresión odds ratio. Salud Pública de México 1993;35:419-424. Tapia-Granados JA. Posibilidades, oportunidades, momios: un comentario sobre la traducción del término odds. Salud Pública de México 1997;39:69-71.
Compartir