Logo Studenta

Capitulo2006,202013

¡Este material tiene más páginas!

Vista previa del material en texto

SEGUNDA PARTE: ESTADÍSTICA DESCRIPTIVA. 
6. ESCALA CUALITATIVA 
La información recabada durante las investigaciones estadísticas proviene de 
observaciones individuales, y éstas casi siempre han de ser resumidas de alguna 
manera antes de que se les pueda utilizar. Resumir datos cualitativos es relativamente 
simple. Sólo hay que contar el número de observaciones según cada característica o 
combinación de éstas, y representarlas como proporciones o razones. Los datos 
cuantitativos también pueden resumirse mediante este procedimiento, siempre y 
cuando se agrupen los valores de la variable en dos o más categorías. 
PROPORCIONES 
Para calcular una proporción se divide la frecuencia absoluta de la categoría que se 
está analizando entre el total de individuos identificados con la variable de estudio. Lo 
anterior se representa mediante la fórmula: 
 ( ) /p a a b a N= ÷ + = (6,1) 
Donde p representa la proporción, a es el número de elementos con la característica 
de interés y b el número de elementos sin la característica de interés. Hay que notar 
que a + b es el total del universo (N). 
Ejemplo explicativo 6-1 ---------------------------------------------------------------------------------- 
Considérese la serie del cuadro 6-1, en la cual se presentan algunas características de 
20 niños de 1 a 4 años que fallecieron ahogados en su hogar en la Zona Metropolitana 
de Guadalajara. Esta serie de datos puede resumirse, mediante el uso de proporciones, 
tal como se muestra en el cuadro 6-2. 
 
Cuadro 6-1. Características de 20 niños, de 1 a 4 años de edad, ahogados 
en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. 
i Sexo Depósito i Sexo Depósito 
1 Masculino Aljibe 11 Femenino Aljibe 
2 Masculino Balde/tina 12 Masculino Olla 
3 Masculino Olla 13 Masculino Pozo de agua 
4 Femenino Aljibe 14 Masculino Otro 
5 Femenino Balde/tina 15 Masculino Aljibe 
6 Masculino Aljibe 16 Masculino Aljibe 
7 Masculino Pozo de agua 17 Masculino Balde/tina 
8 Masculino Aljibe 18 Femenino Aljibe 
9 Femenino Aljibe 19 Masculino Otro 
10 Masculino Otro 20 Masculino Otro 
 
Con formato: Normal
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Cuadro 6-2. Características 20 niños, de niños de 1 a 4 años de edad, ahogados 
en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. 
Variable Frecuencia Proporción 
Sexo 
Masculino 15 15 ÷ 20 = 0.75 
Femenino 5 5 ÷ 20 = 0.25 
Depósito 
Aljibe 9 9 ÷ 20 = 0.45 
Balde/tina 3 3 ÷ 20 = 0.15 
Olla 2 2 ÷ 20 = 0.10 
Pozo de agua 2 2 ÷ 20 = 0.10 
Otro 4 4 ÷ 20 = 0.20 
 ------------------------------------------------------------------------------------------------------------------ 
 
La interpretación de las proporciones puede ser un poco confusa para el principiante. 
Por ello, se acostumbra multiplicarlas por 100 para expresarlas como porcentaje, y se 
especifican mediante el símbolo “%”. Así, para calcular un porcentaje basta dividir el 
número de individuos en cada categoría entre el total del grupo y multiplicar el 
resultado por 100. En el Ejemplo explicativo 6-1 los porcentajes serían: 0.75 × 100 = 
75% varones, 0.25 × 100 = 25% mujeres, 0.45 × 100 = 45% ahogados en aljibes, 0.15 × 
100 = 15% en baldes/tinas, 0.10 × 100 = 10% en ollas, 0.10 × 100 = 10% en pozos de 
agua, y 0.20 × 100 = 20% en otros depósitos de agua. 
El uso de proporciones tiene varias ventajas. En primer lugar, permiten comparar 
con facilidad dos o más series cuyos totales son diferentes, pues éstos quedan 
convenientemente reducidos a la unidad (o a 100 en el caso de porcentajes). En 
segundo lugar, a través de las proporciones se puede asumir la probabilidad de que un 
evento ocurra. En el ejemplo anterior, existe una probabilidad de 0.75 (o 75%) de que 
el sexo de un niño ahogado en el hogar sea masculino. 
Cómo hacerlo en Epi Info, 6-1. ------------------------------------------------------------------------- 
Llame el programa Epi Info 7 y haga click en la opción “Classic” de “Analyze Data” 
(figura 6-1). 
 
 
Figura 6-1. Menú de Epi Info 7. 
 
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Normal sangría, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Fuente: +Cuerpo
(Calibri), Sin subrayado, Color de
fuente: Automático
Con formato: Fuente: +Cuerpo
(Calibri), Sin subrayado, Color de
fuente: Automático
Con formato: Fuente: +Cuerpo
(Calibri), Sin subrayado, Color de
fuente: Automático
Con formato: Ejemplo
Cuando se muestre la ventana de “Analysis” haga click en “Read” (el comando lo podrá 
encontrar en el extremo superior de las opciones de comando). El programa le 
mostrará la ventana de “Read”. En ella, primero haga click en la opción “Data Type” y 
seleccione la opción “Microsoft Access 2002-2003 (.mbd)”
*
. Luego haga click en “Data 
Source” y busque en el disco de datos que acompaña al libro el archivo 
“Bioestadistica_3ra.MDB” (en la imagen de este ejemplo la carpeta donde se 
encuentra el archivo es “I:\Cursos\Bioestadistica\Libro 3ra Edicion\bases\”, y esto 
seguramente será diferente dependiendo de la unidad de memoria y la carpeta en que 
guarde el archivo); Cuando lo encuentre selecciónelo. A continuación haga click en 
“Bio3_06a”. En ese momento la ventana “Read” se mostrará tal como se aprecia en la 
figura 6-2. Continúe haciendo click en el botón “OK”. 
 
 
Figura 6-2. Pantalla de “Analysis” mostrando la ventana de “Read” con las selecciones 
“Microsoft Access 2002-2003 (.mbd)”, “Bioestadistica_3ra.MDB” y “Bio3_06a”. 
 
Notará que en el cuadro de “Epi Info” se apreciará el texto que se muestra en la figura 
6-3. 
 
 
 
 
*
 Para los ejemplos de Epi Info 7 de esta edición hemos preferido utilizar el formato de 
datos de Epi Info 2000 de tal manera que los datos puedan ser leídos tanto en la 
versión 7 de Epi Info como en la anterior de Epi Info 2000 para Windows. 
Figura 6-3. Mensaje que se muestra en la ventana después 
de llamar los datos en “Analysis” de Epi Info 7. 
 
Para obtener las frecuencias y los porcentajes correspondientes de una variable haga 
click en “Frequencies” (el comando lo podrá encontrar en la mitad de la pantalla en la 
lista de comandos), en el apartado “Statistics”]. En la ventana de diálogo que se 
despliega seleccione “DEPOSITO” en la opción “Frequency of”. En ese momento la 
ventana deberá observarse como en la Figura 6-4. 
 
 
Figura 6-4. Ventana de diálogo para la frecuencia 
de DEPOSITO según la tabla de datos 06a$. 
 
Al hacer click con el ratón en “OK” podrá observar en la ventana de resultados (Figura 
6-5) los siguientes elementos: 
 
 1. Categorías de la variable DEPOSITO. 
 2. Frecuencias absolutas de las categorías listadas. 
 3. Porcentaje de cada categoría en relación al total. 
 4. Porcentajes acumulados. 
 5. Gráfica de barras horizontales. 
 6. Intervalos de confianza del 95% para los porcentajes de la frecuencia de cada 
categoría. Este tema será tratado más adelante, el en Capítulo 16. 
 
 
Figura 6-5. Frecuencias de las categorías de la variable 
DEPOSITO, según la tabla de datos 06a$. 
 ------------------------------------------------------------------------------------------------------------------ 
Uso de las proporciones en Epidemiología 
Las proporciones son muy utilizadas en la práctica de la epidemiología, de tal manera 
que algunos usos específicos de estas tienen nombres propios,como es el caso de la 
prevalencia, la incidencia acumulada, la sensibilidad y la especificidad. Estas la 
describiremos más adelante, pero antes de hacerlo es necesario que aclaremos 
algunos elementos del proceso salud-enfermedad que se toman en cuenta para la 
estimación de la frecuencia de la enfermedad. 
La frecuencia de la enfermedad en bioestadística 
Típicamente la enfermedad es considerada un estado adverso de salud que caracteriza 
a un individuo durante un periodo. Ejemplos de enfermedad son: demencia, 
tuberculosis, alcoholismo, infección de vías urinarias, Diabetes Mellitus, etc. En la 
figura 6-6 esto se presenta de manera gráfica. 
 
Inicia la enfermedad
(Evento)
Duración de la enfermedad
(Estado)
 
Figura 6-6. Secuencia salud-enfermedad-salud en un sujeto. 
 
Aunque por lo general se piensa en la enfermedad como un estado, también es posible 
concebirla como un evento. El inicio de un estado de enfermedad es un evento que 
ocurre en un punto específico del tiempo. Tal es el caso del cambio de sujeto sano a 
enfermo de Diabetes Mellitus, hipertensión arterial, cáncer de cérvix, etc. 
Prevalencia 
La prevalencia cuantifica la proporción de individuos en la población que tienen algún 
estado de enfermedad en un instante específico del tiempo, y proporciona una 
estimación de la probabilidad de que un individuo se encuentre enfermo en algún 
punto del tiempo. La fórmula para calcular la prevalencia (p) es: 
 
número de casos con la enfermedad en un punto específico del tiempo
P
total de la población en el mismo grupo y punto específico de tiempo
= (6,2) 
Este “punto” puede referirse a un día específico en el calendario, a la edad del sujeto 
estudiado o a un momento en el curso del tiempo a partir de un evento. Para facilitar 
la lectura del cociente anterior, se acostumbra multiplicar el resultado por una 
constante que puede ser 100, 1 000, 10 000 u otra cantidad, con la finalidad de no 
utilizar fracciones pequeñas al expresar prevalencias. 
Ejemplo explicativo 6-2 ---------------------------------------------------------------------------------- 
Con frecuencia, los servicios de medicina familiar están interesados en conocer la 
prevalencia de pacientes enfermos de diabetes en la comunidad donde brindan el 
servicio médico. Para obtener esa información, el epidemiólogo ordena a su equipo 
que visite y registre toda la población que cubre su unidad. Como resultado de su 
investigación encuentra que en una población de 4 550 habitantes se identificaron 228 
sujetos diabéticos. Así, la prevalencia de diabetes en esa población es de 228/4 550 = 
0.05, o 5.0/100 habitantes. 
 ------------------------------------------------------------------------------------------------------------------ 
Eliminado: ¶
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Código de campo cambiado
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Título 5, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Incidencia acumulada 
En contraste con la prevalencia, la incidencia cuantifica el número de eventos de 
enfermedad que se desarrollan en la población de individuos en riesgo durante un 
intervalo específico de tiempo. La incidencia acumulada (IA) es la proporción de 
personas que adquieren la enfermedad durante un periodo específico, y se calcula 
como: 
 
número de casos nuevos de enfermedad durante un período de tiempo
IA
total de la población en riesgo al inicio del período de estudio
= (6,3) 
Esta medida de frecuencia proporciona un estimado de la probabilidad de que un 
individuo tomado al azar en una población en riesgo (susceptible) desarrolle la 
enfermedad durante un periodo específico. A esta probabilidad también se le conoce 
como riesgo. El periodo de observación es arbitrario y depende de las características 
evolutivas de la enfermedad. Al igual que con la prevalencia, la IA puede multiplicarse 
por una constante para facilitar su lectura e interpretación. 
Antes de continuar es necesario señalar que una persona se encuentra “en 
riesgo” de una enfermedad cuando es biológicamente posible que desarrolle la 
enfermedad en un futuro inmediato. “En riesgo” significa que el sujeto es susceptible a 
la enfermedad. En otras palabras, que la probabilidad de que desarrolle una 
enfermedad no es igual a cero. En términos epidemiológicos, “en riesgo” no significa 
“en mayor riesgo” en relación con otra persona. Razones frecuentes de que alguien no 
se encuentre en riesgo son: 
 
 • La persona tiene la enfermedad. Alguien que sufra de Diabetes Mellitus no se 
encuentra en riesgo de desarrollarla nuevamente. 
 • La persona ha adquirido inmunidad. Un niño que ya enfermó de sarampión no lo 
padecerá de nuevo. 
 • La persona no tiene la capacidad biológica de desarrollar la enfermedad. Los 
varones nunca sufrirán cáncer uterino. 
 • Durante algún tiempo de vida la persona fue susceptible de desarrollar la 
enfermedad, pero ésta fue abolida por algún procedimiento particular. La mujer 
a la que se le ha practicado histerectomía no puede desarrollar cáncer uterino. 
Ejemplo explicativo 6-3 ---------------------------------------------------------------------------------- 
Si se toma una cohorte de 12 sujetos y se le observa durante cinco años (sin que sus 
elementos se pierdan para el estudio y sin que dejen de estar en riesgo durante el 
periodo del estudio) y de ellos cinco desarrollan la enfermedad, entonces la IA será 
5/12 = 0.42 en cinco años. En otras palabras, si se toma un individuo de los observados 
al inicio del estudio, la probabilidad de que en el transcurso de cinco años desarrolle la 
enfermedad es de 0.42, o 42/100. 
 ------------------------------------------------------------------------------------------------------------------ 
La prevalencia y la incidencia son dos aspectos de un mismo fenómeno. Para 
entenderlas hay que poner atención a la figura 6-7, en la cual se representa a 13 
sujetos en observación durante cinco años. Al inicio del estudio todos los sujetos se 
encuentran sanos y todos ellos tienen el riesgo (son susceptibles) de contraer la 
enfermedad. Se debe convenir que en esa figura la cruz representa el inicio de la 
Con formato: Título 5, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Normal sangría, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Nor 1, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Conformato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Español (España - alfab. tradicional)
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
enfermedad, o “evento”; que la línea gruesa representa el tiempo durante el cual el 
sujeto está enfermo, o “estado”; y el cuadro representa el momento en que el sujeto 
sale del estudio porque muere. Si se hace un corte después de un año de observación 
se encuentra que en ese “punto específico de tiempo” existen dos enfermos entre los 
13 sujetos observados. Así, la prevalencia es igual a 2/13 = 0.15, mientras que la 
incidencia acumulada desde el inicio del estudio es 2/13 = 0.15 en un año. En este 
caso, la prevalencia y la incidencia son semejantes, pero no siempre tiene que ser así, 
ya que para el cuarto año han fallecido cuatro sujetos y sólo quedan nueve, de los 
cuales tres están enfermos. Por tanto, la prevalencia es de 3/9 = 0.33, mientras que la 
incidencia acumulada es de 7/13 = 0.54 en cuatro años. 
 
1
3
5
7
9
11
13
0 1 2 3 4 5
sujeto sano en observación
inicia la enfermedad
sujeto enfermo en observación
defunción
Tiempo de observación del grupo
Sujeto ( )i
 
Figura 6-7. Eventos y estados de enfermedad en un grupo de sujetos. 
Sensibilidad y especificidad 
La sensibilidad y la especificidad son dos proporciones que nos permiten medir la 
validez de un instrumento de medición en relación a un criterio de clasificación, y se 
definen de la siguiente manera: 
 
 • Sensibilidad.- Es la probabilidad de clasificar correctamente a aquellos que tienen 
la característica de interés. 
 • Especificidad.- Es la probabilidad de clasificar correctamente a aquellos que no 
tienen la característica de interés. 
 
Para su cálculo procedemos de la siguiente manera: 
 
Código de campo cambiado
Con formato: Título 5, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
 1. Mediante un procedimiento de clasificación “perfecto” (generalmente conocido 
como “gold standard” o “estándar de oro”) los sujetos son clasificados según 
presenten la característica o no la presenten (en términos clínicos, generalmente 
se clasifican como enfermos y no enfermos). 
 2. Luego, estos mismos sujetos con clasificados mediante un instrumentos menos 
perfecto (aunque más sencillo, económico o menos invasivo) en dos grupos 
según presenten la característica o no la presenten (en términos clínicos, 
generalmente se clasifican como “positivos” o “negativos” a la prueba). Uno 
esperaría que todos aquellos que tienen la característica (según se medió con el 
“estándar de oro”) resulten “positivos”, y que aquellos que no tienen la 
característica (según se midió con el “estándar de oro”) resulten “negativos” 
 3. Dado que el segundo criterio de clasificación es imperfecto, algunos sujetos que 
realmente presentan la característica (según el “estándar de oro”) serán 
clasificados incorrectamente como que no la tienen (o “negativos”), mientras 
que algunos que realmente no presentan la característica (según el “estándar de 
oro”) serán clasificados incorrectamente como que sí la tienen (o “positivos”). 
 4. Para el cálculo de la sensibilidad y la especificidad, generalmente, acomodamos 
los datos según el cuadro 6-3. 
 
 Clasificación con el 
“estándar de oro” 
Prueba alternativa Presente Ausente 
Positivo a b 
Ausente c d 
 a + c b + d 
Cuadro 6-3. Arreglo de datos para el 
cálculo de sensibilidad y especificidad. 
 
 5. Concluimos nuestro cálculo con las dos fórmulas que se muestran a 
continuación. 
Sensibilidad =
+
a
a c
 
Especificidad =
+
d
b d
 
 
Es necesario notar que cuando la sensibilidad es perfecta, el 100% de los que fueron 
clasificados con la característica mediante el “estándar de oro” también son 
clasificados mediante el segundo criterio de clasificación. Cuando eso no ocurre la 
sensibilidad es menor al 100%. Lo mismo ocurre con la especificidad para los que 
fueron clasificados por el “estándar de oro” sin la característica. 
Ejemplo explicativo 6-4 ---------------------------------------------------------------------------------- 
Supongamos que tenemos interés en evaluar la validez de una prueba diagnóstica que 
es más rápida y económica que el “estándar de oro”. Para hacerlo seleccionamos dos 
grupos: uno de enfermos u otro de no enfermos: ambos clasificados mediante el uso 
del “estándar de oro”. Las frecuencias cada categoría se muestran en el cuadro 6-4. 
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
 
Cuadro 6-4. Arreglo de datos ficticios para el 
cálculo de sensibilidad y especificidad. 
 Clasificación con el 
“estándar de oro” 
Prueba alternativa Enfermo Sano 
Positivo 85 10 
Negativo 15 190 
 100 200 
 
Para los datos que se muestran en el cuadro 6-2, la sensibilidad de la prueba 
alternativa sería 85/100 = 0.85, o 85%, y la especificidad de la prueba alternativa sería 
de 190/200 = 0.95, o 95%. ------------------------------------------------------------------------------- 
RAZONES 
Cuando la serie que se está examinando consta sólo de dos categorías, o el interés de 
la investigación se dirige únicamente a dos categorías, se pueden utilizar las razones 
para resumir la información. Para ello, se divide la totalidad de individuos que tengan 
una característica (de preferencia el grupo de mayor tamaño) entre el grupo que tenga 
la otra característica. De esta manera, y a diferencia de las proporciones, las lecturas 
del numerador no se incluyen en el denominador. Su fórmula es: 
 R a b= ÷ (6,4) 
En la que R representa la razón, a simboliza el número de elementos con la 
característica de interés y b el número de elementos con una característica diferente. 
Hay que notar que a + b no necesariamente son el total del universo. 
Ejemplo explicativo 6-5. --------------------------------------------------------------------------------- 
Continuando con el Ejemplo explicativo 6-1, la serie de datos puede resumirse, 
mediante el uso de razones, de la siguiente manera: 
 
 1. Según el sexo del niño (cuadro 6-2), por cada niña que se asfixia por inmersión en 
el hogar hay tres niños que sufren ese accidente mortal. En este ejemplo a = 15, 
 b = 5 y a ÷ b = 3 es la razón. 
 
Cuadro 6-5. Sexo de niños de 1 a 4 años de edad ahogados en su hogar. 
Zona Metropolitana de Guadalajara. 1991-1993. 
Sexo Frecuencia Razón 
Masculino 15 15 ÷ 5 = 3 
Femenino 5 
 
 2. Según el depósito en que se ahogó (cuadro 6-6), por cada menor que se asfixia 
por inmersión en un balde o tina, hay tres que pierden la vida en un aljibe. En 
este ejemplo, a = 9, b = 3, a ÷ b = 3 es la razón. 
 
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri), 12
pto, Sin subrayado, Color de fuente:
Automático, Español (España - alfab.
tradicional)
Cuadro 6-6. Depósito de agua en que niños de 1 a 4 años de edad se ahogaron 
en su hogar. Zona Metropolitana de Guadalajara. 1991-1993. 
Depósito Frecuencia Razón 
Aljibe 9 9 ÷ 3 = 3 
Balde/tina 3 
 ------------------------------------------------------------------------------------------------------------------ 
Densidad de incidencia 
Para el cálculo de una razón no siempre se utiliza información de dos grupos 
diferentes. También podemos utilizar en el numerador y el denominador información 
procedente de un mismo grupo, pero de diferente naturaleza. Tal es el caso de la 
densidad de incidencia (DI) en la que el numerador es semejante a la incidencia 
acumulada pero el denominador es la suma del tiempo que cada individuo ha 
permanecido en observación (“tiempo persona”) y en riesgo de enfermar. Su fórmula 
está dada por 
 
número de casos nuevos de enfermedad durante un período de tiempo
DI=
total de tiempo-persona de observación
 (6,5) 
Al presentar la densidad de incidencia es esencial que se especifique la unidad de 
tiempo; esto es, si la tasa representa el número de casos por día-persona, mes-
persona, año-persona, o alguna otra medida de tiempo-persona. La densidad de 
incidencia nos habla del cambio potencial instantáneo del estado de enfermedad de 
una población en una unidad de tiempo. 
A diferencia de la incidencia acumulada que es una proporción y puede 
interpretarse como una probabilidad, la densidad de incidencia dirige su atención al 
número de eventos que se presentan en una unidad de tiempo (y de manera inversa al 
tiempo que transcurre entre evento y evento). Esto se gráfica en la Figura 6-8, donde 
el tiempo persona en riesgo se refiere al tiempo acumulado que tuvieron que 
acumular los sujetos en estudio para registrar los eventos de interés. 
 
1
3
5
7
9
11
13
0 1 2 3 4 5
Tiempo de observación del grupo
Sujeto ( )i
Tiempo persona en riesgo
 
Con formato: Ejem. normal
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri), 12
pto, Español (España - alfab.
tradicional)
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin Cursiva, Sin
subrayado, Color de fuente:
Automático, Español (alfab.
internacional)
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin Cursiva, Sin
subrayado, Color de fuente:
Automático, Español (alfab.
internacional)
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin Cursiva, Sin
subrayado, Color de fuente:
Automático, Español (alfab.
internacional)
Con formato: Normal sangría
Código de campo cambiado
Figura 6-8. Tiempo persona de observación correspondiente a población en riesgo. 
Ejemplo explicativo 6-6. ---------------------------------------------------------------------------------- 
En una unidad de terapia intensiva están interesados en conocer la incidencia de 
muertes en pacientes que ingresan con infarto de miocardio. Después de 10 días se 
han registrado los datos del cuadro 6-7. 
 
Cuadro 6-7. Pacientes con infarto de miocardio observados en terapia intensiva 
Paciente i Tiempo de observación en 
días a partir del ingreso 
hasta la alta de terapia 
intensiva 
Motivo de egreso 
1 9 defunción 
2 5 mejoría 
3 3 mejoría 
4 3 defunción 
5 1 defunción 
 
Con los datos anteriores no es posible calcular una incidencia acumulada, ya que los 
periodos de observación no son los mismos en todos los sujetos, pero se puede 
calcular una densidad de incidencia. Para ello, se toma el total de eventos de interés 
observados (tres defunciones) y se les divide entre el tiempo-persona observado 
durante el cual se presentaron esos eventos (21 días-persona). Así, la densidad de 
incidencia es 3 ÷ 21 = 0.143 días-persona
–1
, o 0.143 defunciones por cada día de 
estancia acumulada por el grupo. ---------------------------------------------------------------------- 
LA COMPARACIÓN DE GRUPOS 
Con frecuencia, en el campo de las ciencias de la salud se tiene la necesidad de 
comparar grupos entre sí. Cuando el tamaño de los grupos a comparar es idéntico es 
posible valerse de frecuencias absolutas. Sin embargo, lo más frecuente es que los 
grupos sean diferentes en cuanto al tamaño del grupo en estudio. En estas ocasiones 
el uso de frecuencias relativas (proporciones o razones) facilita la comparación 
mediante una simple sustracción. Es preciso notar que cuando las frecuencias relativas 
(proporciones o razones) de dos grupos son iguales, la diferencia es de cero, mientras 
que cuando son diferentes el resultado es mayor o menor que cero. 
Ejemplo explicativo 6-7. --------------------------------------------------------------------------------- 
Supóngase que se sospecha y existe interés en probar la hipótesis de que en una 
escuela secundaria los alumnos varones se lesionan más frecuentemente que sus 
compañeras. Para ello, se observa a los estudiantes durante un año escolar y al final de 
él se encuentra que el número de lesionados es semejante para ambos grupos: 15 
lesionados en el transcurso del año. Estas frecuencias absolutas son de valor, pero 
pueden conducir a errores graves de interpretación; por ejemplo, si de 300 alumnos 
que estudian en el plantel sólo 100 fueran varones. En este caso, el uso de una 
proporción permitirá evaluar la frecuencia con que se presentan las lesiones según el 
sexo. De esta manera, la incidencia de lesionados en el grupo de varones es de 
15/100 = 0.15, mientras que para las mujeres tan sólo es de 15/200 = 0.08, por lo que 
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejem. normal, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Fuente: +Cuerpo
(Calibri), 12 pto, Sin subrayado, Color
de fuente: Automático, Español
(España - alfab. tradicional),
Superíndice 
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
la diferencia sería de 0.15 - 0.08 = 0.07. Lo anterior indicaría que en esa escuela los 
varones se accidentan más que las mujeres. -------------------------------------------------------- 
Riesgo Atribuible 
En epidemiología a esta diferencia se le conoce como riesgo atribuible (RA), y 
proporciona información acerca del efecto absoluto de la exposición o exceso de 
riesgo de la característica de interés en aquellos que pertenecen a un grupo con una 
característica específica (expuestos) en comparación con aquellos que no la tienen (no 
expuestos). Ayuda a responder a la pregunta: (si se ha inferido que la exposición causa 
la enfermedad) entre las personas expuestas, ¿qué cantidad de la característica de 
interés (quizá una enfermedad) se debe a la exposición? Esta medida se define como la 
diferencia entre la incidencia de los expuestos y los no expuestos, y se calcula 
mediante: 
 
e o
I I− (6,6) 
Donde Ie es la incidencia de expuestos (medida como incidencia acumulada o como 
densidad de incidencia), mientras que Io es la incidencia de no expuestos (medida 
también como incidencia acumulada o como densidad de incidencia). Dos prevalencias 
también pueden compararse mediante la sustracción, aunque el resultado se conoce 
como diferencia de prevalenciasy no como riesgo atribuible. 
Riesgo Relativo 
La razón también es un instrumento útil para comparar dos grupos. Para su 
interpretación se debe tomar en cuenta el grupo a comparar (el numerador) en 
referencia con el grupo de comparación (el denominador). Cuando ambos grupos son 
iguales, el resultado siempre es igual a uno. Así, 9 ÷ 9 = 3 ÷ 3 = 1 indica que el grupo a 
comparar es igual al grupo de comparación o referencia. En otras palabras, por cada 
elemento en el grupo a comparar existe otro en el grupo de comparación. Cuando el 
numerador es mayor que el denominador, como en 9 ÷ 3 = 3, el resultado siempre será 
mayor a 1. Si éste es el caso, el resultado indica cuántos elementos (y fracción de ellos) 
en el grupo a comparar existen por cada elemento en el grupo de referencia. Por otra 
parte, si el numerador es menor que el denominador, 3 ÷ 9 = 0.33, el resultado expresa 
qué fracción de un elemento, en el grupo a comparar, existe por cada elemento en el 
grupo de comparación. En epidemiología a este cociente se le conoce como riesgo 
relativo (RR), y estima la magnitud de una asociación entre exposición y enfermedad e 
indica la probabilidad del grupo expuesto de desarrollar la enfermedad en relación con 
aquellos que no están expuestos. Ayuda a responder a la pregunta: ¿la exposición 
causa la enfermedad? Esta medida se define como el cociente de la incidencia de los 
expuestos entre la incidencia los no expuestos, y se calcula mediante: 
 e
o
I
I
 (6,7) 
En la cual Ie es la incidencia de expuestos (medida como incidencia acumulada o como 
densidad de incidencia) e Io es la incidencia de no expuestos (medida también como 
incidencia acumulada o como densidad de incidencia). Dos prevalencias también 
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Título 4, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Normal
pueden compararse mediante una razón, aunque el resultado se conoce como razón 
de prevalencias y no como riesgo relativo. 
Una interpretación alternativa del riesgo relativo consiste en restar 1 al resultado 
(cociente) y multiplicarlo por 100. De esta manera, el resultado se interpreta como el 
porcentaje que el grupo a comparar se encuentra por arriba o por abajo en relación 
con el grupo de referencia. Cuando los grupos son idénticos, el resultado es igual a 0% 
[(1 - 1) × 100 = 0%]. Si el numerador es mayor que el denominador, el resultado es 
superior a 0% [(3 – 1) × 100 = 200%], mientras que lo contrario resulta en un valor 
negativo [(0.33 – 1) × 100 = –67%]. Si se toma al grupo de comparación como 100%, el 
resultado mediante el procedimiento anterior indica, de manera porcentual, en qué 
magnitud porcentual el grupo a comparar se encuentra por arriba o por abajo del 
grupo de referencia. 
Ejemplo explicativo 6-8. ---------------------------------------------------------------------------------- 
La comparación de grupos que realizamos mediante la diferencia de proporciones en 
el Ejemplo explicativo 6-7 también puede efectuarse mediante una razón entre 
proporciones, donde 0.15 ÷ 0.08 = 1.88 nos indica que existen 1.88 hombres 
lesionados por cada mujer lesionada, o también que existen 88% más hombres 
lesionados que mujeres lesionadas. ------------------------------------------------------------------- 
Tablas de contingencia 
Las tablas de contingencia son arreglos ordenados de frecuencias que se acomodan en 
celdas definidas por columnas y renglones. Las frecuencias presentadas de esta 
manera facilitan algunos procedimientos estadísticos utilizados frecuentemente, como 
son el cálculo de riesgo atribuible, riesgo relativo, chi-cuadrada y prueba exacta de 
Fisher, por mencionar cuatro de los más frecuentes. 
La tabla de contingencia más utilizada es la conocida como 2 x 2, que consiste en 
una tabla con dos hileras y dos columnas donde los sujetos se clasifican según dos 
criterios, cada uno de los cuales ocurre en dos niveles. Una tabla de este tipo se 
presenta en el Cuadro 6-8. 
 
Cuadro 6-8. Tabla de contingencia 2 x 2. 
 Criterio de efecto 
 Si No Total 
Criterio de Si a b a + b 
exposición No c d c + d 
 Total a + c b + d a + b + c + d 
Ejemplo explicativo 6-9. --------------------------------------------------------------------------------- 
Las frecuencias del Ejemplo explicativo 6-7 pueden presentarse en una tabla de 
contingencia 2 x 2. El cuadro 6-9 nos muestra los datos en una tabla de este tipo. 
 
Cuadro 6-9. Frecuencias observadas según el ejercicio explicativo 6-7. 
 Lesionados 
 Si No Total 
Hombres 15 85 100 
Mujeres 15 185 200 
Con formato: Normal sangría, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Título 4
Con formato: Normal sangría
Con formato: Ejemplo
Total 30 300 300 
 
A partir de este arreglo, la incidencia de lesiones en hombres se puede calcular 
mediante a/(a+b) = 15/100, mientras que la incidencia de lesiones en mujeres sería 
igual c/(c+d) = 15/200. ----------------------------------------------------------------------------------- 
Odds Ratio 
El riesgo relativo supone que el muestreo en la población ha sido realizado de manera 
aleatoria, y que posteriormente los sujetos han sido clasificados según dos variables 
dicotómicas (diseño transversal analítico), o bien que los grupos muestreados han sido 
formados atendiendo a su nivel de exposición (diseño de cohortes). En Epidemiología 
es frecuente que los grupos a comparar sean formados a partir de la condición de 
enfermedad que se desea estudiar (diseño de casos y controles). En estas 
circunstancias, no es factible estimar el riesgo relativo de manera directa (para una 
explicación más completa consulte algún libro de Epidemiología). No obstante, cuando 
se puede mantener el supuesto de que la frecuencia de la enfermedad que se estudia 
está por debajo del 10%, se puede utilizar una aproximación al riesgo relativo conocida 
como odds ratio. Cuando las frecuencias al comparar dos grupos se presentan en un 
cuadro 2 x 2 semejante al mostrado en el cuadro 6-8 el odds ratio se puede calcular 
utilizando la fórmula siguiente: 
 Odds ratio 
ad
bc
ϕ= = (6,8) 
Ejemplo explicativo 6-10. -------------------------------------------------------------------------------- 
Al utilizar las frecuencias que se presentan en el cuadro 6-9 el odds ratio será igual a 
15 x 185/15 x 85 = 2 775 x 1 275 = 2.18, que nos sugiere que existen 2.18 hombres 
lesionados por cada mujer lesionada. El resultado no es igual al calculado con el riesgo 
relativo en el Ejemplo explicativo 6-8 (de 1.88), pero es una buena aproximación 
cuando el diseño de muestreo no nos permite calcularlo, y los dos resultados se 
aproximarán en la medida en que el fenómeno estudiado sea más raro. ------------------- 
 
La expresión odds ratio ha sido traducida al español de diferentes formas entre las que 
se pueden mencionar “razón de productos cruzados”, “razón de momios”, 
“oportunidad relativa” y “razón de posibilidades” sin que se hubiera llegado a definir 
un consenso. 
Cómo hacerlo en Epi Info, 6-2. ------------------------------------------------------------------------- 
Epi Info 7 brinda varias alternativas para comparar dos grupos mediante Riesgos 
relativos, Riegos atribuibles y Odds Ratio. 
 
 1. Cuando estamos interesados en una variable independiente o factor de riesgo y 
una variable dependiente, ambas dicotómicas (tabla 2 x 2), utilizamos la orden 
Tables” tal como se muestra a continuación. En Epi Info 7 abra el archivo 
Bioestadistica_3ra y seleccione la tabla Bio3_06b
†
. Después de seleccionar la† Si tiene dificultad para encontrar la tabla de datos Bio3_06b revise la sección “Cómo 
hacerlo en Epi Info, 6-1” en este mismo capítulo. 
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin subrayado, Color
de fuente: Automático
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin subrayado, Color
de fuente: Automático
Código de campo cambiado
Con formato: Normal
tabla de datos haga click en “OK”. Para continuar haga click en “Tables”, en el 
apartado “Statistics” de la lista de comandos. En la ventana de diálogo que se 
despliega seleccione “H_ARTER” en “Exposure Variable” y “BAJO_PES” en 
“Outcome Variable”. En ese momento la ventana deberá observarse como en la 
Figura 6-7. 
 
 
Figura 6-7. Ventana de diálogo para la taba de Hipertensión Arterial (H_ARTERIAL) 
y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_06b 
 
 Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la ventana de 
resultados (Figura 6-8). 
 
 1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila 
(Row%) y columna (Col%). 
 2. Un gráfico que muestra visualmente el peso que cada celda tiene en la tabla 
2 x 2. 
 3. Odds Ratio, según dos procedimientos, y sus intervalos de confianza (el tema 
de los intervalos de confianza para estimaciones con variables cualitativas 
será tratado más adelante, en el Capítulo 16. 
 4. Razón de Riesgos, o Riego Relativo (Risk Ratio), y sus intervalos de confianza. 
 5. Diferencia de Riegos (Risk Difference), o Riego Atribuible, y sus intervalos de 
confianza. 
 6. Test estadísticos de Chi cuadrado (tema que será tratado en el Capítulo 15) 
 7. Cálculos de probabilidad mediante la aproximación a la distribución de la 
binomial y la Prueba Exacta de Fisher. 
 
 
Figura 6-8. Frecuencias para la taba de Hipertensión Arterial (H_ARTERIAL) 
y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b 
 
 2. Cuando estamos interesados en una variable independiente o factor de riesgo 
con más de dos categorías y una variable dependiente dicotómica (tabla r x 2) 
también utilizamos la orden “Tables”, pero los resultados que se muestran son 
un poco diferentes a los de una tabla 2 x 2 tal como se muestra a continuación. 
Utilizando la tabla Bio3_06b, haga click en “Tablas” [“Tables”]. En la ventana de 
diálogo “TABAQUISMO” en “Exposure Variable” y “BAJO_PESO” en “Outcome 
Variable”. Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la 
ventana de resultados (Figura 6-9). 
 
 1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila 
(Row%) y columna (Col%). 
 2. No se muestra gráfico. 
 3. No se muestran estadísticos de riesgo. 
 4. Test estadístico de Chi cuadrado (tema que será tratado en el Capítulo 15) 
 
 
Figura 6-9. Frecuencias para la taba de Tabaquismo (TABAQUISMO) 
y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b 
 
 3. Cuando estamos interesados en comparar dos grupos mediante un análisis de 
riesgo, y ya tenemos las frecuencias en una tabla de contingencia (como es el 
caso de la Figura 6-9) utilizamos la opción “Tables (2 x 2, 2 , n)” que se encuentra 
en el menú colgante de StatCalc del menú principal de Epi Info 7 (Figura 6-10). Al 
hacer click observará que se abre la ventana que se muestra en la Figura 6-11. 
 
 
Figura 6-10. Menú colgante que muestra las opciones de Utilidades [“Utilities”] 
 
 
Figura 6-11. Pantalla de la opción “Tables (2 x 2, 2 x n)” de Statcalc. 
 
Asumamos que en relación a la variable TABAQUISMO, el código “0” corresponde a 
“no fumadoras”, el 1 a “fumadoras pasivas” y el código 2 a “fumadoras activas”, y que 
tenemos interés en comparar el riesgo de las “fumadoras activas” con el de las “no 
fumadoras”. Para realizar los cálculos solamente tecle los números que correspondan 
a cada celda, tal como se aprecia en la figura 6-11. Observe que hemos ubicado los 
valores del grupo 2 de TABAQUISMO (el de mayor consumo de cigarrillos) en el 
renglón de expuestos, y al grupo 0 de TABAQUISMO (el que no consume cigarrillos) en 
el renglón de no expuestos. Al completar los números las cuatro celdas podrá 
encontrar las estimaciones de Odds Ratio y Riego Relativo (con sus respectivos 
intervalos de confianza), tres cálculos de Chi Cuadrado y de la Prueba Exacta de Fisher. 
Dependiendo del diseño de muestreo el usuario tendrá de decidir si estos resultados 
con adecuados o no para el análisis. StatCalc no proporciona una estimación de Riesgo 
Atribuible. 
Para estimar el riesgo del siguiente nivel de exposición tecle los números de la 
exposición 1 a TABAQUISMO en el renglón de exposición, y los de exposición 0 a 
TABACO en el renglón de no expuestos. Los resultados se pueden presentar en forma 
tabular, tal como se muestran en el Cuadro 6-10 donde los códigos han sido cambiados 
por las categorías correspondientes. Utilizamos los valores de Riesgo Relativo o de 
Odds Ratio cuando el diseño de estudio lo permita. Los intervalos de confianza serán 
tratados en el Capítulo 16, pero aquí podremos comentar que los mismos se anotan en 
la siguiente columna, dejando en blanco el espacio que corresponde al grupo de 
referencia (las no fumadoras en este ejemplo) 
 
Cuadro 6-10. 
 Bajo peso al nacer Riesgo Relativo IC 95% 
Tabaquismo Si No 
No 26 82 1.0 
Si, pasivo 38 92 1.2 0.8 a 1.9 
Si, fumadora de cigarrillos 70 92 1.8 1.2 a 2.6 
 ------------------------------------------------------------------------------------------------------------------ 
CAMBIO PORCENTUAL 
El cambio porcentual es un cociente, cuyo numerador se constituye con el cambio 
entre dos momentos y el denominador es un periodo base. Su fórmula es: 
 P A P
A A
cambio porcentual 100 1 100
x x x
x x
 −
= = − 
 
 (6,9) 
Donde xA representa el valor en el periodo anterior y xP el valor en el periodo posterior. 
El cambio porcentual permite expresar numéricamente el cambio cuantitativo 
observado entre dos momentos, tomando como referencia el valor observado en el 
periodo anterior. 
Ejemplo explicativo 6-10. -------------------------------------------------------------------------------- 
Los datos que se presentan en el Cuadro 6-11 corresponden al número de casos de 
hepatitis viral notificados a la Secretaría de Salud; la primera columna corresponde al 
año de notificación y la segunda al número de casos notificados. En la tercera columna 
se señala el cambio porcentual del número de notificaciones de cada año 
comparándolo con el anterior. 
 
Cuadro 6-11. Casos de hepatitis viral notificadas en México, 1994-1997. 
Año Casos 
reportados 
Cambio Porcentual 
1994 16 918 
1995 7 083 (7,083-16,918)/16,918*100 =-58.13% 
1996 14 181 (14,181-7,083)/ 7,083*100 = 100.21% 
1997 26 824 (26,824-14,181)/ 14,181*100 = 89.15% 
Fuente: Epidemiología, 1996;13(2):3. Epidemiología, 1997;14(2):4. 
Epidemiología, 1998;15(2):4. 
 
Si esto se quisiera expresar en palabras, se diría: en 1994 se reportaron 16 918 casos; 
para el año siguiente (1995) el número de casos notificados disminuyó en 58.13%; para 
1996 se observó un incremento de 100.21% en relación con 1995; y para 1997 
nuevamente se observó un incremento, pero sólo de 89.15% en relación con el año 
anterior. ----------------------------------------------------------------------------------------------------- 
DATOS AGRUPADOS 
Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un 
arreglo ordenado donde los valores se agrupan en intervalos de clase que señalan los 
valores que deben incluirse en la tabulación, y son definidos por sus límites inferior y 
superior de clase. Los intervalos de clase no deben traslaparse y son consecutivos, por 
lo que el límite superior de clase de un intervalo es el límite inferior de clase del 
siguiente. Para la elaboración de un arreglo ordenado se procede de la siguiente 
manera: 
 
 1. Definir el número de intervalos de clase. Se recomienda que el númerode 
intervalos no sea menor de 5, ni mayor de 15. Generalmente, el número de 
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Código de campo cambiado
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejem. normal, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Nor 1, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
observaciones determina el de intervalos: mientras más observaciones más 
intervalos. La siguiente fórmula es útil para definirlos 
 1 3.322(log )nk = + (6,10) 
 Donde k corresponde al número de intervalos de clase y n es el número de 
observaciones que se quieren agrupar. El resultado es una orientación y el 
investigador podrá cambiarlo según convenga a su presentación. 
 2. Definir la amplitud de cada intervalo de clase. Generalmente todos los intervalos 
que se presentan tienen la misma amplitud, aunque no es obligatorio sea así. 
Algunas tabulaciones tienen intervalos que muestran amplitudes de diferente 
magnitud. Por ejemplo, en el campo de la salud los menores de 10 años suelen 
agruparse en menores de 1 año, de 1 a 4 años y de 5 a 10 años. Cuando se desea 
que todos los intervalos tengan la misma amplitud, éstos se determinan 
dividiendo el rango (valor superior menos valor inferior) entre k, o número de 
intervalos de clase. El resultado debe ser tomado como una aproximación y 
deberá modificarse en beneficio de la tabulación de datos. 
 3. Contar el número de observaciones cuyos valores son incluidos en cada intervalo 
de clase. 
 
Un cuadro que presenta los intervalos de clase y la frecuencia de observaciones que 
corresponde a cada intervalo es conocido como distribución de frecuencia. A partir de 
una distribución de frecuencia podemos obtener una distribución de frecuencia 
acumulada, una distribución de frecuencia relativa o una distribución de frecuencia 
relativa acumulada. 
Ejemplo explicativo 6-11. -------------------------------------------------------------------------------- 
Cuando el interés se encuentra en describir datos cuantitativos, tales como los 
mostrados en el cuadro 6-12 referentes a las tallas de un grupo de niños, podemos 
proceder de la siguiente manera: primero se decide cuántos intervalos de clase hemos 
de utilizar utilizando la fórmula 6,10, mediante la cual se obtiene k = 1+3.322(log(100)) 
= 7.644. Optamos por redondear el número de intervalos de clase a siete (pero 
también podríamos redondearlo a ocho). A continuación se calcula de qué amplitud 
será cada intervalo de clase dividiendo el rango 156-107=49 entre 7 resultando 
49/7=7. Para definir los límites inferiores de clase empezamos con 107 al primero, y a 
los siguientes les sumamos 7 hasta que superemos el valor máximo de nuestra serie de 
datos. El límite superior de cada intervalo de clase debe ser menor al límite inferior de 
siguiente intervalo, tal como se muestra en el Cuadro 6-12. A continuación tabulamos 
los datos del Cuadro 6-11 y los registramos en el Cuadro 6-12. 
 
 
Con formato: Nor 1, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Cuadro 6-11. Tallas de un grupo de 100 niños. 
i talla i talla i talla i talla i talla 
1 107 21 122 41 128 61 133 81 139 
2 107 22 123 42 128 62 134 82 139 
3 114 23 123 43 128 63 134 83 140 
4 116 24 123 44 128 64 134 84 140 
5 116 25 123 45 128 65 134 85 140 
6 117 26 124 46 129 66 134 86 140 
7 117 27 124 47 129 67 135 87 141 
8 117 28 124 48 129 68 135 88 142 
9 118 29 124 49 129 69 135 89 143 
10 119 30 124 50 129 70 136 90 144 
11 119 31 125 51 130 71 136 91 146 
12 120 32 126 52 130 72 136 92 146 
13 120 33 126 53 131 73 136 93 147 
14 121 34 126 54 131 74 136 94 147 
15 121 35 126 55 131 75 137 95 148 
16 121 36 126 56 131 76 137 96 148 
17 122 37 127 57 132 77 137 97 148 
18 122 38 127 58 132 78 137 98 149 
19 122 39 127 59 132 79 138 99 153 
20 122 40 128 60 133 80 138 100 156 
 
Para describir mediante frecuencias relativas la serie de datos, solo falta calcular los 
porcentajes correspondientes a cada intervalo de clase. 
 
Cuadro 6-12. Distribución de tallas de un grupo de 100 niños. 
Intervalo de clase 
Límite inferior Límite superior Frecuencia Porcentaje 
107 113 2 2.0 
114 120 11 11.0 
121 127 26 26.0 
128 134 27 27.0 
135 141 21 21.0 
142 148 10 10.0 
149 155 2 2.0 
156 160 1 1.0 
 100 100.0 
Cómo hacerlo en Epi Info, 6-3. ------------------------------------------------------------------------- 
En Epi Info para Windows abra el archivo Bioestadistica_3ra y seleccione la tabla 
Bio3_06c. Después de seleccionar la tabla de datos haga click en “OK”. 
Antes de agrupar los datos primero tiene que definir una nueva variable. Para 
hacerlo haga click con el mouse en “Define” (en el bloque de “Variables” de la ventana 
de comandos). Cuando aparezca la ventana de diálogo escribimos el nombre de la 
variable a definir (“GRUPOS”), y marcamos la opción estándar, tal como se aprecia en 
la Figura 6-12. Para ejecutar la orden sólo hacemos click con el mouse en “OK”. 
Con formato: Ejemplo
Con formato: Normal sangría
 
 
Figura 6-12. Venta de opciones de la orden “Define”. 
 
Continuamos agrupando los datos de la variable talla en la nueva variable (“GRUPOS”) 
que hemos definido. Para hacerlo haga click con el mouse en “Recode” (también en el 
bloque de “Variables” de la ventana de comandos. En la ventana de diálogo que se 
muestra en la Figura 6-14A primero defina la variable de origen, tal como se muestra 
en la ventanita “From”. Luego defina la variable destino, como se muestra en la 
ventanita “To”. Por último, defina los límites inferiores y superiores de cada intervalo 
de clase, así como el código de cada agrupación (evite utilizar el 0 en el valor 
recodificado). Para cambiar de celda al definir estos tres valores utilice el mouse 
(haciendo “click” en el espacio correspondiente. Al terminar de recodificar la ventana 
de diálogo deberá verse como la que se muestra en la Figura 6-14B. Para ejecutar la 
orden sólo haga click con el mouse en ““OK”. 
 
 
 
A B 
Figura 6-12. Ventana de la orden Recodificar [“Recode”] 
 
Para obtener las frecuencias agrupadas sólo haga click en Frequencies” (ver la sección 
“Cómo hacerlo en Epi Info, 6-1” al principio de este capítulo), seleccione “GRUPOS” en 
“Frequency of” y haga click con el mouse en ““OK” para ejecutar la orden. ---------------- 
EJERCICIOS 
Ejercicio A 
Observe el cuadro 6-13. Los datos que contiene se refieren a las características de 40 
niños recién nacidos y sus madres. Los datos están en la tabla Ejer_06a del archivo 
Bioestadistica_3ra. 
 
 
Con formato: Normal centro
Con formato: Normal centro
Cuadro 6-13. Características de 40 niños recién nacidos. 
i 
(identificación 
progresiva) 
Bajo peso del 
niño al nacer 
Sexo del 
recién nacido 
Exposición de la 
madre al humo de 
tabaco durante el 
embarazo 
Consumo de 
alcohol por la 
madre durante 
el embarazo1 no femenino fumadora pasiva no 
2 no femenino fumadora pasiva si 
3 si femenino fumadora activa no 
4 no masculino fumadora pasiva no 
5 no femenino fumadora pasiva no 
6 no masculino fumadora activa no 
7 si femenino fumadora activa no 
8 si femenino fumadora pasiva no 
9 no masculino fumadora pasiva si 
10 no masculino no no 
11 no femenino fumadora activa no 
12 si femenino fumadora pasiva si 
13 no femenino fumadora activa si 
14 no masculino no no 
15 no femenino no no 
16 si masculino fumadora pasiva si 
17 no femenino no no 
18 no femenino fumadora pasiva si 
19 no masculino fumadora activa si 
20 no femenino fumadora activa si 
21 no masculino no si 
22 si masculino fumadora activa si 
23 no femenino fumadora pasiva no 
24 no masculino fumadora activa no 
25 no femenino no no 
26 no masculino no si 
27 no masculino fumadora pasiva no 
28 si masculino fumadora activa no 
29 si masculino fumadora activa no 
30 no masculino fumadora activa no 
31 no masculino fumadora activa no 
32 no femenino fumadora pasiva si 
33 si femenino no no 
34 no femenino fumadora activa si 
35 no masculino no no 
36 no masculino no si 
37 no masculino fumadora activa no 
38 no femenino fumadora pasiva si 
39 no femenino fumadora activa si 
40 si femenino no si 
 
 
Ejercicio A1. 
Suponga que los datos fueron registrados durante todo un año de estancia en una 
comunidad del país y le interesa presentarlos ante sus colegas. A partir de esos datos 
llene el Cuadro 6-14 considerando los cuarenta registros como el total. 
 
Cuadro 5-14. 
Variables Frecuencia Porcentaje 
Bajo peso al nacer 
Si 
No 
Sexo del RN 
Femenino 
Masculino 
Exposición al tabaco 
Fumadora activa 
Fumadora pasiva 
No 
Consumo de alcohol 
Si 
No 
 
Ejercicio A2. 
Al estar preparando su presentación le surge el interés de explorar la relación que 
existe entre tres de las variables (sexo del recién nacido, tabaco y alcohol) con el bajo 
peso. Para poder hacerlo presenta los datos en el siguiente Cuadro 6-15. 
 
Cuadro 6-15. 
Variables Niños con 
bajo peso 
% (de 
renglón) 
Niños sin 
bajo peso 
% (de 
renglón) 
Sexo del RN 
Femenino 
Masculino 
Exposición al tabaco 
Fumadora activa 
Pasiva 
No 
Consumo de alcohol 
Si 
No 
 
Ejercicio A3. 
A partir del cuadro 6-15 Ud. decide hacer varias comparaciones para identificar las 
características asociadas con el bajo peso al nacer. Para hacer las comparaciones llene 
el Cuadro 6-16 con los valores de Riesgo Atribuible y Riesgo Relativo considerando las 
siguientes categorías como los valores de referencia: sexo masculino, no exposición al 
tabaco durante el embarazo y no consumo del alcohol durante el embarazo. 
 
Cuadro 6-16. 
Variables Riesgo Atribuible Riesgo Relativo 
Sexo del RN 
Femenino 
Masculino (grupo de referencia) 0.0 1.0 
Exposición al tabaco 
Fumadora activa 
Fumadora pasiva 
No (grupo de referencia) 0.0 1.0 
Consumo de alcohol 
Si 
No (grupo de referencia) 0.0 1.0 
Ejercicio B 
El administrador de una clínica de atención médica ha registrado los números de 
consultas que se presentan en el Cuadro 6-17. A partir de esos datos ayúdele a calcular 
los cambios porcentuales que la clínica ha registrado durante los años señalados, y 
preséntelos en el cuadro 6-17. 
 
Cuadro 6-17. 
Año Casos 
reportados 
Cambio Porcentual 
1999 10 785 
2000 9 279 
2001 10 642 
2002 15 193 
 
REFERENCIAS 
Daniel WW: Bioestadística. Base para el análisis en las ciencias de la salud, 3ra. 
edición. México: Limusa, Noriega Editores, 1987. 
Kleinbaum DG, Kupper LL, Morgenstern H: Epidemiologic Research. 1ra. edición. Van 
Nostrand Reinhold. New York, 1982. 
Koepsell T, Weill N, Swanson M: Apuntes del curso de Epidemiología 512. 
Washington, Universidad de Washington, Seattle, 1991. 
Martín-Moreno JM, Banegas JR. Sobre la traducción del término inglés odds ratio 
como oportunidad relativa. Salud Pública de México 1997;39:72-74. 
Tapia JA, Nieto FJ. Razón de posibilidades: una propuesta de traducción de la 
expresión odds ratio. Salud Pública de México 1993;35:419-424. 
Tapia-Granados JA. Posibilidades, oportunidades, momios: un comentario sobre la 
traducción del término odds. Salud Pública de México 1997;39:69-71.

Continuar navegando