Capitulo2006,202013

•

Outros

Los Mejores Apuntes

25/10/2022

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Ingeniería Civil

106.563 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

SEGUNDA PARTE: ESTADÍSTICA DESCRIPTIVA.
6. ESCALA CUALITATIVA
La información recabada durante las investigaciones estadísticas proviene de
observaciones individuales, y éstas casi siempre han de ser resumidas de alguna
manera antes de que se les pueda utilizar. Resumir datos cualitativos es relativamente
simple. Sólo hay que contar el número de observaciones según cada característica o
combinación de éstas, y representarlas como proporciones o razones. Los datos
cuantitativos también pueden resumirse mediante este procedimiento, siempre y
cuando se agrupen los valores de la variable en dos o más categorías.
PROPORCIONES
Para calcular una proporción se divide la frecuencia absoluta de la categoría que se
está analizando entre el total de individuos identificados con la variable de estudio. Lo
anterior se representa mediante la fórmula:
( ) /p a a b a N= ÷ + = (6,1)
Donde p representa la proporción, a es el número de elementos con la característica
de interés y b el número de elementos sin la característica de interés. Hay que notar
que a + b es el total del universo (N).
Ejemplo explicativo 6-1 ----------------------------------------------------------------------------------
Considérese la serie del cuadro 6-1, en la cual se presentan algunas características de
20 niños de 1 a 4 años que fallecieron ahogados en su hogar en la Zona Metropolitana
de Guadalajara. Esta serie de datos puede resumirse, mediante el uso de proporciones,
tal como se muestra en el cuadro 6-2.

Cuadro 6-1. Características de 20 niños, de 1 a 4 años de edad, ahogados
en su hogar. Zona Metropolitana de Guadalajara. 1991-1993.
i Sexo Depósito i Sexo Depósito
1 Masculino Aljibe 11 Femenino Aljibe
2 Masculino Balde/tina 12 Masculino Olla
3 Masculino Olla 13 Masculino Pozo de agua
4 Femenino Aljibe 14 Masculino Otro
5 Femenino Balde/tina 15 Masculino Aljibe
6 Masculino Aljibe 16 Masculino Aljibe
7 Masculino Pozo de agua 17 Masculino Balde/tina
8 Masculino Aljibe 18 Femenino Aljibe
9 Femenino Aljibe 19 Masculino Otro
10 Masculino Otro 20 Masculino Otro

Con formato: Normal
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Cuadro 6-2. Características 20 niños, de niños de 1 a 4 años de edad, ahogados
en su hogar. Zona Metropolitana de Guadalajara. 1991-1993.
Variable Frecuencia Proporción
Sexo
Masculino 15 15 ÷ 20 = 0.75
Femenino 5 5 ÷ 20 = 0.25
Depósito
Aljibe 9 9 ÷ 20 = 0.45
Balde/tina 3 3 ÷ 20 = 0.15
Olla 2 2 ÷ 20 = 0.10
Pozo de agua 2 2 ÷ 20 = 0.10
Otro 4 4 ÷ 20 = 0.20
------------------------------------------------------------------------------------------------------------------

La interpretación de las proporciones puede ser un poco confusa para el principiante.
Por ello, se acostumbra multiplicarlas por 100 para expresarlas como porcentaje, y se
especifican mediante el símbolo “%”. Así, para calcular un porcentaje basta dividir el
número de individuos en cada categoría entre el total del grupo y multiplicar el
resultado por 100. En el Ejemplo explicativo 6-1 los porcentajes serían: 0.75 × 100 =
75% varones, 0.25 × 100 = 25% mujeres, 0.45 × 100 = 45% ahogados en aljibes, 0.15 ×
100 = 15% en baldes/tinas, 0.10 × 100 = 10% en ollas, 0.10 × 100 = 10% en pozos de
agua, y 0.20 × 100 = 20% en otros depósitos de agua.
El uso de proporciones tiene varias ventajas. En primer lugar, permiten comparar
con facilidad dos o más series cuyos totales son diferentes, pues éstos quedan
convenientemente reducidos a la unidad (o a 100 en el caso de porcentajes). En
segundo lugar, a través de las proporciones se puede asumir la probabilidad de que un
evento ocurra. En el ejemplo anterior, existe una probabilidad de 0.75 (o 75%) de que
el sexo de un niño ahogado en el hogar sea masculino.
Cómo hacerlo en Epi Info, 6-1. -------------------------------------------------------------------------
Llame el programa Epi Info 7 y haga click en la opción “Classic” de “Analyze Data”
(figura 6-1).

Figura 6-1. Menú de Epi Info 7.

Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Normal sangría, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Fuente: +Cuerpo
(Calibri), Sin subrayado, Color de
fuente: Automático
Con formato: Fuente: +Cuerpo
(Calibri), Sin subrayado, Color de
fuente: Automático
Con formato: Fuente: +Cuerpo
(Calibri), Sin subrayado, Color de
fuente: Automático
Con formato: Ejemplo
Cuando se muestre la ventana de “Analysis” haga click en “Read” (el comando lo podrá
encontrar en el extremo superior de las opciones de comando). El programa le
mostrará la ventana de “Read”. En ella, primero haga click en la opción “Data Type” y
seleccione la opción “Microsoft Access 2002-2003 (.mbd)”
*
. Luego haga click en “Data
Source” y busque en el disco de datos que acompaña al libro el archivo
“Bioestadistica_3ra.MDB” (en la imagen de este ejemplo la carpeta donde se
encuentra el archivo es “I:\Cursos\Bioestadistica\Libro 3ra Edicion\bases\”, y esto
seguramente será diferente dependiendo de la unidad de memoria y la carpeta en que
guarde el archivo); Cuando lo encuentre selecciónelo. A continuación haga click en
“Bio3_06a”. En ese momento la ventana “Read” se mostrará tal como se aprecia en la
figura 6-2. Continúe haciendo click en el botón “OK”.

Figura 6-2. Pantalla de “Analysis” mostrando la ventana de “Read” con las selecciones
“Microsoft Access 2002-2003 (.mbd)”, “Bioestadistica_3ra.MDB” y “Bio3_06a”.

Notará que en el cuadro de “Epi Info” se apreciará el texto que se muestra en la figura
6-3.

*
Para los ejemplos de Epi Info 7 de esta edición hemos preferido utilizar el formato de
datos de Epi Info 2000 de tal manera que los datos puedan ser leídos tanto en la
versión 7 de Epi Info como en la anterior de Epi Info 2000 para Windows.
Figura 6-3. Mensaje que se muestra en la ventana después
de llamar los datos en “Analysis” de Epi Info 7.

Para obtener las frecuencias y los porcentajes correspondientes de una variable haga
click en “Frequencies” (el comando lo podrá encontrar en la mitad de la pantalla en la
lista de comandos), en el apartado “Statistics”]. En la ventana de diálogo que se
despliega seleccione “DEPOSITO” en la opción “Frequency of”. En ese momento la
ventana deberá observarse como en la Figura 6-4.

Figura 6-4. Ventana de diálogo para la frecuencia
de DEPOSITO según la tabla de datos 06a$.

Al hacer click con el ratón en “OK” podrá observar en la ventana de resultados (Figura
6-5) los siguientes elementos:

1. Categorías de la variable DEPOSITO.
2. Frecuencias absolutas de las categorías listadas.
3. Porcentaje de cada categoría en relación al total.
4. Porcentajes acumulados.
5. Gráfica de barras horizontales.
6. Intervalos de confianza del 95% para los porcentajes de la frecuencia de cada
categoría. Este tema será tratado más adelante, el en Capítulo 16.

Figura 6-5. Frecuencias de las categorías de la variable
DEPOSITO, según la tabla de datos 06a$.
------------------------------------------------------------------------------------------------------------------
Uso de las proporciones en Epidemiología
Las proporciones son muy utilizadas en la práctica de la epidemiología, de tal manera
que algunos usos específicos de estas tienen nombres propios,como es el caso de la
prevalencia, la incidencia acumulada, la sensibilidad y la especificidad. Estas la
describiremos más adelante, pero antes de hacerlo es necesario que aclaremos
algunos elementos del proceso salud-enfermedad que se toman en cuenta para la
estimación de la frecuencia de la enfermedad.
La frecuencia de la enfermedad en bioestadística
Típicamente la enfermedad es considerada un estado adverso de salud que caracteriza
a un individuo durante un periodo. Ejemplos de enfermedad son: demencia,
tuberculosis, alcoholismo, infección de vías urinarias, Diabetes Mellitus, etc. En la
figura 6-6 esto se presenta de manera gráfica.

Inicia la enfermedad
(Evento)
Duración de la enfermedad
(Estado)

Figura 6-6. Secuencia salud-enfermedad-salud en un sujeto.

Aunque por lo general se piensa en la enfermedad como un estado, también es posible
concebirla como un evento. El inicio de un estado de enfermedad es un evento que
ocurre en un punto específico del tiempo. Tal es el caso del cambio de sujeto sano a
enfermo de Diabetes Mellitus, hipertensión arterial, cáncer de cérvix, etc.
Prevalencia
La prevalencia cuantifica la proporción de individuos en la población que tienen algún
estado de enfermedad en un instante específico del tiempo, y proporciona una
estimación de la probabilidad de que un individuo se encuentre enfermo en algún
punto del tiempo. La fórmula para calcular la prevalencia (p) es:

número de casos con la enfermedad en un punto específico del tiempo
P
total de la población en el mismo grupo y punto específico de tiempo
= (6,2)
Este “punto” puede referirse a un día específico en el calendario, a la edad del sujeto
estudiado o a un momento en el curso del tiempo a partir de un evento. Para facilitar
la lectura del cociente anterior, se acostumbra multiplicar el resultado por una
constante que puede ser 100, 1 000, 10 000 u otra cantidad, con la finalidad de no
utilizar fracciones pequeñas al expresar prevalencias.
Ejemplo explicativo 6-2 ----------------------------------------------------------------------------------
Con frecuencia, los servicios de medicina familiar están interesados en conocer la
prevalencia de pacientes enfermos de diabetes en la comunidad donde brindan el
servicio médico. Para obtener esa información, el epidemiólogo ordena a su equipo
que visite y registre toda la población que cubre su unidad. Como resultado de su
investigación encuentra que en una población de 4 550 habitantes se identificaron 228
sujetos diabéticos. Así, la prevalencia de diabetes en esa población es de 228/4 550 =
0.05, o 5.0/100 habitantes.
------------------------------------------------------------------------------------------------------------------
Eliminado: ¶
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Código de campo cambiado
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Título 5, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Incidencia acumulada
En contraste con la prevalencia, la incidencia cuantifica el número de eventos de
enfermedad que se desarrollan en la población de individuos en riesgo durante un
intervalo específico de tiempo. La incidencia acumulada (IA) es la proporción de
personas que adquieren la enfermedad durante un periodo específico, y se calcula
como:

número de casos nuevos de enfermedad durante un período de tiempo
IA
total de la población en riesgo al inicio del período de estudio
= (6,3)
Esta medida de frecuencia proporciona un estimado de la probabilidad de que un
individuo tomado al azar en una población en riesgo (susceptible) desarrolle la
enfermedad durante un periodo específico. A esta probabilidad también se le conoce
como riesgo. El periodo de observación es arbitrario y depende de las características
evolutivas de la enfermedad. Al igual que con la prevalencia, la IA puede multiplicarse
por una constante para facilitar su lectura e interpretación.
Antes de continuar es necesario señalar que una persona se encuentra “en
riesgo” de una enfermedad cuando es biológicamente posible que desarrolle la
enfermedad en un futuro inmediato. “En riesgo” significa que el sujeto es susceptible a
la enfermedad. En otras palabras, que la probabilidad de que desarrolle una
enfermedad no es igual a cero. En términos epidemiológicos, “en riesgo” no significa
“en mayor riesgo” en relación con otra persona. Razones frecuentes de que alguien no
se encuentre en riesgo son:

• La persona tiene la enfermedad. Alguien que sufra de Diabetes Mellitus no se
encuentra en riesgo de desarrollarla nuevamente.
• La persona ha adquirido inmunidad. Un niño que ya enfermó de sarampión no lo
padecerá de nuevo.
• La persona no tiene la capacidad biológica de desarrollar la enfermedad. Los
varones nunca sufrirán cáncer uterino.
• Durante algún tiempo de vida la persona fue susceptible de desarrollar la
enfermedad, pero ésta fue abolida por algún procedimiento particular. La mujer
a la que se le ha practicado histerectomía no puede desarrollar cáncer uterino.
Ejemplo explicativo 6-3 ----------------------------------------------------------------------------------
Si se toma una cohorte de 12 sujetos y se le observa durante cinco años (sin que sus
elementos se pierdan para el estudio y sin que dejen de estar en riesgo durante el
periodo del estudio) y de ellos cinco desarrollan la enfermedad, entonces la IA será
5/12 = 0.42 en cinco años. En otras palabras, si se toma un individuo de los observados
al inicio del estudio, la probabilidad de que en el transcurso de cinco años desarrolle la
enfermedad es de 0.42, o 42/100.
------------------------------------------------------------------------------------------------------------------
La prevalencia y la incidencia son dos aspectos de un mismo fenómeno. Para
entenderlas hay que poner atención a la figura 6-7, en la cual se representa a 13
sujetos en observación durante cinco años. Al inicio del estudio todos los sujetos se
encuentran sanos y todos ellos tienen el riesgo (son susceptibles) de contraer la
enfermedad. Se debe convenir que en esa figura la cruz representa el inicio de la
Con formato: Título 5, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Normal sangría, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Nor 1, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Conformato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Español (España - alfab. tradicional)
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
enfermedad, o “evento”; que la línea gruesa representa el tiempo durante el cual el
sujeto está enfermo, o “estado”; y el cuadro representa el momento en que el sujeto
sale del estudio porque muere. Si se hace un corte después de un año de observación
se encuentra que en ese “punto específico de tiempo” existen dos enfermos entre los
13 sujetos observados. Así, la prevalencia es igual a 2/13 = 0.15, mientras que la
incidencia acumulada desde el inicio del estudio es 2/13 = 0.15 en un año. En este
caso, la prevalencia y la incidencia son semejantes, pero no siempre tiene que ser así,
ya que para el cuarto año han fallecido cuatro sujetos y sólo quedan nueve, de los
cuales tres están enfermos. Por tanto, la prevalencia es de 3/9 = 0.33, mientras que la
incidencia acumulada es de 7/13 = 0.54 en cuatro años.

1
3
5
7
9
11
13
0 1 2 3 4 5
sujeto sano en observación
inicia la enfermedad
sujeto enfermo en observación
defunción
Tiempo de observación del grupo
Sujeto ( )i

Figura 6-7. Eventos y estados de enfermedad en un grupo de sujetos.
Sensibilidad y especificidad
La sensibilidad y la especificidad son dos proporciones que nos permiten medir la
validez de un instrumento de medición en relación a un criterio de clasificación, y se
definen de la siguiente manera:

• Sensibilidad.- Es la probabilidad de clasificar correctamente a aquellos que tienen
la característica de interés.
• Especificidad.- Es la probabilidad de clasificar correctamente a aquellos que no
tienen la característica de interés.

Para su cálculo procedemos de la siguiente manera:

Código de campo cambiado
Con formato: Título 5, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
1. Mediante un procedimiento de clasificación “perfecto” (generalmente conocido
como “gold standard” o “estándar de oro”) los sujetos son clasificados según
presenten la característica o no la presenten (en términos clínicos, generalmente
se clasifican como enfermos y no enfermos).
2. Luego, estos mismos sujetos con clasificados mediante un instrumentos menos
perfecto (aunque más sencillo, económico o menos invasivo) en dos grupos
según presenten la característica o no la presenten (en términos clínicos,
generalmente se clasifican como “positivos” o “negativos” a la prueba). Uno
esperaría que todos aquellos que tienen la característica (según se medió con el
“estándar de oro”) resulten “positivos”, y que aquellos que no tienen la
característica (según se midió con el “estándar de oro”) resulten “negativos”
3. Dado que el segundo criterio de clasificación es imperfecto, algunos sujetos que
realmente presentan la característica (según el “estándar de oro”) serán
clasificados incorrectamente como que no la tienen (o “negativos”), mientras
que algunos que realmente no presentan la característica (según el “estándar de
oro”) serán clasificados incorrectamente como que sí la tienen (o “positivos”).
4. Para el cálculo de la sensibilidad y la especificidad, generalmente, acomodamos
los datos según el cuadro 6-3.

Clasificación con el
“estándar de oro”
Prueba alternativa Presente Ausente
Positivo a b
Ausente c d
a + c b + d
Cuadro 6-3. Arreglo de datos para el
cálculo de sensibilidad y especificidad.

5. Concluimos nuestro cálculo con las dos fórmulas que se muestran a
continuación.
Sensibilidad =
+
a
a c

Especificidad =
+
d
b d

Es necesario notar que cuando la sensibilidad es perfecta, el 100% de los que fueron
clasificados con la característica mediante el “estándar de oro” también son
clasificados mediante el segundo criterio de clasificación. Cuando eso no ocurre la
sensibilidad es menor al 100%. Lo mismo ocurre con la especificidad para los que
fueron clasificados por el “estándar de oro” sin la característica.
Ejemplo explicativo 6-4 ----------------------------------------------------------------------------------
Supongamos que tenemos interés en evaluar la validez de una prueba diagnóstica que
es más rápida y económica que el “estándar de oro”. Para hacerlo seleccionamos dos
grupos: uno de enfermos u otro de no enfermos: ambos clasificados mediante el uso
del “estándar de oro”. Las frecuencias cada categoría se muestran en el cuadro 6-4.
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números

Cuadro 6-4. Arreglo de datos ficticios para el
cálculo de sensibilidad y especificidad.
Clasificación con el
“estándar de oro”
Prueba alternativa Enfermo Sano
Positivo 85 10
Negativo 15 190
100 200

Para los datos que se muestran en el cuadro 6-2, la sensibilidad de la prueba
alternativa sería 85/100 = 0.85, o 85%, y la especificidad de la prueba alternativa sería
de 190/200 = 0.95, o 95%. -------------------------------------------------------------------------------
RAZONES
Cuando la serie que se está examinando consta sólo de dos categorías, o el interés de
la investigación se dirige únicamente a dos categorías, se pueden utilizar las razones
para resumir la información. Para ello, se divide la totalidad de individuos que tengan
una característica (de preferencia el grupo de mayor tamaño) entre el grupo que tenga
la otra característica. De esta manera, y a diferencia de las proporciones, las lecturas
del numerador no se incluyen en el denominador. Su fórmula es:
R a b= ÷ (6,4)
En la que R representa la razón, a simboliza el número de elementos con la
característica de interés y b el número de elementos con una característica diferente.
Hay que notar que a + b no necesariamente son el total del universo.
Ejemplo explicativo 6-5. ---------------------------------------------------------------------------------
Continuando con el Ejemplo explicativo 6-1, la serie de datos puede resumirse,
mediante el uso de razones, de la siguiente manera:

1. Según el sexo del niño (cuadro 6-2), por cada niña que se asfixia por inmersión en
el hogar hay tres niños que sufren ese accidente mortal. En este ejemplo a = 15,
b = 5 y a ÷ b = 3 es la razón.

Cuadro 6-5. Sexo de niños de 1 a 4 años de edad ahogados en su hogar.
Zona Metropolitana de Guadalajara. 1991-1993.
Sexo Frecuencia Razón
Masculino 15 15 ÷ 5 = 3
Femenino 5

2. Según el depósito en que se ahogó (cuadro 6-6), por cada menor que se asfixia
por inmersión en un balde o tina, hay tres que pierden la vida en un aljibe. En
este ejemplo, a = 9, b = 3, a ÷ b = 3 es la razón.

Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri),
Sin Cursiva, Sin subrayado, Color de
fuente: Automático, Español (España -
alfab. tradicional)
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri), 12
pto, Sin subrayado, Color de fuente:
Automático, Español (España - alfab.
tradicional)
Cuadro 6-6. Depósito de agua en que niños de 1 a 4 años de edad se ahogaron
en su hogar. Zona Metropolitana de Guadalajara. 1991-1993.
Depósito Frecuencia Razón
Aljibe 9 9 ÷ 3 = 3
Balde/tina 3
------------------------------------------------------------------------------------------------------------------
Densidad de incidencia
Para el cálculo de una razón no siempre se utiliza información de dos grupos
diferentes. También podemos utilizar en el numerador y el denominador información
procedente de un mismo grupo, pero de diferente naturaleza. Tal es el caso de la
densidad de incidencia (DI) en la que el numerador es semejante a la incidencia
acumulada pero el denominador es la suma del tiempo que cada individuo ha
permanecido en observación (“tiempo persona”) y en riesgo de enfermar. Su fórmula
está dada por

número de casos nuevos de enfermedad durante un período de tiempo
DI=
total de tiempo-persona de observación
(6,5)
Al presentar la densidad de incidencia es esencial que se especifique la unidad de
tiempo; esto es, si la tasa representa el número de casos por día-persona, mes-
persona, año-persona, o alguna otra medida de tiempo-persona. La densidad de
incidencia nos habla del cambio potencial instantáneo del estado de enfermedad de
una población en una unidad de tiempo.
A diferencia de la incidencia acumulada que es una proporción y puede
interpretarse como una probabilidad, la densidad de incidencia dirige su atención al
número de eventos que se presentan en una unidad de tiempo (y de manera inversa al
tiempo que transcurre entre evento y evento). Esto se gráfica en la Figura 6-8, donde
el tiempo persona en riesgo se refiere al tiempo acumulado que tuvieron que
acumular los sujetos en estudio para registrar los eventos de interés.

1
3
5
7
9
11
13
0 1 2 3 4 5
Tiempo de observación del grupo
Sujeto ( )i
Tiempo persona en riesgo

Con formato: Ejem. normal
Con formato: Fuente:
(Predeterminado) +Cuerpo (Calibri), 12
pto, Español (España - alfab.
tradicional)
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin Cursiva, Sin
subrayado, Color de fuente:
Automático, Español (alfab.
internacional)
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin Cursiva, Sin
subrayado, Color de fuente:
Automático, Español (alfab.
internacional)
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin Cursiva, Sin
subrayado, Color de fuente:
Automático, Español (alfab.
internacional)
Con formato: Normal sangría
Código de campo cambiado
Figura 6-8. Tiempo persona de observación correspondiente a población en riesgo.
Ejemplo explicativo 6-6. ----------------------------------------------------------------------------------
En una unidad de terapia intensiva están interesados en conocer la incidencia de
muertes en pacientes que ingresan con infarto de miocardio. Después de 10 días se
han registrado los datos del cuadro 6-7.

Cuadro 6-7. Pacientes con infarto de miocardio observados en terapia intensiva
Paciente i Tiempo de observación en
días a partir del ingreso
hasta la alta de terapia
intensiva
Motivo de egreso
1 9 defunción
2 5 mejoría
3 3 mejoría
4 3 defunción
5 1 defunción

Con los datos anteriores no es posible calcular una incidencia acumulada, ya que los
periodos de observación no son los mismos en todos los sujetos, pero se puede
calcular una densidad de incidencia. Para ello, se toma el total de eventos de interés
observados (tres defunciones) y se les divide entre el tiempo-persona observado
durante el cual se presentaron esos eventos (21 días-persona). Así, la densidad de
incidencia es 3 ÷ 21 = 0.143 días-persona
–1
, o 0.143 defunciones por cada día de
estancia acumulada por el grupo. ----------------------------------------------------------------------
LA COMPARACIÓN DE GRUPOS
Con frecuencia, en el campo de las ciencias de la salud se tiene la necesidad de
comparar grupos entre sí. Cuando el tamaño de los grupos a comparar es idéntico es
posible valerse de frecuencias absolutas. Sin embargo, lo más frecuente es que los
grupos sean diferentes en cuanto al tamaño del grupo en estudio. En estas ocasiones
el uso de frecuencias relativas (proporciones o razones) facilita la comparación
mediante una simple sustracción. Es preciso notar que cuando las frecuencias relativas
(proporciones o razones) de dos grupos son iguales, la diferencia es de cero, mientras
que cuando son diferentes el resultado es mayor o menor que cero.
Ejemplo explicativo 6-7. ---------------------------------------------------------------------------------
Supóngase que se sospecha y existe interés en probar la hipótesis de que en una
escuela secundaria los alumnos varones se lesionan más frecuentemente que sus
compañeras. Para ello, se observa a los estudiantes durante un año escolar y al final de
él se encuentra que el número de lesionados es semejante para ambos grupos: 15
lesionados en el transcurso del año. Estas frecuencias absolutas son de valor, pero
pueden conducir a errores graves de interpretación; por ejemplo, si de 300 alumnos
que estudian en el plantel sólo 100 fueran varones. En este caso, el uso de una
proporción permitirá evaluar la frecuencia con que se presentan las lesiones según el
sexo. De esta manera, la incidencia de lesionados en el grupo de varones es de
15/100 = 0.15, mientras que para las mujeres tan sólo es de 15/200 = 0.08, por lo que
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejem. normal, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Fuente: +Cuerpo
(Calibri), 12 pto, Sin subrayado, Color
de fuente: Automático, Español
(España - alfab. tradicional),
Superíndice
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
la diferencia sería de 0.15 - 0.08 = 0.07. Lo anterior indicaría que en esa escuela los
varones se accidentan más que las mujeres. --------------------------------------------------------
Riesgo Atribuible
En epidemiología a esta diferencia se le conoce como riesgo atribuible (RA), y
proporciona información acerca del efecto absoluto de la exposición o exceso de
riesgo de la característica de interés en aquellos que pertenecen a un grupo con una
característica específica (expuestos) en comparación con aquellos que no la tienen (no
expuestos). Ayuda a responder a la pregunta: (si se ha inferido que la exposición causa
la enfermedad) entre las personas expuestas, ¿qué cantidad de la característica de
interés (quizá una enfermedad) se debe a la exposición? Esta medida se define como la
diferencia entre la incidencia de los expuestos y los no expuestos, y se calcula
mediante:

e o
I I− (6,6)
Donde Ie es la incidencia de expuestos (medida como incidencia acumulada o como
densidad de incidencia), mientras que Io es la incidencia de no expuestos (medida
también como incidencia acumulada o como densidad de incidencia). Dos prevalencias
también pueden compararse mediante la sustracción, aunque el resultado se conoce
como diferencia de prevalenciasy no como riesgo atribuible.
Riesgo Relativo
La razón también es un instrumento útil para comparar dos grupos. Para su
interpretación se debe tomar en cuenta el grupo a comparar (el numerador) en
referencia con el grupo de comparación (el denominador). Cuando ambos grupos son
iguales, el resultado siempre es igual a uno. Así, 9 ÷ 9 = 3 ÷ 3 = 1 indica que el grupo a
comparar es igual al grupo de comparación o referencia. En otras palabras, por cada
elemento en el grupo a comparar existe otro en el grupo de comparación. Cuando el
numerador es mayor que el denominador, como en 9 ÷ 3 = 3, el resultado siempre será
mayor a 1. Si éste es el caso, el resultado indica cuántos elementos (y fracción de ellos)
en el grupo a comparar existen por cada elemento en el grupo de referencia. Por otra
parte, si el numerador es menor que el denominador, 3 ÷ 9 = 0.33, el resultado expresa
qué fracción de un elemento, en el grupo a comparar, existe por cada elemento en el
grupo de comparación. En epidemiología a este cociente se le conoce como riesgo
relativo (RR), y estima la magnitud de una asociación entre exposición y enfermedad e
indica la probabilidad del grupo expuesto de desarrollar la enfermedad en relación con
aquellos que no están expuestos. Ayuda a responder a la pregunta: ¿la exposición
causa la enfermedad? Esta medida se define como el cociente de la incidencia de los
expuestos entre la incidencia los no expuestos, y se calcula mediante:
e
o
I
I
(6,7)
En la cual Ie es la incidencia de expuestos (medida como incidencia acumulada o como
densidad de incidencia) e Io es la incidencia de no expuestos (medida también como
incidencia acumulada o como densidad de incidencia). Dos prevalencias también
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Título 4, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Normal
pueden compararse mediante una razón, aunque el resultado se conoce como razón
de prevalencias y no como riesgo relativo.
Una interpretación alternativa del riesgo relativo consiste en restar 1 al resultado
(cociente) y multiplicarlo por 100. De esta manera, el resultado se interpreta como el
porcentaje que el grupo a comparar se encuentra por arriba o por abajo en relación
con el grupo de referencia. Cuando los grupos son idénticos, el resultado es igual a 0%
[(1 - 1) × 100 = 0%]. Si el numerador es mayor que el denominador, el resultado es
superior a 0% [(3 – 1) × 100 = 200%], mientras que lo contrario resulta en un valor
negativo [(0.33 – 1) × 100 = –67%]. Si se toma al grupo de comparación como 100%, el
resultado mediante el procedimiento anterior indica, de manera porcentual, en qué
magnitud porcentual el grupo a comparar se encuentra por arriba o por abajo del
grupo de referencia.
Ejemplo explicativo 6-8. ----------------------------------------------------------------------------------
La comparación de grupos que realizamos mediante la diferencia de proporciones en
el Ejemplo explicativo 6-7 también puede efectuarse mediante una razón entre
proporciones, donde 0.15 ÷ 0.08 = 1.88 nos indica que existen 1.88 hombres
lesionados por cada mujer lesionada, o también que existen 88% más hombres
lesionados que mujeres lesionadas. -------------------------------------------------------------------
Tablas de contingencia
Las tablas de contingencia son arreglos ordenados de frecuencias que se acomodan en
celdas definidas por columnas y renglones. Las frecuencias presentadas de esta
manera facilitan algunos procedimientos estadísticos utilizados frecuentemente, como
son el cálculo de riesgo atribuible, riesgo relativo, chi-cuadrada y prueba exacta de
Fisher, por mencionar cuatro de los más frecuentes.
La tabla de contingencia más utilizada es la conocida como 2 x 2, que consiste en
una tabla con dos hileras y dos columnas donde los sujetos se clasifican según dos
criterios, cada uno de los cuales ocurre en dos niveles. Una tabla de este tipo se
presenta en el Cuadro 6-8.

Cuadro 6-8. Tabla de contingencia 2 x 2.
Criterio de efecto
Si No Total
Criterio de Si a b a + b
exposición No c d c + d
Total a + c b + d a + b + c + d
Ejemplo explicativo 6-9. ---------------------------------------------------------------------------------
Las frecuencias del Ejemplo explicativo 6-7 pueden presentarse en una tabla de
contingencia 2 x 2. El cuadro 6-9 nos muestra los datos en una tabla de este tipo.

Cuadro 6-9. Frecuencias observadas según el ejercicio explicativo 6-7.
Lesionados
Si No Total
Hombres 15 85 100
Mujeres 15 185 200
Con formato: Normal sangría, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Título 4
Con formato: Normal sangría
Con formato: Ejemplo
Total 30 300 300

A partir de este arreglo, la incidencia de lesiones en hombres se puede calcular
mediante a/(a+b) = 15/100, mientras que la incidencia de lesiones en mujeres sería
igual c/(c+d) = 15/200. -----------------------------------------------------------------------------------
Odds Ratio
El riesgo relativo supone que el muestreo en la población ha sido realizado de manera
aleatoria, y que posteriormente los sujetos han sido clasificados según dos variables
dicotómicas (diseño transversal analítico), o bien que los grupos muestreados han sido
formados atendiendo a su nivel de exposición (diseño de cohortes). En Epidemiología
es frecuente que los grupos a comparar sean formados a partir de la condición de
enfermedad que se desea estudiar (diseño de casos y controles). En estas
circunstancias, no es factible estimar el riesgo relativo de manera directa (para una
explicación más completa consulte algún libro de Epidemiología). No obstante, cuando
se puede mantener el supuesto de que la frecuencia de la enfermedad que se estudia
está por debajo del 10%, se puede utilizar una aproximación al riesgo relativo conocida
como odds ratio. Cuando las frecuencias al comparar dos grupos se presentan en un
cuadro 2 x 2 semejante al mostrado en el cuadro 6-8 el odds ratio se puede calcular
utilizando la fórmula siguiente:
Odds ratio
ad
bc
ϕ= = (6,8)
Ejemplo explicativo 6-10. --------------------------------------------------------------------------------
Al utilizar las frecuencias que se presentan en el cuadro 6-9 el odds ratio será igual a
15 x 185/15 x 85 = 2 775 x 1 275 = 2.18, que nos sugiere que existen 2.18 hombres
lesionados por cada mujer lesionada. El resultado no es igual al calculado con el riesgo
relativo en el Ejemplo explicativo 6-8 (de 1.88), pero es una buena aproximación
cuando el diseño de muestreo no nos permite calcularlo, y los dos resultados se
aproximarán en la medida en que el fenómeno estudiado sea más raro. -------------------

La expresión odds ratio ha sido traducida al español de diferentes formas entre las que
se pueden mencionar “razón de productos cruzados”, “razón de momios”,
“oportunidad relativa” y “razón de posibilidades” sin que se hubiera llegado a definir
un consenso.
Cómo hacerlo en Epi Info, 6-2. -------------------------------------------------------------------------
Epi Info 7 brinda varias alternativas para comparar dos grupos mediante Riesgos
relativos, Riegos atribuibles y Odds Ratio.

1. Cuando estamos interesados en una variable independiente o factor de riesgo y
una variable dependiente, ambas dicotómicas (tabla 2 x 2), utilizamos la orden
Tables” tal como se muestra a continuación. En Epi Info 7 abra el archivo
Bioestadistica_3ra y seleccione la tabla Bio3_06b
†
. Después de seleccionar la† Si tiene dificultad para encontrar la tabla de datos Bio3_06b revise la sección “Cómo
hacerlo en Epi Info, 6-1” en este mismo capítulo.
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin subrayado, Color
de fuente: Automático
Con formato: Fuente: +Cuerpo
(Calibri), Negrita, Sin subrayado, Color
de fuente: Automático
Código de campo cambiado
Con formato: Normal
tabla de datos haga click en “OK”. Para continuar haga click en “Tables”, en el
apartado “Statistics” de la lista de comandos. En la ventana de diálogo que se
despliega seleccione “H_ARTER” en “Exposure Variable” y “BAJO_PES” en
“Outcome Variable”. En ese momento la ventana deberá observarse como en la
Figura 6-7.

Figura 6-7. Ventana de diálogo para la taba de Hipertensión Arterial (H_ARTERIAL)
y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_06b

Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la ventana de
resultados (Figura 6-8).

1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila
(Row%) y columna (Col%).
2. Un gráfico que muestra visualmente el peso que cada celda tiene en la tabla
2 x 2.
3. Odds Ratio, según dos procedimientos, y sus intervalos de confianza (el tema
de los intervalos de confianza para estimaciones con variables cualitativas
será tratado más adelante, en el Capítulo 16.
4. Razón de Riesgos, o Riego Relativo (Risk Ratio), y sus intervalos de confianza.
5. Diferencia de Riegos (Risk Difference), o Riego Atribuible, y sus intervalos de
confianza.
6. Test estadísticos de Chi cuadrado (tema que será tratado en el Capítulo 15)
7. Cálculos de probabilidad mediante la aproximación a la distribución de la
binomial y la Prueba Exacta de Fisher.

Figura 6-8. Frecuencias para la taba de Hipertensión Arterial (H_ARTERIAL)
y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b

2. Cuando estamos interesados en una variable independiente o factor de riesgo
con más de dos categorías y una variable dependiente dicotómica (tabla r x 2)
también utilizamos la orden “Tables”, pero los resultados que se muestran son
un poco diferentes a los de una tabla 2 x 2 tal como se muestra a continuación.
Utilizando la tabla Bio3_06b, haga click en “Tablas” [“Tables”]. En la ventana de
diálogo “TABAQUISMO” en “Exposure Variable” y “BAJO_PESO” en “Outcome
Variable”. Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la
ventana de resultados (Figura 6-9).

1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila
(Row%) y columna (Col%).
2. No se muestra gráfico.
3. No se muestran estadísticos de riesgo.
4. Test estadístico de Chi cuadrado (tema que será tratado en el Capítulo 15)

Figura 6-9. Frecuencias para la taba de Tabaquismo (TABAQUISMO)
y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b

3. Cuando estamos interesados en comparar dos grupos mediante un análisis de
riesgo, y ya tenemos las frecuencias en una tabla de contingencia (como es el
caso de la Figura 6-9) utilizamos la opción “Tables (2 x 2, 2 , n)” que se encuentra
en el menú colgante de StatCalc del menú principal de Epi Info 7 (Figura 6-10). Al
hacer click observará que se abre la ventana que se muestra en la Figura 6-11.

Figura 6-10. Menú colgante que muestra las opciones de Utilidades [“Utilities”]

Figura 6-11. Pantalla de la opción “Tables (2 x 2, 2 x n)” de Statcalc.

Asumamos que en relación a la variable TABAQUISMO, el código “0” corresponde a
“no fumadoras”, el 1 a “fumadoras pasivas” y el código 2 a “fumadoras activas”, y que
tenemos interés en comparar el riesgo de las “fumadoras activas” con el de las “no
fumadoras”. Para realizar los cálculos solamente tecle los números que correspondan
a cada celda, tal como se aprecia en la figura 6-11. Observe que hemos ubicado los
valores del grupo 2 de TABAQUISMO (el de mayor consumo de cigarrillos) en el
renglón de expuestos, y al grupo 0 de TABAQUISMO (el que no consume cigarrillos) en
el renglón de no expuestos. Al completar los números las cuatro celdas podrá
encontrar las estimaciones de Odds Ratio y Riego Relativo (con sus respectivos
intervalos de confianza), tres cálculos de Chi Cuadrado y de la Prueba Exacta de Fisher.
Dependiendo del diseño de muestreo el usuario tendrá de decidir si estos resultados
con adecuados o no para el análisis. StatCalc no proporciona una estimación de Riesgo
Atribuible.
Para estimar el riesgo del siguiente nivel de exposición tecle los números de la
exposición 1 a TABAQUISMO en el renglón de exposición, y los de exposición 0 a
TABACO en el renglón de no expuestos. Los resultados se pueden presentar en forma
tabular, tal como se muestran en el Cuadro 6-10 donde los códigos han sido cambiados
por las categorías correspondientes. Utilizamos los valores de Riesgo Relativo o de
Odds Ratio cuando el diseño de estudio lo permita. Los intervalos de confianza serán
tratados en el Capítulo 16, pero aquí podremos comentar que los mismos se anotan en
la siguiente columna, dejando en blanco el espacio que corresponde al grupo de
referencia (las no fumadoras en este ejemplo)

Cuadro 6-10.
Bajo peso al nacer Riesgo Relativo IC 95%
Tabaquismo Si No
No 26 82 1.0
Si, pasivo 38 92 1.2 0.8 a 1.9
Si, fumadora de cigarrillos 70 92 1.8 1.2 a 2.6
------------------------------------------------------------------------------------------------------------------
CAMBIO PORCENTUAL
El cambio porcentual es un cociente, cuyo numerador se constituye con el cambio
entre dos momentos y el denominador es un periodo base. Su fórmula es:
P A P
A A
cambio porcentual 100 1 100
x x x
x x
 −
= = − 
 
(6,9)
Donde xA representa el valor en el periodo anterior y xP el valor en el periodo posterior.
El cambio porcentual permite expresar numéricamente el cambio cuantitativo
observado entre dos momentos, tomando como referencia el valor observado en el
periodo anterior.
Ejemplo explicativo 6-10. --------------------------------------------------------------------------------
Los datos que se presentan en el Cuadro 6-11 corresponden al número de casos de
hepatitis viral notificados a la Secretaría de Salud; la primera columna corresponde al
año de notificación y la segunda al número de casos notificados. En la tercera columna
se señala el cambio porcentual del número de notificaciones de cada año
comparándolo con el anterior.

Cuadro 6-11. Casos de hepatitis viral notificadas en México, 1994-1997.
Año Casos
reportados
Cambio Porcentual
1994 16 918
1995 7 083 (7,083-16,918)/16,918*100 =-58.13%
1996 14 181 (14,181-7,083)/ 7,083*100 = 100.21%
1997 26 824 (26,824-14,181)/ 14,181*100 = 89.15%
Fuente: Epidemiología, 1996;13(2):3. Epidemiología, 1997;14(2):4.
Epidemiología, 1998;15(2):4.

Si esto se quisiera expresar en palabras, se diría: en 1994 se reportaron 16 918 casos;
para el año siguiente (1995) el número de casos notificados disminuyó en 58.13%; para
1996 se observó un incremento de 100.21% en relación con 1995; y para 1997
nuevamente se observó un incremento, pero sólo de 89.15% en relación con el año
anterior. -----------------------------------------------------------------------------------------------------
DATOS AGRUPADOS
Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un
arreglo ordenado donde los valores se agrupan en intervalos de clase que señalan los
valores que deben incluirse en la tabulación, y son definidos por sus límites inferior y
superior de clase. Los intervalos de clase no deben traslaparse y son consecutivos, por
lo que el límite superior de clase de un intervalo es el límite inferior de clase del
siguiente. Para la elaboración de un arreglo ordenado se procede de la siguiente
manera:

1. Definir el número de intervalos de clase. Se recomienda que el númerode
intervalos no sea menor de 5, ni mayor de 15. Generalmente, el número de
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Código de campo cambiado
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejemplo, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Ejem. normal, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Con formato: Nor 1, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
observaciones determina el de intervalos: mientras más observaciones más
intervalos. La siguiente fórmula es útil para definirlos
1 3.322(log )nk = + (6,10)
Donde k corresponde al número de intervalos de clase y n es el número de
observaciones que se quieren agrupar. El resultado es una orientación y el
investigador podrá cambiarlo según convenga a su presentación.
2. Definir la amplitud de cada intervalo de clase. Generalmente todos los intervalos
que se presentan tienen la misma amplitud, aunque no es obligatorio sea así.
Algunas tabulaciones tienen intervalos que muestran amplitudes de diferente
magnitud. Por ejemplo, en el campo de la salud los menores de 10 años suelen
agruparse en menores de 1 año, de 1 a 4 años y de 5 a 10 años. Cuando se desea
que todos los intervalos tengan la misma amplitud, éstos se determinan
dividiendo el rango (valor superior menos valor inferior) entre k, o número de
intervalos de clase. El resultado debe ser tomado como una aproximación y
deberá modificarse en beneficio de la tabulación de datos.
3. Contar el número de observaciones cuyos valores son incluidos en cada intervalo
de clase.

Un cuadro que presenta los intervalos de clase y la frecuencia de observaciones que
corresponde a cada intervalo es conocido como distribución de frecuencia. A partir de
una distribución de frecuencia podemos obtener una distribución de frecuencia
acumulada, una distribución de frecuencia relativa o una distribución de frecuencia
relativa acumulada.
Ejemplo explicativo 6-11. --------------------------------------------------------------------------------
Cuando el interés se encuentra en describir datos cuantitativos, tales como los
mostrados en el cuadro 6-12 referentes a las tallas de un grupo de niños, podemos
proceder de la siguiente manera: primero se decide cuántos intervalos de clase hemos
de utilizar utilizando la fórmula 6,10, mediante la cual se obtiene k = 1+3.322(log(100))
= 7.644. Optamos por redondear el número de intervalos de clase a siete (pero
también podríamos redondearlo a ocho). A continuación se calcula de qué amplitud
será cada intervalo de clase dividiendo el rango 156-107=49 entre 7 resultando
49/7=7. Para definir los límites inferiores de clase empezamos con 107 al primero, y a
los siguientes les sumamos 7 hasta que superemos el valor máximo de nuestra serie de
datos. El límite superior de cada intervalo de clase debe ser menor al límite inferior de
siguiente intervalo, tal como se muestra en el Cuadro 6-12. A continuación tabulamos
los datos del Cuadro 6-11 y los registramos en el Cuadro 6-12.

Con formato: Nor 1, Ajustar espacio
entre texto latino y asiático, Ajustar
espacio entre texto asiático y números
Con formato: Justificado,
Interlineado: Mínimo 12 pto, Ajustar
espacio entre texto latino y asiático,
Ajustar espacio entre texto asiático y
números
Cuadro 6-11. Tallas de un grupo de 100 niños.
i talla i talla i talla i talla i talla
1 107 21 122 41 128 61 133 81 139
2 107 22 123 42 128 62 134 82 139
3 114 23 123 43 128 63 134 83 140
4 116 24 123 44 128 64 134 84 140
5 116 25 123 45 128 65 134 85 140
6 117 26 124 46 129 66 134 86 140
7 117 27 124 47 129 67 135 87 141
8 117 28 124 48 129 68 135 88 142
9 118 29 124 49 129 69 135 89 143
10 119 30 124 50 129 70 136 90 144
11 119 31 125 51 130 71 136 91 146
12 120 32 126 52 130 72 136 92 146
13 120 33 126 53 131 73 136 93 147
14 121 34 126 54 131 74 136 94 147
15 121 35 126 55 131 75 137 95 148
16 121 36 126 56 131 76 137 96 148
17 122 37 127 57 132 77 137 97 148
18 122 38 127 58 132 78 137 98 149
19 122 39 127 59 132 79 138 99 153
20 122 40 128 60 133 80 138 100 156

Para describir mediante frecuencias relativas la serie de datos, solo falta calcular los
porcentajes correspondientes a cada intervalo de clase.

Cuadro 6-12. Distribución de tallas de un grupo de 100 niños.
Intervalo de clase
Límite inferior Límite superior Frecuencia Porcentaje
107 113 2 2.0
114 120 11 11.0
121 127 26 26.0
128 134 27 27.0
135 141 21 21.0
142 148 10 10.0
149 155 2 2.0
156 160 1 1.0
100 100.0
Cómo hacerlo en Epi Info, 6-3. -------------------------------------------------------------------------
En Epi Info para Windows abra el archivo Bioestadistica_3ra y seleccione la tabla
Bio3_06c. Después de seleccionar la tabla de datos haga click en “OK”.
Antes de agrupar los datos primero tiene que definir una nueva variable. Para
hacerlo haga click con el mouse en “Define” (en el bloque de “Variables” de la ventana
de comandos). Cuando aparezca la ventana de diálogo escribimos el nombre de la
variable a definir (“GRUPOS”), y marcamos la opción estándar, tal como se aprecia en
la Figura 6-12. Para ejecutar la orden sólo hacemos click con el mouse en “OK”.
Con formato: Ejemplo
Con formato: Normal sangría

Figura 6-12. Venta de opciones de la orden “Define”.

Continuamos agrupando los datos de la variable talla en la nueva variable (“GRUPOS”)
que hemos definido. Para hacerlo haga click con el mouse en “Recode” (también en el
bloque de “Variables” de la ventana de comandos. En la ventana de diálogo que se
muestra en la Figura 6-14A primero defina la variable de origen, tal como se muestra
en la ventanita “From”. Luego defina la variable destino, como se muestra en la
ventanita “To”. Por último, defina los límites inferiores y superiores de cada intervalo
de clase, así como el código de cada agrupación (evite utilizar el 0 en el valor
recodificado). Para cambiar de celda al definir estos tres valores utilice el mouse
(haciendo “click” en el espacio correspondiente. Al terminar de recodificar la ventana
de diálogo deberá verse como la que se muestra en la Figura 6-14B. Para ejecutar la
orden sólo haga click con el mouse en ““OK”.

A B
Figura 6-12. Ventana de la orden Recodificar [“Recode”]

Para obtener las frecuencias agrupadas sólo haga click en Frequencies” (ver la sección
“Cómo hacerlo en Epi Info, 6-1” al principio de este capítulo), seleccione “GRUPOS” en
“Frequency of” y haga click con el mouse en ““OK” para ejecutar la orden. ----------------
EJERCICIOS
Ejercicio A
Observe el cuadro 6-13. Los datos que contiene se refieren a las características de 40
niños recién nacidos y sus madres. Los datos están en la tabla Ejer_06a del archivo
Bioestadistica_3ra.

Con formato: Normal centro
Con formato: Normal centro
Cuadro 6-13. Características de 40 niños recién nacidos.
i
(identificación
progresiva)
Bajo peso del
niño al nacer
Sexo del
recién nacido
Exposición de la
madre al humo de
tabaco durante el
embarazo
Consumo de
alcohol por la
madre durante
el embarazo1 no femenino fumadora pasiva no
2 no femenino fumadora pasiva si
3 si femenino fumadora activa no
4 no masculino fumadora pasiva no
5 no femenino fumadora pasiva no
6 no masculino fumadora activa no
7 si femenino fumadora activa no
8 si femenino fumadora pasiva no
9 no masculino fumadora pasiva si
10 no masculino no no
11 no femenino fumadora activa no
12 si femenino fumadora pasiva si
13 no femenino fumadora activa si
14 no masculino no no
15 no femenino no no
16 si masculino fumadora pasiva si
17 no femenino no no
18 no femenino fumadora pasiva si
19 no masculino fumadora activa si
20 no femenino fumadora activa si
21 no masculino no si
22 si masculino fumadora activa si
23 no femenino fumadora pasiva no
24 no masculino fumadora activa no
25 no femenino no no
26 no masculino no si
27 no masculino fumadora pasiva no
28 si masculino fumadora activa no
29 si masculino fumadora activa no
30 no masculino fumadora activa no
31 no masculino fumadora activa no
32 no femenino fumadora pasiva si
33 si femenino no no
34 no femenino fumadora activa si
35 no masculino no no
36 no masculino no si
37 no masculino fumadora activa no
38 no femenino fumadora pasiva si
39 no femenino fumadora activa si
40 si femenino no si

Ejercicio A1.
Suponga que los datos fueron registrados durante todo un año de estancia en una
comunidad del país y le interesa presentarlos ante sus colegas. A partir de esos datos
llene el Cuadro 6-14 considerando los cuarenta registros como el total.

Cuadro 5-14.
Variables Frecuencia Porcentaje
Bajo peso al nacer
Si
No
Sexo del RN
Femenino
Masculino
Exposición al tabaco
Fumadora activa
Fumadora pasiva
No
Consumo de alcohol
Si
No

Ejercicio A2.
Al estar preparando su presentación le surge el interés de explorar la relación que
existe entre tres de las variables (sexo del recién nacido, tabaco y alcohol) con el bajo
peso. Para poder hacerlo presenta los datos en el siguiente Cuadro 6-15.

Cuadro 6-15.
Variables Niños con
bajo peso
% (de
renglón)
Niños sin
bajo peso
% (de
renglón)
Sexo del RN
Femenino
Masculino
Exposición al tabaco
Fumadora activa
Pasiva
No
Consumo de alcohol
Si
No

Ejercicio A3.
A partir del cuadro 6-15 Ud. decide hacer varias comparaciones para identificar las
características asociadas con el bajo peso al nacer. Para hacer las comparaciones llene
el Cuadro 6-16 con los valores de Riesgo Atribuible y Riesgo Relativo considerando las
siguientes categorías como los valores de referencia: sexo masculino, no exposición al
tabaco durante el embarazo y no consumo del alcohol durante el embarazo.

Cuadro 6-16.
Variables Riesgo Atribuible Riesgo Relativo
Sexo del RN
Femenino
Masculino (grupo de referencia) 0.0 1.0
Exposición al tabaco
Fumadora activa
Fumadora pasiva
No (grupo de referencia) 0.0 1.0
Consumo de alcohol
Si
No (grupo de referencia) 0.0 1.0
Ejercicio B
El administrador de una clínica de atención médica ha registrado los números de
consultas que se presentan en el Cuadro 6-17. A partir de esos datos ayúdele a calcular
los cambios porcentuales que la clínica ha registrado durante los años señalados, y
preséntelos en el cuadro 6-17.

Cuadro 6-17.
Año Casos
reportados
Cambio Porcentual
1999 10 785
2000 9 279
2001 10 642
2002 15 193

REFERENCIAS
Daniel WW: Bioestadística. Base para el análisis en las ciencias de la salud, 3ra.
edición. México: Limusa, Noriega Editores, 1987.
Kleinbaum DG, Kupper LL, Morgenstern H: Epidemiologic Research. 1ra. edición. Van
Nostrand Reinhold. New York, 1982.
Koepsell T, Weill N, Swanson M: Apuntes del curso de Epidemiología 512.
Washington, Universidad de Washington, Seattle, 1991.
Martín-Moreno JM, Banegas JR. Sobre la traducción del término inglés odds ratio
como oportunidad relativa. Salud Pública de México 1997;39:72-74.
Tapia JA, Nieto FJ. Razón de posibilidades: una propuesta de traducción de la
expresión odds ratio. Salud Pública de México 1993;35:419-424.
Tapia-Granados JA. Posibilidades, oportunidades, momios: un comentario sobre la
traducción del término odds. Salud Pública de México 1997;39:69-71.