Logo Studenta

BIOESTADÍSTICA 2 (1) (1)

¡Este material tiene más páginas!

Vista previa del material en texto

BIOESTADÍSTICA – SEMANA 8 
MEDIDAS DE DISPERSIÓN 
 
 
 
BIOESTADÍSTICA - SEMANA 8 
MEDIDAS DE DISPERSIÓN 
A) GENERALIDADES 
Y 
 
LA VARIANZA, LA DESVIACIÓN RANGO INTERCUARTÍLICO COEFICIENTE DE VARIACIÓN 
ESTANDAR Y LA DESVIACIÓN 
MEDIA 
Z 1 Medidas de Dispersión 
Las medidas de tendencia central ofrecen una idea aproximada del comportamiento 
de una serie estadística. Pero, no resultan suficientes para expresar sus 
características: una misma medida puede provenir de valores cercanos a la misma o 
resultar de la confluencia de datos estadísticos enormemente dispares. Para 
conocer en que grado las medidas de tendencia central son representativas de la 
serie, se han de complementar con medidas de dispersión o también llamadas de 
variabilidad absoluta, 
Las medidas dispersión, amplían el concepto de variabilidad, como el método de las 
medidas de Endoncia central, que describen el comportamiento de los datos en una 
distribución de frecuencia. Las informaciones que proporcionan estas medidas son 
limitadas y no dicen nada sobre cómo están distribuidos o dispersos los datos con 
relación a la tendencia central. Poco indican sobre un determinado dato con 
relación a otros de la distribución. 
Las medidas de dispersión o variabilidad son aquellas que miden la 
dispersión de los datos, es decir, nos dicen qué tan parecidos o que tan diferentes 
son entre si los valores observados. 
] Medidas de Dispersión 
La interpretación de un grupo de datos individuales necesita de 
informaciones que permitan apreciar la dispersión de los valores 
alrededor de la medida de tendencia central. Estas medidas son 
importantes por sus propiedades algebraicas, por lo que es 
frecuente su implementación en la solución de problemas de 
estadística aplicada. 
Así, las medidas de dispersión pueden definirse como los 
valores numéricos cuyo objeto es analizar el grado de separación de 
los valores de una serie estadística con respecto a las medidas de 
tendencia central consideradas.
BIOESTADÍSTICA - SEMANA 8 
MEDIDAS DE DISPERSIÓN 
A) GENERALIDADES 
Y 
 
LA VARIANZA, LA DESVIACIÓN RANGO INTERCUARTÍLICO COEFICIENTE DE VARIACIÓN 
ESTANDAR Y LA DESVIACIÓN 
MEDIA 
Z 1 Medidas de Dispersión 
Las medidas de tendencia central ofrecen una idea aproximada del comportamiento 
de una serie estadística. Pero, no resultan suficientes para expresar sus 
características: una misma medida puede provenir de valores cercanos a la misma o 
resultar de la confluencia de datos estadísticos enormemente dispares. Para 
conocer en que grado las medidas de tendencia central son representativas de la 
serie, se han de complementar con medidas de dispersión o también llamadas de 
variabilidad absoluta, 
Las medidas dispersión, amplían el concepto de variabilidad, como el método de las 
medidas de Endoncia central, que describen el comportamiento de los datos en una 
distribución de frecuencia. Las informaciones que proporcionan estas medidas son 
limitadas y no dicen nada sobre cómo están distribuidos o dispersos los datos con 
relación a la tendencia central. Poco indican sobre un determinado dato con 
relación a otros de la distribución. 
Las medidas de dispersión o variabilidad son aquellas que miden la 
dispersión de los datos, es decir, nos dicen qué tan parecidos o que tan diferentes 
son entre si los valores observados. 
] Medidas de Dispersión 
La interpretación de un grupo de datos individuales necesita de 
informaciones que permitan apreciar la dispersión de los valores 
alrededor de la medida de tendencia central. Estas medidas son 
importantes por sus propiedades algebraicas, por lo que es 
frecuente su implementación en la solución de problemas de 
estadística aplicada. 
Así, las medidas de dispersión pueden definirse como los 
valores numéricos cuyo objeto es analizar el grado de separación de 
los valores de una serie estadística con respecto a las medidas de 
tendencia central consideradas.
 
 
 
4 Las medidas de dispersión son de dos tipos: 
+ Medidas de dispersión absoluta: como recorrido, desviación 
media, varianza y desviación típica, que se usan en los análisis 
estadísticos generales. 
* Medidas de dispersión relativa: que determinan la dispersión de la 
distribución estadística independientemente de las unidades en que se 
exprese la variable. Se trata de parámetros más técnicos y utilizados en 
estudios específicos, y entre ellas se encuentran los coeficientes de 
apertura, el recorrido relativo, el coeficiente de variación (índice de 
dispersión de Pearson) y el índice de dispersión mediana. 
21 MEDIDAS DE DISPERSIÓN 
+ Describen la cantidad de dispersión o variabilidad que se encuentra 
entre los datos. Datos bastante agrupados poseen valores relativamente 
pequeños; dato más dispersos tienen valores más grandes. El 
agrupamiento más extenso ocurre cuando los datos carecen de 
dispersión. 
* Desviación estándar: (0) mide cuánto se separan los datos. Es la 
raíz cuadrada de la varianza. 
* Varianza: media aritmética de los cuadrados de las diferencias 
(desviaciones) entre los valores que toma la variable y su media 
aritmética. Su símbolo es S? en la muestra y o? en la población. 
>» Nix, -xy 
S > 
n 
| Resumen de Varianza 
* En otras palabras, sigue estos pasos: 
Calcula la media (el promedio de los números) 
2. Por cada número resta la media y eleva el resultado 
al cuadrado (la diferencia elevada al cuadrado). 
3. Calcula la media de esas diferencias al cuadrado.
4 Las medidas de dispersión son de dos tipos: 
+ Medidas de dispersión absoluta: como recorrido, desviación 
media, varianza y desviación típica, que se usan en los análisis 
estadísticos generales. 
* Medidas de dispersión relativa: que determinan la dispersión de la 
distribución estadística independientemente de las unidades en que se 
exprese la variable. Se trata de parámetros más técnicos y utilizados en 
estudios específicos, y entre ellas se encuentran los coeficientes de 
apertura, el recorrido relativo, el coeficiente de variación (índice de 
dispersión de Pearson) y el índice de dispersión mediana. 
21 MEDIDAS DE DISPERSIÓN 
+ Describen la cantidad de dispersión o variabilidad que se encuentra 
entre los datos. Datos bastante agrupados poseen valores relativamente 
pequeños; dato más dispersos tienen valores más grandes. El 
agrupamiento más extenso ocurre cuando los datos carecen de 
dispersión. 
* Desviación estándar: (0) mide cuánto se separan los datos. Es la 
raíz cuadrada de la varianza. 
* Varianza: media aritmética de los cuadrados de las diferencias 
(desviaciones) entre los valores que toma la variable y su media 
aritmética. Su símbolo es S? en la muestra y o? en la población. 
>» Nix, -xy 
S > 
n 
| Resumen de Varianza 
* En otras palabras, sigue estos pasos: 
Calcula la media (el promedio de los números) 
2. Por cada número resta la media y eleva el resultado 
al cuadrado (la diferencia elevada al cuadrado). 
3. Calcula la media de esas diferencias al cuadrado.
 
 
 
"1 Ejemplo de Varianza 
* Las alturas de los hombros de los siguientes perros son: 
600mm, 470mm, 170mm, 430mm y 300omm. 
600 
400 
200 
0 
 
Q Media 
* Media: 600+470+170+430+300/5=1970/5=3094 
 
 
* Diferencia de cada altura con la media: 
600 
400 
200 
0 
2] Varianza 
+ Para calcular la varianza, toma cada diferencia, elévala al 
cuadrado, y haz la media: 
 
206? + 76? + (-224)? + 36? + (-94)* 108,520 
 Varianza: 0? = = = 21,704
"1 Ejemplo de Varianza 
* Las alturas de los hombros de los siguientes perros son: 
600mm, 470mm, 170mm, 430mm y 300omm. 
600 
400 
200 
0 
 
Q Media 
* Media: 600+470+170+430+300/5=1970/5=3094 
 
 
* Diferencia de cada altura con la media: 
600 
400 
200 
0 
2] Varianza 
+ Para calcular la varianza, toma cada diferencia, elévala al 
cuadrado, y haz la media: 
 
206? + 76? + (-224)? + 36? + (-94)* 108,520 
 Varianza: 0? = = = 21,704
 
 
 
J Ejemplo de Desviación estándar 
+ Es la raíz cuadrada de la varianza. 
o = 421,704= 147 
 
 
 
* Veremos qué alturas están a distancia menos de la desviación 
estándar (147 mm) de la media. 
* Usando la desviación estándar tenemos una manera "estándar" de 
saber qué es normal, o extra grande o extra pequeño. 
 
FL] Desviación Media 
* En toda distribución la suma de las desviaciones de cada valor de la 
variable respecto a la media es cero. Significa que la sunt "de las 
desviaciones de las variables mayores que la media es igual y de 
signo contrario a la suma de las desviaciones de las variables menores que 
la media, razón por la que emplea los valores absolutos de las desviaciones 
para obtener la desviación media. 
* Para calcular la varianza media es necesario prescindir de los signos 
negativos y tomar los valores absolutos de las desviaciones respecto a la 
media aritmética. Si elevamos al cuadrado las desviaciones, logramos que 
todos los resultados positivos, sumando los cuadrados de las desviaciones 
y dividiendo por N, resulte el estadístico llamado varianza, base para 
calcular la desviación estándar. 
Z 1 Desviación Media 
* Las medidas de variabilidad absoluta o de dispersión analizan 
un grupo de datos de manera más rigurosa y profunda, para 
extraer información sobre qué tan dispersos resultan los datos 
alrededor de la media y así verificar su comportamiento 
+ Esta medida de dispersión es considerada como una de las 
medidas más fácil de calcular, por lo que es utilizada en la 
mayoría de los casos, con el único fin de agilizar las operaciones, 
de ahí que el resultado se le considere como una aproximación a 
la cuantificación de la dispersión.
J Ejemplo de Desviación estándar 
+ Es la raíz cuadrada de la varianza. 
o = 421,704 = 147 
 
 
 
* Veremos qué alturas están a distancia menos de la desviación 
estándar (147 mm) de la media. 
* Usando la desviación estándar tenemos una manera "estándar" de 
saber qué es normal, o extra grande o extra pequeño. 
 
FL] Desviación Media 
* En toda distribución la suma de las desviaciones de cada valor de la 
variable respecto a la media es cero. Significa que la sunt "de las 
desviaciones de las variables mayores que la media es igual y de 
signo contrario a la suma de las desviaciones de las variables menores que 
la media, razón por la que emplea los valores absolutos de las desviaciones 
para obtener la desviación media. 
* Para calcular la varianza media es necesario prescindir de los signos 
negativos y tomar los valores absolutos de las desviaciones respecto a la 
media aritmética. Si elevamos al cuadrado las desviaciones, logramos que 
todos los resultados positivos, sumando los cuadrados de las desviaciones 
y dividiendo por N, resulte el estadístico llamado varianza, base para 
calcular la desviación estándar. 
Z 1 Desviación Media 
* Las medidas de variabilidad absoluta o de dispersión analizan 
un grupo de datos de manera más rigurosa y profunda, para 
extraer información sobre qué tan dispersos resultan los datos 
alrededor de la media y así verificar su comportamiento 
+ Esta medida de dispersión es considerada como una de las 
medidas más fácil de calcular, por lo que es utilizada en la 
mayoría de los casos, con el único fin de agilizar las operaciones, 
de ahí que el resultado se le considere como una aproximación a 
la cuantificación de la dispersión.
 
 
 
 
F) Desviación media de una muestra 
+ La desviación media (representada por DM) de una muestra que contiene n observaciones x,, X ,, X,, se escribe de la 
siguiente manera: 
bey 3|+|0,5]+)x,3] +K+|x,-3| 
dm= 
n 
n n 
Y hr Y ll, 
i-1 i-1 
Datos no agrupados: DM= —————— Datos agrupados: DM= 
n n 
+ Donde: 
+ X : media aritmética de la muestra 
+ Xi: ivalor de la variable aleatoria x 
+ n:tamaño de la muestra 
+ Alrealizar la suma de los resultados de las diferencias entre cada observación y la media, sin el valor absoluto la 
respuesta sería, siempre igual a cero. Observe que la desviación media (además de incluir todos los datos) tiene en 
cuenta una medida de posición, que puede ser la media o la mediana. 
+ Si se calcula tomando la media aritmética de los valores absolutos de las diferencias entre cada uno de los datos del 
conjunto y la mediana, se llamará desviación mediana, usada para distribuciones que tienen valores extremos (muy 
alejados del centro) o que contienen intervalos abiertos. 
5 1 57 10,5 =-5,5 59 
8 2 8 - 10,5 = -2,5 2,5 
11 3 11 - 10,5 = 0,5 0,5 
14 1 14 - 10,5 = 3,5 3,5 
16 1 16 - 10,5 = 5,5 5,5 
8 17,5 
= 2,19 
—J Recorrido 
* La medida de dispersión más inmediata es el recorrido de la 
distribución estadística, también llamado rango o amplitud, 
ue es la diferencia entre los valores extremos de los intervalos 
( mayor y el menor de todos); rango en el que están 
istribuidos los demás valores del conjunto, dada una serie de 
valores X1, X2, ..., Xn, su recorrido es la diferencia aritmética 
entre el máximo y el mínimo de estos valores: 
Re = x, (máx) — x, (mín), siendoi= 1,2,....n.
 
F) Desviación media de una muestra 
+ La desviación media (representada por DM) de una muestra que contiene n observaciones x,, X ,, X,, se escribe de la 
siguiente manera: 
bey 3|+|0,5]+)x,3] +K+|x,-3| 
dm= 
n 
n n 
Y hr Y ll, 
i-1 i-1 
Datos no agrupados: DM= —————— Datos agrupados: DM= 
n n 
+ Donde: 
+ X : media aritmética de la muestra 
+ Xi: ivalor de la variable aleatoria x 
+ n:tamaño de la muestra 
+ Alrealizar la suma de los resultados de las diferencias entre cada observación y la media, sin el valor absoluto la 
respuesta sería, siempre igual a cero. Observe que la desviación media (además de incluir todos los datos) tiene en 
cuenta una medida de posición, que puede ser la media o la mediana. 
+ Si se calcula tomando la media aritmética de los valores absolutos de las diferencias entre cada uno de los datos del 
conjunto y la mediana, se llamará desviación mediana, usada para distribuciones que tienen valores extremos (muy 
alejados del centro) o que contienen intervalos abiertos. 
5 1 57 10,5 =-5,5 59 
8 2 8 - 10,5 = -2,5 2,5 
11 3 11 - 10,5 = 0,5 0,5 
14 1 14 - 10,5 = 3,5 3,5 
16 1 16 - 10,5 = 5,5 5,5 
8 17,5 
= 2,19 
—J Recorrido 
* La medida de dispersión más inmediata es el recorrido de la 
distribución estadística, también llamado rango o amplitud, 
ue es la diferencia entre los valores extremos de los intervalos 
( mayor y el menor de todos); rango en el que están 
istribuidos los demás valores del conjunto, dada una serie de 
valores X1, X2, ..., Xn, su recorrido es la diferencia aritmética 
entre el máximo y el mínimo de estos valores: 
Re = x, (máx) — x, (mín), siendoi= 1,2,....n.
 
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS 
 
 
3 Intervalos de clase 
* No hay formas definidas respecto al número de clases a utilizar en una 
distribución de frecuencias. Para escoger bien priman la experiencia y 
la intuición. Si son pocos, se pierden detalles; si son demasiados, el 
trabajo se torna dispendioso, mostrando irregularidades, no un patrón 
de comportamiento. Es recomendable no formar menos de cinco y no 
más de 18 intervalos de clase. La anchura de un intervalo de clase es el 
número de elementos que lo forman, debe ser igual, pero no es camisa 
de fuerza. En caso de no establecer esta igualdad, es posible usar 
diferentes anchuras. 
+ Número de intervalos de clase: subconjuntos de medidas o datos. Tienen 
un límite inferior (dato menor) y un límite superior (dato mayor). 
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS 
L43 
AR TN 
 
MEDIDAS DE Fu Varianza Desviación Media Número de 
DISPERSION Y estándar elementos 
las para 1 Df Drhl ys Fórmulas para la si ¡=1 /(%i —Hl ix f Ñ 
varianza y desviación Porción Já E qe Ja? LN EE e 2 
estándar de datos i=1 
agrupados 
 
1
 ! 
Muestra | ¿2 Diz fix -1) s= 5 Dir % fi pa Y 
n-1 n 
 
23 MEDIDAS DE DISPERSIÓN 
Donde: 
» k: número de clases. 
* f: frecuencia absoluta de cada clase, es decir, el número de elementos que 
pertenecen a dicha clase. 
* x,: marcade clase. Es el punto medio del límite inferior y del límite superior. 
+ (?: varianza de la población. 
+ 9d: desviación estándar de la población. 
* 1: media de la población. 
* s2: varianza de la muestra. 
+ s: desviación estándar de la muestra. 
* Xx: media de la muestra 
Tenemos siempre que fijarnos si estamos trabajando con datos que forman una 
población o con datos que forman una muestra, pues las fórmulas son diferentes.
3 Intervalos de clase 
* No hay formas definidas respecto al número de clases a utilizar en una 
distribución de frecuencias. Para escoger bien priman la experiencia y 
la intuición. Si son pocos, se pierden detalles; si son demasiados, el 
trabajo se torna dispendioso, mostrando irregularidades, no un patrón 
de comportamiento. Es recomendable no formar menos de cinco y no 
más de 18 intervalos de clase. La anchura de un intervalo de clase es el 
número de elementos que lo forman, debe ser igual, pero no es camisa 
de fuerza. En caso de no establecer esta igualdad, es posible usar 
diferentes anchuras. 
+ Número de intervalos de clase: subconjuntos de medidas o datos. Tienen 
un límite inferior (dato menor) y un límite superior (dato mayor). 
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS 
L43 
AR TN 
 
MEDIDAS DE Fu Varianza Desviación Media Número de 
DISPERSION Y estándar elementos 
las para 1 Df Drhl ys Fórmulas para la si ¡=1 /(%i —Hl ix f Ñ 
varianza y desviación Porción Já E qe Ja? LN EE e 2 
estándar de datos i=1 
agrupados 
 
1
 ! 
Muestra | ¿2 Diz fix -1) s= 5 Dir % fi pa Y 
n-1 n 
 
23 MEDIDAS DE DISPERSIÓN 
Donde: 
» k: número de clases. 
* f: frecuencia absoluta de cada clase, es decir, el número de elementos que 
pertenecen a dicha clase. 
* x,: marca de clase. Es el punto medio del límite inferior y del límite superior. 
+ (?: varianza de la población. 
+ 9d: desviación estándar de la población. 
* 1: media de la población. 
* s2: varianza de la muestra. 
+ s: desviación estándar de la muestra. 
* Xx: media de la muestra 
Tenemos siempre que fijarnos si estamos trabajando con datos que forman una 
población o con datos que forman una muestra, pues las fórmulas son diferentes.
 
 
 
“1 Desviación media para datos agrupados 
* Silos datos vienen agrupados en una tabla de frecuencias, la 
expresión de la desviación media es: 
 
Ll [11 SE af; E [Ta 5 | $2 O En == z| fn 
A N 
Ad Zi — Tlf; 
D; il A f 
1 Desviación Media para datos agrupados 
Donde: 
* fi: frecuencia absoluta de cada valor, es decir, el número de 
veces que aparece el valor en el estudio. 
* xi: marca de clase. Es el punto medio del límite inferior y el 
límite superior de cada intervalo. 
* k: número de clases. 
* D. M.: desviación media. 
* X: media aritmética de los datos. 
4) Ejemplo para datos agrupados 
 
 
 
 
 
Edad Frecuencia 
* Calcular la varianza y la (años) f: 
desviación estándar de una [O - 2) 7 
población de niños a partir de [2-4) 3 
la siguiente tabla: 
[4 - 6) 8 
[6 - 8] 7 
“1 Desviación media para datos agrupados 
* Silos datos vienen agrupados en una tabla de frecuencias, la 
expresión de la desviación media es: 
 
Ll [11 SE af; E [Ta 5 | $2 O En == z| fn 
A N 
Ad Zi — Tlf; 
D; il A f 
1 Desviación Media para datos agrupados 
Donde: 
* fi: frecuencia absoluta de cada valor, es decir, el número de 
veces que aparece el valor en el estudio. 
* xi: marca de clase. Es el punto medio del límite inferior y el 
límite superior de cada intervalo. 
* k: número de clases. 
* D. M.: desviación media. 
* X: media aritmética de los datos. 
4) Ejemplo para datos agrupados 
 
 
 
 
 
Edad Frecuencia 
* Calcular la varianza y la (años) f: 
desviación estándar de una [O - 2) 7 
población de niños a partir de [2-4) 3 
la siguiente tabla: 
[4 - 6) 8 
[6 - 8] 7 
 
 
 
ha! a 
 
 
 
 
 
 
A Edad Frecuencia 
Solución: 5 
+ En este caso, nos dicen que los datos (a n os) fi 
aa auna pa Eo 
anto, usaremos las fórmulas de 
le población. [O - 2 ) 7 
. Ene ps número de 3 
elementos de la población N: ms : [2 - 4) 
M2 [4 - 6) 8 
.C ruda de la tabla, calcul l a eri ini [6 - 8] / 
k 
rama 2 30 
21 
| Como segundo paso: 
» Calcularemos las marcas de clase. 
Recordemos que la marca de clase 
 
 
 
 
 
 
 
 
 
 
 
xi, es el punto medio del límite Edad | Marcadeclase | Frecuencia 
inferior y el límite superior de cada (años) Xi fi 
intervalo. Se calcula con la siguiente [0-2) 2 > 
fórmula — 1,+L, 
. x= 3 [2 = 4) 3 8 
[4 - 6) 5 8 
z [6 - 8] 7 7 + Agregamos una columna más a _ , 0 
nuestra tabla para la marca de clase == 
xi: 
Como tercer paso: 
* Calculamos la media Edad — | Marcadecase | Frecuencia ? Ñ Ñ Xx f, poblacional 1: (años) fa 
. [0 - 2) d 
7 7 
[2 - 4) 3 8 24 k 
dia Xi hi [4-6) 5 8 40 
N [6 - 8] 7 7 49 
mA] Y 30 120 * Agregamos una columna 
más a nuestra tabla, dónde 
colofajernos los valores de 
xi * fi:
ha! a 
 
 
 
 
 
 
A Edad Frecuencia 
Solución: 5 
+ En este caso, nos dicen que los datos (a n os) fi 
aa auna pa Eo 
anto, usaremos las fórmulas de 
le población. [O - 2 ) 7 
. Ene ps número de 3 
elementos de la población N: ms : [2 - 4) 
M2 [4 - 6) 8 
.C ruda de la tabla, calcul l a eri ini [6 - 8] / 
k 
rama 2 30 
21 
| Como segundo paso: 
» Calcularemos las marcas de clase. 
Recordemos que la marca de clase 
 
 
 
 
 
 
 
 
 
 
 
xi, es el punto medio del límite Edad | Marcadeclase | Frecuencia 
inferior y el límite superior de cada (años) Xi fi 
intervalo. Se calcula con la siguiente [0-2) 2 > 
fórmula — 1,+L, 
. x= 3 [2 = 4) 3 8 
[4 - 6) 5 8 
z [6 - 8] 7 7 + Agregamos una columna más a _ , 0 
nuestra tabla para la marca de clase == 
xi: 
Como tercer paso: 
* Calculamos la media Edad — | Marcadecase | Frecuencia ? Ñ Ñ Xx f, poblacional 1: (años) fa 
. [0 - 2) d 
7 7 
[2 - 4) 3 8 24 k 
dia Xi hi [4-6) 5 8 40 
N [6 - 8] 7 7 49 
mA] Y 30 120 * Agregamos una columna 
más a nuestra tabla, dónde 
colofajernos los valores de 
xi * fi:
 
 
 
RANGO INTERCUARTIL 
* Aplicamos la fórmula: 
Met its LEN 3 
* La media poblacional u tiene un valor de 4 años. 
omo cuarto 
 
 
 
 
 
paso: 
+ Calculamos la varianza 
ión: Edad Marca de clase | Frecuencia : 2 de la población: (años E P Yao aa (im? fm? 
[0- 2) 1 7 7 3 9 63 
(2-4) 3 8 24 1 1 8 
Ko Flw ¿2 [4 - 6) 5 8 40 1 1 8 
is Di=1 (Xi — H) [6 - 8] 7 7 49 3 9 63 
N — y 30 120 — Ml] 2 
 
 
+ Agregamos más 
columnas a nuestra tabla, 
buscando la forma de la 
fórmula de la varianza: 
1 Resultados: 
* Aplicamos la fórmula de la varianza de la población: 
" 
y? = Ei fia 10? 
= 142 
N 30 
* Recuerda que la varianza queda expresada en unidades al cuadrado, 
por ello, nos queda en años al cuadrado. 
* Como último Paso, calculamos la desviación estándar, recordando que 
es la raíz cuadrada positiva de la varianza. 
* o =wy0? =./4,73 (años)? 
a =2,175 años 
+ El valor de la desviación estándar poblacional o es de 2,175 años. 
= 4,73 (años)? 
RANGO INTERCUARTIL
* Aplicamos la fórmula: 
Met its LEN 3 
* La media poblacional u tiene un valor de 4 años. 
omo cuarto 
 
 
 
 
 
paso: 
+ Calculamos la varianza 
ión: Edad Marca de clase | Frecuencia : 2 de la población: (años E P Yao aa (im? fm? 
[0- 2) 1 7 7 3 9 63 
(2-4) 3 8 24 1 1 8 
Ko Flw ¿2 [4 - 6) 5 8 40 1 1 8 
is Di=1 (Xi — H) [6 - 8] 7 7 49 3 9 63 
N — y 30 120 — Ml] 2 
 
 
+ Agregamos más 
columnas a nuestra tabla, 
buscando la forma de la 
fórmula de la varianza: 
1 Resultados: 
* Aplicamos la fórmula de la varianza de la población: 
" 
y? = Ei fia 10? 
= 142 
N 30 
* Recuerda que la varianza queda expresada en unidades al cuadrado, 
por ello, nos queda en años al cuadrado. 
* Como último Paso, calculamos la desviación estándar, recordando que 
es la raíz cuadrada positiva de la varianza. 
* o =wy0? =./4,73 (años)? 
a =2,175 años 
+ El valor de la desviaciónestándar poblacional o es de 2,175 años. 
= 4,73 (años)? 
RANGO INTERCUARTIL
 
 
 
COEFICIENTE DE VARIACIÓN O ÍNDICE DE DISPERSIÓN DE PEARSON 
 
A | Rango intercuartílico IQR 
-— (o rango intercuartil) 
+ Es una estimación estadística de la dispersión de una distribución de datos. 
Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida 
se eliminan los valores extremadamente alejados. El rango intercuartílico es 
altamente recomendable cuando la medida de tendencia central utilizada es la 
mediana (ya que este estadístico es insensible a posibles irregularidades en los 
extremos). 
IQR =Q3-Q1 
+ En una distribución, encontramos la mitad de los datos, el 50 %, ubicados dentro 
del rango intercuartilico. 
» Conforme aumente el IQR, indicará que la dispersión será mayor. 
+ Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución 
normal o campana de Gauss) es más apropiado medir la tendencia central y la 
dispersión mediante la mediana y el rango intercuartil respectivamente que con la 
media aritmética y la desviación típica. 
+ Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy 
visual para evaluar la dispersión de una distribución. 
4) Ejercicio 
Sea un conjunto ordenado de las edades de los veinte PECES SMN) 
sujetos (N=20) de un club. 19 21 24 28 28 29 30 32 33 34 
37 40 45 45 52 53 54 56 60 63 
Para calcular el rango intercuartílico, tendremos que 
calcular el primer y el tercer cuartil (Q1 y Q3). 
Primer cuartil 
El primer cuartil será el sujeto (N+1)/4=21/4=5,25. 
Como es decimal, será un número entre el X5=28 y 
X6=29. ERROR RAI) 
19 21 24 28x5-28x6-29 30 32 33 34 
37. 40 45 45 52 53 54 56 60 63 
El número decimal es el 5,25, por lo que i=5 y 
d=0,25. El cuartil 1 es: 
(); = 15+0, 25-(16—25) = 28+0, 25-(29—28) = 28, 25 
— o — 
Tercer cuartil 
El tercer cuartil es el sujeto 3 +1)/4=63/4=15,75. Como el número es decimal, el 
cuartil estará entre X15=52 y X16=53. 
Edad de los socios de un club (ordenados) 
19 21 241 1281289 [E20/0 ESO] HE32: 33 34 
37 40 45 45 *552%3653 54 56 60 63 
El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es: 
Q3 = 11540, 75-(116—115) = 5240, 75-(53-52) = 52,75 
Rango intercuartílico 
Una vez hemos calculado en primer y tercer cuartil, ya podemos calcular el rango 
intercuartílico. 
TQR = Q3-Qí =52,75—28,25= 24,5 
COEFICIENTE DE VARIACIÓN O ÍNDICE DE DISPERSIÓN DE PEARSON
 
A | Rango intercuartílico IQR 
-— (o rango intercuartil) 
+ Es una estimación estadística de la dispersión de una distribución de datos. 
Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida 
se eliminan los valores extremadamente alejados. El rango intercuartílico es 
altamente recomendable cuando la medida de tendencia central utilizada es la 
mediana (ya que este estadístico es insensible a posibles irregularidades en los 
extremos). 
IQR =Q3-Q1 
+ En una distribución, encontramos la mitad de los datos, el 50 %, ubicados dentro 
del rango intercuartilico. 
» Conforme aumente el IQR, indicará que la dispersión será mayor. 
+ Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución 
normal o campana de Gauss) es más apropiado medir la tendencia central y la 
dispersión mediante la mediana y el rango intercuartil respectivamente que con la 
media aritmética y la desviación típica. 
+ Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy 
visual para evaluar la dispersión de una distribución. 
4) Ejercicio 
Sea un conjunto ordenado de las edades de los veinte PECES SMN) 
sujetos (N=20) de un club. 19 21 24 28 28 29 30 32 33 34 
37 40 45 45 52 53 54 56 60 63 
Para calcular el rango intercuartílico, tendremos que 
calcular el primer y el tercer cuartil (Q1 y Q3). 
Primer cuartil 
El primer cuartil será el sujeto (N+1)/4=21/4=5,25. 
Como es decimal, será un número entre el X5=28 y 
X6=29. ERROR RAI) 
19 21 24 28x5-28x6-29 30 32 33 34 
37. 40 45 45 52 53 54 56 60 63 
El número decimal es el 5,25, por lo que i=5 y 
d=0,25. El cuartil 1 es: 
(); = 15+0, 25-(16—25) = 28+0, 25-(29—28) = 28, 25 
— o — 
Tercer cuartil 
El tercer cuartil es el sujeto 3 +1)/4=63/4=15,75. Como el número es decimal, el 
cuartil estará entre X15=52 y X16=53. 
Edad de los socios de un club (ordenados) 
19 21 241 1281289 [E20/0 ESO] HE32: 33 34 
37 40 45 45 *552%3653 54 56 60 63 
El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es: 
Q3 = 11540, 75-(116—115) = 5240, 75-(53-52) = 52,75 
Rango intercuartílico 
Una vez hemos calculado en primer y tercer cuartil, ya podemos calcular el rango 
intercuartílico. 
TQR = Q3-Qí =52,75—28,25= 24,5 
COEFICIENTE DE VARIACIÓN O ÍNDICE DE DISPERSIÓN DE PEARSON
 
 
 
"J Coeficiente de Variación 
* El coeficiente de variación, también denominado 
como coeficiente de variación de Pearson, es una 
medida estadística que nos informa acerca de la 
dispersión relativa de un conjunto de datos. 
* Es decir, nos informa al igual que otras medidas 
de dispersión, de si una variable se mueve mucho, 
poco, más o menos que otra. 
4) Fórmula del coeficiente de variación 
+ Su cálculo se obtiene de dividir la desviación típica entre el valor 
absoluto de la media del conjunto y por lo general se expresa en 
porcentaje para su mejor comprensión. 
* El coeficiente de variación se puede ver expresado con las letras CV o 
r, dependiendo del manual o la fuente utilizada. Su fórmula es la 
siguiente: 
O. 
cv== 
[X| 
+ X: variable sobre la que se pretenden calcular la varianza 
* G,: Desviación típica de la variable X. 
+ | X |: Es la media de la variable X en valor absoluto con X+ O 
FJ) Fórmula del coeficiente de variación... 
* El coeficiente de variación se utiliza para 
comparar conjuntos de datos pertenecientes a 
poblaciones distintas. Si atendemos a su fórmula, 
vemos que este tiene en cuenta el valor de la 
media. Por lo tanto, el coeficiente de variación nos 
permite tener una medida de dispersión que 
elimine las posibles distorsiones de las medias de 
dos o más poblaciones.
"J Coeficiente de Variación 
* El coeficiente de variación, también denominado 
como coeficiente de variación de Pearson, es una 
medida estadística que nos informa acerca de la 
dispersión relativa de un conjunto de datos. 
* Es decir, nos informa al igual que otras medidas 
de dispersión, de si una variable se mueve mucho, 
poco, más o menos que otra. 
4) Fórmula del coeficiente de variación 
+ Su cálculo se obtiene de dividir la desviación típica entre el valor 
absoluto de la media del conjunto y por lo general se expresa en 
porcentaje para su mejor comprensión. 
* El coeficiente de variación se puede ver expresado con las letras CV o 
r, dependiendo del manual o la fuente utilizada. Su fórmula es la 
siguiente: 
O. 
cv== 
[X| 
+ X: variable sobre la que se pretenden calcular la varianza 
* G,: Desviación típica de la variable X. 
+ | X |: Es la media de la variable X en valor absoluto con X+ O 
FJ) Fórmula del coeficiente de variación... 
* El coeficiente de variación se utiliza para 
comparar conjuntos de datos pertenecientes a 
poblaciones distintas. Si atendemos a su fórmula, 
vemos que este tiene en cuenta el valor de la 
media. Por lo tanto, el coeficiente de variación nos 
permite tener una medida de dispersión que 
elimine las posibles distorsiones de las medias de 
dos o más poblaciones.
 
 
 
 
| Ejemplos de uso del coeficiente de 
-— variación en lugar de la desviación típica 
* Comparación de conjuntos de datos de diferente 
dimensión 
* Se quiere comprar la dispersión entre la altura de 50 alumnos 
de una clase y su peso. Para comparar la altura podríamos 
utilizar como unidad de medida metros y centímetros y para el 
peso el kilogramo. Comparar estas dos distribuciones mediante 
la desviación estándar, no tendría sentido dado que se 
pretenden medir dos variables cualitativas distintas (una 
medida de longitudy una de masa). 
 
A) Ejemplos de uso del coeficiente de 
variación en lugar de la desviación típica 
* Comparar conjuntos con gran diferencia entre medias 
+ Medir el peso de los escarabajos y el de los hipopótamos. 
+ El peso de los escarabajos se mide en gramos o miligramos y el peso 
de los hipopótamos por lo general se mide en toneladas. Si para 
nuestra medición convertimos el peso de los escarabajos a toneladas 
ara que ambas poblaciones estén en la misma escala, utilizar la 
destRición estándar como medida de dispersión no sería lo 
adecuado. El peso medio de los escarabajos medido en toneladas 
sería tan pequeño, que si utilizamos la desviación estándar, apenas 
habría dispersión en los datos. Esto sería un error dado que el peso 
entre las diferentes especies de escarabajos puede variar de manera 
considerable. 
 
Fe) Ejemplo de cálculo del coeficiente de 
a . .)—) 
Varmacion 
* Pensemos en una población de elefantes y otra de ratones. La población de 
elefantes tiene un peso merlo de 5.000 kilogramos y una desviación típica de 400 
kilogramos. La población de ratones tiene un peso medio de 15 gramos y una 
desviación típica de 5 gramos, Si comparáramos la dispersión de ambas 
poblaciones mediante la desviación típica podríamos pensar que hay mayor 
dispersión para la población de elefantes que para la de los ratones. 
* Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos 
daríamos cuenta que es justo al contrario. 
Elefantes: 400/5000=0,08 
Ratones: 5/15=0,33 
+ Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación 
para los elefantes es de apenas un 8%, mientras que el de las ratones es de un. 
33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio, 
vemos que la población con mayor dispersión, no es la que tiene una mayor 
desviación típica.
 
| Ejemplos de uso del coeficiente de 
-— variación en lugar de la desviación típica 
* Comparación de conjuntos de datos de diferente 
dimensión 
* Se quiere comprar la dispersión entre la altura de 50 alumnos 
de una clase y su peso. Para comparar la altura podríamos 
utilizar como unidad de medida metros y centímetros y para el 
peso el kilogramo. Comparar estas dos distribuciones mediante 
la desviación estándar, no tendría sentido dado que se 
pretenden medir dos variables cualitativas distintas (una 
medida de longitud y una de masa). 
 
A) Ejemplos de uso del coeficiente de 
variación en lugar de la desviación típica 
* Comparar conjuntos con gran diferencia entre medias 
+ Medir el peso de los escarabajos y el de los hipopótamos. 
+ El peso de los escarabajos se mide en gramos o miligramos y el peso 
de los hipopótamos por lo general se mide en toneladas. Si para 
nuestra medición convertimos el peso de los escarabajos a toneladas 
ara que ambas poblaciones estén en la misma escala, utilizar la 
destRición estándar como medida de dispersión no sería lo 
adecuado. El peso medio de los escarabajos medido en toneladas 
sería tan pequeño, que si utilizamos la desviación estándar, apenas 
habría dispersión en los datos. Esto sería un error dado que el peso 
entre las diferentes especies de escarabajos puede variar de manera 
considerable. 
 
Fe) Ejemplo de cálculo del coeficiente de 
a . .)—) 
Varmacion 
* Pensemos en una población de elefantes y otra de ratones. La población de 
elefantes tiene un peso merlo de 5.000 kilogramos y una desviación típica de 400 
kilogramos. La población de ratones tiene un peso medio de 15 gramos y una 
desviación típica de 5 gramos, Si comparáramos la dispersión de ambas 
poblaciones mediante la desviación típica podríamos pensar que hay mayor 
dispersión para la población de elefantes que para la de los ratones. 
* Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos 
daríamos cuenta que es justo al contrario. 
Elefantes: 400/5000=0,08 
Ratones: 5/15=0,33 
+ Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación 
para los elefantes es de apenas un 8%, mientras que el de las ratones es de un. 
33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio, 
vemos que la población con mayor dispersión, no es la que tiene una mayor 
desviación típica.
 
MEDIDAS DE LA FORMA DE UNA DISTRIBUCIÓN: ASIMETRÍA Y 
CURTOSIS 
 
J En Resumen 
La estadística descriptiva es una disciplina que proporciona un conjunto de 
métodos y procedimientos para recopilar información, clasificar, encontrar las 
características de los datos y hacer una buena interpretación de los mismos; así, 
es posible emitir una conclusión acertada respecto a un tema de interés. 
Las medidas de dispersión describen qué tan agrupados o separados están los 
datos alrededor de 15 valores de tendencia cántra . Aunque existen medidas de 
dispersión definidas en torno a la mediana, generalmente se definen al comparar 
los datos con la media. Las medidas más usadas son la varianza, la desviación 
estan y el coeficiente de variación; también son conocidas la desviación media 
y el rango. 
Los sistemas o métodos estadísticos sirven para propósitos descriptivos, 
organizar y resumir datos numéricos, campos de estudio de la estadística 
descriptiva. Su aplicación está en diversas áreas, como mercadotecnia, 
contabilidad, control de calidad, estudios de consumidores, análisis de resultados 
deportivos, administradores de instituciones, educación, organismos políticos, 
médicos, entre otros. 
MEDIDAS DE LA FORMA DE UNA DISTRIBUCIÓN: ASIMETRÍA Y 
GENERALIDADES 
Curtosis 
 
ASIMETRÍA CURTOSIS
J En Resumen 
La estadística descriptiva es una disciplina que proporciona un conjunto de 
métodos y procedimientos para recopilar información, clasificar, encontrar las 
características de los datos y hacer una buena interpretación de los mismos; así, 
es posible emitir una conclusión acertada respecto a un tema de interés. 
Las medidas de dispersión describen qué tan agrupados o separados están los 
datos alrededor de 15 valores de tendencia cántra . Aunque existen medidas de 
dispersión definidas en torno a la mediana, generalmente se definen al comparar 
los datos con la media. Las medidas más usadas son la varianza, la desviación 
estan y el coeficiente de variación; también son conocidas la desviación media 
y el rango. 
Los sistemas o métodos estadísticos sirven para propósitos descriptivos, 
organizar y resumir datos numéricos, campos de estudio de la estadística 
descriptiva. Su aplicación está en diversas áreas, como mercadotecnia, 
contabilidad, control de calidad, estudios de consumidores, análisis de resultados 
deportivos, administradores de instituciones, educación, organismos políticos, 
médicos, entre otros. 
MEDIDAS DE LA FORMA DE UNA DISTRIBUCIÓN: ASIMETRÍA Y 
GENERALIDADES 
Curtosis 
 
ASIMETRÍA CURTOSIS
 
 
 
] COEFICIENTE.ASIMETRÍA 
Esta medida nos os permite identiticas si los datos se CURVA samernaca 
distribuyen orma uniforme alrededor del Pon 
punto Sontral “(Media. aritmética). La asimetría / ' 
presenta tres estados diferentes [Figura], cada uno a. 
de los cuales define de forma concisa como están 
distriaados ne datos respecto al eje de asimetría. ON” OS 
dice de la _ asimetría es positiva cuando la VA 
mayoa; los datos se encuentran por encima del Ñ 
valor media aritmética, la curva zo 
es Simó ie cuando se distribuyen id 
aproximadamente la misma cantidad de valores en AS 
ambos lados de la media y se conoce IN 
como. asimetría negativa cuando la mayor AA 
cantidad de datos sé aglomeran en los valores AA 
menores que la media. 
"1 Los resultados pueden ser los siguientes: 
* g1 = O (distribución simétrica; existe la misma concentración 
de valores a la derecha y a la izquierda de la media) 
* g1 > O (distribución asimétrica positiva; existe mayor 
concentración de valores a la derecha de la media que a su 
izquierda) 
* g1 < O (distribución asimétrica negativa; existe mayor 
concentración de valores a la izquierda de la media que a su 
derecha)“3 FUNCIÓN CURTOSIS 
Esta medida determina el grado 
de concentración que presentan 
los valores en la región central 
de la distribución. Por medio 
del Coeficiente de Curtosis, 
podemos identificar si existe 
una gran concentración de Mec 
valores (Leptocúrtica), una la 
concentración normal 
(Mesocúrtica) óÓ una baja 
concentración (Platicúrtica). 
 
H
A
N
S
] COEFICIENTE.ASIMETRÍA 
Esta medida nos os permite identiticas si los datos se CURVA samernaca 
distribuyen orma uniforme alrededor del Pon 
punto Sontral “(Media. aritmética). La asimetría / ' 
presenta tres estados diferentes [Figura], cada uno a. 
de los cuales define de forma concisa como están 
distriaados ne datos respecto al eje de asimetría. ON” OS 
dice de la _ asimetría es positiva cuando la VA 
mayoa; los datos se encuentran por encima del Ñ 
valor media aritmética, la curva zo 
es Simó ie cuando se distribuyen id 
aproximadamente la misma cantidad de valores en AS 
ambos lados de la media y se conoce IN 
como. asimetría negativa cuando la mayor AA 
cantidad de datos sé aglomeran en los valores AA 
menores que la media. 
"1 Los resultados pueden ser los siguientes: 
* g1 = O (distribución simétrica; existe la misma concentración 
de valores a la derecha y a la izquierda de la media) 
* g1 > O (distribución asimétrica positiva; existe mayor 
concentración de valores a la derecha de la media que a su 
izquierda) 
* g1 < O (distribución asimétrica negativa; existe mayor 
concentración de valores a la izquierda de la media que a su 
derecha) 
“3 FUNCIÓN CURTOSIS 
Esta medida determina el grado 
de concentración que presentan 
los valores en la región central 
de la distribución. Por medio 
del Coeficiente de Curtosis, 
podemos identificar si existe 
una gran concentración de Mec 
valores (Leptocúrtica), una la 
concentración normal 
(Mesocúrtica) óÓ una baja 
concentración (Platicúrtica). 
 
H
A
N
S
 
 
 
Descripción 
* Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza 
la intensidad de pico o la curvatura relativa de una distribución en. 
comparación con la distribución normal. Una curtosis positiva indica 
una distribución relativamente elevada. Una curtosis negativa indica 
una distribución relativamente plana. 
Sintaxis 
CURTOSIS(número1, [número2], ...) 
* La sintaxis de la función CURTOSIS tiene los siguientes argumentos: 
* Número1, número2... Númeroi1 es obligatorio, los demás 
números son opcionales. De 1 a 255 argumentos cuya curtosis puede 
calcular. También puede usar una matriz única o una referencia de 
matriz en lugar de argumentos separados por comas. 
“1 Observaciones 
* Los argumentos pueden ser números o nombres, matrices o 
referencias que contengan números. 
* Se tienen en cuenta los valores lógicos y las representaciones 
textuales de números escritos directamente en la lista de 
argumentos. 
* Si el argumento matricial o de referencia contiene texto, valores 
lógicos 0 celdas vacías, estos valores se pasan por alto; sin embargo, 
se Incluirán las celdas con el valor cero. 
* Los argumentos que son valores de error o texto que no se pueden 
traducir a números provocan errores. 
* Si hay menos de cuatro puntos de datos, o si la desviación estándar 
de la'muestra es igual a cero, curtosis devuelve el ¿+¿DIV/o! +¡VALOR! 
1 FUNCIÓN CURTOSIS 
Los resultados de esta fórmula se interpretan: 
* (g2 = 0) la distribución es Mesocúrtica: Al igual que en la 
asimetría es bastante difícil encontrar un coeficiente de 
Curtosis de cero (0), por lo que se suelen aceptar los valores 
cercanos (+ 0.5 aprox.). 
* (g2 > 0) la distribución es Leptocúrtica 
* (g2 < 0) la distribución es Platicúrtica
Descripción 
* Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza 
la intensidad de pico o la curvatura relativa de una distribución en. 
comparación con la distribución normal. Una curtosis positiva indica 
una distribución relativamente elevada. Una curtosis negativa indica 
una distribución relativamente plana. 
Sintaxis 
CURTOSIS(número1, [número2], ...) 
* La sintaxis de la función CURTOSIS tiene los siguientes argumentos: 
* Número1, número2... Númeroi1 es obligatorio, los demás 
números son opcionales. De 1 a 255 argumentos cuya curtosis puede 
calcular. También puede usar una matriz única o una referencia de 
matriz en lugar de argumentos separados por comas. 
“1 Observaciones 
* Los argumentos pueden ser números o nombres, matrices o 
referencias que contengan números. 
* Se tienen en cuenta los valores lógicos y las representaciones 
textuales de números escritos directamente en la lista de 
argumentos. 
* Si el argumento matricial o de referencia contiene texto, valores 
lógicos 0 celdas vacías, estos valores se pasan por alto; sin embargo, 
se Incluirán las celdas con el valor cero. 
* Los argumentos que son valores de error o texto que no se pueden 
traducir a números provocan errores. 
* Si hay menos de cuatro puntos de datos, o si la desviación estándar 
de la'muestra es igual a cero, curtosis devuelve el ¿+¿DIV/o! +¡VALOR! 
1 FUNCIÓN CURTOSIS 
Los resultados de esta fórmula se interpretan: 
* (g2 = 0) la distribución es Mesocúrtica: Al igual que en la 
asimetría es bastante difícil encontrar un coeficiente de 
Curtosis de cero (0), por lo que se suelen aceptar los valores 
cercanos (+ 0.5 aprox.). 
* (g2 > 0) la distribución es Leptocúrtica 
* (g2 < 0) la distribución es Platicúrtica
 
 
BIOESTADÍSTICA – SEMANA 9 
PROBABILIDADES 
 
Y Ejemplo 
+ Copie los datos de ejemplo en 
la tabla siguiente y péguelos 
en la celda A1 de una hoja de 
cálculo nueva de Excel. Para 
que las fórmulas muestren los 
resultados, selecciónelas, 
presione F2 y luego ENTRAR. 
Si lo necesita, puede ajustar el 
ancho de las columnas para 
ver todos los datos. 
3 
4 
5 
2 
3 
4 
5 
6 
4 
7 
Fórmula Descripción Resultado 
=CURTOSIS( Curtosis del -0,15179963 
A2:A11) conjunto de 
datos anterior 
BIOESTADÍSTICA -—- SEMANA 9 
PROBABILIDADES 
7] Nociones de probabilidad 
+ Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de 
veces que ocurriría el suceso al realizar un experimento repetidas veces. 
CLASIFICACION OMS 
 
 
 
Frecuencia_| Porcentaje 
Válidos NORMAL 469 46,9% 
OSTEOPENIA 467 46,7% 
OSTEOPOROSIS 64 6,4% 
Total 1000 100,0 
CLASIFICACION OMS 
 
NORMAL: 
OSTEOPENI 
OSTEOPOROSI 
 
 
t I 
0 10 20 30 40 50 
Porcentaje 
+ Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal. En 
ambos tipos de definiciones aparece el concepto de suceso. Vamos a ver qué son y 
algunas operaciones que se pueden realizar con sucesos.
Y Ejemplo 
+ Copie los datos de ejemplo en 
la tabla siguiente y péguelos 
en la celda A1 de una hoja de 
cálculo nueva de Excel. Para 
que las fórmulas muestren los 
resultados, selecciónelas, 
presione F2 y luego ENTRAR. 
Si lo necesita, puede ajustar el 
ancho de las columnas para 
ver todos los datos. 
3 
4 
5 
2 
3 
4 
5 
6 
4 
7 
Fórmula Descripción Resultado 
=CURTOSIS( Curtosis del -0,15179963 
A2:A11) conjunto de 
datos anterior 
BIOESTADÍSTICA -—- SEMANA 9 
PROBABILIDADES 
7] Nociones de probabilidad 
+ Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de 
veces que ocurriría el suceso al realizar un experimento repetidas veces. 
CLASIFICACION OMS 
 
 
 
Frecuencia_| Porcentaje 
Válidos NORMAL 469 46,9% 
OSTEOPENIA 467 46,7% 
OSTEOPOROSIS 64 6,4% 
Total 1000 100,0 
CLASIFICACION OMS 
 
NORMAL: 
OSTEOPENI 
OSTEOPOROSI 
 
 
t I 
0 10 20 30 40 50 
Porcentaje 
+ Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal. En 
ambos tipos de definiciones aparece el concepto de suceso. Vamos a ver qué son y 
algunas operaciones que se pueden realizar con sucesos.
 
 
r 
_J Sucesos 
+ Cuando se realiza un experimento aleatorio diversos 
resultados son posibles. El conjunto de todos los resultados 
posibles se llama espaciomuestral (E). 
+ Se llama suceso a un subconjunto de dichos resultados. 
* Se llama suceso contrario (complementario) de un suceso A, 
A”, al formado por los elementos que no están en A 
* Se llama suceso unión de A y B, AUB, al formado por los 
resultados experimentales que están en A o en B (incluyendo 
los que están en ambos. 
+ Se llama suceso intersección de A y B, AMB o simplemente AB, 
al formado por los elementos que están en A y B 
 
UNIÓN INTERS: 
E espacio muestral E espacio muestral 
 
 
 
 
Definición de probabilidad 
+ Se llama probabilidad a cualquier función, P, 
suceso A un valor numérico P(A), verificando 
reglas (axiomas) 
 
E espacio muestral 
 
 
E espacio muestral 
o 
o A 
 
 
E espacio muestral 
 
 
joestadística. U. Málaga. 
Ing. Liliana má a Sarmiento Barreiro, MSIG 
que asigna a cada 
as siguientes 
 
E espacio muestral 
* P(E)=1 100%. 
E espacio muestral 
* OSP(A) <1 
 
- P(AUB)=P(A)+P(B) si AMB=0 
* Ves el conjunto vacío. . 
* Podemos imaginar la probabilidad de un subconjunto como el 
tamaño relativo con respecto al total (suceso seguro)
r 
_J Sucesos 
+ Cuando se realiza un experimento aleatorio diversos 
resultados son posibles. El conjunto de todos los resultados 
posibles se llama espacio muestral (E). 
+ Se llama suceso a un subconjunto de dichos resultados. 
* Se llama suceso contrario (complementario) de un suceso A, 
A”, al formado por los elementos que no están en A 
* Se llama suceso unión de A y B, AUB, al formado por los 
resultados experimentales que están en A o en B (incluyendo 
los que están en ambos. 
+ Se llama suceso intersección de A y B, AMB o simplemente AB, 
al formado por los elementos que están en A y B 
 
UNIÓN INTERS: 
E espacio muestral E espacio muestral 
 
 
 
 
Definición de probabilidad 
+ Se llama probabilidad a cualquier función, P, 
suceso A un valor numérico P(A), verificando 
reglas (axiomas) 
 
E espacio muestral 
 
 
E espacio muestral 
o 
o A 
 
 
E espacio muestral 
 
 
joestadística. U. Málaga. 
Ing. Liliana má a Sarmiento Barreiro, MSIG 
que asigna a cada 
as siguientes 
 
E espacio muestral 
* P(E)=1 100%. 
E espacio muestral 
* OSP(A) <1 
 
- P(AUB)=P(A)+P(B) si AMB=0 
* Ves el conjunto vacío. . 
* Podemos imaginar la probabilidad de un subconjunto como el 
tamaño relativo con respecto al total (suceso seguro)
 
 
 
Probabilidad condicionada 
+ Se llama probabilidad de A condicionada a B, o 
probabilidad de A sabiendo que pasa B: 
Error frecuentíiiisimo: 
O No confundir probabilidad condicionada con intersección. 
U En ambos medimos efectivamente la intersección, pero... 
En P(ANB) con respecto a P(E)=1 
En P(AIB) con resbecto a P(B1 
 
 
 
E espacio muestral 
 
 
 
P(A)=3/9=1/3 
P(B)=5/9 
P(AUB)=6/9=2/3 
P(AB)=2/9 
P(A')=6/9=2/3 
P(B')=4/9 
 
 
 
E espacio muestral 
 
Rinestadistica 11 Málar 
 
 
 
 
 
P(A)=3/9=1/3 
E espacio muestral 
 
( 
P(B)=2/9 
P(AUB)=5/9 
P(AB)=0 
P(A')=6/9=2/3 
P(B”)=7/9 
 
E espacio muestral 
 
 
P(A)=3/9=1/3 
P(B)=2/9 
P(AUB)=3/9=1/3 
P(AB)=2/9 
P(A')=6/9=2/3 
P(B')=7/9 
 
 Bioestadística. U. Málaga. 
 
 
Probabilidad condicionada 
+ Se llama probabilidad de A condicionada a B, o 
probabilidad de A sabiendo que pasa B: 
Error frecuentíiiisimo: 
O No confundir probabilidad condicionada con intersección. 
U En ambos medimos efectivamente la intersección, pero... 
En P(ANB) con respecto a P(E)=1 
En P(AIB) con resbecto a P(B1 
 
 
 
E espacio muestral 
 
 
 
P(A)=3/9=1/3 
P(B)=5/9 
P(AUB)=6/9=2/3 
P(AB)=2/9 
P(A')=6/9=2/3 
P(B')=4/9 
 
 
 
E espacio muestral 
 
Rinestadistica 11 Málar 
 
 
 
 
 
P(A)=3/9=1/3 
E espacio muestral 
 
( 
P(B)=2/9 
P(AUB)=5/9 
P(AB)=0 
P(A')=6/9=2/3 
P(B”)=7/9 
 
E espacio muestral 
 
 
P(A)=3/9=1/3 
P(B)=2/9 
P(AUB)=3/9=1/3 
P(AB)=2/9 
P(A')=6/9=2/3 
P(B')=7/9 
 
 Bioestadística. U. Málaga. 
 
 
 
UNIVERSIDAD DE GUAYAQUIL Intulr la probabilidad condicionada 
 
 
 
 
A A 
=== ca 
5 B 
P(A) =0,25 P(A) =0,25 
P(B) =0,10 P(B) =0,10 
P(ANB) = 0,10 P(ANB) = 0,08 
¿Probabilidad de A sabiendo que ha pasado B? 
P(A|B)=1 P(A|B)=0,8 
 
A | A 
 
n
a
]
 
 
B 
P(A) =0,25 P(A) =0,25 
P(B) =0,10 P(B) =0,10 
P(ANB) = 0,005 P(ANB) = 0 
¿Probabilidad de A sabiendo que ha pasado B? 
P(A|B)=0,05 P(A|B)=0 
Rinactadíctira 1! há
UNIVERSIDAD DE GUAYAQUIL Intulr la probabilidad condicionada 
 
 
 
 
A A 
=== ca 
5 B 
P(A) =0,25 P(A) =0,25 
P(B) =0,10 P(B) =0,10 
P(ANB) = 0,10 P(ANB) = 0,08 
¿Probabilidad de A sabiendo que ha pasado B? 
P(A|B)=1 P(A|B)=0,8 
 
A | A 
 
n
a
]
 
 
B 
P(A) =0,25 P(A) =0,25 
P(B) =0,10 P(B) =0,10 
P(ANB) = 0,005 P(ANB) = 0 
¿Probabilidad de A sabiendo que ha pasado B? 
P(A|B)=0,05 P(A|B)=0 
Rinactadíctira 1! há
 
 
Algunas reglas de cálculo prácticas 
* Cualquier problema de probabilidad puede resolverse 
en teoría mediante aplicación de los axiomas. Sin 
embargo, es más cómodo conocer algunas reglas de 
cálculo: 
- P(A')=1-P(A) 
- P(AUB) = P(A) + P(B) - P(AB) 
- P(AB) = P(A) P(B|A) 
= P(B) P(A|B) 
* Prob. de que pasen A y B es la prob. de A y que también pase B 
sabiendo que pasó A. 
Recuento 
 
MENOPAUSIA 
 
 
 
 
. 
Ejemplo (1) o a] rua 
CLASIFICACION NORMAL 189 280 469 
OMS OSTEOPENIA 108 359 467 
OSTEOPOROSIS 6 58 64 
Total 303 697 1000 
 
+ Se ha repetido en 1000 ocasiones el experimento de elegir a una 
mujer de una población muy grande. El resultado está en la tabla. 
+ ¿Cuál es la probabilidad de que una mujer tenga 
osteoporosis? 
» P(Osteoporosis)=64/1000=0,064=6,4% 
+ Noción frecuentista de probabilidad 
+ ¿Cuál es la probabilidad de que una mujer no tenga 
osteoporosis? 
+ P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6%
Algunas reglas de cálculo prácticas 
* Cualquier problema de probabilidad puede resolverse 
en teoría mediante aplicación de los axiomas. Sin 
embargo, es más cómodo conocer algunas reglas de 
cálculo: 
- P(A')=1-P(A) 
- P(AUB) = P(A) + P(B) - P(AB) 
- P(AB) = P(A) P(B|A) 
= P(B) P(A|B) 
* Prob. de que pasen A y B es la prob. de A y que también pase B 
sabiendo que pasó A. 
Recuento 
 
MENOPAUSIA 
 
 
 
 
. 
Ejemplo (1) o a] rua 
CLASIFICACION NORMAL 189 280 469 
OMS OSTEOPENIA 108 359 467 
OSTEOPOROSIS 6 58 64 
Total 303 697 1000 
 
+ Se ha repetido en 1000 ocasiones el experimento de elegir a una 
mujer de una población muy grande. El resultado está en la tabla. 
+ ¿Cuál es la probabilidad de que una mujer tenga 
osteoporosis? 
» P(Osteoporosis)=64/1000=0,064=6,4% 
+ Noción frecuentista de probabilidad 
+ ¿Cuál es la probabilidad de que una mujer no tenga 
osteoporosis? 
+ P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6%
 
 
 
Ml SEMANA 9 
* QU — ? AYAQUIL Recuento 
MENOPAUSIA 
NO si Tot 
CLASIFICACION NORMAL 189 280 400 
 
 
 
 
OMS OSTEOPENIA 108 359 467 
OSTEOPOROSIS 6 Cs8) || 
Total 303 69 1000 
+ ¿Probabilidad de tener osteopenia u osteoporosis? 
» P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)-P(Osteopenia” Osteoporosis) 
=467/1000+64/1000=0,531 
+ Son sucesos disjuntos 
+ Osteopenia f) Osteoporosis=0 
+ ¿Probabilidad de tener osteoporosis o menopausia? 
» P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-P(Osteoporosis Menopausia) 
=64/1000+697/1000-58/1000=0,703 
+ No son sucesos disjuntos 
+ ¿Probabilidad de una mujer normal? 
» P(Normal)=469/1000=0,469 
» P(Normal)=1-P(Normal' )=1-P(OsteopeniaU Osteoporosis) =1-0,531=0,469 
Ejemplo (111) 
1 
OMS OSTEOPENIA 108 
OSTEOPOROSIS 6 
Total 303 
 
* Si es menopáusica... ¿probabilidad de osteoporosis? 
» P(Osteoporosis| Menopausia)=58/697=0,083 
+ ¿Probabilidad de menopausia y osteoporosis?» P(Menop ÑN Osteoporosis) = 58/1000=0,058 
» Otra forma: 
 
P(MenopN Osteopoross) = P(Menop)x P(Osteopoross| Menop) = 
5% ga =58/1000= 0,058 
1000 697 
LA Tabla de contingencia 
 
 
 
Ml SEMANA 9 
* QU — ? AYAQUIL Recuento 
MENOPAUSIA 
NO si Tot 
CLASIFICACION NORMAL 189 280 400 
 
 
 
 
OMS OSTEOPENIA 108 359 467 
OSTEOPOROSIS 6 Cs8) || 
Total 303 69 1000 
+ ¿Probabilidad de tener osteopenia u osteoporosis? 
» P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)-P(Osteopenia” Osteoporosis) 
=467/1000+64/1000=0,531 
+ Son sucesos disjuntos 
+ Osteopenia f) Osteoporosis=0 
+ ¿Probabilidad de tener osteoporosis o menopausia? 
» P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-P(Osteoporosis Menopausia) 
=64/1000+697/1000-58/1000=0,703 
+ No son sucesos disjuntos 
+ ¿Probabilidad de una mujer normal? 
» P(Normal)=469/1000=0,469 
» P(Normal)=1-P(Normal' )=1-P(OsteopeniaU Osteoporosis) =1-0,531=0,469 
Ejemplo (111) 
1 
OMS OSTEOPENIA 108 
OSTEOPOROSIS 6 
Total 303 
 
* Si es menopáusica... ¿probabilidad de osteoporosis? 
» P(Osteoporosis| Menopausia)=58/697=0,083 
+ ¿Probabilidad de menopausia y osteoporosis? 
» P(Menop ÑN Osteoporosis) = 58/1000=0,058 
» Otra forma: 
 
P(MenopN Osteopoross) = P(Menop)x P(Osteopoross| Menop) = 
5% ga =58/1000= 0,058 
1000 697 
LA Tabla de contingencia 
 
 
 
 
 
 
2 
 Y] 
 
 
 
 
 
Y1 [ni [n:> Nik 
Y2 |; |n Mk 
Yp Mp1 | Mp2 Mpk 
 
La misma tabla puede expresarse en 
frecuencias relativas o proporciones sin 
más que dividir cada casilla nij por el total 
N.yY===kjpiij 
 
SAL 
 
donde nij expresa la frecuencia 
absoluta observada en las 
modalidades Xi e Yj refleja la 
distribución conjunta de X e Y. 
 
 
Las tablas de contingencia hemos dicho que estudia 
relaciones entre dos variables cualitativas 
Si queremos estudiar la relación entre el color de ojos y el color del 
La variable X: Color de 
ojos 
x1: ojos claros 
x2: Ojos Oscuros 
 
EJEMPLO. En un hospital 
psiquiátrico “se hace un 
estudio en el que participan 
30 pacientes con dos tipos de 
problemas neuronales (altos y 
bajos), queremos comparar 
un fármaco nuevo con otro 
antiguo. ¿Cómo podemos 
representar esta situación? 
¿Cómo podemos ver si el 
tratamiento nuevo es 
preferible al anterior? 
pelo. 
 
La variable Y: Color de 
pelo 
y1: pelo claro 
y2: pelo oscuro 
¿Cómo construir una tabla 
de contingencia? 
 
 
Variable X: Tipo de tratamiento 
x1: antiguo 
x2: nuevo 
Variable Y: Problemas neuronales 
y1: altos 
y2: bajos 
2 
 Y] 
 
 
 
 
 
Y1 [ni [n:> Nik 
Y2 |; |n Mk 
Yp Mp1 | Mp2 Mpk 
 
La misma tabla puede expresarse en 
frecuencias relativas o proporciones sin 
más que dividir cada casilla nij por el total 
N.yY===kjpiij 
 
SAL 
 
donde nij expresa la frecuencia 
absoluta observada en las 
modalidades Xi e Yj refleja la 
distribución conjunta de X e Y. 
 
 
Las tablas de contingencia hemos dicho que estudia 
relaciones entre dos variables cualitativas 
Si queremos estudiar la relación entre el color de ojos y el color del 
La variable X: Color de 
ojos 
x1: ojos claros 
x2: Ojos Oscuros 
 
EJEMPLO. En un hospital 
psiquiátrico “se hace un 
estudio en el que participan 
30 pacientes con dos tipos de 
problemas neuronales (altos y 
bajos), queremos comparar 
un fármaco nuevo con otro 
antiguo. ¿Cómo podemos 
representar esta situación? 
¿Cómo podemos ver si el 
tratamiento nuevo es 
preferible al anterior? 
pelo. 
 
La variable Y: Color de 
pelo 
y1: pelo claro 
y2: pelo oscuro 
¿Cómo construir una tabla 
de contingencia? 
 
 
Variable X: Tipo de tratamiento 
x1: antiguo 
x2: nuevo 
Variable Y: Problemas neuronales 
y1: altos 
y2: bajos 
 
 
 
 
 
Los pacientes nos dijeron el tipo de problema y que fármaco tomaban 
 
 
 
 
 
Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo), 
Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujetos (alto, nuevo)... 
Contamos cuantos hay del mismo tipo, es decir: | 
 
 
 
a = Problemas altos y tratamiento antiguo = 10 
b = Problemas bajos y tratamiento antiguo = 4 
c = Problemas altos y tratamiento nuevo = 5 
d = Problemas bajos y tratamiento nuevo = 11 
Id 
TABLA DE CONTINGENCIA 
Problemas neuronales (Y) 
Altos (y1) Bajos (y2) 
Antiguo (x1) a=10 b=4 
Nuevo (x2) c=5D d = 11 
 
 Tratamiento (X) 
 
 
 
Estos 4 valores calculados llamaremos frecuencias absolutas dobles 
(f), que nos dicen el número de sujetos que hay, con valores 
específicos de las variables 
] FRECUENCIAS MARGINALES Y DISTRIBUCIÓN MARGINAL 
En la tabla de las frecuencias absolutas dobles anterior, 
NEIRA INNER SN 
llamaremos “TOTAL”, en ambos casos. 
¡EMINEM om 
Xx 
Cada valor llamaremos frecuencia marginal de X 
La fila del TOTAL llamaremos distribución marginal de Y 
Cada valor llamaremos frecuencia marginal de Y 
LAR 
MENE E al mc 
na NINE Nc 
 
 
 
Los pacientes nos dijeron el tipo de problema y que fármaco tomaban 
 
 
 
 
 
Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo), 
Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujetos (alto, nuevo)... 
Contamos cuantos hay del mismo tipo, es decir: | 
 
 
 
a = Problemas altos y tratamiento antiguo = 10 
b = Problemas bajos y tratamiento antiguo = 4 
c = Problemas altos y tratamiento nuevo = 5 
d = Problemas bajos y tratamiento nuevo = 11 
Id 
TABLA DE CONTINGENCIA 
Problemas neuronales (Y) 
Altos (y1) Bajos (y2) 
Antiguo (x1) a=10 b=4 
Nuevo (x2) c=5D d = 11 
 
 Tratamiento (X) 
 
 
 
Estos 4 valores calculados llamaremos frecuencias absolutas dobles 
(f), que nos dicen el número de sujetos que hay, con valores 
específicos de las variables 
] FRECUENCIAS MARGINALES Y DISTRIBUCIÓN MARGINAL 
En la tabla de las frecuencias absolutas dobles anterior, 
NEIRA INNER SN 
llamaremos “TOTAL”, en ambos casos. 
¡EMINEM om 
Xx 
Cada valor llamaremos frecuencia marginal de X 
La fila del TOTAL llamaremos distribución marginal de Y 
Cada valor llamaremos frecuencia marginal de Y 
LAR 
MENE E al mc 
na NINE Nc 
 
 
 
 
 
 
 
 
Tratamiento Problemas neuronales TOTAL 
Altos Bajos 
Antiguo 10 4 10+4 = 14 
(f1.) 
Nuevo 9 11 5+11=16 
(f2.) 
TOTAL 10+5=15 4+11=15 30 (n) 
(f.1) (f.2) 
 
El valor n, se obtiene sumando cualquier distribución 
marginal, representa el número total de sujetos, que como 
recordamos son 30 pacientes. 
FRECUENCIAS CONDICIONALES Y DISTRIBUCION 
CONDICIONAL 
Vamos a conocer estos términos con nuestro ejemplo 
Se trabaja con la tabla de frecuencias absolutas, es decir: 
 
 
 
 
 
Tratamiento Problemas neuronales TOTAL 
Altos Bajos 
Antiguo 10 (111) 4 (112) 14 (f1.) 
Nuevo 9 (121) 11 (122) 16 (f2.) 
TOTAL 15 (f.1) 15 (f.2) 30 (n) 
 
 
 
 
 
 
 
Tratamiento Problemas neuronales TOTAL 
Altos Bajos 
Antiguo 10 4 10+4 = 14 
(f1.) 
Nuevo 9 11 5+11=16 
(f2.) 
TOTAL 10+5=15 4+11=15 30 (n) 
(f.1) (f.2) 
 
El valor n, se obtiene sumando cualquier distribución 
marginal, representa el número total de sujetos, que como 
recordamos son 30 pacientes. 
FRECUENCIAS CONDICIONALES Y DISTRIBUCION 
CONDICIONAL 
Vamos a conocer estos términos con nuestro ejemplo 
Se trabaja con la tabla de frecuencias absolutas, es decir: 
 
 
 
 
 
Tratamiento Problemas neuronales TOTAL 
Altos Bajos 
Antiguo 10 (111) 4 (112) 14 (f1.) 
Nuevo 9 (121) 11 (122) 16 (f2.) 
TOTAL 15 (f.1) 15 (f.2) 30 (n) 
 
 
 
 
 
 
Podemos 
NN 
loto 
X condicionada 
LORI 
Podemos 
Ne 
culo 
Y condicionada 
LPI 
Los datos que nos interesan son: 
(ANNAN! 
Elo xl 
NAO ie oe 
LODO 
IE 
La frecuencia 
Onion 
Rie 
e) 
La frecuencia 
Onion 
UPRO talles 
¡A 
 
 
 
 
 
 
 
 
Tratamiento | Problemas neuronales (Y) | TOTAL 
Altos (y1) Bajos (y2) 
Nuevo (x2) 5 11 16 
Las frecuencias condicionales son: 
Tratamiento | Problemasneuronales (Y) | TOTAL 
Altos (y1) Bajos (y2) 
Nuevo (x2) | 9/16=0,3125 | 11/16=0,6875 1 
(h(y1/x2)) (h(y2/x2)) 
 
 
 
Podemos 
NN 
loto 
X condicionada 
LORI 
Podemos 
Ne 
culo 
Y condicionada 
LPI 
Los datos que nos interesan son: 
(ANNAN! 
Elo xl 
NAO ie oe 
LODO 
IE 
La frecuencia 
Onion 
Rie 
e) 
La frecuencia 
Onion 
UPRO talles 
¡A 
 
 
 
 
 
 
 
 
Tratamiento | Problemas neuronales (Y) | TOTAL 
Altos (y1) Bajos (y2) 
Nuevo (x2) 5 11 16 
Las frecuencias condicionales son: 
Tratamiento | Problemas neuronales (Y) | TOTAL 
Altos (y1) Bajos (y2) 
Nuevo (x2) | 9/16=0,3125 | 11/16=0,6875 1 
(h(y1/x2)) (h(y2/x2)) 
 
 
 
 
La interpretación 
 
Tratamiento | Problemas neuronales (Y) TOTAL 
Altos (y1) Bajos (y2) 
Nuevo (x2) | 5/16=0,3125 | 11/16=0,6875 1 
(h(y1/x2)) (h(y2/x2)) 
 
 
 
 
- El 31,25% de los pacientes con el tratamiento 
nuevo, tienen problemas neuronales altos 
- El 68,75% de los pacientes con el tratamiento 
nuevo, tienen problemas neuronales bajos 
Es requisito que todos y cada uno de los elementos 
de la población tengan la misma probabilidad de 
ser seleccionados (azar) 
 
 
mm de) » Ñ 
mm ra Q " as Su Se debe tener disponible un listado completo de 
pim ). mil > 
a - 
 
todos los elementos de la población, a esto se le 
Al llama MARCO DE MUESTREO. 
 
Munciran Donmbombrilíctiom 
14) TIPOS DE MUESTREO 
ALEATORIO SIMPLE (Muestreo Simple al Azar) 
 
 
Cada sujeto tiene una probabilidad igual de ser 
seleccionado para el estudio. Se necesita una lista 
numerada de las unidades de la población que se quiere 
muestrear. 
| Ejemplo : 
Cobertura de la vacuna anti- sarampión entre 1200 
 
 
 
 
Pasos : niños de una escuela X : 
> Determinar el tamaño de la muestra > Muestra = 60 
> Numerar los individuos de1an > Hacer una lista de todos los niños 
> Tirar unidades al azar (probabilidad igual) > Numerarlos de 1 a 1200 
 > Selección aleatoria de 60 números 
 
La interpretación 
 
Tratamiento | Problemas neuronales (Y) TOTAL 
Altos (y1) Bajos (y2) 
Nuevo (x2) | 5/16=0,3125 | 11/16=0,6875 1 
(h(y1/x2)) (h(y2/x2)) 
 
 
 
 
- El 31,25% de los pacientes con el tratamiento 
nuevo, tienen problemas neuronales altos 
- El 68,75% de los pacientes con el tratamiento 
nuevo, tienen problemas neuronales bajos 
Es requisito que todos y cada uno de los elementos 
de la población tengan la misma probabilidad de 
ser seleccionados (azar) 
 
 
mm de) » Ñ 
mm ra Q " as Su Se debe tener disponible un listado completo de 
pim ). mil > 
a - 
 
todos los elementos de la población, a esto se le 
Al llama MARCO DE MUESTREO. 
 
Munciran Donmbombrilíctiom 
14) TIPOS DE MUESTREO 
ALEATORIO SIMPLE (Muestreo Simple al Azar) 
 
 
Cada sujeto tiene una probabilidad igual de ser 
seleccionado para el estudio. Se necesita una lista 
numerada de las unidades de la población que se quiere 
muestrear. 
| Ejemplo : 
Cobertura de la vacuna anti- sarampión entre 1200 
 
 
 
 
Pasos : niños de una escuela X : 
> Determinar el tamaño de la muestra > Muestra = 60 
> Numerar los individuos de1an > Hacer una lista de todos los niños 
> Tirar unidades al azar (probabilidad igual) > Numerarlos de 1 a 1200 
 > Selección aleatoria de 60 números 
 
 
 
 
 
A) 2 ——Ká— ALEATORIO SISTEMÁTICO 
Ejemplo : 
» Población (N) : 12,000 
Muestra requerida (n) : 600 
Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20 
Escoger el 1er numero al azar [1 - 20] 
Añadir k para escoger la siguiente unidad y así sucesivamente 
hasta completar n. 
MMMM 
Ar 0 rea pnn0dd Os 
PERA 
Muestreo Estratificado. 
 
 
 
 
Cuando la muestra incluye subgrupos representativos 
(estratos) de los elementos de estudio con características 
específicas: urbano, rural, nivel de instrucción, año 
académico, carrera, sexo, grupo étnico, edad, paridad etc. 
En cada estrato para obtener el tamaño de la muestra se 
puede utilizar el muestreo aleatorio o sistemático. 
 
Ejemplo: Estudiantes de la 
Carrera de Medicina 2005 
l año =20% 
II año=18% 
TII año =15% 
IV año=30% 
A) Muestreo por Racimos (Cluster o Conglomerado) 
 
 
Conglomerados: son unidades geográficas | | Limitantes: financieras, tiempo, geografía y otros 
(distritos, pueblos, organizaciones, clínicas) obstáculos. Se reducen costos, tiempo y energía al 
Facultad de Ciencias Económicas considerar que muchas veces las unidades de análisis 
Facultad de Ciencias Jurídicas y Sociales se encuentran encapsuladas o encerradas en 
Facultad de Química y Farmacia determinados lugares físicos o geográficos: 
Conglomerados. 
 
Comunidad A = Conglomerado N*1 Unidad de análisis: sujeto o sujetos 
Unidad Muestral en este caso: conglomerado a 
través del cual se logra el acceso a la unidad de 
análisis. 
Selección en 2 etapas: 
> Los racimos o conglomerados 
> En los racimos se seleccionan a los sujetos a 
ser medidos. Población, Localidades, Viviendas. 
Croquis. 
 
 
A) 2 ——Ká— ALEATORIO SISTEMÁTICO 
Ejemplo : 
» Población (N) : 12,000 
Muestra requerida (n) : 600 
Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20 
Escoger el 1er numero al azar [1 - 20] 
Añadir k para escoger la siguiente unidad y así sucesivamente 
hasta completar n. 
MMMM 
Ar 0 rea pnn0dd Os 
PERA 
Muestreo Estratificado. 
 
 
 
 
Cuando la muestra incluye subgrupos representativos 
(estratos) de los elementos de estudio con características 
específicas: urbano, rural, nivel de instrucción, año 
académico, carrera, sexo, grupo étnico, edad, paridad etc. 
En cada estrato para obtener el tamaño de la muestra se 
puede utilizar el muestreo aleatorio o sistemático. 
 
Ejemplo: Estudiantes de la 
Carrera de Medicina 2005 
l año =20% 
II año=18% 
TII año =15% 
IV año=30% 
A) Muestreo por Racimos (Cluster o Conglomerado) 
 
 
Conglomerados: son unidades geográficas | | Limitantes: financieras, tiempo, geografía y otros 
(distritos, pueblos, organizaciones, clínicas) obstáculos. Se reducen costos, tiempo y energía al 
Facultad de Ciencias Económicas considerar que muchas veces las unidades de análisis 
Facultad de Ciencias Jurídicas y Sociales se encuentran encapsuladas o encerradas en 
Facultad de Química y Farmacia determinados lugares físicos o geográficos: 
Conglomerados. 
 
Comunidad A = Conglomerado N*1 Unidad de análisis: sujeto o sujetos 
Unidad Muestral en este caso: conglomerado a 
través del cual se logra el acceso a la unidad de 
análisis. 
Selección en 2 etapas: 
> Los racimos o conglomerados 
> En los racimos se seleccionan a los sujetos a 
ser medidos. Población, Localidades, Viviendas. 
Croquis. 
 
BIOESTADÍSTICA – SEMANA 10 
PROBABILIDADES 
 
 
 
BIOESTADÍSTICA -— SEMANA 10 
PROBABILIDADES 
Generalidades 
 
 
 
 e B Z 
2.5.2.3 Tablas de 2.5.2.4 Independencia 2.5.2.5 Tasa de riesgo 2.5.2.6 Regla de Bayes. 
probabilidad. y razón de 
probabilidad. 
TABLAS DE PROBABILIDAD 
Una tabla de probaniad es una matriz cuadrada 
que contiene las probabilidades calculadas dada 
una función de distribución de probabilidad y un 
número determinado por el cuál se quiere saber 
la probabilidad. 
+ Una tabla de probabilidad contiene en la primera 
columna las únidades y. en la cabecera los decimales y en 
su interior la probabilidad calculada a partir de una 
función de probabilidad. 
| * También se las conoce como tablas de distribución o 
tablas estadísticas 
 
2.1 Estructura de la tabla 
 
z Decimales Decimales Decimales 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
 
 
 
 
 
Generalización de una tabla de probabilidad
BIOESTADÍSTICA -— SEMANA 10 
PROBABILIDADES 
Generalidadese B Z 
2.5.2.3 Tablas de 2.5.2.4 Independencia 2.5.2.5 Tasa de riesgo 2.5.2.6 Regla de Bayes. 
probabilidad. y razón de 
probabilidad. 
TABLAS DE PROBABILIDAD 
Una tabla de probaniad es una matriz cuadrada 
que contiene las probabilidades calculadas dada 
una función de distribución de probabilidad y un 
número determinado por el cuál se quiere saber 
la probabilidad. 
+ Una tabla de probabilidad contiene en la primera 
columna las únidades y. en la cabecera los decimales y en 
su interior la probabilidad calculada a partir de una 
función de probabilidad. 
| * También se las conoce como tablas de distribución o 
tablas estadísticas 
 
2.1 Estructura de la tabla 
 
z Decimales Decimales Decimales 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
Unidades | Probabilidad Probabilidad Probabilidad 
 
 
 
 
 
Generalización de una tabla de probabilidad
 
 
 
» No todas las tablas de probabilidad serán iguales, su forma va 
NS NN AS no 
ANA SEEN E 
evitar la confusión. 
 
NM 
 Probabilidad 
des | Probabilidad | Probabilidad | Probabilidad 
 
 des | Probabilidad 
 
Utilidad de las tablas de probabilidad 
+ Las tablas de probabilidad sirven para saber la probabilidad 
RN eN AR 
hacer cálculos complejos. 
+ El procedimiento que ahorran las tablas de probabilidad es 
tener que calcular la probabilidad dado un número 
riel Mito) 
¡xr lo ito 
 
LJ INDEPENDENCIA 
+ En teoría de probabilidades, se dice que dos sucesos aleatorios 
son independientes entre sí cuando la probabilidad de cada uno 
de ellos no está influida porque el otro suceso ocurra o no, es 
decir, cuando ambos sucesos no están relacionados. 
Entonces, dos sucesos son independientes si la ocurrencia 
de uno de ellos no modifica la probabilidad del otro. 
Matemáticamente P(A|B)=P(A)P(AIB)=P(A) y P(BIA)=P( 
B)P(BIA)=P(B). 
En consecuencia, si dos sucesos son independientes 
P(ANB)=P(A)-P(B) 
 
» No todas las tablas de probabilidad serán iguales, su forma va 
NS NN AS no 
ANA SEEN E 
evitar la confusión. 
 
NM 
 Probabilidad 
des | Probabilidad | Probabilidad | Probabilidad 
 
 des | Probabilidad 
 
Utilidad de las tablas de probabilidad 
+ Las tablas de probabilidad sirven para saber la probabilidad 
RN eN AR 
hacer cálculos complejos. 
+ El procedimiento que ahorran las tablas de probabilidad es 
tener que calcular la probabilidad dado un número 
riel Mito) 
¡xr lo ito 
 
LJ INDEPENDENCIA 
+ En teoría de probabilidades, se dice que dos sucesos aleatorios 
son independientes entre sí cuando la probabilidad de cada uno 
de ellos no está influida porque el otro suceso ocurra o no, es 
decir, cuando ambos sucesos no están relacionados. 
Entonces, dos sucesos son independientes si la ocurrencia 
de uno de ellos no modifica la probabilidad del otro. 
Matemáticamente P(A|B)=P(A)P(AIB)=P(A) y P(BIA)=P( 
B)P(BIA)=P(B). 
En consecuencia, si dos sucesos son independientes 
P(ANB)=P(A)-P(B) 
 
 
 
A A A A o 
A | Probabilidad de eventos independientes 
> Ejemplos 
 
 
* Se lanza un dado dos veces. ¿Cuál es la probabilidad de que en el primer 
lanzamiento resulte 3 y en el segundo lanzamiento un número impar? 
* Solución: 
Sean los eventos: 
+ A=Obtener un 3. De seis números posibles, hay un solo 3 >P(A) =1/6 
+ B=Obtener un número impar. De seis números posibles, tenemos tres 
impares> P(B) =3/6 =1/2 
* Los eventos A y B son independientes, por lo tanto, P(ANB) = P(A) -P(B)= 
(1/041/2)= 1/12 
 
A | ” ¡E ma mM n 
 
+ Una persona muy distraída ha extraviado el número telefónico de su mejor amigo, pero logra 
averiguar las 5 cifras intermedias de un total de 7. Sabiendo además que el primer dígito debe ser 
par, distinto de o y que la última cifra es impar mayor que 4, ¿cuál es la probabilidad de acertar al 
número de teléfono de su amigo? 
» Solución: 
Solo debe adivinar dos dígitos, el primero y el último. Las posibilidades para el primer número son 
par y distinto de cero: 2, 4, 6, 8. Las posibilidades para el segundo número son impar y mayor que 
cuatro: 5, 7,9 
Sean los eventos: 
+ A =Acertar el primer dígito. 
+ B=Acertar el segundo dígito. 
+ ANB =Acertar los dos dígitos. 
+ Entonces P(A) =1/4 
+ Entonces P(B) =1/3 
Como son eventos independientes, la probabilidad de acertar los dos dígitos en el número telefónico 
de su amigo es el producto de ambas probabilidades: 
P(AN B) = P(A) -P(B)=(1/4)(1/3)=1/12 
 
A A A A o 
A | Probabilidad de eventos independientes 
> Ejemplos 
 
 
* Se lanza un dado dos veces. ¿Cuál es la probabilidad de que en el primer 
lanzamiento resulte 3 y en el segundo lanzamiento un número impar? 
* Solución: 
Sean los eventos: 
+ A=Obtener un 3. De seis números posibles, hay un solo 3 >P(A) =1/6 
+ B=Obtener un número impar. De seis números posibles, tenemos tres 
impares> P(B) =3/6 =1/2 
* Los eventos A y B son independientes, por lo tanto, P(ANB) = P(A) -P(B)= 
(1/041/2)= 1/12 
 
A | ” ¡E ma mM n 
 
+ Una persona muy distraída ha extraviado el número telefónico de su mejor amigo, pero logra 
averiguar las 5 cifras intermedias de un total de 7. Sabiendo además que el primer dígito debe ser 
par, distinto de o y que la última cifra es impar mayor que 4, ¿cuál es la probabilidad de acertar al 
número de teléfono de su amigo? 
» Solución: 
Solo debe adivinar dos dígitos, el primero y el último. Las posibilidades para el primer número son 
par y distinto de cero: 2, 4, 6, 8. Las posibilidades para el segundo número son impar y mayor que 
cuatro: 5, 7,9 
Sean los eventos: 
+ A =Acertar el primer dígito. 
+ B=Acertar el segundo dígito. 
+ ANB =Acertar los dos dígitos. 
+ Entonces P(A) =1/4 
+ Entonces P(B) =1/3 
Como son eventos independientes, la probabilidad de acertar los dos dígitos en el número telefónico 
de su amigo es el producto de ambas probabilidades: 
P(AN B) = P(A) -P(B)=(1/4)(1/3)=1/12 
 
 
TASA DE RIESGO Y RAZÓN DE PROBABILIDAD 
 
EVENTOS 
DEPENDIENTES 
 
Dos o más eventos serán dependientes cuando la ocurrencia o no- 
ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (o 
otros). Cuando tenemos este caso, empleamos entonces, el concepto de 
probabilidad condicional para denominar la probabilidad del evento 
relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del 
evento A sí el evento B ya ocurrió. 
+ Se debe tener claro que A|B no es una fracción. 
+ P(A[B) =P(A y B/P(B) o P(B|A) = P(A y B)/P(A) 
Ejemplos: 
Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas azules. Una canica es 
eliminada de la caja y no es reemplazada. Otra canica se saca de la caja. Cuál es la 
probabilidad de que la primera canica sea azul y la segunda canica sea verde? 
+ Yaque la primera canica no es reemplazada, el tamaño del espacio muestral para la 
primera canica (9) es cambiado para la segunda canica (8) así los eventos son 
dependientes. 
+ P(azul luego verde) = P(azul) - P(verde) 
 
TASA DE RIESGO Y RAZÓN DE PROBABILIDAD 
LJ Riesgos y tasas 
 a, 
 
 
 
 
 
 
 
EVENTOS 
DEPENDIENTES 
 
Dos o más eventos serán dependientes cuando la ocurrencia o no- 
ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (o 
otros). Cuando tenemos este caso, empleamos entonces, el concepto de 
probabilidad condicional para denominar la probabilidad del evento 
relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del 
evento A sí el evento B ya ocurrió. 
+ Se debe tener claro que A|B no es una fracción. 
+ P(A[B) =P(A y B/P(B) o P(B|A) = P(A y B)/P(A) 
Ejemplos: 
Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas azules. Una canica es 
eliminada de la caja y no es reemplazada. Otra canica se saca de la caja. Cuál es la 
probabilidad de que la primera canica sea azul y la segunda canica

Continuar navegando