Estadistica Medica-Domingo Ledesma

•

Humanas / Sociais

carlos palacios

26/8/2022

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Ciencias

89.057 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Estadística médica
BIB L IO T EC A D E L U N IV E R S IT A R IO
MANUALES /M E D IC IN A
Estadística médica
DOMINGO A. LEDESMA
El'DEBA EDITORIAL UNIVERSITARIA 1)E BUENOS AIRES
EDITORIAL UNIVERSITARIA DE BUENOS AIRES
Rivadavia 1571/73
Sociedad de Economía Mixta
Fundada por la Universidad de Buenos Aires
Hecho el depósito de ley
IMPRESO EN LA ARGENTINA - PRINTED IN ARGENTINA
©1972
INDICE
INTRODUCCION . . . : ................................................................. XI
PRIMERA PARTE
CONCEPTOS FUNDAMENTALES
I. CONCEPTOS GENERALES ................................................ 3
Concepto de estadística, 3; Ubicación en el cuadro de las cien
cias, 4; Relación con el cálculo de probabilidades, 4; Importancia
en medicina, 4; El azar o casualidad, 4; Universo y muestra, 5:
Observación y dato, 6; Registro y clasificación de los datos, 6;
Tabulación, 7.
II. CONCEPTOS PARTICULARES............................................. 9
Población o efectivo, 9; Tamaño, 9; Dispersión de los datos, 9;
Ordenamiento de los datos, 10; Serie estadística, 10; Agolpa
miento de los datos, 10; Intervalo o módulo, 10; Frecuencia, 11;
Probabilidad, II; Ordenación de los grupos, 12: Distribución de
frecuencias, 12; Ejemplo de distribución normal de frecuencias,
13; Ejemplo de distribución de Gosset "Student", 14; Ejemplo
son, 15. *
III. REPRESENTACIONES GRAFICAS........................................ 17
Cuadriláteros, 17; Sectores, 18; Histograma, 20; Ejemplo de his-
tograma, 21; Ejemplo, 22; Curvas, 22; Curva normal o de Gauss.
23.
IV. PARAMETROS ESTADISTICOS ........................................... 25
Parámetros fundamentales, 25; Parámetros derivados, 25; Pará
metros de posición, 26; Proposición de Cauchy, 30; Promedio y
mayoría, 30; Desvío, 30; Parámetros de dispersión, 31; Media
del universo, 34; Parámetros derivados, 3S; Promedio ponderado.
38; Error probable, 39; Error relativo, 39.
Vil
http://booksmedicos.org
SECUNDA PARTE
LA MUESTRA NORMAL NUMEROSA O MUESTRA NORMAL DE
PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD
Propiedad “A” de la media. 49; Propiedad “B" de la media.
55; Propiedad "A" del desvio standard. 57; Propiedad "B” del
VIL VARIANCIA...................................................................... 61
la. observación. 61; 2a. observación. 62; 3a. observación, 63;
IX. ECUACION DE LA CURVA DE GAUSS ........................... 87
Cálculo de la ordenada "y”. 88; Significado de “y". 89; Cons
trucción de la curva, 89; Arca subtendida a la curva. Area par
cial, 91; Tablas de áreas subtendidas a la curva. Tablas de
probabilidades, 92; Frecuencias teóricas de una muestra nor
mal, 96.
X. VARIACION DE LAS MUESTRAS
http://booksmedicos.org
TERCERA PARTE
LA MUESTRA NORMAL POCO NUMEROSA O MUESTRA DE GOSSET
"STUDENT"
CUARTA PARTE
LA MUESTRA B1NOMIAL NUMEROSA O MUESTRA DE BERNOUILLI
XIII. DISTRIBUCION BINOMIAL ............................................... 131
XIV. SERIE BINOMIAL DE BERNOUILLI................................... 145
148; Observaciones, 150; Cálculo de la frecuencia de un resul-
lado determinado, 165.
XV. PARAMETROS MEDIA Y DESVIO STANDARD EN LAS
MUESTRAS BINOMIALES................................................. 177
Resultados en valores absolutos. 177; Resultados en valores
185.
XVI. INTERVALO DE CONFIANZA DE LA MEDIA Y SIGNIFI
CACION DE LA DIFERENCIA ENTRE MEDIAS.....................201
Significación de la diferencia entre dos medias binomiales
de la media, 203; Determinación del intervalo de confianza de
muestra o la frecuencia de la media, 207.
IX
http://booksmedicos.org
ESTADISTICA MEDICA
XVII. MUESTRAS DE POISSON .
Concepto, 219; Frecuencia de un resultado, 220; Obtención
de la media, 221; La variancia, 223; Los límites del intervalo
de confianza, 223.
XVIII. METODO DE PEARSON ..
XIX. ASOCIACION.........................................................
Correlación, 263; Probabilidad de un coeficiente de o
dón, 271; Regresión, 273; Tarjetas y dameros, 278;
pruebas de correlación, 287; Análisis de la covarianza, 29
X
http://booksmedicos.org
INTRODUCCION
XI
http://booksmedicos.org
Los libros de estadística existentes en plaza, algunos de ellos muy
buenos, todos ellos extranjeros (un libro argentino similar al nuestro, el de
KOHAN y CARRO, trata de la estadística aplicada a la psicología, a la
sociología, a la educación y a las ciencias políticas, no a la medicinal, y
los cursos de estadística a los que concurrimos, igualmente muy buenos,
exigen conocimientos matemáticos que el común de nuestros médicos, no
poseen. Esto les hace a ellos sumamente difícil la comprensión de la esta
dística. Magnificas tablas, como las de GEIGY, necesitan explicaciones
más elementales que las que ellas traen para ser manejables por la mayoría
de los médicos que las necesitan.
Compenetrados de esa necesidad de médicos y estudiantes, y ante su
dificultad para obtener dichos conocimientos en los textos o en los cursos
corrientes, que en gran parte se sitúan fuera de la realidad de sus necesi
dades y de los conocimientos matemáticos que poseen, nos propusimos
explicar con palabras sencillas y con nociones elementales los conceptos
básicos de esta ciencia. Con éstos podrán todos comprender y manejar la
mayoría de los problemas comunes de la estadística médica.
En este libro diremos lo fundamental de esta materia, en sus aspectos
generalmente más utilizados en medicina, y lo diremos sin recurrir a las
matemáticas superiores, es decir, manteniéndonos siempre dentro de ¡os
conocimientos de matemáticas del médico corriente.
No obstante lo dicho, no estará de más que con la lectura de este
libro el lector refresque sus conocimientos de matemáticas deI colegio
nacional, releyendo algunos de sus textos.
Sin ser de vulgarización, éste es un libro de estadística elemental, al
alcance y para uso de médicos y estudiantes que leen trabajos científicos
o que realizan tareas habituales de investigación. Es un resumen de los
cursos de estadística médica dictados por el autor en la maternidad del
policlínico "Profesor doctor Gregorio Aráoz Alfaro" de Lanús. y por lo
tanto, está redactado con la experiencia dada por la enseñanza viva de la
materia a los destinatarios del mismo.
En él nos referiremos a una media docena de temas estadísticos fun
damentales para la investigación médica. Nos liemos preocupado, en
primer termino, por dar claros y precisos conceptos fundamentales. De
esto nos ocupamos en la primera parte de! libro, la que abarca siete capí
tulos. Después nos esforzamos por precisar las principales clases de mues
tras que generalmente el médico tiene entre manos y las técnicas estadís
ticas aplicables a cada clase. De ello nos ocupamos en las cuatro partes
siguientes. Por último, damos algunas nociones aplicables a cualquier clase
de muestra. De esto tratan las dos últimas partes.
En resumen, los temas que tratamos en el libro son:
ESTADISTICA MEDICA
XII
http://booksmedicos.org
INTRODUCCION
1. Conceptos fundamentales.
2. El estudio estadístico de Ias muestras numerosas con una distri
bución normaI de las frecuencias de sus datos, o sea de lo que puede
llamarse muestra de GAUSS. y de las técnicas que le son aplicables
3. El estudio estadístico de las muestras poco numerosas también con
una distribución normal de la frecuencia de sus daros o muestras de
GOSSET "STUDENT", y de ¡as técnicas correspondientes
4. El estudio de las grandes muestras con una distribución binomial
de la frecuencia de sus datos, o muestra de BERNOUILLI, y sus técnicas
5. Las grandes muestras con un resultado poco numeroso y una dis
tribución de frecuencia próxima a la binomial o muestras de POISSON y
sus técnicas.
6. El método de PEARSON o de J i Cuadrado fx1) para la compara
ción entre una muestra real y una teórica, y su técnica en los diversos
7. La asociación o relación estadística entre dos variables observadas
simultáneamente en una misma muestra y sus técnicas.
En lo posiblehemos explicado los conceptos y los métodos o técnicas
dando el porqué de los mismos, y sólo cuando ello exigía una profundi-
2ación matemática fuera del alcance del común de los médicos, nos con
formamos con decir solamente cómo se hace. Por eso. algunos temas
como Ji Cuadrado, se han explicado principalmente por medio de ejem
plos. Estos son suficientes para capacitar al médico en la utilización del
método en la mayoría de las circunstancias en que puede serle útil. En
cambio, otros temas, como distribución binomial, se han explicado con
cierto detenimiento, ya que es imprescindible tener bien claro lo que es el
desarrollo de un binomio elevado para comprender el concepto de lo que
es una muestra con una distribución binomial de sus frecuencias.
Finalmente, hemos procurado ejemplificar todo al máximo posible
dentro de la manualidad del volumen.
XUI
http://booksmedicos.org
http://booksmedicos.org
CONCEPTOS FUNDAMENTALES
http://booksmedicos.org
http://booksmedicos.org
CAPITULO I
3
http://booksmedicos.org
Por trabajar con números la estadística participa de las ciencias ma
temáticas, pero al igual que en muchas otras ramas del conocimiento
-física, química, etc.,- éstas son el instrumento que debe ser aplicado a
una materia, en este caso las observaciones o experiencias similares valo-
Relación con el cálculo de probabilidades
Por sus métodos matemáticos la estadística se halla relacionada con el
cálculo de probabilidades y podría dccitsc que es un capítulo de él, pero
mientras dicho cálculo se ocupa de los grandes números, de los conjuntos
infinitos, la estadística se ocupa de los pequeños números, de los conjun-
Importancia en medicina
La importancia de la estadística en medicina se debe a la capacidad
de la primera en valorar la magnitud del azar en la segunda.
El azar o casualidad
resultados de la actividad médica, ya se trate de diagnósticos, pronósticos
sea que observemos la aparición de un dato clínico o de laboratorio, que
pronostiquemos la duración de una enfermedad o de un embarazo, que
comprobemos la ventaja de un medicamento o de una técnica quirúrgica,
etcétera, el resultado está siempre influido, en mayor o menor grado, por
la casualidad.
Es decir, los resultados médicos se hallan siempre influidos por un
conjunto variable de factores invisibles e imponderables, que englobamos
con el nombre de azar o casualidad.
Es este conjunto de factores, desconocidos y variables, el que diver-
Estc azar pudo haber tenido una gran participación en los resultados,
o, por el contrario, sólo una insignificante, pero de antemano eso no
podemos saberlo; es decir, directamente, al azar no podemos medirlo.
Necesitamos por lo tanto de algún procedimiento indirecto capaz de
medir el tamaño, o sea la magnitud de la importancia del azar. Este mé-
http://booksmedicos.org
CONCEPTOS GENERALES
Esta se basa en que si observamos un gran número de casos seme
jantes, es lógico suponer que los factores desconocidos han de neutrali
zarse en gran parte, por lo menos, mutuamente. De ahí que si estudiamos
dos series paralelas en estas condiciones, en una de las cuales aparece o
interviene un factor determinado que no interviene ni aparece en la otra,
la diferencia de los resultados pueda lógicamente atribuirse a esc factor.
Pero aun así, no estamos completamente seguros de haber neutrali
zado totalmente al azar, o sea que la diferencia se deba exclusivamente al
factor presente en una serie y ausente en la otra. Por eso. también aquí,
para medir la magnitud de ese azar residual tenemos que recurrir también
La magnitud de la influencia del azar se mide en porciento de proba
bilidad. Un resultado puede deberse en un 100% a ella o en un 50% o en
un 5%, etcétera. Cuando la influencia del azar en un resultado médico es
pequeña, menos del S%, los estadísticos que se ocupan de cuestiones mé
dicas aceptan que, prácticamente, puede considerarse que el resultado no
vención del azar es superior al 5%, opinan que dicho resultado puede
considerarse debido simplemente a la casualidad.
Dijimos que la estadística es un capítulo del cálculo de probabilida
des. Este se ocupa de los valores numéricos de hechos similares, pero en
general sólo se ocupa de los grandes números, de los grandes conjuntos,
de aquellos que por ser infinitos se llaman universos de casos similares (o
universos simplemente dicho).
La estadística, en cambio, se ocupa preferentemente de los pequeños
números, de los pequeños conjuntos, de los conjuntos finitos, extraídos
naturalmente de aquel gran conjunto y que por ser fracciones de él se
denominan muestras. Por ejemplo, si observamos el peso de un conjunto
de niños recién nacidos, podremos comprobar lo que pesan un número
determinado de ellos, pero no el de todos los recién nacidos habidos y
por haber. El conjunto finito de recién nacidos sometidos a nuestra obser
vación es ¡a muestra-, el conjunto infinito de todos los recién nacidos ha
bidos y por haber es el universo (el universo de recién nacidos).
La muestra es el elemento fundamental con que trabaja la estadística.
Sin muestra no hay estadística.
5
http://booksmedicos.org
Observación y dato
La muestra es el conjunto de observaciones valoradas cuantitativamen
te y también el conjunto de los valores numéricos individuales. Estos, los
valores numéricos individuales, se denominan “datos”. Por ejemplo, el
conjunto de las observaciones de las horas dormidas por los pacientes del
ejemplo dado anteriormente constituye los datos. El dato es el valor numé
rico de la observación individual.
Cuando las observaciones se clasifican cualitativamente (por ejemplo:
gordos, medianos o flacos), el conjunto de observaciones de igual clasifi
cación constituye una clase. A las clases se las simboliza genéricamente
con una x minúscula. En este caso el valor de cada observación es igual a
Registro y clasificación de los datos
La observación o la clase y su dato deben, en primer término, 'er
registrados, esto es, deben ser llevados a una planilla, a una ficha, a una
tarjeta, a una hoja de cuaderno, etcétera.
Hecho esto, las observaciones no clasificadas deben serlo, es decir, se
las debe.agrupar en clases. Vimos que se llama clase a un conjunto de
observaciones similares.
A mayor abundamiento diremos que las observaciones difieren entre
Si observamos niños recién nacidos, éstos pueden diferir por. el sexo
(diferencia cualitativa) o por el peso (diferencia cuantitativa). El conjunto
de los recién nacidos varones constituye la clase de los recién nacidos va
rones; el conjunto de los que pesan 3000 g, la clase de los que pesan
3000 g, etcétera.
El número de observaciones de una clase constituye su frecuencia.
( frecuencia absoluta véase infra).
Cuando una muestra está formada por un gran número de observa
ciones (lo que ocurre especialmente cuando las diferencias son cuantita
tivas) se juntan las observaciones similares en un solo grupo, constituyen
do cada grupo una clase. El número de observaciones agrupadas en una
clase constituye la frecuencia de ese grupo o clase.
Es necesario fijar claramente los límites del grupo o clase, de modo
que no haya duda de si una observación pertenece a un grupo u otro.
Para ello conviene tomar como límites de los grupos valores inaccesibles a
los métodos de medidas usados en la investigación. Si la balanza sólo es
capaz de medir gramos, colocamos los límites a mitad de gramo, por
ejemplo 0,5 g - 9,5 — 19,5 - 29,5 g, etcétera.
http://booksmedicos.org
En estos casos se toma como valor representativo del grupo o clase la
semisuma de los limites del grupo (en el ejemplo dado, 5 g - 14,5 - 24,5
- etc.), es decir, se considera como si todas las observaciones di grupo
pesasen ese valor medio. Puede haber en esto un pequeño erro pero
generalmente las diferencias se compensan y el error no existe o s mí-
Luego el dato también debe ser clasificado, esto es. reconocido como
una cantidad continua o discontinua. Por ejemplo,si so trata del número
de glóbulos rojos por milímetros cúbicos, el dato es discontinuo, pues en
un volumen dado de sangre no puede haber sino un número entero de
glóbulos rojos y la diferencia con otro volumen de sangre implicará tam-'
bien un número entero de ellos.
Pero'si se trata de la hemoglobina contenida en un volumen de san
gre, el dato será continuo, ya que la cantidad será un número fraccionado
de la unidad que se utilice (difícilmente un número entero de esa unidad)
y podrá presentar toda la gama posible de valores intermedios entre un
número entero de unidades y el siguiente. La diferencia con otro volumen
de sangre será asimismo un número fraccionado de unidades, difícilmente
Los datos discontinuos se suelen denominar también datos discretos.
La presentación de éstos no ofrece dificultades. En cambio, cuando se tra
ta de datos continuos es necesario aclarar si el valor registrado es el valor
más próximo al valor real o si se trata de la parte entera de un valor real
al que le sigue una fracción.
Así. si se dice que una persona mide 1,60 m, es necesario aclarar si se
han tomado los 60 cm por estar el valor real más próximo a esa medida
que a 1,59 m o a 1,61, o si se dice 1.60 m cuando la talla real es 1,60 m
o más, pero menos de 1,61. En el primer caso se habrán registrado como
1.60 las tallas reales desde 1,596 m hasta 1,605 m, y en el segundo, desde
1,600 a 1,609. Como se ve, si los datos son continuos debe aclararse la
forma como se los ha tomado; si son discontinuos esta precaución es inne-
Tabulación
Finalmente, los datos deben ser tabulados, es decir presentados en
una tabla, colocándolos en columna vertical (aunque puede hacérselo tam
bién en línea horizontal).
A partir de este momento se está en condiciones de iniciar el análisis
estadístico propiamente dicho. Así la muestra de las horas de sueño pro
ducidas por un hipnótico deben ser tabuladas como muestra el cuadro 1.
CONCEPTOS GENERALES
http://booksmedicos.org
EJEMPLO DE TABULACION
(Horas de sueño producidas por un hipnótico
http://booksmedicos.org
CAPITULO II
CONCEPTOS PARTICULARES
http://booksmedicos.org
Los dalos pueden hallarse más o menos uniformemente diseminados, o
por el contrario, mostrar tendencia a confluir hacia los valores menores,
medianos o mayores.
Ordenamiento de los datos
En la muestra los datos se presentan al observador en forma desorde
nada. La primera tarea del tratamiento estadístico es ordenarlos, general
mente de menor a mayor pero podría ser a la inversa.
Serie estadística
El resultado del ordenamiento es transformar un conjunto desorde
nado de números en una serie ordenada de ellos. Por tratarse de los datos
o valores de observaciones similares, el conjunto ordenado de los datos se
denomina serie estadística.
Cada uno de los datos toma ahora el nombre genérico de término de
la serie. La serie consta de tantos términos como de observaciones la
La x minúscula que simboliza genéricamente a los datos, simboliza
igualmente a los términos.
La serie estadística se parece a las otras series matemáticas (aritmé
tica, geométrica, etc.) en que consiste en un conjunto ordenado de núme
ros, pero se diferencia de ellas en que los términos pueden repetirse,
saltearse y carecen de toda relación o razón con sus vecinos.
Agrupamiento de los datos
Frecuentemente en una muestra (y en una serie) hay datos repetidos,
o de un valor tan próximo o parecido, que pueden darse por iguales, y
por lo tanto, por repetidos.
Cuando así ocurre en muestras muy numerosas, es decir, con una
población de 30 o más, deben reunirse o agruparse estas obsetvaciones
repetidas o similares. Es lo que se llama agrupación o agrupamiento de los
ESTADISTICA MEDICA
Intervalo o módulo
Cuando los grupos comprenden no solamente datos iguales, sino muy
próximos, es necesario fijar los límites dentro de los cuales tendrán cabida
los datos de cada grupo. La distancia entre los límites de cada grupo se
denomina intervalo o módulo,
10
http://booksmedicos.org
CONCEPTOS PARTICULARES
Por ejemplo, si se trata de una muestra formada por observaciones de
hemoglobina expresada en porcentaje de un valor que se considera nor
mal, podemos reunir los datos comprendidos entre SI y 60 en un solo
gmpo, los entre 61 y 70 en otro, los entre 71 y 80 en otro, etcétera. En
este caso decimos que el intervalo o módulo es 10.
Como valor representativo del grupo se toma el equidistante a los
límites del mismo. En los grupos del ejemplo dado se toman como repre
sentativos los valores SS para el 1°, 65 para el 2°, 75 para el 3°, etcétera.
Por lo tanto, se considera como si cada una de las observaciones del
grupo valiera lo que el valor representativo del grupo. La realidad es que
unos valen más y otros menos, pero la verdad es que muy probablemente
esos más y esos menos, es decir esas diferencias, se compensarán o el error
será muy pequeño, lo cual autoriza a proceder a dicho agrupamiento.
Frecuencia
Es el número o cantidad de observaciones iguales o semejantes de la
muestra. Es. por lo tanto, la población de los grupos. Se denomina igual
mente frecuencia absoluta.
También, frecuencia es la relación entre esa cantidad o población del
grupo y la cantidad o población total de la muestra. Se llama entonces
frecuencia relativa. A esa frecuencia algunos autores la denominan proba
bilidad.
Se la simboliza generalmente por una f minúscula.
En el primer caso, frecuencia es simplemente f.
En el segundo, frecuencia =* -f-
En el primer caso, la suma de las frecuencias es igual a la población
de la muestra,
n = 2 f.
En el segundo, la suma de las frecuencias es igual a la unidad,
El número de observaciones de un grupo es la frecuencia de dicho
Probabilidad
Es la relación entre la cantidad de hechos equivalentes y la cantidad
http://booksmedicos.org
ESTADISTICA MEDICA
total o infinita de hechos similares de ese universo.
Esa cantidad infinita se suele simbolizar una veces por la unidad y
otras veces por dentó. En este caso se habla de probabilida porcentualPor
ejemplo, la probabilidad de que caiga cara una moneda arrojada al suelo
puede expresarse por 0,5 o también por 50%.
Ordenación de los grupos
Si, como debe hacerse, el ordenamiento de los datos precedió al agru-
pamiento de ellos, los grupos ya estarán ordenados.
De no haberse hecho asi, corresponde ordenar los grupos de acuerdo
con el ordenamiento de los datos, es decir, primero los grupos correspon
dientes a datos más pequeños y después los mayores. De este modo los
grupos más numerosos quedan generalmente hacia la parte media de la
serie de los grupos, pero no siempre ocurre asi y puede suceder lo con-
Distribución de frecuencias
Con la ordenación de los grupos según la ordenación de los datos,
quedan también ordenadas las frecuencias de acuerdo con la ordenación
de los datos. Esta ordenación especial se denomina distribución de fre
cuencias (d. de f.).
La d. de f. es la serie de frecuencias de los datos ordenados, con espe
cificación de los datos o de las clases a que correspondan.
Al tabular los grupos, éstos van en la primera columna encabezada
por una x, hallándose cada grupo representado por el dato repetido o
representativo del grupo.
En la segunda columna, encabezada por una f, va la frecuencia del
grupo. Ya dijimos que la suma de esta columna (2f) es igual a la pobla
ción de la muestra (n).
En la tercera columna, encabezada por la multiplicación indicada f x
van los productos de multiplicar el dato repetido o representativo del gru
po por su frecuencia. La suma de esta columna (Efx) es igual al tamaño
de la muestra (Sfx — T).
Aun cuando las muestras pueden tener distribuciones de frecuencia
muy variadas, en medicina las distribuciones más comunes son estas cua
tro: 1) la de Gauss; 2) la Gosset "Student” (derivada de la anterior); 3) la
de Bernouilli y 4) la de Poisson (vecina a la anterior).
Las dos primeras corresponden a datos continuos y las dos segundas a
datos discontinuos o discretos(véase clasificación de los datos).
12
http://booksmedicos.org
CONCEPTOS PARTICULARES
Cuando las frecuencias de los valores más bajos son relativamente
escasas, pero las de los siguientes aumentan progresivamente hasta alcan
zar un máximo para luego disminuir progresivamente haciéndose cada vez
más escasas, siendo el decrecimiento simétrico al crecimiento, la distribu
ción se denomina Normal o de Gauss.
Cuando una distribución de Gauss corresponde a muestras poco nu
merosas, con una población de 60 o menos observaciones o clases, y sobre
todo de 30 o menos, la distribución se denomina de Gosset "Student"
(siendo “Student" el seudónimo del estadístico W. S. Gosset).
Cuando la distribución está formada por valores que corresponden a
los de los monomios del desarrollo de un binomio elevado o potenciado la
distribución se denomina binomial o de Bemouilli.
Y cuando esta distribución corresponde a una muestra numerosa, pero
en la que algunas observaciones ocurren muy pocas veces, la distribución
se denomina de Poisson.
Ejemplo de distribución normal de frecuencias
ba entre 56 y 65
66 y 75
76 y 85
86 y 95
96 y 105
106 y 115
116 y 125
126 y 135
136 y 145
13
http://booksmedicos.org
Ejemplo de distribución binomial
Se investigó el grupo sanguíneo de 36 personas hijos de padre y ma
dre grupo AB y se encontró lo siguiente:
http://booksmedicos.org
CONCEPTOS PARTICULARES
Estas frecuencias pueden escribirse asi:
18 = 2X 3X 3
(3 + 3)2 = 3* + 2 X 3 X 3 + 3’ .
Ejemplo de distribución de Poisson
Se ha dividido el territorio de la República en seis regiones, cada una
con una población equivalente. En cada zona se han tomado al azar den
localidades con una pobladón de diez mil habitantes. Se ha hecho el re
cuento de albinos en cada una de ellas y se ha obtenido el siguiente
resultado:
N° de albinos Porciento en ¡a población
15
http://booksmedicos.org
desarrollo del binomio elevado:
sea de los seis últimos resultados (véase m
amial, Serie de resultados).
En efecto:
> adelante Distribución bi-
http://booksmedicos.org
CAPITULO III
REPRESENTACIONES GRAFICAS
SUMARIO: Representaciones gráficas. Cuadriláteros. Sectores. Repr.
Cuando se desea dar una impresión visual de las proporciones que
guardan las poblaciones de los distintos grupos, se recurre al dibujo, con
feccionando gráneos.
Si los grupos son pocos, los gráficos más usados son los cudriláteros y
los sectores.
Cuadriláteros
Cuando se utilizan cuadriláteros hay que cuidar de que si son rectán
gulos y se los dibuja de pie, todas las bases se hallen en la misma linea
horizontal, y si acostados, que sus extremos izquierdos se hallen sobre la
misma línea vertical. En cualquier caso, la longitud de los cuadriláteros
debe ser proporcional a la población de los grupos.
Por ejemplo, si se quiere indicar que por cada 100 niños recién naci
dos femeninos se encontraron 105 recién nacidos masculinos, la longitud
del cuadrilátero que representa a las niñas deberá medir, por ejemplo, 100
mm y la del que representa a los niños, 105 mm.
Estos cuadriláteros se dibujan separados uno de otros y no interesa la
anchura que se les asigne, pero todos deben tener la misma, como se ob
serva en el Cuadro 3.
17
http://booksmedicos.org
ESTADISTICA MEDICA
Cuadro 3
EJEMPLO DE REPRESENTACION GRAFICA: CUADRILATEROS
lProporción de nacimientos según el sexo¡
Para dibujar los cuadriláteros generalmente se empieza por el corres
pondiente al del grupo más numeroso, dándosele un tamaño que se con
sidere apropiado a la página donde debe aparecer la ilustración. Sus
medidas pueden ser, por ejemplo, base 2,5 cm y altura 10 cm.
Los otros cuadriláteros deben tener la misma base, es decir 2,5 cm, y
la altura debe ser proporcional a la del primero, teniendo en cuenta la
población de ambos grupos. Asi, si se tratase de sólo dos grupos, uno de
900 varones y otro de 850 mujeres, la altura del rectángulo correspon
diente a éstas se calcula por una simple regla de tres.
900 : 10 :: 850 : X
10 X 850
Cuando para las representaciones gráficas se recurre a los sectores de
círculo, la población de la muestra se la equipara a los 360° del circulo y,
proporcionalmente a la población de los grupos, se dibujan los sectores.
18
http://booksmedicos.org
REPRESENTACIONES GRAFICAS
Los grados de círculo que corresponden a cada grupo se calculan apli
cando también la regla de tres. Así, si la población de la muestra de
recién nacidos es:
n = 105 + 100 = 205,
la regla de tres dice que los grados de círculo que corresponden al grupo
de mujeres es:
205 : 360 :: 100 : X,
X = 36<2QS 1Q°~ = l75,' ' °
Con un radio cualquiera se dibuja un círculo y dentro de él se dibujan
dos sectores, uno de 175°,.. ° y el otro, lógicamente, de
360° - 175°___ = 184, ..
Ver Cuadro 4.
(Proporción de nacimientos según el sexoJ
http://booksmedicos.org
ESTADISTICA MEDICA
Hislograma
Cuando los grupos son mis numerosos es preferible recurrir al histo-
grama: éste, como se verá, corresponde a las representaciones ortogonales,
es decir, que se funda en dos ejes que se corlan perpendieularmente (ejes
ortogonales o coordenadas cartesianas).
Aqui se trata también de cuadriláteros, pero pegados unos a otros.
Además, las bases de éstos, las que descansan sobre el eje horizontal o de
las abscisas, representan y miden lo que los módulos o intervalos (i) de los
grupos; y las alturas, o sea las ordenadas, la población o frecuencia del
grupo dividido por el intervalo (f/i); en esta forma el área del cuadrilátero
representa la población del grupo, y el área total del hislograma, la pobla
ción de la muestra.
2(hX i) = £ f = n
Si tomamos como altura del cuadrilátero la frecuencia o población del
o dividida por la base del cuadrilátero (i) multiplicada por la pobla-
, o efectivo de la muestra (n)
y la suma de las áreas de los cuadriláteros es igual a 1,
2(h X i) = £ - = = — = 1.
Las abscisas marcan los limites de cada grupo.
Cuando el intervalo es I la altura del cuadrilátero indica directamente
la población del grupo, o sea la frecuencia absoluta.
20
http://booksmedicos.org
ENTACIONES GRAFICAS
Ejemplo de histograma
o población del grupo
la correspondiente es el que r
Cuadro 5
EJEMPLO DE REPRESENTACION GRAFICA: HISTOGRAMA
Edades de 488 pacientes afectadas de carcinoma uterino
21
http://booksmedicos.org
ESTADISTICA MEDICA
Cuando los valores agrupados se reemplazan por el valor equidistante
de los limites del grupo, pueden representarse los grupos por los vértices de
un polígono obtenido uniendo los puntos que tienen como abscisas el
valor medio del grupo y como ordenada la población del grupo o frecuen
cia dividida por el intervalo.
Esto equivale a unir los puntos medios de las bases superiores de los
cuadriláteros del histograma. Cuando el intérnalo es igual a 1, la ordenada
indica directamente la población del grupo, o sea la frecuencia absoluta.
Cuando la ordenada es igual a la frecuencia dividida por el producto del
intervalo multiplicado por la población de la muestra, el área subtendida
al polígono se aproxima a 1.
El área subtendida al polígono es una aproximación al área del histo-
Ejemplo
Las 488 pacientes con cáncer de cuello recién vistas pueden ser tabu
ladas como se observa a continuación:
Edad media - x / n° de pacientes n°/i = y
26.0 8 18 2,25
32.5 5 45 9,00
37.5 S 79 15,80
47.5 15 225 15,00
37.5 5 63 12,60
65.0 10 45 4,50
80.0 20 13 0,65
El polígono correspondiente sería el que muestra el Cuadro 6.
Cuando los grupos son muy numerosos, lógicamente los intervalos son
relativamente muy pequeños: en este caso, si la diferencia de población
entre grupos próximos es también muy pequeña, el polígono se confunde
con una curva. Lo mismo ocurre en el histograma con la línea quebrada
formada por las bases superiores de los cuadriláteros y las porciones co
rrespondientes de los lados laterales de los mismos. Esta línea quebrada,
http://booksmedicos.org
RFPRFSF.NTACIONES GRAFICAS
Cuadro6
EJEMPLO DE REPRESENTACION GRAFICA: POLIGONO
Edades de 488 pacientes afectadas de carcinoma uterino
Como el área del histograma indica la población de la muestra, el área
subtendida de la curva, cuando ésta procede de un histograma, indica
igualmente la población de la muestra.
Curva normal o de Gauss
Cuando esta curva presenta una sola elevación o cima a partir de la
cual la línea desciende en forma simétrica para tender a horizontalizarse
'en sus extremos, esta curva toma una forma acampanada y lleva el nom
bre de curva normal o típica o curva de Gauss.
CURVA DE GAUSS
23
http://booksmedicos.org
http://booksmedicos.org
CAPITULO IV
PARAMETROS ESTADISTICOS
srsssrsss
http://booksmedicos.org
ESTADISTICA MEDICA
Parámetros de posición
Algunos de los parámetros fundamentales tratan de fijar la posición
del valor que pueda darse como representativo de los valores de los datos
de la muestra. Son los llamados parámetros de posición, o también pro
medios.
Según sea el procedimiento que se siga para la elección de este pará
metro, el promedio se denomina modo, mediana o media.
Cuando el procedimiento es tomar el valor que se encuentra repetido
un mayor número de veces, el que está de moda diríamos, el parámetro
toma el nombre de modo.
En la serie puede situarse en cualquier parte, a veces hacia la mitad, a
Cuando en una muestra no hay valores repetidos, la misma carece de
Cuando hay algunos pocos grupos de valores igualmente más repe
tidos, cualquiera de ellos puede tomarse como modo; pero si son muchos
los grupos de valores igualmente más repetidos, es dudoso el valor repre
sentativo de cualquiera de éstos;y cuando todos los valores de la muestra
están igualmente repetidos, nos encontramos con una situación similar a
cuando ninguno de ellos está repetido, es decir, no podemos tomar nin
guno de ellos, y por lo tanto la muestra carecería también de modo.
Es dudoso igualmente el valor representativo de un modo situado
hacia uno de los extremos de la serie, sobre todo si se encuentra aislado,
es decir, sin la vecindad de otros valores repetidos.
El modo es a veces el promedio elegido, por ejemplo, cuando interesa
señalar la duración habitual de una enfermedad, pero en general es un
promedio poco usado en medicina, porque no se lo puede obtener o por
que su representatividad resulta poco convincente. Por ejemplo, si quisié
ramos tener una idea de la edad promedio de los habitantes de una ciudad
e hiciéramos un grupo con los que tienen de 1 a 5 años, otro con los de 6
a 10, otro con los de 11 a 15, etcétera, seguramente encontraríamos que
el grupo más numeroso es el de 1 a 5 años, y si tomáramos el modo
como promedio tendríamos que decir que la edad promedio de los habi
tantes de esa ciudad es la de 1 a 5 años. Con toda seguridad esta contes
tación no nos dejaría satisfechos, y recurriríamos a otro valor represen
tativo para tener Uua i ‘'a satisfactoria de la edad promedio de los
habitantes de dicha ci.'.dad.
26
http://booksmedicos.org
http://booksmedicos.org
Como la suma de los dalos se denomina tamaño de la muestia y la de
las obseivaciones población, se puede decir que la media aritmética es
igual al tamaño de la muestra dividida por la población de la misma.
- 1 x - I = S x f
m “ S f = ' ” 2 f
La media aritmética cr el promedio más utilizado en medicina. Presen
ta, sin embargo, algunos puntos débiles, de los cuales los mis importantes
son: 1°) Frecuentemente no corresponde a ningún dato de la muestra. 2°)
Puede pertenecer a un grupo poco numeroso. 3o) Se ve fuertemente in
fluida por los datos extremes.
Además de esta media aritmética ma, existen otras medias, menos
geométrica mg y la armónica mh,
Media geométrica
número o cantidad, se multiplican los datos entre si y al producto se le
extrae la raíz correspondiente a su número o cantidad.
media geométrica = v^Xi X X, X X3 X . . . X„.
Esta media se utiliza cuando se examinan hechos que siguen la ley del
crecimiento, o sea cuando la serie estadística correspondiente se asemeja a
una serie geométrica, por ejemplo 2, 4, 8, 16, 32, etcétera.
Por ejemplo, supongamos que se haga el recuento de gérmenes de un
cultivo y se encuentran 200.000 por cc. Dos días después un nuevo re
cuento indica 400.000 por cc. Si quisiéramos calcular el recuento que se
hubiera encontrado de haberlo hecho en el dia intermedio, la media arit
mética nos diría que habríamos encontrado 300.000. Sin embargo, este
el mismo el primer día que el segundo, cuando sabemos que en el según-
Recurriendo a la media geométrica, en cambio, el resultado sería:
m = j 200.000 X 400.000 = 282.843,
lo cual satisface más, porque indica que el aumento del primer día habría
sido 82.843 y el del segundo día 117.157, es decir 34.314 más que el
primer día.
http://booksmedicos.org
PARAMETROS ESTADISTICOS
Media armónica
En esta media, en vez de dividir la sumatoria de los datos (£ x) por la
población (n), dividimos la población por la sumatoria de la inversa o re
cíproca de los datos:
media armónica = ——
Esta media se utiliza cuando se trata de datos que se expresan en unida
des relativas, es decir, cuando se refieren a velocidades sobre espacios
iguales, o consumos de volumen en tiempo ¡guales, etcétera. Por ejemplo,
centímetros por hora, litros por minutos, etcétera. Así, si deseamos co
nocer la velocidad media con que se propaga el edema producido por la
picadura de una araña, podemos encontrar que el radio del área de la zo
na edematosa alcanzó I cm en los primeros 15 minutos, es decir una velo
cidad de 4 cm por hora. Pero luego observamos que para alcanzar el 2°
cm el edema tardó 20 minutos. Entonces anotamos velocidad, de la segun
da observación, 3 cm por hora. El 3° cm fue alcanzado 30 minutos des
pués, lo que nos da para la tercera observación una velocidad de 2 cm por
hora. Por fin, el 4° cm se alcanzó 60 minutos después, lo cual nos permi
te registrar la cuarta observación con el dato de I cm por hora. Dispo
nemos asi de cuatro observaciones en las que los datos se valoran en
velocidades sobre espacios iguales, es decir, en unidades relativas.
La velocidad media de la muestra, si recurriésemos a la media arit-
15 + 20 + 30 + 60 = 125 min
:n 2 horas 5 minutos, lo que significa
, . . . distancia velocidad = — --------
29
http://booksmedicos.org
http://booksmedicos.org
Como hay datos cuyos valores son mayores que la media y otros que
son menores, los primeros tendrán desvíos positivos (afectados con el sig
no más), y los segundos, desvíos negativos (afectados con el signo menos).
Como el valor de la media es igual al tamaño de la muestra dividido
por la población, puede decirse, en términos generales y aproximadamen
te, que el valor de la media es intermedio entre los valores del primero y
del último término de la serie, e igualmente intermedio entre los del se
gundo y del penúltimo, y entre los del tercero y del antepenúltimo, et
cétera. Es decir, la distancia en magnitud del primer término a la media es
igual a la distancia en magnitud de la media al último, y del segundo a la
media que de la media al penúltimo, etcétera; y en términos exactos, que
la suma de las distancias, en magnitud a la media, de los términos que la
preceden, es igual a la suma de las distancias, en magnitud, de los térmi
nos que la siguen.
Nótese que decimos distancia, que del punto A al B es la misma que
la del B al A, pero no decimos que las sumas de las diferencias sean igua
les, porque no es lo mismo A menos B que B menos A. Como se sabe, la
diferencia entre estas dos restas está en el signo que afecta al resultado,
siendo la cantidad la misma.
Parámetros de dispersión
Se denominan parámetros de dispersión aquellos que tratan de fijar el
valor de la dispersión (véase pág. 9) de los datos de una muestra. Entre
éstos se cuentan la amplitud, el desvío medio o simple o aritmético, el
desvío medio standard y el error standard.
Amplitud
Es la diferencia de valor entre eldato mayor y el menor de la mues
tra, y también entre el último y el primer término de la serie.
Se lo denomina también, a veces, intervalo de variación, o rango.
Puede servir como medida de la extensión de la muestra, pero no nos
da una idea exacta de la dispersión de los datos. Dos muestras pueden
tener la misma amplitud, pero una con los datos concentrados en las pro
ximidades de la media y la otra con los valores de los datos alejados de
ella. Por tanto, es un parámetro poco usado.
Desvio medio aritmético
Es la media de las distancias, en valor, de los datos a la media.
PARAMETROS ESTADISTICOS
31
http://booksmedicos.org
Se lo calcula suprimiendo el signo que afecta a los desvíos, sumando*
los después y dividiendo esa suma por su número o cantidad, o sea por la
población de la muestra.
Suele lomarse por los profanos en estadística como valor representa
tivo de los desvíos. Pero esto no es correcto, porque no todos los desvíos
son valores positivos. La mitad de ellos son negativos, y no es lo mismo
un valor positivo que un negativo, es decir, no es posible ignorar o su
primir el signo que afecta a un desvío.
Además de esta dificultad doctrinaria para aceptar el desvio medio arit
mético como representativo de los desvíos de los datos, existe la dificul
tad práctica de ser un valor chico, por lo tanto tener una magnitud pe
queña que lo hace inútil o poco útil en los cálculos estadísticos ulteriores
en los que se necesita un valor representativo de los desvíos.
Desvio medio standard
■Es un valor convencional que se da como representativo de los des
víos. En él se obvia al parecer el inconveniente de que unos desvíos son
positivos y otros negativos, elevando al cuadrado el valor de cada desvío,
con lo cual todos los valores obtenidos son positivos. Luego se suman esos
cuadrados y la suma se divide por la población; finalmente al cociente se
le extrae la raíz cuadrada.
El principal mérito del desvío medio standard es suministrar un valor
cuya magnitud, mayor que la del desvío medio aritmético, lo hace útil
para los cálculos ulteriores en los que se necesita un valor representativo
Se lo simboliza generalmente por una “S” mayúscula subseguida de
una "x" minúscula. Entonces:
■ = \ [
Es decir que el desvío medio standard es la raíz cuadrada de la media
de los cuadrados de los desvíos simples.
El valor así obtenido es suficientemente grande cuando se trata de
muestras numerosas, con una población de 60 o más observaciones, o por
lo menos de 30 o más, es decir de una muestra de Gauss; pero resulta
todavía pequeño cuando la muestra es poco numerosa, o muestra de
Gauss “Student".
En este caso es necesario un valor todavía mayor, y tanto más cuanto
32
http://booksmedicos.org
Se ha encontrado que este valor útil puede obtenerse multiplicando la
cantidad subradical por el cociente "población sobre población menos
uno”, es decir n-j y , factor conocido con el nombre de “Factor de co
rrección de Bessel”, o sea
Z (x - m)’
Este valor convencional se denomina "desvio medio standard de las
muestras poco numerosas”. Ejemplo:
Si tuviésemos la muestra: I, 3, 5. 7, 9, en la que la media es S y los
desvíos —4, —2,0, +2. +4, el desvío medio aritmético sería:
4 + 24-2 + 4 12
el desvío medio standard:
y el “desvio medio standard de una muestra poco numerosa”.
■ - *
Al desvío medio standard se lo suele llamar de muchas maneras: des
vío medio tipo, normal, convencional, cuadrático, etcétera. Posiblemente
la manera más común de llamarlo es simplemente desvío standard.
El desvío standard, aun siendo un promedio de desvíos, no deja de
ser un parámetro de posición (de la posición del valor representativo de
los desvíos), y por lo tanto puede ser el mismo para muestras de pobla
ciones distintas. Es decir, el desvío standard no nos da una idea de la
población de la muestra.
Error standard
Es el cociente del desvío standard dividido por la raíz cuadrada de la
población.
33
http://booksmedicos.org
http://booksmedicos.org
PARAMETROS ESTADISTICOS
Puede aceptarse que hay un 68% de probabilidad de que la media del
universo se halle dentro de un error standard a derecha o izquierda de
nuestra media y un 95% dentro de 2 Sm * nuestra media.
Desvio relativo de la media
Es el desvío standard (S») expresado en porciento de la media.
Ejemplo: El parto de la primípara tiene una duración media de 14
horas con una desviación relativa de la media del 20%.
■ _ 20 _ 20 _ 20 X 14 _ 280 g
m ~ íoom “ 100 _ 100 100 ~ ‘ *
Esto significa que el desvio standard es igual a 2,8 horas, o, lo que es
lo mismo, que en el 68% de los casos el parto de la primípara dura 14 hs.
i 2,8 hs., y en el 95% 14 hs. ± 5,6 hs., o sea, entre 8 horas 24 minutos y
19 horas 36 minutos.
Parámetros derivados
Se denominan parámetros derivados a valores calculados indirecta
mente a partir de los valores de los dalos.
Los parámetros derivados son, e indican, relaciones entre otros pará
metros y generalmente se expresan como cocientes. Modifican cuantitati
vamente al parámetro principal o fundamental, del que derivan, pero no
cualitativamente. Por eso suelen denominarse también parámetros sccun-
Es la relación de la dispersión de los datos (expresada como suma de
los cuadrados de los desvíos) con el número de observaciones, o sea con
la población de la muestra. Se la denomina también dispersión o fluctua
ción de los desvíos.
Puede decirse también que es la media de los cuadrados de los des-
Y también que es el cuadrado del desvío standard.
35
http://booksmedicos.org
ESTADISTICA MEDICA
. s i - (JH2Z )’,
http://booksmedicos.org
PARAMETROS ESTADISTICOS
Se 16 denomina también desvío relativo.
Significado
El desvío reducido es el desvío simple expresado en unidades de des
vío standard, o sea: el desvío reducido expresa cuántas veces 'el desvio de
la observación es menor o mayor que el desvío medio standard de la
El desvío reducido permite saber a qué distancia relativa de la media
se encuentra la observación a que pertenece, y hacer comparaciones con
las distancias a que se encuentran otras observaciones de la misma mues
tra, o comparaciones con las distancias a la media de observaciones con
igual desvío reducido de otras muestras, en caso de que ambas muestras
tengan una normal distribución de frecuencia.
El principal uso del desvío reducido es su aplicación al cálculo de la
cantidad o porción de-observaciones con menores o con igual o mayores
desvíos reducidos que nuestra observación existente en la muestra. Con
ello se logra una base numérica al concepto de significación de la diferen
cia del valor de una observación al valor de la media.
En una distribución normal, las observaciones cuyos desvíos reducidos
son menores que I. es decir cuyos desvíos simples son menores que el
desvío standard, constituyen algo más del 68% del total de la muestra.
Aquellas cuyos desvíos reducidos son menores de 2, es decir cuyos des
víos simples valen menos que dos desvíos standard, suman algo más del
95% del total. Los que tienen uno menor de 3, es decir, cuyos desvíos
simples valen menos que tres desvíos standard, constituyen algo más del
99,7% del total. Y los que tienen uno mayor de 3, es decir cuyos desvíos
simples valen más que tres desvíos standard, constituyen algo menor del
99,7% del total. También podemos decir que las observaciones cuyos des
víos reducidos valen 1 o más suman algo menos del 32% del total, aque
llas cuyos desvíos reducidos valen 2 o más, consituyen algo menos del 5%
del total y aquellas cuyos desvíos reducidos valen 3 o mis, suman algo
menos del 0,3% del total.
El desvio reducido es una parámetro de dispersión que califica a las
Se denomina Probits al desvío reducido aumentado en 5 unidades.
37
http://booksmedicos.org
La utilidad y razón de ser del Probils consiste en que evita trabajar
con cantidades negativas, lo cual ocurre cuando se trabaja con D. R. co
rrespondientes a datos cuyos valores son inferiores a los de la media.I£n el Probits el valor del D.R. se aumenta en S unidades porque en la
práctica generalmente se trabaja con D.R. superiores a -S y sólo por
excepción con D.R. menores de -5.
Dispersión de la media
Bs la relación entre la variancia (o sea. entre el cuadrado del desvío
standard) y la población de la muestra.
ESTADISTICA MEDICA
También puede decirse que es el cuadrado del error standard, ya que
ca „ - .-51 _ _ SL
" i S T T n •
Significado
Como la variancia y el error standard, de los que deriva, y como su
nombre lo indica, es un parámetro de dispersión, lo cual se ve claramente
Promedio ponderado
Bs la relación del tamaño total de varias muestras, con la población
D. de la M. =
Promedio ponderado = Zfprom. pare. X pobiac. pare.)Población total
38
http://booksmedicos.org
Significado
El promedio ponderado es la media de un conjunto de muestras de
cada una de las cuales se conoce la media y la población.
Error probable
Es el error standard multiplicado por 2/3 (más exactamente, multipli
cado por 0,67449).
E. Prob. = 0,67449 S , ? y S„ - y ^ = -
E1 error probable equivale aproximadamente a los 2/3 del error stan
dard.
Significado
El error probable de una muestra indica que el 50% de las medias de
las muestras similares a dicha muestra caerán dentro de los limites media
± 1 B.P. de dicha muestra.
Se puede aceptar además que hay un 50% de probabilidades de que la
media del universo caiga también dentro de dichos limites.
Error relativo
Es la relación entre la media y el error standard.
Error relativo = ~
El error relativo es el cociente de la media dividido por el error stan-
Se puede decir también que es la media expresada en unidades de
errores standard y también que el error relativo muestra cuántas veces la
media es mayor o menor que el error standard.
Significado
Si el error relativo es igual o superior a 2, es decir, si la media es igual
o superior al doble del error standard, éste es suficientemente pequeño
PARAMETROS ESTADISTICOS
39
http://booksmedicos.org
como para aceptar que la media es fidedigna de pertenecer a una muestra
de la muestra, o sea normalmente dispersos alrededor de la media; en
cambio si el error relativo es inferior a 2, o sea si la media es inferior al
doble del error standard, los datos se hallan anormalmente diseminados
dentro de la muestra, esto es, excesivamente dispersos con relación a la
media, lo cual probablemente ocurra porque algunos datos se hallen afec
tados o influidos por factores extraños al resto de las observaciones de la
génea. de una muestra no formada por observaciones similares.
El error relativo es, por lo tanto, un parámetro de dispersión, pero al
mismo tiempo es un parámetro que califica a la media en fidedigna o no.
Es decir que la significación de la media está dada por el valor del E.
R. (Véase capítulo X; Significación de la media).
ESTADISTICA MEDICA
40
http://booksmedicos.org
LA MUESTRA NORMAL NUMEROSA O MUESTRA NOR
MAL DE GAUSS
SEGUNDA PARTE
El cálculo de sus parámetros
http://booksmedicos.org
http://booksmedicos.org
CAPITULO V
MEDIA, DESVIO STANDARD Y ERROR STANDARD
Método fundamental
Se habla de cálculo de parámetro por el método fundamental cuando
se refiere a aquel que se basa directamente en las fótmuias que expresan
simbólicamente el concepto del parámetro. Así, el cálculo fundamental de
la media es aquel que hace uso directo de la fórmula conceptual.
El del desvio standard el que hace uso direc
Cálculo de la media, del desvío standard y del error standard
El desarrollo de este tema vamos a hacerlo recurriendo a un ejemplo:
Supongamos que se desea conocer el peso medio de los niños recién
nacidos normales, pero además se desea conocer la dispersión de las ob
43
http://booksmedicos.org
servaciones y la dispersión de las medias de muestras similares a la mués-
Los .datos se hallan registrados en un conjunto de historias clínicas
que hemos seleccionado a objeto de lograr una muestra lo más uniforme
posible. Es decir hemos eliminado todas las sospechosas de pertenecer a
casos de prematuros o de posmaduros, asi como las que presenten algún
dato clínico u obstétrico anormal.
El dato del peso, en las H.C1., está registrado en kilos y gramos, es
decir en un guarismo de 4 cifras. Nosotros, para simplificar el cálculo,
tomaremos solamente las dos primeras cifras, es decir la que expresa los
kilos, y la primera cifra decimal.
Al hacerlo así, tomamos conciencia de que nuestros datos corres
ponden a la clase de los llamados continuos y que cuando decimos, por
ejemplo, 3,2, decimos en realidad 3,2 o más. pero menos de 3,3.
Estos datos se nos presentan en el conjunto de H. Cl. en forma de
sordenada, es decir que después del valor consignado en una historia,
encontramos que el de la siguiente puede ser menor, igual o mayor, indis-
Nuestra tarea inmediata será, por lo tanto, ordenarlos y agruparlos
por grupos de valores iguales, para lo cual hacemos uso del método de los
palotes. Este consiste en tomar una hoja de papel, y en una primera co
lumna, encabezada con una x minúscula, colocamos una serie de valores
sucesivos, desde el que consideramos que ha de ser el menor, hasta el que
pensamos que será el mayor.
Si esto no se confirmara y encontráramos valores más pequeños o
mayores que los esperados, no habrá inconveniente en agregarlos antes del
primero o después del último. Esa primera columna estará por lo tanto
formada provisionalmente, y quizá definitivamente, por los valores indi
cados en el cuadro 7.
A continuación leemos el dato en cada historia clínica y en la 2da.
columna marcamos un palote en la línea del valor correspondiente. Así
hemos obtenido la siguiente columna.
Hecho esto, obtenemos los valores de una 3ra. columna, encabezada
por una “f , sumando los palotes de cada línea. La suma de esta columna
(£ f) es la población de la muestra.
2 f = 44
Por fin. organizamos una 4ta. columna encabezada x í multiplicando el
valor del x por f. La suma de esta columna (2 x f) es el tamaño de la
44
http://booksmedicos.org
MEDIA, DESVIO STANDARD Y ERROR STANDARD
2 * f = 146,9 = T
Hemos hecho asi varias cosas:
1°) Hemos ordenado los dalos.
2°) Hemos agrupado los datos, obteniendo grupos ordenados.
Cuadro 7
EJEMPLO DE AGRUPAMIENTO Y ORDENACION DE LOS DATOS:
PALOTES
Exf ■ tamaño tpeso total de todos los niños).
http://booksmedicos.org
3”) Hemos obtenido la población de los grupos, es decir la frecuen
cia, la que por estar ordenados de acuerdo a los datos, constituye una
distribución de frecuencias. Vemos que en esta muestra la frecuencia se
inicia con un valor mínii .c * aumenta progresivamente hasta un valor
máximo, a partir del cual .isminuye también progresivamente, hasta vol
ver a un valor mínimo, quedando el grupo de frecuencia máxima relati
vamente equidistante de los grupos de frecuencia mínima. Esta distribu
ción de frecuencia es, por lo tanto, una distribución casi normal.
4 ) Hemos obtenido la “población" y el "tamaño" de la muestra.
Con este tratamiento previo de la muestra estamos ya en condiciones
de calcular los parámetros media, desvío standard y error standard, por
los métodos fundamentales.
El más sencillo de todos es el cálculo de la media.
La media es igual al tamaño de la muestra dividido por la población.
Entonces tenemos:
ESTADISTICA MEDICA
El desvio standard es la raíz cuadrada de la media de los cuadrados
de los desvíos. Debemos calcular por lo tanto los desvíos, elevarlos al cua
drado y obtener su sumatoria. Esto exige la confección de una "planilla
de operaciones". Esta se confecciona de la siguiente manera:
En una primera columna, encabezada por una "x". se coloca el valor
del dato o de los datos que integran cada grupo. Naturalmente, los grupos
inexistentes no aparecen en la planilla. Ver cuadro 8.
En una segunda columna, encabezada por una *T\ colocamos la po
blación de cada grupo, o sea la frecuencia.
Dijimos que la suma de esta columna es la población de la muestra.A continuación calculamos los desvíos de cada dato, es decir sus dis
tancias a la media ya calculada y los colocamos en la línea correspondien
te al dato, en una 3ra. columna encabezada por la expresión x - m.
Ahora formamos una 4ta. columna, encabezada por la expresión (x -
ni)3, formada por los cuadrados de estos desvíos.
Luego formamos un Sta. columna, encabezada por la expresión f (x —
m)z , formada por los productos de la frecuencia o población de los
grapos multiplicada por el cuadrado de los desvíos, con lo cual se obtiene
el tamaño de los grupos de les desvíos elevados al cuadrado.
Su suma es el tamaño de los cuadrados de todos los desvíos y su
media es la cantidad subradical del desvío standard.
http://booksmedicos.org
£
£
fi
i
£
£
£
£
£
£
£
£
£
£
£
£
£
C
http://booksmedicos.org
3°) Que la dispersión de las medias es 0,06.
(Si queremos, podemos expresarlos en gramos).
Esto significa: 1°) que el peso medio de los recién nacidos de la
muestra es 3,3 kg; 2o) que si bien es cierto que ese peso solo lo tienen
algunos recién nacidos (y quizá ninguno) el peso del 68% de ellos está
comprendido entre la media más un desvío standard y la media menos un
desvio standard, es decir entre 2,9 y 3,7 kg; y 3°) que el 95% está com
prendido entre la media más o menos 2 desvíos standard; es decir, entre
2,S y 4,1 kg, y significa además que si se examinan muchas muestras si
milares a la muestra, es posible, igualmente, que sólo algunas medias, (o
quizá ninguna) coincida con la muestra, pero que en el 68% de las mues
tras la media se encontrará entre la nuestra menos un error standard y
nuestra media más un error standard, es decir entre 3,24 y 3,36 kg, y en
el 95% entre nuestra media más o menos 2 errores standard, es decir entre
3,18 y 3,42 kg.
Así se obtienen la media, el desvío standard y el error standard por el
método fundamental.
Cuando se trata de muestras pequeñas, poco numerosas, no hay in
conveniente en utilizar este método, pero cuando son muestras grandes y
numerosas, este método puede resultar largo y fatigoso. En esos casos es
preferible utilizar métodos simplificados basados en fórmulas derivadas de
las fundamentales.
Para comprender estas fórmulas y estos métodos es necesario conocer
previamente algunas propiedades de la media y del desvío standard. Es lo
que pasaremos ahora a estudiar.
ESTADISTICA MEDICA
http://booksmedicos.org
CAPITULO VI
PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD
SUMARIO: Propiedades de la media y del desvio standard. Propiedad “A"
de U media. Propiedad "B". Propiedad "A" del desvío standard. Propiedad
El cálculo de los parámetros media, desvío standard, y variancia pue
de hacerse, naturalmente, por el método fundamental, es decir utilizando
directamente las fórmulas conceptuales de estos parámetros; pero a veces
los cálculos realizados utilizando estas fórmulas resultan muy largos y
laboriosos, especialmente cuando se trata de muestras numerosas y de
gran tantalio. Por este motivo los estadísticos han buscado y obtenido
métodos simplificados de cálculo que abrevian y aligeran extraordinaria
mente esta tarea. Estos métodos simplificados utilizan fórmulas derivadas
de las fundamentales, las cuales se basan en propiedades especiales de
estos parámetros.
Para comprender dichas fórmulas es por lo tanto indispensable cono-
siguiente.
Propiedad “A” de la media
Si desplazamos el 0 de una serie y lo colocamos en un punto cual
quiera 0', se modifican los valores de los términos y por lo tanto el de la
http://booksmedicos.org
ESTADISTICA Mi
Coloquemos ahí
segunda observación
vos valores de los te
Este es el valor de la media (m‘) de los nuevos datos (modificados por
Vemos así que la nueva media es igual a la media real menos el valor
de la escala en que se colocó 0*. Es decir:
m' = m - va = 165 - 160 = 5 (1)
De (1) se deduce:
m = m' + v.a. (2)
Es decir: la media real (m) es igual a la media de los nuevos valores
sumada algebraicamente al valor arbitrario (v.a.) en el que se colocó el
m = 5 + 160 = 165
http://booksmedicos.org
PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD
Importancia de la propiedad "A "de la media
Cuando los valores de los dalos se expresan con números alejados de
cero, como ocurre cuando se miden la estatura de la personas en cm, o
las presiones arteriales en mm, o se trata de densidades de orina, etcétera,
es mucho más cómodo, al hacer el cálculo de la media, transformar los
valores de los datos en otros más chicos, colocando el 0' de la nueva es
cala más cerca de los valores de la muestra, y hasta dentro de ella.
De ese modo se transforman los valores primitivos en otros secunda
rios. En estas condiciones, la media que se obtenga será también una
media secundaria; pero será muy fácil transformar esta media secundaria
en la media de la serie primitiva con sólo sumarla algebraicamente al valor
frente al cual se colocó el 0' de la escala, al hacer la transformación de los
valores primitivos en los secundarios.
Ejemplos
Se nos pide la estatura media de 4 personas cuyas tallas, se dan en
cm, en la siguiente forma; La Ira. mide ISO cm, la 2da. 160; la 3ra. 170,
y la 4a. 180 cm.
De acuerdo con el procedimiento fundamental tendríamos que sumar
esos 4 valores y la suma dividirla por 4.
Asi
150 + 160 + 170 + 180 = 660
m = 660 •/. 4 = 165
La estatura media de esas cuatro personas es, pues, 165 cm.
Pero nosotros, en vez de trabajar con números superiores a 100, po
demos hacerlo con otros menores, transformando los valores originarios en
otros más pequeños, con sólo tomar esos valores desde un punto situado
más o menos lejos del 0 y más o menos cerca de la muestra, como, por
ejemplo, desde 100 cm, o sea desde el metro.
Entonces el problema planteado podría expresarse en la siguiente tüi
¿Cuál es la talla media de 4 personas, la la. de las cuales excede al
metro en 50 cm; la 2a„ en 60; la 3a., en 70, y la 4a.. en 80 cm?
Para resolver este problema tomamos como antes estos datos y los
sumamos, pero *ahora sumamos números menores de 100, mientras que
antes sumábamos números mayores de 100, y en ello consiste la simplifi
cación del cálculo.
51
http://booksmedicos.org
ESTADISTICA MEDICA
La media de esos 4 valores derivados es:
50 + 60 + 70 + 80 = 260
m- = 260 •/. 4 - 6 5
La media de estos valores derivados es 65; pero nosotros necesitamos
la media de los valores originarios y no la de los valores derivados.
La solución, muy simple, consiste en agregar algebraicamente esa
media derivada (65) al valor frente al cual se colocó el 0' de la escala al
hacer la transformación de unos valores en otros, es decir a 100.
La media de los valores originarios es, pues,
m = 65 + 100 = 165
Es decir el mismo resultado que habíamos obtenido antes.
Si en vez de colocar el 0‘ de nuestra regla sobre el 100 de la escala
originaria, lo colocamos frente a cualquier otro valor, el resultado no cam
bia. Por ejemplo, coloquemos el 0' frente al valor 120 de la escala origi
naria: Esto equivaldría a plantear el problema de la siguiente manera:
¿Cuál es la estatura media de 4 personas, la la. de las cuales excede
en 30 cm a los 120; la 2a., en 40; la 3a.. en 50, y la 4a„ en 60 cm:
Como antes, sumaríamos esos 4 valores y la suma la dividiríamos por
4. Así:
30 + 40 + 50 + 60 = 180
m’ = 180 •/. 4 = 45
Ahora agregaríamos esta media secundaria o derivada al valor frente al
cual pusimos el 0' de nuestra escala, es decir a 120, y el resultado será la
media de los valores originarios. Esto es
m = 45 + 120 = 165
Es decir: el mismo resultado que antes.
También podríamos poner el 0‘ en uno de los datos de la muestra y
tampoco cambiaría el resultado.
Por ejemplo, podríamos colocarlo en el 1° de ellos, es decir en 150.
Entonces el problema podría plantearse en esta forma:
¿Cuál es la talla media de 4 personas, la más baja de las cuales mide
150 cm; la siguiente, 10 cm más; la otra, 20 cm más, y la 4a., 30 cm
más?
http://booksmedicos.org
Estasería la media derivada; la media verdadera, es decir la de los
itos originarios, se obtiene sumando esa media derivada al valor frente al
tal se puso el 0' de la escala al hacer la transformación de unos valores
i otros, es decir a ISO. Y así:
m = 15 + 150 = 165
Tenemos la misma media de antes.
Tampoco cambiaría el resultado final si el 0’ de la escala lo pusiára-
ios sobre cualquiera de los otros datos de la muestra, o hasta sobre un
üor inexistente en la muestra, como podemos comprobarlo fácilmente.
Coloquemos, por ejemplo, el 0' sobre el valor 155, inexistente en la
Entonces el problema se plantearía así:
¿Cuál es la talla media de 4 personas, una de las cuales mide 5 cm
icnos de 155 cm; otra, 5 cm más; otra. 15 cm más, y la otra, 25 cm
Sumando algebraicamente esos valores, te
Dividiendo la suma por 4, tenemos
Esta es la media derivada. La media originaria o verdadera es igual a
más 155. Entonces:
53
http://booksmedicos.org
ESTADISTICA MEDICA
Coloquemos ahora el 0' frente a otro valor de la muestra, por ejemplo
frente al 2°, es decir frente a 160. Entonces el problema podría presen
tarse como sigue: ¿Cuál es la talla media de 4 personas, la la. de las cua
les mide 10 cm menos que la 2a.; ésta mide 160 cm; la 3a., 10 cm más
que ésta, y la 4a., 20 cm mis que esta 2a.?
Ahora los valores derivados serian
-10; 0;+10;+ 20
La suma algebraica es: +20
La media derivada es: +5
La media verdadera es: +5 + 160 = 16S
Es decir, la misma de siempre.
Coloquemos, para verificar, el 0' sobre el 3er. valor, es decir sobre
170.
Entonces los valores derivados son:
- 20; - 10; 0; +10
La suma algebraica es -20.
El cociente o media secundaría m‘ es:— = —5.
La media verdadera es:
m = -S + 170 = 170 - S = 165
Lo mismo de siempre.
Coloquemos ahora, el 0- sobre el último valor de la muestra, es decir
sobre 180.
Entonces los valores derivados son:
-30;-20;-10; 0
La suma algebraica es: -60
El córente m' es: -60 ■/. 4 = -15
La media verdadera m = -15 + 180 = 180 - 15 = 165
Lo de siempre.
Pero también podemos colocar el 0' más allá de la muestra, por ejem
plo en los 2 m, o sea en los 200 cm.
Entonces el problema se presentaría como si fuese:
54
http://booksmedicos.org
faltan SO cm para medir 2 m; a la 2a. Ic faltan 40; a la 3a„ 30, y a la 4a.,
20 cm?
Ahora los valores derivados son:
-50; -40; -30 y - 20
La suma algebraica es -140
La media verdadera m es: -3S + 200 o sea: 200 - 35 = 165
Lo mismo de siempre.
Es decir, en definitiva, que para comodidad en el cálculo de la media,
para poder operar con números más pequeños, podemos seguir el proce
dimiento de transformar los valores originarios en otros más chicos, colo
cando el 0' de estos valores frente a un valor arbitrario cualquiera de la
otra escala, por ejemplo frente a un valor próximo o interior a la muestra,
recordando que la media asi obtenida será por lo pronto una media deri
vada, secundaria o arbitraría, que podrá transformarse en la media ver
dadera con sólo sumarla algebraicamente al valor arbitrario frente al cual
se colocó el 0' de nuestra escala. Es decir,
m = m’ + valor arbitrario,
que es lo que dijimos al principio (2)
Propiedad "B” de la media
Si dividimos cada uno de los términos de una serie por un divisor
común, obtenemos una nueva serie y, por lo tanto, una nueva media. Esta
es igual a la media anterior dividida por el divisor común.
De (3) se deduce:
m = m- r (4)
Es decir que: la media real (m) de los valores originarios es igual a la
media de los nuevos valores (m-) multiplicada por el factor de reducción
W-
55
http://booksmedicos.org
ESTADISTICA MEDICA
Ejemplo I
http://booksmedicos.org
PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD
Esta es la inedia reducida de la serie reducida. Como vimos en (4), la
media de la serie primitiva es igual al producto de esta media reducida por
el factor de reducción. En el ejemplo dado
Propiedad “A" del desvio standard
Cuando una serie estadística se transforma en otra por haberse colo
cado el 0' en un lugar distinto de 0, el valor de los desvíos no se modifica
y, por lo tanto, el desvío medio standard de esta serie derivada es el
mismo que el de la serie primitiva.
S,. = Sx
- V¡66
= 12,88
= V ¡66
= 12,88
57
http://booksmedicos.org
ESTADISTICA MEDICA
Propiedad “B" del desvío standard
Cuando una serie estadística se transforma en otra por división de
cada uno de sus términos por un divisor común (r), llamado también fac
tor de reducción, el desvío standard de esa serie derivada es igual al des
vio standard de la serie primitiva dividido por dicho factor de reducción.
S8
http://booksmedicos.org
PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD
Como vimos en (6)
Sx' = — S* = r S*’
Es decir que el desvio standard de la serie primitiva es igual al desvio
standard de la' serie derivada multiplicado por el factor de reducción.
En el ejemplo dado,
S* = 5 X 2,58 = 12,88
Si se resta a todos los datos de una muestra un sustraendo común la
si dichos datos son divididos por un divisor común, tanto la x como el Sx
resultan divididos por dicho divisor.
59
http://booksmedicos.org
http://booksmedicos.org
CAPITULO VII
La variancia, como se sabe, es la media de los cuadrados de los des-
v„ . = z ( x ~ m)1
por lo cual se la denomina también desviación cuadrática media.
la. observación
Si al hacer el cálculo de la variancia, en vez de tomar las diferencias
de los datos a la media se toman a un valor arbitrario (v. a.) distinto de
ella, se obtiene un resultado mayor, independientemente que el valor arbi
trario sea mayor o menor que la media. (Es decir que los cuadrados de las
diferencias de los datos a la media (x - m)1, son cuadrados mínimos.)
, Ejemplo 1
x m x - m (x - mí1
2 - 3 9
61
http://booksmedicos.org
ESTADISTICA MEDICA
E(* - v.a.)J = 36
(X - V.O.Í1
1
1 E(x - v.a.)» 36
£(x - v.».)1 ■
También aquí vemos que
Como la media de la muestra
la media del universo, la variancia real
mayor que ia obtenida a parí
variancia de la muestra subestima el valor de
rencia es especialmente manifiesta en las mu
cambio, en aquellas cuya población es de 30
las de 60 ó más, la diferencia resulta insignificante.
62
más, y especialmente er
http://booksmedicos.org
VARIANCIA
Para compensar esta pequenez de las variancias de las muestras poco
numerosas, o de Gosset "Student", que veremos más adelante, al resulta
do obtenido al hacer el cálculo de la misma debe multiplicárselo por el
cociente de la población dividida por la población menos uno, es decir
por , factor conocido con el nombre de factor de corrección de
Bessel, como vimos en la página 33, capitulo 4.
En la medida en que la población de la muestra es mayor, el valor del
factor de Bessel se aproxima a la unidad. Cuando la población es nume
rosa, el valor de dicho factor es tan próximo a 1, que su aplicación prác
ticamente no modifica el resultado y por lo tanto puede no ser utilizado.
3a. observación
Si al hacer el cálculo de la variancia se toman las diferencias de los
datos a un valor arbitrario distinto de la media, el resultado difiere de la
variancia en el cuadrado de la diferencia entre la media y el valor arbitra-
Así, en el ejemplo 1 de la I a. observación
J ^ £ - V a , = 9 - 5 = 4
(m - v.a.)a = (S - 7)a = (-2)* = 4
Y en el ejemplo 2 de la misma observación.
S (x — yj.)a _ yac — 9 _ 5 = 4
(m - v.a.)1 = (5 - 3)a = 2a = 4
Por consiguiente:
Var _ Z (* ^v.a.) (m _ v a )i fórmula (1)
63
http://booksmedicos.org
Es decir que cuando los desvíos de los datos se toman restando' de
ellos un valor arbitrario (v.a.) distinto de la media (n)), la variancia real
(var.) es igual al nuevo resultado menos el cuadrado de la diferencia de la
4a. observación
Cuando el valor arbitrario hasta el que se toman las diferencias de los
datos es 0, dichas diferencias son los propios datos, ya que cualquier
número es igual a la diferencia entre él y 0, o sea cualquier número es
igual a si mismo menos 0. Lomismo ocurre con la diferencia de este
valor arbitrario 0, de la media. O sea
Por lo tanto, de la fóimula (1) sacamos:
Var. - — — - n? fórmula (2)
Es decir que cuando los desvíos de los dalos se loman restando de
ellos el valor cero, o sea cuando se loma como valor de los desvíos el
valor de los propios datos, la variancia real (Var.) es igual a la media de
los cuadrados de los datos menos el cuadrado de la media.
Esta fórmula (2) puede adoptar la forma
Var.= — — - (~ ~ ~ J fórmula (2 bis,)
Y también ésta
64
http://booksmedicos.org
E x 2 (Sx)J _ _120 400 _ 120 _ 100 _ 20 ,
Es decir, el mismo resultado <
Sa. observación
La fónnula 2 bis,
Var.= -
- (Ex)»/n E x» -T » /n
fónnula (3)
la fónnula (3) puede adoptar la forma
Ex = mn = T
la fónnula (4) puede tomar la forma
Var = £ ~ m 2 * = S <*-"■
http://booksmedicos.org
ESTADISTICA MI
1°) El cuadrado del tamaflo dividido por la población (fórmula 3).
2°) La media multiplicada por el tamaflo (fórmula 4).
3°) El cuadrado de la media multiplicada por la población (fórmula
S* = 20 m = 5 y = 120
Í5 Ü 1 - — = ion
'■x = S X 20 = 100
n = 25 X 4 = 100
Sx* - T*/n _ I r 1 - n i
Estas son las fórmulas que generalmente se utilizan en la práctica.
iás exacta es la primera (fórmula 3), porque no necesita calcular la
¡a, con lo cual se evita la imprecisión obligada de un parámetro
ene que expresarse con un número limitado de decimales, como oci
>n la segunda (4) y especialmente con la tercera (5), cuya inexactitud
imenta al potenciarse la media.
Cuando las muestras son de escasa población, 30 observaciones o
s "n".
Asf, en la pequefia muestra vista, la planilla y los cálculos son los
- 4; Ix = T = 20; £xJ = 120
S*3 - Ta •/. n 120 - 400 •/.
3l?
r
http://booksmedicos.org
6a. observación
Cuando los valores de los datos se dividen por un divisor común (r) la
varianza de estos nuevos datos (var') es igual a la varianza de los datos
originarios (var) dividida por el cuadrado del divisor común (r3)
Var' = var ■/. r3
VARIANCIA
= 53 — 25
Se'3 - T'3-/. n 120 - 400 /. 4
120 - 100 20
En el ejemplo dado:
Var = 53 X 20 25 X 20
67
http://booksmedicos.org
http://booksmedicos.org
CAPITULO VIII
SIMPLIFICACION DEL CALCULO DE LA MEDIA
SUMARIO. Simplificación de los cálculos de la media. Variantes y simpli
ficaciones en el cálculo del desvío standard. Verificación de los cálculos.
Como es sabido, el cálculo de la media se hace fundamentalmente
sumando todos y cada uno de los valores o datos de las observaciones de
la muestra y dividiendo luego esta suma por la población, o sea por el
número o cantidad de tales datos:
Ex T
ler. método de simplificación
Cuando en una muestra hay datos repetidos, una primera simplifica
ción de los cálculos consiste en agrupar esas observaciones repetidas y
verificar cuánto suman. Esta suma se llama frecuencia de dicha observa
ción repetida.
Una vez hecho esto, en vez de sumar los datos de las observaciones
originarias, teniendo en cuenta que la multiplicación es una suma abre
viada, la simplificación consiste en multiplicar el valor del dato que se
repite por la frecuencia con que lo hace.
Después se suman estos resultados o productos y finalmente esta
sumatoria se divide por la población.
- Sx f
Ejemplo
En un problema donde se dan los datos del número de resfríos .te
nidos en un aflo por cada una de las 641 personas que constituyen la
http://booksmedicos.org
muestra se pregunta cuál es el número medio de resfríos tenido por esas
personas, o sea, cuál es la media de la muestra.
De acuerdo con el método originario del cálculo de la media, habría
que sumar el número de resfríos tenido por cada una de las personas, y
dividir luego esta suma por el número dicho de personas, o sea por 641.
Es evidente que este procedimiento resulta largo y engorroso.
Mucho más simple, e igualmente exacto, es agrupar las personas que
habían tenido el mismo número de resfríos y hacer su recuento, esto es,
verificar cuánto suman. Luego multiplicar esta suma por el número de
resfríos tenido por cada una de ellas. Hacer después la suma de esos
productos y finalmente dividir la sumatoria por el número o cantidad de
personas.
En esta forma, una suma que iba a comprender 641 sumandos se
transforma en otra con solo 10 sumandos.
2do. método de simplificación
Cuando los valores de los datos se expresan con números alejados del
cero, como ocurre cuando se miden las estaturas de las personas en cm, o
las presiones arteriales en mm, o se trata de densidades de orina, etcétera,
una manera de simplificar los cálculos es operar con números más peque
ños, transformando los valores de los datos en otros más chicos, colocan
do el 0’ de la escala más cerca de los valores de la muestra y aun dentro
de ella.
Naturalmente esto significa transformar los valores primitivos en otros
secundarios, y en estas condiciones la media que se obtenga será también
una media secundaria; pero, como hemos visto, será muy fácil transformar
esta media secundaria en la media correcta, con sólo sumarla algebraica
mente al valor frente al cual se colocó el 0' de la escala al hacer la trans
formación de los valores primitivos en los secundarios.
3er. método de simplificación
De acuerdo con la propiedad "B” de la media cuando los valores de
una serie se dividen por un divisor común, la media (m'j de esta serie
derivada es igual a la media (m) de la serie primitiva dividida por este
divisor común.
Esto permite un 3er. procedimiento de simplificación del cálculo de la
media. La media de la serie primitiva se obtiene multiplicando esta media
reducida (m') por el factor de reducción: m = m’ r.
ESTADISTICA MEDICA
70
http://booksmedicos.org
Ejemplo
En el problema de la talla media de 4 personas que miden respecti
vamente ISO, 160, 170 y 180 cm podemos transformar estos valores en
otros menores y por lo tanto más manuables, dividiéndolos por un de
nominador común, que puede ser 2, 5 6 10. Dividiéndolos por este último
factor de reducción obtendremos los siguientes nuevos valores:
1S; 16; 17 y 18,
los cuales son 10 veces más pequeños que los originales.
Para obtener la media de estos nuevos valores procedemos, como
siempre, primero a sumarlos y después a dividir la suma por el número o
cantidad de ellos.
15 + 16 + 17 + 18 - 66
m’ = 66 ■/. 4 = 16,5
Esta es una media reducida (m’).
La verdadera media (m) de la muestra original la obtendremos multi
plicando esta media reducida por el factor de reducción (r).
Así:
16,5 X 10 = 165
4to. método de simplificación
A riesgo de cometer un pequeño error, el cálculo de la media puede
también simplificarse agrupando los valores próximos dentro de un inter
valo y considerando que las observaciones dentro de cada grupo son igua
les al valor central de dicho intervalo.
Es verdad que no todos, tal vez sólo algunos, o quizá ninguno de los
valores reales coincidirá con el valor central, y que seguramente la mayo
ría se distribuirá entre unos que valen menos y otros que valen más que
dicho valor central. Pero precisamente ahí está la probabilidad de que las
diferencias se neutralicen mutuamente y que el producto de la frecuencia
por el valor central resulte igual o muy cercano a la suma de los valores
individuales del grupo.
Después se sigue como en el 1er. procedimiento de simplificación de
los cálculos, multiplicando dicho valor central por el número de observa-
cionê ydel grupo; a lo cual sigue la sumatoria de estos productos, y por
fin la división de esta sumatoria por la población de la muestra.
71
http://booksmedicos.org
ESTADISTICA MEDICA
3910 = 2 (v.C. X f)
72
http://booksmedicos.org
SIMPLIFICACION DLL CALCULO DE LA MEDIA
, _ S (v.C. - V.a.)f 95
m n 30 “ '
m = m' + v.a. = 3,2 + 127,5 = 130,7
r muy próximo al anterior (1303) y también ir
i.
. £ (v e. - v.a.) f
También podríamos combinarlo con el 3er. procedimienlo, cuidando
que los intervalos fueran iguales, como lo son en este ejemplo, dividiendo