Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística médica BIB L IO T EC A D E L U N IV E R S IT A R IO MANUALES /M E D IC IN A Estadística médica DOMINGO A. LEDESMA El'DEBA EDITORIAL UNIVERSITARIA 1)E BUENOS AIRES EDITORIAL UNIVERSITARIA DE BUENOS AIRES Rivadavia 1571/73 Sociedad de Economía Mixta Fundada por la Universidad de Buenos Aires Hecho el depósito de ley IMPRESO EN LA ARGENTINA - PRINTED IN ARGENTINA ©1972 INDICE INTRODUCCION . . . : ................................................................. XI PRIMERA PARTE CONCEPTOS FUNDAMENTALES I. CONCEPTOS GENERALES ................................................ 3 Concepto de estadística, 3; Ubicación en el cuadro de las cien cias, 4; Relación con el cálculo de probabilidades, 4; Importancia en medicina, 4; El azar o casualidad, 4; Universo y muestra, 5: Observación y dato, 6; Registro y clasificación de los datos, 6; Tabulación, 7. II. CONCEPTOS PARTICULARES............................................. 9 Población o efectivo, 9; Tamaño, 9; Dispersión de los datos, 9; Ordenamiento de los datos, 10; Serie estadística, 10; Agolpa miento de los datos, 10; Intervalo o módulo, 10; Frecuencia, 11; Probabilidad, II; Ordenación de los grupos, 12: Distribución de frecuencias, 12; Ejemplo de distribución normal de frecuencias, 13; Ejemplo de distribución de Gosset "Student", 14; Ejemplo son, 15. * III. REPRESENTACIONES GRAFICAS........................................ 17 Cuadriláteros, 17; Sectores, 18; Histograma, 20; Ejemplo de his- tograma, 21; Ejemplo, 22; Curvas, 22; Curva normal o de Gauss. 23. IV. PARAMETROS ESTADISTICOS ........................................... 25 Parámetros fundamentales, 25; Parámetros derivados, 25; Pará metros de posición, 26; Proposición de Cauchy, 30; Promedio y mayoría, 30; Desvío, 30; Parámetros de dispersión, 31; Media del universo, 34; Parámetros derivados, 3S; Promedio ponderado. 38; Error probable, 39; Error relativo, 39. Vil http://booksmedicos.org SECUNDA PARTE LA MUESTRA NORMAL NUMEROSA O MUESTRA NORMAL DE PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD Propiedad “A” de la media. 49; Propiedad “B" de la media. 55; Propiedad "A" del desvio standard. 57; Propiedad "B” del VIL VARIANCIA...................................................................... 61 la. observación. 61; 2a. observación. 62; 3a. observación, 63; IX. ECUACION DE LA CURVA DE GAUSS ........................... 87 Cálculo de la ordenada "y”. 88; Significado de “y". 89; Cons trucción de la curva, 89; Arca subtendida a la curva. Area par cial, 91; Tablas de áreas subtendidas a la curva. Tablas de probabilidades, 92; Frecuencias teóricas de una muestra nor mal, 96. X. VARIACION DE LAS MUESTRAS http://booksmedicos.org TERCERA PARTE LA MUESTRA NORMAL POCO NUMEROSA O MUESTRA DE GOSSET "STUDENT" CUARTA PARTE LA MUESTRA B1NOMIAL NUMEROSA O MUESTRA DE BERNOUILLI XIII. DISTRIBUCION BINOMIAL ............................................... 131 XIV. SERIE BINOMIAL DE BERNOUILLI................................... 145 148; Observaciones, 150; Cálculo de la frecuencia de un resul- lado determinado, 165. XV. PARAMETROS MEDIA Y DESVIO STANDARD EN LAS MUESTRAS BINOMIALES................................................. 177 Resultados en valores absolutos. 177; Resultados en valores 185. XVI. INTERVALO DE CONFIANZA DE LA MEDIA Y SIGNIFI CACION DE LA DIFERENCIA ENTRE MEDIAS.....................201 Significación de la diferencia entre dos medias binomiales de la media, 203; Determinación del intervalo de confianza de muestra o la frecuencia de la media, 207. IX http://booksmedicos.org ESTADISTICA MEDICA XVII. MUESTRAS DE POISSON . Concepto, 219; Frecuencia de un resultado, 220; Obtención de la media, 221; La variancia, 223; Los límites del intervalo de confianza, 223. XVIII. METODO DE PEARSON .. XIX. ASOCIACION......................................................... Correlación, 263; Probabilidad de un coeficiente de o dón, 271; Regresión, 273; Tarjetas y dameros, 278; pruebas de correlación, 287; Análisis de la covarianza, 29 X http://booksmedicos.org INTRODUCCION XI http://booksmedicos.org Los libros de estadística existentes en plaza, algunos de ellos muy buenos, todos ellos extranjeros (un libro argentino similar al nuestro, el de KOHAN y CARRO, trata de la estadística aplicada a la psicología, a la sociología, a la educación y a las ciencias políticas, no a la medicinal, y los cursos de estadística a los que concurrimos, igualmente muy buenos, exigen conocimientos matemáticos que el común de nuestros médicos, no poseen. Esto les hace a ellos sumamente difícil la comprensión de la esta dística. Magnificas tablas, como las de GEIGY, necesitan explicaciones más elementales que las que ellas traen para ser manejables por la mayoría de los médicos que las necesitan. Compenetrados de esa necesidad de médicos y estudiantes, y ante su dificultad para obtener dichos conocimientos en los textos o en los cursos corrientes, que en gran parte se sitúan fuera de la realidad de sus necesi dades y de los conocimientos matemáticos que poseen, nos propusimos explicar con palabras sencillas y con nociones elementales los conceptos básicos de esta ciencia. Con éstos podrán todos comprender y manejar la mayoría de los problemas comunes de la estadística médica. En este libro diremos lo fundamental de esta materia, en sus aspectos generalmente más utilizados en medicina, y lo diremos sin recurrir a las matemáticas superiores, es decir, manteniéndonos siempre dentro de ¡os conocimientos de matemáticas del médico corriente. No obstante lo dicho, no estará de más que con la lectura de este libro el lector refresque sus conocimientos de matemáticas deI colegio nacional, releyendo algunos de sus textos. Sin ser de vulgarización, éste es un libro de estadística elemental, al alcance y para uso de médicos y estudiantes que leen trabajos científicos o que realizan tareas habituales de investigación. Es un resumen de los cursos de estadística médica dictados por el autor en la maternidad del policlínico "Profesor doctor Gregorio Aráoz Alfaro" de Lanús. y por lo tanto, está redactado con la experiencia dada por la enseñanza viva de la materia a los destinatarios del mismo. En él nos referiremos a una media docena de temas estadísticos fun damentales para la investigación médica. Nos liemos preocupado, en primer termino, por dar claros y precisos conceptos fundamentales. De esto nos ocupamos en la primera parte de! libro, la que abarca siete capí tulos. Después nos esforzamos por precisar las principales clases de mues tras que generalmente el médico tiene entre manos y las técnicas estadís ticas aplicables a cada clase. De ello nos ocupamos en las cuatro partes siguientes. Por último, damos algunas nociones aplicables a cualquier clase de muestra. De esto tratan las dos últimas partes. En resumen, los temas que tratamos en el libro son: ESTADISTICA MEDICA XII http://booksmedicos.org INTRODUCCION 1. Conceptos fundamentales. 2. El estudio estadístico de Ias muestras numerosas con una distri bución normaI de las frecuencias de sus datos, o sea de lo que puede llamarse muestra de GAUSS. y de las técnicas que le son aplicables 3. El estudio estadístico de las muestras poco numerosas también con una distribución normal de la frecuencia de sus daros o muestras de GOSSET "STUDENT", y de ¡as técnicas correspondientes 4. El estudio de las grandes muestras con una distribución binomial de la frecuencia de sus datos, o muestra de BERNOUILLI, y sus técnicas 5. Las grandes muestras con un resultado poco numeroso y una dis tribución de frecuencia próxima a la binomial o muestras de POISSON y sus técnicas. 6. El método de PEARSON o de J i Cuadrado fx1) para la compara ción entre una muestra real y una teórica, y su técnica en los diversos 7. La asociación o relación estadística entre dos variables observadas simultáneamente en una misma muestra y sus técnicas. En lo posiblehemos explicado los conceptos y los métodos o técnicas dando el porqué de los mismos, y sólo cuando ello exigía una profundi- 2ación matemática fuera del alcance del común de los médicos, nos con formamos con decir solamente cómo se hace. Por eso. algunos temas como Ji Cuadrado, se han explicado principalmente por medio de ejem plos. Estos son suficientes para capacitar al médico en la utilización del método en la mayoría de las circunstancias en que puede serle útil. En cambio, otros temas, como distribución binomial, se han explicado con cierto detenimiento, ya que es imprescindible tener bien claro lo que es el desarrollo de un binomio elevado para comprender el concepto de lo que es una muestra con una distribución binomial de sus frecuencias. Finalmente, hemos procurado ejemplificar todo al máximo posible dentro de la manualidad del volumen. XUI http://booksmedicos.org http://booksmedicos.org CONCEPTOS FUNDAMENTALES http://booksmedicos.org http://booksmedicos.org CAPITULO I 3 http://booksmedicos.org Por trabajar con números la estadística participa de las ciencias ma temáticas, pero al igual que en muchas otras ramas del conocimiento -física, química, etc.,- éstas son el instrumento que debe ser aplicado a una materia, en este caso las observaciones o experiencias similares valo- Relación con el cálculo de probabilidades Por sus métodos matemáticos la estadística se halla relacionada con el cálculo de probabilidades y podría dccitsc que es un capítulo de él, pero mientras dicho cálculo se ocupa de los grandes números, de los conjuntos infinitos, la estadística se ocupa de los pequeños números, de los conjun- Importancia en medicina La importancia de la estadística en medicina se debe a la capacidad de la primera en valorar la magnitud del azar en la segunda. El azar o casualidad resultados de la actividad médica, ya se trate de diagnósticos, pronósticos sea que observemos la aparición de un dato clínico o de laboratorio, que pronostiquemos la duración de una enfermedad o de un embarazo, que comprobemos la ventaja de un medicamento o de una técnica quirúrgica, etcétera, el resultado está siempre influido, en mayor o menor grado, por la casualidad. Es decir, los resultados médicos se hallan siempre influidos por un conjunto variable de factores invisibles e imponderables, que englobamos con el nombre de azar o casualidad. Es este conjunto de factores, desconocidos y variables, el que diver- Estc azar pudo haber tenido una gran participación en los resultados, o, por el contrario, sólo una insignificante, pero de antemano eso no podemos saberlo; es decir, directamente, al azar no podemos medirlo. Necesitamos por lo tanto de algún procedimiento indirecto capaz de medir el tamaño, o sea la magnitud de la importancia del azar. Este mé- http://booksmedicos.org CONCEPTOS GENERALES Esta se basa en que si observamos un gran número de casos seme jantes, es lógico suponer que los factores desconocidos han de neutrali zarse en gran parte, por lo menos, mutuamente. De ahí que si estudiamos dos series paralelas en estas condiciones, en una de las cuales aparece o interviene un factor determinado que no interviene ni aparece en la otra, la diferencia de los resultados pueda lógicamente atribuirse a esc factor. Pero aun así, no estamos completamente seguros de haber neutrali zado totalmente al azar, o sea que la diferencia se deba exclusivamente al factor presente en una serie y ausente en la otra. Por eso. también aquí, para medir la magnitud de ese azar residual tenemos que recurrir también La magnitud de la influencia del azar se mide en porciento de proba bilidad. Un resultado puede deberse en un 100% a ella o en un 50% o en un 5%, etcétera. Cuando la influencia del azar en un resultado médico es pequeña, menos del S%, los estadísticos que se ocupan de cuestiones mé dicas aceptan que, prácticamente, puede considerarse que el resultado no vención del azar es superior al 5%, opinan que dicho resultado puede considerarse debido simplemente a la casualidad. Dijimos que la estadística es un capítulo del cálculo de probabilida des. Este se ocupa de los valores numéricos de hechos similares, pero en general sólo se ocupa de los grandes números, de los grandes conjuntos, de aquellos que por ser infinitos se llaman universos de casos similares (o universos simplemente dicho). La estadística, en cambio, se ocupa preferentemente de los pequeños números, de los pequeños conjuntos, de los conjuntos finitos, extraídos naturalmente de aquel gran conjunto y que por ser fracciones de él se denominan muestras. Por ejemplo, si observamos el peso de un conjunto de niños recién nacidos, podremos comprobar lo que pesan un número determinado de ellos, pero no el de todos los recién nacidos habidos y por haber. El conjunto finito de recién nacidos sometidos a nuestra obser vación es ¡a muestra-, el conjunto infinito de todos los recién nacidos ha bidos y por haber es el universo (el universo de recién nacidos). La muestra es el elemento fundamental con que trabaja la estadística. Sin muestra no hay estadística. 5 http://booksmedicos.org Observación y dato La muestra es el conjunto de observaciones valoradas cuantitativamen te y también el conjunto de los valores numéricos individuales. Estos, los valores numéricos individuales, se denominan “datos”. Por ejemplo, el conjunto de las observaciones de las horas dormidas por los pacientes del ejemplo dado anteriormente constituye los datos. El dato es el valor numé rico de la observación individual. Cuando las observaciones se clasifican cualitativamente (por ejemplo: gordos, medianos o flacos), el conjunto de observaciones de igual clasifi cación constituye una clase. A las clases se las simboliza genéricamente con una x minúscula. En este caso el valor de cada observación es igual a Registro y clasificación de los datos La observación o la clase y su dato deben, en primer término, 'er registrados, esto es, deben ser llevados a una planilla, a una ficha, a una tarjeta, a una hoja de cuaderno, etcétera. Hecho esto, las observaciones no clasificadas deben serlo, es decir, se las debe.agrupar en clases. Vimos que se llama clase a un conjunto de observaciones similares. A mayor abundamiento diremos que las observaciones difieren entre Si observamos niños recién nacidos, éstos pueden diferir por. el sexo (diferencia cualitativa) o por el peso (diferencia cuantitativa). El conjunto de los recién nacidos varones constituye la clase de los recién nacidos va rones; el conjunto de los que pesan 3000 g, la clase de los que pesan 3000 g, etcétera. El número de observaciones de una clase constituye su frecuencia. ( frecuencia absoluta véase infra). Cuando una muestra está formada por un gran número de observa ciones (lo que ocurre especialmente cuando las diferencias son cuantita tivas) se juntan las observaciones similares en un solo grupo, constituyen do cada grupo una clase. El número de observaciones agrupadas en una clase constituye la frecuencia de ese grupo o clase. Es necesario fijar claramente los límites del grupo o clase, de modo que no haya duda de si una observación pertenece a un grupo u otro. Para ello conviene tomar como límites de los grupos valores inaccesibles a los métodos de medidas usados en la investigación. Si la balanza sólo es capaz de medir gramos, colocamos los límites a mitad de gramo, por ejemplo 0,5 g - 9,5 — 19,5 - 29,5 g, etcétera. http://booksmedicos.org En estos casos se toma como valor representativo del grupo o clase la semisuma de los limites del grupo (en el ejemplo dado, 5 g - 14,5 - 24,5 - etc.), es decir, se considera como si todas las observaciones di grupo pesasen ese valor medio. Puede haber en esto un pequeño erro pero generalmente las diferencias se compensan y el error no existe o s mí- Luego el dato también debe ser clasificado, esto es. reconocido como una cantidad continua o discontinua. Por ejemplo,si so trata del número de glóbulos rojos por milímetros cúbicos, el dato es discontinuo, pues en un volumen dado de sangre no puede haber sino un número entero de glóbulos rojos y la diferencia con otro volumen de sangre implicará tam-' bien un número entero de ellos. Pero'si se trata de la hemoglobina contenida en un volumen de san gre, el dato será continuo, ya que la cantidad será un número fraccionado de la unidad que se utilice (difícilmente un número entero de esa unidad) y podrá presentar toda la gama posible de valores intermedios entre un número entero de unidades y el siguiente. La diferencia con otro volumen de sangre será asimismo un número fraccionado de unidades, difícilmente Los datos discontinuos se suelen denominar también datos discretos. La presentación de éstos no ofrece dificultades. En cambio, cuando se tra ta de datos continuos es necesario aclarar si el valor registrado es el valor más próximo al valor real o si se trata de la parte entera de un valor real al que le sigue una fracción. Así. si se dice que una persona mide 1,60 m, es necesario aclarar si se han tomado los 60 cm por estar el valor real más próximo a esa medida que a 1,59 m o a 1,61, o si se dice 1.60 m cuando la talla real es 1,60 m o más, pero menos de 1,61. En el primer caso se habrán registrado como 1.60 las tallas reales desde 1,596 m hasta 1,605 m, y en el segundo, desde 1,600 a 1,609. Como se ve, si los datos son continuos debe aclararse la forma como se los ha tomado; si son discontinuos esta precaución es inne- Tabulación Finalmente, los datos deben ser tabulados, es decir presentados en una tabla, colocándolos en columna vertical (aunque puede hacérselo tam bién en línea horizontal). A partir de este momento se está en condiciones de iniciar el análisis estadístico propiamente dicho. Así la muestra de las horas de sueño pro ducidas por un hipnótico deben ser tabuladas como muestra el cuadro 1. CONCEPTOS GENERALES http://booksmedicos.org EJEMPLO DE TABULACION (Horas de sueño producidas por un hipnótico http://booksmedicos.org CAPITULO II CONCEPTOS PARTICULARES http://booksmedicos.org Los dalos pueden hallarse más o menos uniformemente diseminados, o por el contrario, mostrar tendencia a confluir hacia los valores menores, medianos o mayores. Ordenamiento de los datos En la muestra los datos se presentan al observador en forma desorde nada. La primera tarea del tratamiento estadístico es ordenarlos, general mente de menor a mayor pero podría ser a la inversa. Serie estadística El resultado del ordenamiento es transformar un conjunto desorde nado de números en una serie ordenada de ellos. Por tratarse de los datos o valores de observaciones similares, el conjunto ordenado de los datos se denomina serie estadística. Cada uno de los datos toma ahora el nombre genérico de término de la serie. La serie consta de tantos términos como de observaciones la La x minúscula que simboliza genéricamente a los datos, simboliza igualmente a los términos. La serie estadística se parece a las otras series matemáticas (aritmé tica, geométrica, etc.) en que consiste en un conjunto ordenado de núme ros, pero se diferencia de ellas en que los términos pueden repetirse, saltearse y carecen de toda relación o razón con sus vecinos. Agrupamiento de los datos Frecuentemente en una muestra (y en una serie) hay datos repetidos, o de un valor tan próximo o parecido, que pueden darse por iguales, y por lo tanto, por repetidos. Cuando así ocurre en muestras muy numerosas, es decir, con una población de 30 o más, deben reunirse o agruparse estas obsetvaciones repetidas o similares. Es lo que se llama agrupación o agrupamiento de los ESTADISTICA MEDICA Intervalo o módulo Cuando los grupos comprenden no solamente datos iguales, sino muy próximos, es necesario fijar los límites dentro de los cuales tendrán cabida los datos de cada grupo. La distancia entre los límites de cada grupo se denomina intervalo o módulo, 10 http://booksmedicos.org CONCEPTOS PARTICULARES Por ejemplo, si se trata de una muestra formada por observaciones de hemoglobina expresada en porcentaje de un valor que se considera nor mal, podemos reunir los datos comprendidos entre SI y 60 en un solo gmpo, los entre 61 y 70 en otro, los entre 71 y 80 en otro, etcétera. En este caso decimos que el intervalo o módulo es 10. Como valor representativo del grupo se toma el equidistante a los límites del mismo. En los grupos del ejemplo dado se toman como repre sentativos los valores SS para el 1°, 65 para el 2°, 75 para el 3°, etcétera. Por lo tanto, se considera como si cada una de las observaciones del grupo valiera lo que el valor representativo del grupo. La realidad es que unos valen más y otros menos, pero la verdad es que muy probablemente esos más y esos menos, es decir esas diferencias, se compensarán o el error será muy pequeño, lo cual autoriza a proceder a dicho agrupamiento. Frecuencia Es el número o cantidad de observaciones iguales o semejantes de la muestra. Es. por lo tanto, la población de los grupos. Se denomina igual mente frecuencia absoluta. También, frecuencia es la relación entre esa cantidad o población del grupo y la cantidad o población total de la muestra. Se llama entonces frecuencia relativa. A esa frecuencia algunos autores la denominan proba bilidad. Se la simboliza generalmente por una f minúscula. En el primer caso, frecuencia es simplemente f. En el segundo, frecuencia =* -f- En el primer caso, la suma de las frecuencias es igual a la población de la muestra, n = 2 f. En el segundo, la suma de las frecuencias es igual a la unidad, El número de observaciones de un grupo es la frecuencia de dicho Probabilidad Es la relación entre la cantidad de hechos equivalentes y la cantidad http://booksmedicos.org ESTADISTICA MEDICA total o infinita de hechos similares de ese universo. Esa cantidad infinita se suele simbolizar una veces por la unidad y otras veces por dentó. En este caso se habla de probabilida porcentualPor ejemplo, la probabilidad de que caiga cara una moneda arrojada al suelo puede expresarse por 0,5 o también por 50%. Ordenación de los grupos Si, como debe hacerse, el ordenamiento de los datos precedió al agru- pamiento de ellos, los grupos ya estarán ordenados. De no haberse hecho asi, corresponde ordenar los grupos de acuerdo con el ordenamiento de los datos, es decir, primero los grupos correspon dientes a datos más pequeños y después los mayores. De este modo los grupos más numerosos quedan generalmente hacia la parte media de la serie de los grupos, pero no siempre ocurre asi y puede suceder lo con- Distribución de frecuencias Con la ordenación de los grupos según la ordenación de los datos, quedan también ordenadas las frecuencias de acuerdo con la ordenación de los datos. Esta ordenación especial se denomina distribución de fre cuencias (d. de f.). La d. de f. es la serie de frecuencias de los datos ordenados, con espe cificación de los datos o de las clases a que correspondan. Al tabular los grupos, éstos van en la primera columna encabezada por una x, hallándose cada grupo representado por el dato repetido o representativo del grupo. En la segunda columna, encabezada por una f, va la frecuencia del grupo. Ya dijimos que la suma de esta columna (2f) es igual a la pobla ción de la muestra (n). En la tercera columna, encabezada por la multiplicación indicada f x van los productos de multiplicar el dato repetido o representativo del gru po por su frecuencia. La suma de esta columna (Efx) es igual al tamaño de la muestra (Sfx — T). Aun cuando las muestras pueden tener distribuciones de frecuencia muy variadas, en medicina las distribuciones más comunes son estas cua tro: 1) la de Gauss; 2) la Gosset "Student” (derivada de la anterior); 3) la de Bernouilli y 4) la de Poisson (vecina a la anterior). Las dos primeras corresponden a datos continuos y las dos segundas a datos discontinuos o discretos(véase clasificación de los datos). 12 http://booksmedicos.org CONCEPTOS PARTICULARES Cuando las frecuencias de los valores más bajos son relativamente escasas, pero las de los siguientes aumentan progresivamente hasta alcan zar un máximo para luego disminuir progresivamente haciéndose cada vez más escasas, siendo el decrecimiento simétrico al crecimiento, la distribu ción se denomina Normal o de Gauss. Cuando una distribución de Gauss corresponde a muestras poco nu merosas, con una población de 60 o menos observaciones o clases, y sobre todo de 30 o menos, la distribución se denomina de Gosset "Student" (siendo “Student" el seudónimo del estadístico W. S. Gosset). Cuando la distribución está formada por valores que corresponden a los de los monomios del desarrollo de un binomio elevado o potenciado la distribución se denomina binomial o de Bemouilli. Y cuando esta distribución corresponde a una muestra numerosa, pero en la que algunas observaciones ocurren muy pocas veces, la distribución se denomina de Poisson. Ejemplo de distribución normal de frecuencias ba entre 56 y 65 66 y 75 76 y 85 86 y 95 96 y 105 106 y 115 116 y 125 126 y 135 136 y 145 13 http://booksmedicos.org Ejemplo de distribución binomial Se investigó el grupo sanguíneo de 36 personas hijos de padre y ma dre grupo AB y se encontró lo siguiente: http://booksmedicos.org CONCEPTOS PARTICULARES Estas frecuencias pueden escribirse asi: 18 = 2X 3X 3 (3 + 3)2 = 3* + 2 X 3 X 3 + 3’ . Ejemplo de distribución de Poisson Se ha dividido el territorio de la República en seis regiones, cada una con una población equivalente. En cada zona se han tomado al azar den localidades con una pobladón de diez mil habitantes. Se ha hecho el re cuento de albinos en cada una de ellas y se ha obtenido el siguiente resultado: N° de albinos Porciento en ¡a población 15 http://booksmedicos.org desarrollo del binomio elevado: sea de los seis últimos resultados (véase m amial, Serie de resultados). En efecto: > adelante Distribución bi- http://booksmedicos.org CAPITULO III REPRESENTACIONES GRAFICAS SUMARIO: Representaciones gráficas. Cuadriláteros. Sectores. Repr. Cuando se desea dar una impresión visual de las proporciones que guardan las poblaciones de los distintos grupos, se recurre al dibujo, con feccionando gráneos. Si los grupos son pocos, los gráficos más usados son los cudriláteros y los sectores. Cuadriláteros Cuando se utilizan cuadriláteros hay que cuidar de que si son rectán gulos y se los dibuja de pie, todas las bases se hallen en la misma linea horizontal, y si acostados, que sus extremos izquierdos se hallen sobre la misma línea vertical. En cualquier caso, la longitud de los cuadriláteros debe ser proporcional a la población de los grupos. Por ejemplo, si se quiere indicar que por cada 100 niños recién naci dos femeninos se encontraron 105 recién nacidos masculinos, la longitud del cuadrilátero que representa a las niñas deberá medir, por ejemplo, 100 mm y la del que representa a los niños, 105 mm. Estos cuadriláteros se dibujan separados uno de otros y no interesa la anchura que se les asigne, pero todos deben tener la misma, como se ob serva en el Cuadro 3. 17 http://booksmedicos.org ESTADISTICA MEDICA Cuadro 3 EJEMPLO DE REPRESENTACION GRAFICA: CUADRILATEROS lProporción de nacimientos según el sexo¡ Para dibujar los cuadriláteros generalmente se empieza por el corres pondiente al del grupo más numeroso, dándosele un tamaño que se con sidere apropiado a la página donde debe aparecer la ilustración. Sus medidas pueden ser, por ejemplo, base 2,5 cm y altura 10 cm. Los otros cuadriláteros deben tener la misma base, es decir 2,5 cm, y la altura debe ser proporcional a la del primero, teniendo en cuenta la población de ambos grupos. Asi, si se tratase de sólo dos grupos, uno de 900 varones y otro de 850 mujeres, la altura del rectángulo correspon diente a éstas se calcula por una simple regla de tres. 900 : 10 :: 850 : X 10 X 850 Cuando para las representaciones gráficas se recurre a los sectores de círculo, la población de la muestra se la equipara a los 360° del circulo y, proporcionalmente a la población de los grupos, se dibujan los sectores. 18 http://booksmedicos.org REPRESENTACIONES GRAFICAS Los grados de círculo que corresponden a cada grupo se calculan apli cando también la regla de tres. Así, si la población de la muestra de recién nacidos es: n = 105 + 100 = 205, la regla de tres dice que los grados de círculo que corresponden al grupo de mujeres es: 205 : 360 :: 100 : X, X = 36<2QS 1Q°~ = l75,' ' ° Con un radio cualquiera se dibuja un círculo y dentro de él se dibujan dos sectores, uno de 175°,.. ° y el otro, lógicamente, de 360° - 175°___ = 184, .. Ver Cuadro 4. (Proporción de nacimientos según el sexoJ http://booksmedicos.org ESTADISTICA MEDICA Hislograma Cuando los grupos son mis numerosos es preferible recurrir al histo- grama: éste, como se verá, corresponde a las representaciones ortogonales, es decir, que se funda en dos ejes que se corlan perpendieularmente (ejes ortogonales o coordenadas cartesianas). Aqui se trata también de cuadriláteros, pero pegados unos a otros. Además, las bases de éstos, las que descansan sobre el eje horizontal o de las abscisas, representan y miden lo que los módulos o intervalos (i) de los grupos; y las alturas, o sea las ordenadas, la población o frecuencia del grupo dividido por el intervalo (f/i); en esta forma el área del cuadrilátero representa la población del grupo, y el área total del hislograma, la pobla ción de la muestra. 2(hX i) = £ f = n Si tomamos como altura del cuadrilátero la frecuencia o población del o dividida por la base del cuadrilátero (i) multiplicada por la pobla- , o efectivo de la muestra (n) y la suma de las áreas de los cuadriláteros es igual a 1, 2(h X i) = £ - = = — = 1. Las abscisas marcan los limites de cada grupo. Cuando el intervalo es I la altura del cuadrilátero indica directamente la población del grupo, o sea la frecuencia absoluta. 20 http://booksmedicos.org ENTACIONES GRAFICAS Ejemplo de histograma o población del grupo la correspondiente es el que r Cuadro 5 EJEMPLO DE REPRESENTACION GRAFICA: HISTOGRAMA Edades de 488 pacientes afectadas de carcinoma uterino 21 http://booksmedicos.org ESTADISTICA MEDICA Cuando los valores agrupados se reemplazan por el valor equidistante de los limites del grupo, pueden representarse los grupos por los vértices de un polígono obtenido uniendo los puntos que tienen como abscisas el valor medio del grupo y como ordenada la población del grupo o frecuen cia dividida por el intervalo. Esto equivale a unir los puntos medios de las bases superiores de los cuadriláteros del histograma. Cuando el intérnalo es igual a 1, la ordenada indica directamente la población del grupo, o sea la frecuencia absoluta. Cuando la ordenada es igual a la frecuencia dividida por el producto del intervalo multiplicado por la población de la muestra, el área subtendida al polígono se aproxima a 1. El área subtendida al polígono es una aproximación al área del histo- Ejemplo Las 488 pacientes con cáncer de cuello recién vistas pueden ser tabu ladas como se observa a continuación: Edad media - x / n° de pacientes n°/i = y 26.0 8 18 2,25 32.5 5 45 9,00 37.5 S 79 15,80 47.5 15 225 15,00 37.5 5 63 12,60 65.0 10 45 4,50 80.0 20 13 0,65 El polígono correspondiente sería el que muestra el Cuadro 6. Cuando los grupos son muy numerosos, lógicamente los intervalos son relativamente muy pequeños: en este caso, si la diferencia de población entre grupos próximos es también muy pequeña, el polígono se confunde con una curva. Lo mismo ocurre en el histograma con la línea quebrada formada por las bases superiores de los cuadriláteros y las porciones co rrespondientes de los lados laterales de los mismos. Esta línea quebrada, http://booksmedicos.org RFPRFSF.NTACIONES GRAFICAS Cuadro6 EJEMPLO DE REPRESENTACION GRAFICA: POLIGONO Edades de 488 pacientes afectadas de carcinoma uterino Como el área del histograma indica la población de la muestra, el área subtendida de la curva, cuando ésta procede de un histograma, indica igualmente la población de la muestra. Curva normal o de Gauss Cuando esta curva presenta una sola elevación o cima a partir de la cual la línea desciende en forma simétrica para tender a horizontalizarse 'en sus extremos, esta curva toma una forma acampanada y lleva el nom bre de curva normal o típica o curva de Gauss. CURVA DE GAUSS 23 http://booksmedicos.org http://booksmedicos.org CAPITULO IV PARAMETROS ESTADISTICOS srsssrsss http://booksmedicos.org ESTADISTICA MEDICA Parámetros de posición Algunos de los parámetros fundamentales tratan de fijar la posición del valor que pueda darse como representativo de los valores de los datos de la muestra. Son los llamados parámetros de posición, o también pro medios. Según sea el procedimiento que se siga para la elección de este pará metro, el promedio se denomina modo, mediana o media. Cuando el procedimiento es tomar el valor que se encuentra repetido un mayor número de veces, el que está de moda diríamos, el parámetro toma el nombre de modo. En la serie puede situarse en cualquier parte, a veces hacia la mitad, a Cuando en una muestra no hay valores repetidos, la misma carece de Cuando hay algunos pocos grupos de valores igualmente más repe tidos, cualquiera de ellos puede tomarse como modo; pero si son muchos los grupos de valores igualmente más repetidos, es dudoso el valor repre sentativo de cualquiera de éstos;y cuando todos los valores de la muestra están igualmente repetidos, nos encontramos con una situación similar a cuando ninguno de ellos está repetido, es decir, no podemos tomar nin guno de ellos, y por lo tanto la muestra carecería también de modo. Es dudoso igualmente el valor representativo de un modo situado hacia uno de los extremos de la serie, sobre todo si se encuentra aislado, es decir, sin la vecindad de otros valores repetidos. El modo es a veces el promedio elegido, por ejemplo, cuando interesa señalar la duración habitual de una enfermedad, pero en general es un promedio poco usado en medicina, porque no se lo puede obtener o por que su representatividad resulta poco convincente. Por ejemplo, si quisié ramos tener una idea de la edad promedio de los habitantes de una ciudad e hiciéramos un grupo con los que tienen de 1 a 5 años, otro con los de 6 a 10, otro con los de 11 a 15, etcétera, seguramente encontraríamos que el grupo más numeroso es el de 1 a 5 años, y si tomáramos el modo como promedio tendríamos que decir que la edad promedio de los habi tantes de esa ciudad es la de 1 a 5 años. Con toda seguridad esta contes tación no nos dejaría satisfechos, y recurriríamos a otro valor represen tativo para tener Uua i ‘'a satisfactoria de la edad promedio de los habitantes de dicha ci.'.dad. 26 http://booksmedicos.org http://booksmedicos.org Como la suma de los dalos se denomina tamaño de la muestia y la de las obseivaciones población, se puede decir que la media aritmética es igual al tamaño de la muestra dividida por la población de la misma. - 1 x - I = S x f m “ S f = ' ” 2 f La media aritmética cr el promedio más utilizado en medicina. Presen ta, sin embargo, algunos puntos débiles, de los cuales los mis importantes son: 1°) Frecuentemente no corresponde a ningún dato de la muestra. 2°) Puede pertenecer a un grupo poco numeroso. 3o) Se ve fuertemente in fluida por los datos extremes. Además de esta media aritmética ma, existen otras medias, menos geométrica mg y la armónica mh, Media geométrica número o cantidad, se multiplican los datos entre si y al producto se le extrae la raíz correspondiente a su número o cantidad. media geométrica = v^Xi X X, X X3 X . . . X„. Esta media se utiliza cuando se examinan hechos que siguen la ley del crecimiento, o sea cuando la serie estadística correspondiente se asemeja a una serie geométrica, por ejemplo 2, 4, 8, 16, 32, etcétera. Por ejemplo, supongamos que se haga el recuento de gérmenes de un cultivo y se encuentran 200.000 por cc. Dos días después un nuevo re cuento indica 400.000 por cc. Si quisiéramos calcular el recuento que se hubiera encontrado de haberlo hecho en el dia intermedio, la media arit mética nos diría que habríamos encontrado 300.000. Sin embargo, este el mismo el primer día que el segundo, cuando sabemos que en el según- Recurriendo a la media geométrica, en cambio, el resultado sería: m = j 200.000 X 400.000 = 282.843, lo cual satisface más, porque indica que el aumento del primer día habría sido 82.843 y el del segundo día 117.157, es decir 34.314 más que el primer día. http://booksmedicos.org PARAMETROS ESTADISTICOS Media armónica En esta media, en vez de dividir la sumatoria de los datos (£ x) por la población (n), dividimos la población por la sumatoria de la inversa o re cíproca de los datos: media armónica = —— Esta media se utiliza cuando se trata de datos que se expresan en unida des relativas, es decir, cuando se refieren a velocidades sobre espacios iguales, o consumos de volumen en tiempo ¡guales, etcétera. Por ejemplo, centímetros por hora, litros por minutos, etcétera. Así, si deseamos co nocer la velocidad media con que se propaga el edema producido por la picadura de una araña, podemos encontrar que el radio del área de la zo na edematosa alcanzó I cm en los primeros 15 minutos, es decir una velo cidad de 4 cm por hora. Pero luego observamos que para alcanzar el 2° cm el edema tardó 20 minutos. Entonces anotamos velocidad, de la segun da observación, 3 cm por hora. El 3° cm fue alcanzado 30 minutos des pués, lo que nos da para la tercera observación una velocidad de 2 cm por hora. Por fin, el 4° cm se alcanzó 60 minutos después, lo cual nos permi te registrar la cuarta observación con el dato de I cm por hora. Dispo nemos asi de cuatro observaciones en las que los datos se valoran en velocidades sobre espacios iguales, es decir, en unidades relativas. La velocidad media de la muestra, si recurriésemos a la media arit- 15 + 20 + 30 + 60 = 125 min :n 2 horas 5 minutos, lo que significa , . . . distancia velocidad = — -------- 29 http://booksmedicos.org http://booksmedicos.org Como hay datos cuyos valores son mayores que la media y otros que son menores, los primeros tendrán desvíos positivos (afectados con el sig no más), y los segundos, desvíos negativos (afectados con el signo menos). Como el valor de la media es igual al tamaño de la muestra dividido por la población, puede decirse, en términos generales y aproximadamen te, que el valor de la media es intermedio entre los valores del primero y del último término de la serie, e igualmente intermedio entre los del se gundo y del penúltimo, y entre los del tercero y del antepenúltimo, et cétera. Es decir, la distancia en magnitud del primer término a la media es igual a la distancia en magnitud de la media al último, y del segundo a la media que de la media al penúltimo, etcétera; y en términos exactos, que la suma de las distancias, en magnitud a la media, de los términos que la preceden, es igual a la suma de las distancias, en magnitud, de los térmi nos que la siguen. Nótese que decimos distancia, que del punto A al B es la misma que la del B al A, pero no decimos que las sumas de las diferencias sean igua les, porque no es lo mismo A menos B que B menos A. Como se sabe, la diferencia entre estas dos restas está en el signo que afecta al resultado, siendo la cantidad la misma. Parámetros de dispersión Se denominan parámetros de dispersión aquellos que tratan de fijar el valor de la dispersión (véase pág. 9) de los datos de una muestra. Entre éstos se cuentan la amplitud, el desvío medio o simple o aritmético, el desvío medio standard y el error standard. Amplitud Es la diferencia de valor entre eldato mayor y el menor de la mues tra, y también entre el último y el primer término de la serie. Se lo denomina también, a veces, intervalo de variación, o rango. Puede servir como medida de la extensión de la muestra, pero no nos da una idea exacta de la dispersión de los datos. Dos muestras pueden tener la misma amplitud, pero una con los datos concentrados en las pro ximidades de la media y la otra con los valores de los datos alejados de ella. Por tanto, es un parámetro poco usado. Desvio medio aritmético Es la media de las distancias, en valor, de los datos a la media. PARAMETROS ESTADISTICOS 31 http://booksmedicos.org Se lo calcula suprimiendo el signo que afecta a los desvíos, sumando* los después y dividiendo esa suma por su número o cantidad, o sea por la población de la muestra. Suele lomarse por los profanos en estadística como valor representa tivo de los desvíos. Pero esto no es correcto, porque no todos los desvíos son valores positivos. La mitad de ellos son negativos, y no es lo mismo un valor positivo que un negativo, es decir, no es posible ignorar o su primir el signo que afecta a un desvío. Además de esta dificultad doctrinaria para aceptar el desvio medio arit mético como representativo de los desvíos de los datos, existe la dificul tad práctica de ser un valor chico, por lo tanto tener una magnitud pe queña que lo hace inútil o poco útil en los cálculos estadísticos ulteriores en los que se necesita un valor representativo de los desvíos. Desvio medio standard ■Es un valor convencional que se da como representativo de los des víos. En él se obvia al parecer el inconveniente de que unos desvíos son positivos y otros negativos, elevando al cuadrado el valor de cada desvío, con lo cual todos los valores obtenidos son positivos. Luego se suman esos cuadrados y la suma se divide por la población; finalmente al cociente se le extrae la raíz cuadrada. El principal mérito del desvío medio standard es suministrar un valor cuya magnitud, mayor que la del desvío medio aritmético, lo hace útil para los cálculos ulteriores en los que se necesita un valor representativo Se lo simboliza generalmente por una “S” mayúscula subseguida de una "x" minúscula. Entonces: ■ = \ [ Es decir que el desvío medio standard es la raíz cuadrada de la media de los cuadrados de los desvíos simples. El valor así obtenido es suficientemente grande cuando se trata de muestras numerosas, con una población de 60 o más observaciones, o por lo menos de 30 o más, es decir de una muestra de Gauss; pero resulta todavía pequeño cuando la muestra es poco numerosa, o muestra de Gauss “Student". En este caso es necesario un valor todavía mayor, y tanto más cuanto 32 http://booksmedicos.org Se ha encontrado que este valor útil puede obtenerse multiplicando la cantidad subradical por el cociente "población sobre población menos uno”, es decir n-j y , factor conocido con el nombre de “Factor de co rrección de Bessel”, o sea Z (x - m)’ Este valor convencional se denomina "desvio medio standard de las muestras poco numerosas”. Ejemplo: Si tuviésemos la muestra: I, 3, 5. 7, 9, en la que la media es S y los desvíos —4, —2,0, +2. +4, el desvío medio aritmético sería: 4 + 24-2 + 4 12 el desvío medio standard: y el “desvio medio standard de una muestra poco numerosa”. ■ - * Al desvío medio standard se lo suele llamar de muchas maneras: des vío medio tipo, normal, convencional, cuadrático, etcétera. Posiblemente la manera más común de llamarlo es simplemente desvío standard. El desvío standard, aun siendo un promedio de desvíos, no deja de ser un parámetro de posición (de la posición del valor representativo de los desvíos), y por lo tanto puede ser el mismo para muestras de pobla ciones distintas. Es decir, el desvío standard no nos da una idea de la población de la muestra. Error standard Es el cociente del desvío standard dividido por la raíz cuadrada de la población. 33 http://booksmedicos.org http://booksmedicos.org PARAMETROS ESTADISTICOS Puede aceptarse que hay un 68% de probabilidad de que la media del universo se halle dentro de un error standard a derecha o izquierda de nuestra media y un 95% dentro de 2 Sm * nuestra media. Desvio relativo de la media Es el desvío standard (S») expresado en porciento de la media. Ejemplo: El parto de la primípara tiene una duración media de 14 horas con una desviación relativa de la media del 20%. ■ _ 20 _ 20 _ 20 X 14 _ 280 g m ~ íoom “ 100 _ 100 100 ~ ‘ * Esto significa que el desvio standard es igual a 2,8 horas, o, lo que es lo mismo, que en el 68% de los casos el parto de la primípara dura 14 hs. i 2,8 hs., y en el 95% 14 hs. ± 5,6 hs., o sea, entre 8 horas 24 minutos y 19 horas 36 minutos. Parámetros derivados Se denominan parámetros derivados a valores calculados indirecta mente a partir de los valores de los dalos. Los parámetros derivados son, e indican, relaciones entre otros pará metros y generalmente se expresan como cocientes. Modifican cuantitati vamente al parámetro principal o fundamental, del que derivan, pero no cualitativamente. Por eso suelen denominarse también parámetros sccun- Es la relación de la dispersión de los datos (expresada como suma de los cuadrados de los desvíos) con el número de observaciones, o sea con la población de la muestra. Se la denomina también dispersión o fluctua ción de los desvíos. Puede decirse también que es la media de los cuadrados de los des- Y también que es el cuadrado del desvío standard. 35 http://booksmedicos.org ESTADISTICA MEDICA . s i - (JH2Z )’, http://booksmedicos.org PARAMETROS ESTADISTICOS Se 16 denomina también desvío relativo. Significado El desvío reducido es el desvío simple expresado en unidades de des vío standard, o sea: el desvío reducido expresa cuántas veces 'el desvio de la observación es menor o mayor que el desvío medio standard de la El desvío reducido permite saber a qué distancia relativa de la media se encuentra la observación a que pertenece, y hacer comparaciones con las distancias a que se encuentran otras observaciones de la misma mues tra, o comparaciones con las distancias a la media de observaciones con igual desvío reducido de otras muestras, en caso de que ambas muestras tengan una normal distribución de frecuencia. El principal uso del desvío reducido es su aplicación al cálculo de la cantidad o porción de-observaciones con menores o con igual o mayores desvíos reducidos que nuestra observación existente en la muestra. Con ello se logra una base numérica al concepto de significación de la diferen cia del valor de una observación al valor de la media. En una distribución normal, las observaciones cuyos desvíos reducidos son menores que I. es decir cuyos desvíos simples son menores que el desvío standard, constituyen algo más del 68% del total de la muestra. Aquellas cuyos desvíos reducidos son menores de 2, es decir cuyos des víos simples valen menos que dos desvíos standard, suman algo más del 95% del total. Los que tienen uno menor de 3, es decir, cuyos desvíos simples valen menos que tres desvíos standard, constituyen algo más del 99,7% del total. Y los que tienen uno mayor de 3, es decir cuyos desvíos simples valen más que tres desvíos standard, constituyen algo menor del 99,7% del total. También podemos decir que las observaciones cuyos des víos reducidos valen 1 o más suman algo menos del 32% del total, aque llas cuyos desvíos reducidos valen 2 o más, consituyen algo menos del 5% del total y aquellas cuyos desvíos reducidos valen 3 o mis, suman algo menos del 0,3% del total. El desvio reducido es una parámetro de dispersión que califica a las Se denomina Probits al desvío reducido aumentado en 5 unidades. 37 http://booksmedicos.org La utilidad y razón de ser del Probils consiste en que evita trabajar con cantidades negativas, lo cual ocurre cuando se trabaja con D. R. co rrespondientes a datos cuyos valores son inferiores a los de la media.I£n el Probits el valor del D.R. se aumenta en S unidades porque en la práctica generalmente se trabaja con D.R. superiores a -S y sólo por excepción con D.R. menores de -5. Dispersión de la media Bs la relación entre la variancia (o sea. entre el cuadrado del desvío standard) y la población de la muestra. ESTADISTICA MEDICA También puede decirse que es el cuadrado del error standard, ya que ca „ - .-51 _ _ SL " i S T T n • Significado Como la variancia y el error standard, de los que deriva, y como su nombre lo indica, es un parámetro de dispersión, lo cual se ve claramente Promedio ponderado Bs la relación del tamaño total de varias muestras, con la población D. de la M. = Promedio ponderado = Zfprom. pare. X pobiac. pare.)Población total 38 http://booksmedicos.org Significado El promedio ponderado es la media de un conjunto de muestras de cada una de las cuales se conoce la media y la población. Error probable Es el error standard multiplicado por 2/3 (más exactamente, multipli cado por 0,67449). E. Prob. = 0,67449 S , ? y S„ - y ^ = - E1 error probable equivale aproximadamente a los 2/3 del error stan dard. Significado El error probable de una muestra indica que el 50% de las medias de las muestras similares a dicha muestra caerán dentro de los limites media ± 1 B.P. de dicha muestra. Se puede aceptar además que hay un 50% de probabilidades de que la media del universo caiga también dentro de dichos limites. Error relativo Es la relación entre la media y el error standard. Error relativo = ~ El error relativo es el cociente de la media dividido por el error stan- Se puede decir también que es la media expresada en unidades de errores standard y también que el error relativo muestra cuántas veces la media es mayor o menor que el error standard. Significado Si el error relativo es igual o superior a 2, es decir, si la media es igual o superior al doble del error standard, éste es suficientemente pequeño PARAMETROS ESTADISTICOS 39 http://booksmedicos.org como para aceptar que la media es fidedigna de pertenecer a una muestra de la muestra, o sea normalmente dispersos alrededor de la media; en cambio si el error relativo es inferior a 2, o sea si la media es inferior al doble del error standard, los datos se hallan anormalmente diseminados dentro de la muestra, esto es, excesivamente dispersos con relación a la media, lo cual probablemente ocurra porque algunos datos se hallen afec tados o influidos por factores extraños al resto de las observaciones de la génea. de una muestra no formada por observaciones similares. El error relativo es, por lo tanto, un parámetro de dispersión, pero al mismo tiempo es un parámetro que califica a la media en fidedigna o no. Es decir que la significación de la media está dada por el valor del E. R. (Véase capítulo X; Significación de la media). ESTADISTICA MEDICA 40 http://booksmedicos.org LA MUESTRA NORMAL NUMEROSA O MUESTRA NOR MAL DE GAUSS SEGUNDA PARTE El cálculo de sus parámetros http://booksmedicos.org http://booksmedicos.org CAPITULO V MEDIA, DESVIO STANDARD Y ERROR STANDARD Método fundamental Se habla de cálculo de parámetro por el método fundamental cuando se refiere a aquel que se basa directamente en las fótmuias que expresan simbólicamente el concepto del parámetro. Así, el cálculo fundamental de la media es aquel que hace uso directo de la fórmula conceptual. El del desvio standard el que hace uso direc Cálculo de la media, del desvío standard y del error standard El desarrollo de este tema vamos a hacerlo recurriendo a un ejemplo: Supongamos que se desea conocer el peso medio de los niños recién nacidos normales, pero además se desea conocer la dispersión de las ob 43 http://booksmedicos.org servaciones y la dispersión de las medias de muestras similares a la mués- Los .datos se hallan registrados en un conjunto de historias clínicas que hemos seleccionado a objeto de lograr una muestra lo más uniforme posible. Es decir hemos eliminado todas las sospechosas de pertenecer a casos de prematuros o de posmaduros, asi como las que presenten algún dato clínico u obstétrico anormal. El dato del peso, en las H.C1., está registrado en kilos y gramos, es decir en un guarismo de 4 cifras. Nosotros, para simplificar el cálculo, tomaremos solamente las dos primeras cifras, es decir la que expresa los kilos, y la primera cifra decimal. Al hacerlo así, tomamos conciencia de que nuestros datos corres ponden a la clase de los llamados continuos y que cuando decimos, por ejemplo, 3,2, decimos en realidad 3,2 o más. pero menos de 3,3. Estos datos se nos presentan en el conjunto de H. Cl. en forma de sordenada, es decir que después del valor consignado en una historia, encontramos que el de la siguiente puede ser menor, igual o mayor, indis- Nuestra tarea inmediata será, por lo tanto, ordenarlos y agruparlos por grupos de valores iguales, para lo cual hacemos uso del método de los palotes. Este consiste en tomar una hoja de papel, y en una primera co lumna, encabezada con una x minúscula, colocamos una serie de valores sucesivos, desde el que consideramos que ha de ser el menor, hasta el que pensamos que será el mayor. Si esto no se confirmara y encontráramos valores más pequeños o mayores que los esperados, no habrá inconveniente en agregarlos antes del primero o después del último. Esa primera columna estará por lo tanto formada provisionalmente, y quizá definitivamente, por los valores indi cados en el cuadro 7. A continuación leemos el dato en cada historia clínica y en la 2da. columna marcamos un palote en la línea del valor correspondiente. Así hemos obtenido la siguiente columna. Hecho esto, obtenemos los valores de una 3ra. columna, encabezada por una “f , sumando los palotes de cada línea. La suma de esta columna (£ f) es la población de la muestra. 2 f = 44 Por fin. organizamos una 4ta. columna encabezada x í multiplicando el valor del x por f. La suma de esta columna (2 x f) es el tamaño de la 44 http://booksmedicos.org MEDIA, DESVIO STANDARD Y ERROR STANDARD 2 * f = 146,9 = T Hemos hecho asi varias cosas: 1°) Hemos ordenado los dalos. 2°) Hemos agrupado los datos, obteniendo grupos ordenados. Cuadro 7 EJEMPLO DE AGRUPAMIENTO Y ORDENACION DE LOS DATOS: PALOTES Exf ■ tamaño tpeso total de todos los niños). http://booksmedicos.org 3”) Hemos obtenido la población de los grupos, es decir la frecuen cia, la que por estar ordenados de acuerdo a los datos, constituye una distribución de frecuencias. Vemos que en esta muestra la frecuencia se inicia con un valor mínii .c * aumenta progresivamente hasta un valor máximo, a partir del cual .isminuye también progresivamente, hasta vol ver a un valor mínimo, quedando el grupo de frecuencia máxima relati vamente equidistante de los grupos de frecuencia mínima. Esta distribu ción de frecuencia es, por lo tanto, una distribución casi normal. 4 ) Hemos obtenido la “población" y el "tamaño" de la muestra. Con este tratamiento previo de la muestra estamos ya en condiciones de calcular los parámetros media, desvío standard y error standard, por los métodos fundamentales. El más sencillo de todos es el cálculo de la media. La media es igual al tamaño de la muestra dividido por la población. Entonces tenemos: ESTADISTICA MEDICA El desvio standard es la raíz cuadrada de la media de los cuadrados de los desvíos. Debemos calcular por lo tanto los desvíos, elevarlos al cua drado y obtener su sumatoria. Esto exige la confección de una "planilla de operaciones". Esta se confecciona de la siguiente manera: En una primera columna, encabezada por una "x". se coloca el valor del dato o de los datos que integran cada grupo. Naturalmente, los grupos inexistentes no aparecen en la planilla. Ver cuadro 8. En una segunda columna, encabezada por una *T\ colocamos la po blación de cada grupo, o sea la frecuencia. Dijimos que la suma de esta columna es la población de la muestra.A continuación calculamos los desvíos de cada dato, es decir sus dis tancias a la media ya calculada y los colocamos en la línea correspondien te al dato, en una 3ra. columna encabezada por la expresión x - m. Ahora formamos una 4ta. columna, encabezada por la expresión (x - ni)3, formada por los cuadrados de estos desvíos. Luego formamos un Sta. columna, encabezada por la expresión f (x — m)z , formada por los productos de la frecuencia o población de los grapos multiplicada por el cuadrado de los desvíos, con lo cual se obtiene el tamaño de los grupos de les desvíos elevados al cuadrado. Su suma es el tamaño de los cuadrados de todos los desvíos y su media es la cantidad subradical del desvío standard. http://booksmedicos.org £ £ fi i £ £ £ £ £ £ £ £ £ £ £ £ £ C http://booksmedicos.org 3°) Que la dispersión de las medias es 0,06. (Si queremos, podemos expresarlos en gramos). Esto significa: 1°) que el peso medio de los recién nacidos de la muestra es 3,3 kg; 2o) que si bien es cierto que ese peso solo lo tienen algunos recién nacidos (y quizá ninguno) el peso del 68% de ellos está comprendido entre la media más un desvío standard y la media menos un desvio standard, es decir entre 2,9 y 3,7 kg; y 3°) que el 95% está com prendido entre la media más o menos 2 desvíos standard; es decir, entre 2,S y 4,1 kg, y significa además que si se examinan muchas muestras si milares a la muestra, es posible, igualmente, que sólo algunas medias, (o quizá ninguna) coincida con la muestra, pero que en el 68% de las mues tras la media se encontrará entre la nuestra menos un error standard y nuestra media más un error standard, es decir entre 3,24 y 3,36 kg, y en el 95% entre nuestra media más o menos 2 errores standard, es decir entre 3,18 y 3,42 kg. Así se obtienen la media, el desvío standard y el error standard por el método fundamental. Cuando se trata de muestras pequeñas, poco numerosas, no hay in conveniente en utilizar este método, pero cuando son muestras grandes y numerosas, este método puede resultar largo y fatigoso. En esos casos es preferible utilizar métodos simplificados basados en fórmulas derivadas de las fundamentales. Para comprender estas fórmulas y estos métodos es necesario conocer previamente algunas propiedades de la media y del desvío standard. Es lo que pasaremos ahora a estudiar. ESTADISTICA MEDICA http://booksmedicos.org CAPITULO VI PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD SUMARIO: Propiedades de la media y del desvio standard. Propiedad “A" de U media. Propiedad "B". Propiedad "A" del desvío standard. Propiedad El cálculo de los parámetros media, desvío standard, y variancia pue de hacerse, naturalmente, por el método fundamental, es decir utilizando directamente las fórmulas conceptuales de estos parámetros; pero a veces los cálculos realizados utilizando estas fórmulas resultan muy largos y laboriosos, especialmente cuando se trata de muestras numerosas y de gran tantalio. Por este motivo los estadísticos han buscado y obtenido métodos simplificados de cálculo que abrevian y aligeran extraordinaria mente esta tarea. Estos métodos simplificados utilizan fórmulas derivadas de las fundamentales, las cuales se basan en propiedades especiales de estos parámetros. Para comprender dichas fórmulas es por lo tanto indispensable cono- siguiente. Propiedad “A” de la media Si desplazamos el 0 de una serie y lo colocamos en un punto cual quiera 0', se modifican los valores de los términos y por lo tanto el de la http://booksmedicos.org ESTADISTICA Mi Coloquemos ahí segunda observación vos valores de los te Este es el valor de la media (m‘) de los nuevos datos (modificados por Vemos así que la nueva media es igual a la media real menos el valor de la escala en que se colocó 0*. Es decir: m' = m - va = 165 - 160 = 5 (1) De (1) se deduce: m = m' + v.a. (2) Es decir: la media real (m) es igual a la media de los nuevos valores sumada algebraicamente al valor arbitrario (v.a.) en el que se colocó el m = 5 + 160 = 165 http://booksmedicos.org PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD Importancia de la propiedad "A "de la media Cuando los valores de los dalos se expresan con números alejados de cero, como ocurre cuando se miden la estatura de la personas en cm, o las presiones arteriales en mm, o se trata de densidades de orina, etcétera, es mucho más cómodo, al hacer el cálculo de la media, transformar los valores de los datos en otros más chicos, colocando el 0' de la nueva es cala más cerca de los valores de la muestra, y hasta dentro de ella. De ese modo se transforman los valores primitivos en otros secunda rios. En estas condiciones, la media que se obtenga será también una media secundaria; pero será muy fácil transformar esta media secundaria en la media de la serie primitiva con sólo sumarla algebraicamente al valor frente al cual se colocó el 0' de la escala, al hacer la transformación de los valores primitivos en los secundarios. Ejemplos Se nos pide la estatura media de 4 personas cuyas tallas, se dan en cm, en la siguiente forma; La Ira. mide ISO cm, la 2da. 160; la 3ra. 170, y la 4a. 180 cm. De acuerdo con el procedimiento fundamental tendríamos que sumar esos 4 valores y la suma dividirla por 4. Asi 150 + 160 + 170 + 180 = 660 m = 660 •/. 4 = 165 La estatura media de esas cuatro personas es, pues, 165 cm. Pero nosotros, en vez de trabajar con números superiores a 100, po demos hacerlo con otros menores, transformando los valores originarios en otros más pequeños, con sólo tomar esos valores desde un punto situado más o menos lejos del 0 y más o menos cerca de la muestra, como, por ejemplo, desde 100 cm, o sea desde el metro. Entonces el problema planteado podría expresarse en la siguiente tüi ¿Cuál es la talla media de 4 personas, la la. de las cuales excede al metro en 50 cm; la 2a„ en 60; la 3a., en 70, y la 4a.. en 80 cm? Para resolver este problema tomamos como antes estos datos y los sumamos, pero *ahora sumamos números menores de 100, mientras que antes sumábamos números mayores de 100, y en ello consiste la simplifi cación del cálculo. 51 http://booksmedicos.org ESTADISTICA MEDICA La media de esos 4 valores derivados es: 50 + 60 + 70 + 80 = 260 m- = 260 •/. 4 - 6 5 La media de estos valores derivados es 65; pero nosotros necesitamos la media de los valores originarios y no la de los valores derivados. La solución, muy simple, consiste en agregar algebraicamente esa media derivada (65) al valor frente al cual se colocó el 0' de la escala al hacer la transformación de unos valores en otros, es decir a 100. La media de los valores originarios es, pues, m = 65 + 100 = 165 Es decir el mismo resultado que habíamos obtenido antes. Si en vez de colocar el 0‘ de nuestra regla sobre el 100 de la escala originaria, lo colocamos frente a cualquier otro valor, el resultado no cam bia. Por ejemplo, coloquemos el 0' frente al valor 120 de la escala origi naria: Esto equivaldría a plantear el problema de la siguiente manera: ¿Cuál es la estatura media de 4 personas, la la. de las cuales excede en 30 cm a los 120; la 2a., en 40; la 3a.. en 50, y la 4a„ en 60 cm: Como antes, sumaríamos esos 4 valores y la suma la dividiríamos por 4. Así: 30 + 40 + 50 + 60 = 180 m’ = 180 •/. 4 = 45 Ahora agregaríamos esta media secundaria o derivada al valor frente al cual pusimos el 0' de nuestra escala, es decir a 120, y el resultado será la media de los valores originarios. Esto es m = 45 + 120 = 165 Es decir: el mismo resultado que antes. También podríamos poner el 0‘ en uno de los datos de la muestra y tampoco cambiaría el resultado. Por ejemplo, podríamos colocarlo en el 1° de ellos, es decir en 150. Entonces el problema podría plantearse en esta forma: ¿Cuál es la talla media de 4 personas, la más baja de las cuales mide 150 cm; la siguiente, 10 cm más; la otra, 20 cm más, y la 4a., 30 cm más? http://booksmedicos.org Estasería la media derivada; la media verdadera, es decir la de los itos originarios, se obtiene sumando esa media derivada al valor frente al tal se puso el 0' de la escala al hacer la transformación de unos valores i otros, es decir a ISO. Y así: m = 15 + 150 = 165 Tenemos la misma media de antes. Tampoco cambiaría el resultado final si el 0’ de la escala lo pusiára- ios sobre cualquiera de los otros datos de la muestra, o hasta sobre un üor inexistente en la muestra, como podemos comprobarlo fácilmente. Coloquemos, por ejemplo, el 0' sobre el valor 155, inexistente en la Entonces el problema se plantearía así: ¿Cuál es la talla media de 4 personas, una de las cuales mide 5 cm icnos de 155 cm; otra, 5 cm más; otra. 15 cm más, y la otra, 25 cm Sumando algebraicamente esos valores, te Dividiendo la suma por 4, tenemos Esta es la media derivada. La media originaria o verdadera es igual a más 155. Entonces: 53 http://booksmedicos.org ESTADISTICA MEDICA Coloquemos ahora el 0' frente a otro valor de la muestra, por ejemplo frente al 2°, es decir frente a 160. Entonces el problema podría presen tarse como sigue: ¿Cuál es la talla media de 4 personas, la la. de las cua les mide 10 cm menos que la 2a.; ésta mide 160 cm; la 3a., 10 cm más que ésta, y la 4a., 20 cm mis que esta 2a.? Ahora los valores derivados serian -10; 0;+10;+ 20 La suma algebraica es: +20 La media derivada es: +5 La media verdadera es: +5 + 160 = 16S Es decir, la misma de siempre. Coloquemos, para verificar, el 0' sobre el 3er. valor, es decir sobre 170. Entonces los valores derivados son: - 20; - 10; 0; +10 La suma algebraica es -20. El cociente o media secundaría m‘ es:— = —5. La media verdadera es: m = -S + 170 = 170 - S = 165 Lo mismo de siempre. Coloquemos ahora, el 0- sobre el último valor de la muestra, es decir sobre 180. Entonces los valores derivados son: -30;-20;-10; 0 La suma algebraica es: -60 El córente m' es: -60 ■/. 4 = -15 La media verdadera m = -15 + 180 = 180 - 15 = 165 Lo de siempre. Pero también podemos colocar el 0' más allá de la muestra, por ejem plo en los 2 m, o sea en los 200 cm. Entonces el problema se presentaría como si fuese: 54 http://booksmedicos.org faltan SO cm para medir 2 m; a la 2a. Ic faltan 40; a la 3a„ 30, y a la 4a., 20 cm? Ahora los valores derivados son: -50; -40; -30 y - 20 La suma algebraica es -140 La media verdadera m es: -3S + 200 o sea: 200 - 35 = 165 Lo mismo de siempre. Es decir, en definitiva, que para comodidad en el cálculo de la media, para poder operar con números más pequeños, podemos seguir el proce dimiento de transformar los valores originarios en otros más chicos, colo cando el 0' de estos valores frente a un valor arbitrario cualquiera de la otra escala, por ejemplo frente a un valor próximo o interior a la muestra, recordando que la media asi obtenida será por lo pronto una media deri vada, secundaria o arbitraría, que podrá transformarse en la media ver dadera con sólo sumarla algebraicamente al valor arbitrario frente al cual se colocó el 0' de nuestra escala. Es decir, m = m’ + valor arbitrario, que es lo que dijimos al principio (2) Propiedad "B” de la media Si dividimos cada uno de los términos de una serie por un divisor común, obtenemos una nueva serie y, por lo tanto, una nueva media. Esta es igual a la media anterior dividida por el divisor común. De (3) se deduce: m = m- r (4) Es decir que: la media real (m) de los valores originarios es igual a la media de los nuevos valores (m-) multiplicada por el factor de reducción W- 55 http://booksmedicos.org ESTADISTICA MEDICA Ejemplo I http://booksmedicos.org PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD Esta es la inedia reducida de la serie reducida. Como vimos en (4), la media de la serie primitiva es igual al producto de esta media reducida por el factor de reducción. En el ejemplo dado Propiedad “A" del desvio standard Cuando una serie estadística se transforma en otra por haberse colo cado el 0' en un lugar distinto de 0, el valor de los desvíos no se modifica y, por lo tanto, el desvío medio standard de esta serie derivada es el mismo que el de la serie primitiva. S,. = Sx - V¡66 = 12,88 = V ¡66 = 12,88 57 http://booksmedicos.org ESTADISTICA MEDICA Propiedad “B" del desvío standard Cuando una serie estadística se transforma en otra por división de cada uno de sus términos por un divisor común (r), llamado también fac tor de reducción, el desvío standard de esa serie derivada es igual al des vio standard de la serie primitiva dividido por dicho factor de reducción. S8 http://booksmedicos.org PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD Como vimos en (6) Sx' = — S* = r S*’ Es decir que el desvio standard de la serie primitiva es igual al desvio standard de la' serie derivada multiplicado por el factor de reducción. En el ejemplo dado, S* = 5 X 2,58 = 12,88 Si se resta a todos los datos de una muestra un sustraendo común la si dichos datos son divididos por un divisor común, tanto la x como el Sx resultan divididos por dicho divisor. 59 http://booksmedicos.org http://booksmedicos.org CAPITULO VII La variancia, como se sabe, es la media de los cuadrados de los des- v„ . = z ( x ~ m)1 por lo cual se la denomina también desviación cuadrática media. la. observación Si al hacer el cálculo de la variancia, en vez de tomar las diferencias de los datos a la media se toman a un valor arbitrario (v. a.) distinto de ella, se obtiene un resultado mayor, independientemente que el valor arbi trario sea mayor o menor que la media. (Es decir que los cuadrados de las diferencias de los datos a la media (x - m)1, son cuadrados mínimos.) , Ejemplo 1 x m x - m (x - mí1 2 - 3 9 61 http://booksmedicos.org ESTADISTICA MEDICA E(* - v.a.)J = 36 (X - V.O.Í1 1 1 E(x - v.a.)» 36 £(x - v.».)1 ■ También aquí vemos que Como la media de la muestra la media del universo, la variancia real mayor que ia obtenida a parí variancia de la muestra subestima el valor de rencia es especialmente manifiesta en las mu cambio, en aquellas cuya población es de 30 las de 60 ó más, la diferencia resulta insignificante. 62 más, y especialmente er http://booksmedicos.org VARIANCIA Para compensar esta pequenez de las variancias de las muestras poco numerosas, o de Gosset "Student", que veremos más adelante, al resulta do obtenido al hacer el cálculo de la misma debe multiplicárselo por el cociente de la población dividida por la población menos uno, es decir por , factor conocido con el nombre de factor de corrección de Bessel, como vimos en la página 33, capitulo 4. En la medida en que la población de la muestra es mayor, el valor del factor de Bessel se aproxima a la unidad. Cuando la población es nume rosa, el valor de dicho factor es tan próximo a 1, que su aplicación prác ticamente no modifica el resultado y por lo tanto puede no ser utilizado. 3a. observación Si al hacer el cálculo de la variancia se toman las diferencias de los datos a un valor arbitrario distinto de la media, el resultado difiere de la variancia en el cuadrado de la diferencia entre la media y el valor arbitra- Así, en el ejemplo 1 de la I a. observación J ^ £ - V a , = 9 - 5 = 4 (m - v.a.)a = (S - 7)a = (-2)* = 4 Y en el ejemplo 2 de la misma observación. S (x — yj.)a _ yac — 9 _ 5 = 4 (m - v.a.)1 = (5 - 3)a = 2a = 4 Por consiguiente: Var _ Z (* ^v.a.) (m _ v a )i fórmula (1) 63 http://booksmedicos.org Es decir que cuando los desvíos de los datos se toman restando' de ellos un valor arbitrario (v.a.) distinto de la media (n)), la variancia real (var.) es igual al nuevo resultado menos el cuadrado de la diferencia de la 4a. observación Cuando el valor arbitrario hasta el que se toman las diferencias de los datos es 0, dichas diferencias son los propios datos, ya que cualquier número es igual a la diferencia entre él y 0, o sea cualquier número es igual a si mismo menos 0. Lomismo ocurre con la diferencia de este valor arbitrario 0, de la media. O sea Por lo tanto, de la fóimula (1) sacamos: Var. - — — - n? fórmula (2) Es decir que cuando los desvíos de los dalos se loman restando de ellos el valor cero, o sea cuando se loma como valor de los desvíos el valor de los propios datos, la variancia real (Var.) es igual a la media de los cuadrados de los datos menos el cuadrado de la media. Esta fórmula (2) puede adoptar la forma Var.= — — - (~ ~ ~ J fórmula (2 bis,) Y también ésta 64 http://booksmedicos.org E x 2 (Sx)J _ _120 400 _ 120 _ 100 _ 20 , Es decir, el mismo resultado < Sa. observación La fónnula 2 bis, Var.= - - (Ex)»/n E x» -T » /n fónnula (3) la fónnula (3) puede adoptar la forma Ex = mn = T la fónnula (4) puede tomar la forma Var = £ ~ m 2 * = S <*-"■ http://booksmedicos.org ESTADISTICA MI 1°) El cuadrado del tamaflo dividido por la población (fórmula 3). 2°) La media multiplicada por el tamaflo (fórmula 4). 3°) El cuadrado de la media multiplicada por la población (fórmula S* = 20 m = 5 y = 120 Í5 Ü 1 - — = ion '■x = S X 20 = 100 n = 25 X 4 = 100 Sx* - T*/n _ I r 1 - n i Estas son las fórmulas que generalmente se utilizan en la práctica. iás exacta es la primera (fórmula 3), porque no necesita calcular la ¡a, con lo cual se evita la imprecisión obligada de un parámetro ene que expresarse con un número limitado de decimales, como oci >n la segunda (4) y especialmente con la tercera (5), cuya inexactitud imenta al potenciarse la media. Cuando las muestras son de escasa población, 30 observaciones o s "n". Asf, en la pequefia muestra vista, la planilla y los cálculos son los - 4; Ix = T = 20; £xJ = 120 S*3 - Ta •/. n 120 - 400 •/. 3l? r http://booksmedicos.org 6a. observación Cuando los valores de los datos se dividen por un divisor común (r) la varianza de estos nuevos datos (var') es igual a la varianza de los datos originarios (var) dividida por el cuadrado del divisor común (r3) Var' = var ■/. r3 VARIANCIA = 53 — 25 Se'3 - T'3-/. n 120 - 400 /. 4 120 - 100 20 En el ejemplo dado: Var = 53 X 20 25 X 20 67 http://booksmedicos.org http://booksmedicos.org CAPITULO VIII SIMPLIFICACION DEL CALCULO DE LA MEDIA SUMARIO. Simplificación de los cálculos de la media. Variantes y simpli ficaciones en el cálculo del desvío standard. Verificación de los cálculos. Como es sabido, el cálculo de la media se hace fundamentalmente sumando todos y cada uno de los valores o datos de las observaciones de la muestra y dividiendo luego esta suma por la población, o sea por el número o cantidad de tales datos: Ex T ler. método de simplificación Cuando en una muestra hay datos repetidos, una primera simplifica ción de los cálculos consiste en agrupar esas observaciones repetidas y verificar cuánto suman. Esta suma se llama frecuencia de dicha observa ción repetida. Una vez hecho esto, en vez de sumar los datos de las observaciones originarias, teniendo en cuenta que la multiplicación es una suma abre viada, la simplificación consiste en multiplicar el valor del dato que se repite por la frecuencia con que lo hace. Después se suman estos resultados o productos y finalmente esta sumatoria se divide por la población. - Sx f Ejemplo En un problema donde se dan los datos del número de resfríos .te nidos en un aflo por cada una de las 641 personas que constituyen la http://booksmedicos.org muestra se pregunta cuál es el número medio de resfríos tenido por esas personas, o sea, cuál es la media de la muestra. De acuerdo con el método originario del cálculo de la media, habría que sumar el número de resfríos tenido por cada una de las personas, y dividir luego esta suma por el número dicho de personas, o sea por 641. Es evidente que este procedimiento resulta largo y engorroso. Mucho más simple, e igualmente exacto, es agrupar las personas que habían tenido el mismo número de resfríos y hacer su recuento, esto es, verificar cuánto suman. Luego multiplicar esta suma por el número de resfríos tenido por cada una de ellas. Hacer después la suma de esos productos y finalmente dividir la sumatoria por el número o cantidad de personas. En esta forma, una suma que iba a comprender 641 sumandos se transforma en otra con solo 10 sumandos. 2do. método de simplificación Cuando los valores de los datos se expresan con números alejados del cero, como ocurre cuando se miden las estaturas de las personas en cm, o las presiones arteriales en mm, o se trata de densidades de orina, etcétera, una manera de simplificar los cálculos es operar con números más peque ños, transformando los valores de los datos en otros más chicos, colocan do el 0’ de la escala más cerca de los valores de la muestra y aun dentro de ella. Naturalmente esto significa transformar los valores primitivos en otros secundarios, y en estas condiciones la media que se obtenga será también una media secundaria; pero, como hemos visto, será muy fácil transformar esta media secundaria en la media correcta, con sólo sumarla algebraica mente al valor frente al cual se colocó el 0' de la escala al hacer la trans formación de los valores primitivos en los secundarios. 3er. método de simplificación De acuerdo con la propiedad "B” de la media cuando los valores de una serie se dividen por un divisor común, la media (m'j de esta serie derivada es igual a la media (m) de la serie primitiva dividida por este divisor común. Esto permite un 3er. procedimiento de simplificación del cálculo de la media. La media de la serie primitiva se obtiene multiplicando esta media reducida (m') por el factor de reducción: m = m’ r. ESTADISTICA MEDICA 70 http://booksmedicos.org Ejemplo En el problema de la talla media de 4 personas que miden respecti vamente ISO, 160, 170 y 180 cm podemos transformar estos valores en otros menores y por lo tanto más manuables, dividiéndolos por un de nominador común, que puede ser 2, 5 6 10. Dividiéndolos por este último factor de reducción obtendremos los siguientes nuevos valores: 1S; 16; 17 y 18, los cuales son 10 veces más pequeños que los originales. Para obtener la media de estos nuevos valores procedemos, como siempre, primero a sumarlos y después a dividir la suma por el número o cantidad de ellos. 15 + 16 + 17 + 18 - 66 m’ = 66 ■/. 4 = 16,5 Esta es una media reducida (m’). La verdadera media (m) de la muestra original la obtendremos multi plicando esta media reducida por el factor de reducción (r). Así: 16,5 X 10 = 165 4to. método de simplificación A riesgo de cometer un pequeño error, el cálculo de la media puede también simplificarse agrupando los valores próximos dentro de un inter valo y considerando que las observaciones dentro de cada grupo son igua les al valor central de dicho intervalo. Es verdad que no todos, tal vez sólo algunos, o quizá ninguno de los valores reales coincidirá con el valor central, y que seguramente la mayo ría se distribuirá entre unos que valen menos y otros que valen más que dicho valor central. Pero precisamente ahí está la probabilidad de que las diferencias se neutralicen mutuamente y que el producto de la frecuencia por el valor central resulte igual o muy cercano a la suma de los valores individuales del grupo. Después se sigue como en el 1er. procedimiento de simplificación de los cálculos, multiplicando dicho valor central por el número de observa- cionê ydel grupo; a lo cual sigue la sumatoria de estos productos, y por fin la división de esta sumatoria por la población de la muestra. 71 http://booksmedicos.org ESTADISTICA MEDICA 3910 = 2 (v.C. X f) 72 http://booksmedicos.org SIMPLIFICACION DLL CALCULO DE LA MEDIA , _ S (v.C. - V.a.)f 95 m n 30 “ ' m = m' + v.a. = 3,2 + 127,5 = 130,7 r muy próximo al anterior (1303) y también ir i. . £ (v e. - v.a.) f También podríamos combinarlo con el 3er. procedimienlo, cuidando que los intervalos fueran iguales, como lo son en este ejemplo, dividiendo
Compartir