Vista previa del material en texto
ESTADISTICA 2.3. ORGANIZACIÓN DE DATOS DISTRIBUCIÓN DE FRECUENCIAS: La distribución de frecuencias o tabla de frecuencias es un método para organizar y resumir datos. Bajo este método los datos que componen una serie o grupo se clasifican y ordenan indicándose el número de veces a frecuencia con que se repite cada valor o variable. 2.3.1. DATOS AGRUPADOS EN FORMA SIMPLE FRECUENCIA ABSOLUTA: Es el número de veces que se repite el valor de la variable )( ix , la representamos por in . FRECUENCIA ABSOLUTA ACUMULADA: La frecuencia absoluta acumulada muestra las frecuencias acumuladas hasta determinada clase o grupo de observaciones, la representamos por iN . Se obtiene sumando sucesivamente las frecuencias o por la formula iii nNN 1 FRECUENCIA RELATIVA: La frecuencia relativa es aquella en que el número de observaciones relacionados con cada clase se convierte en frecuencia relativa al dividirlo por el número total de observaciones. n n h ii FRECUENCIA RELATIVA ACUMULADA: Muestra las frecuencias acumuladas relativas hasta determinada clase o grupo de observaciones, la representaremos por iH . Se obtiene sumando sucesivamente las frecuencias relativas o por la formula: iii hHH 1 FRECUENCIA PORCENTUAL: Es la frecuencia relativa correspondiente a cada clase multiplicada por 100 y representa el porcentaje total de los datos que está incluido en determinada clase. Se obtiene por: 100 n ni FRECUENCIA PORCENTUAL ACUMULADA: Es la frecuencia relativa acumulada multiplicada por 100, en cada clase y representa el porcentaje total de datos hasta determinada clase. Se obtiene por: 100 n Ni ó )100( iH ALGUNAS PROPIEDADES DE LAS FRECUENCIAS: a) La suma de las frecuencias absolutas es igual a n n i inn 1 b) La suma de las frecuencias relativa es igual a 1. n i ih 1 1 c) Las frecuencias absolutas son siempre valores enteros. d) Las frecuencias relativas son siempre valores fraccionarios. 10 ih e) El último valor de las frecuencias absolutas acumuladas es igual a n , nNm f) El último valor correspondiente a las frecuencias relativas acumuladas debe ser igual a 1, 1mH ELABORACIÓN DE LA TABLA DE FRECUENCIAS: Ejemplo: Suponga que en un hospital se encontraban 200 niños enfermos de gastroenteritis, se saco una muestra de 20 niños para determinar la edad de los niños. Se obtuvieron las siguientes edades de los niños (se consideraron años cumplidos): 3, 2, 0, 2, 3, 3, 1, 1, 0, 1, 3, 3, 4, 4, 3, 2, 4, 4, 2. Se ordena las edades de menor a mayor o de mayor a menor, se le anota la frecuencia con que se repite cada variable y después se calculan las demás frecuencias como se indicó: EDADES (AÑOS) ix FRECUENCIA ABSOLUTA (No. NIÑOS) in FRECUENCIA ABSOLUTA ACUMULADA iN FRECUENCIA RELATIVA ih FRECUENCIA RELATIVA ACUMULADA iH FRECUENCIA PORCENTUAL ih % FRECUENCIA PORCENTUAL ACUMULADA %iH 0 1 2 3 4 2 3 5 6 4 2 5 10 16 20 0.10 0.15 0.25 0.30 0.20 0.10 0.25 0.50 0.80 1.00 10 15 25 30 20 10 25 50 80 100 20n ----- 1.00 ----- 100 ---- PRESENTACIÓN GRÁFICA: A veces las tablas son demasiado amplias y complejas entonces para mayor claridad se hace la representación gráfica que dará mejor comprensión y análisis de los datos. Para esto graficamos los ejes coordenados (abcisa, ordenada) donde representamos las variables y frecuencias respectivamente; y después marcamos la frecuencia que corresponde a determinada variable. Nota: El diagrama de frecuencia relativa es similar al diagrama de frecuencia absoluta y el diagrama de frecuencia relativa acumulada es similar al diagrama de frecuencia absoluta acumulada. 2.3.3. DATOS AGRUPADOS EN INTERVALOS Cuando tenemos un conjunto de observaciones muy numeroso, las organizamos en arreglos o clases para tener una mejor comprensión y lograr una mayor síntesis. INTERVALOS DE CLASES: Son grupos de observaciones contiguas que no se traslapan o sea que cada valor en el conjunto de observaciones pueda colocarse en uno y solo uno de los intervalos. El número de intervalos de clase depende del juicio personal que se tenga de la información, del tipo de información, finalidad del estudio, necesidad de ejecutar comparaciones con otros estudios que obliguen a mantener un número de intervalos. El número de intervalos (S) se puede obtener por la formula: ns 10log3.31 y si da un número fraccionario se aproxima a la cifra inmediatamente superior, pero esta formula no es muy usada. a la cifra inmediatamente superior, pero esta formula no es muy usada. Se recomienda tomar de 5 a 15 intervalos, se debe tratar de no tomar demasiados, ya que no permite ver la concentración de la información y muy pocos intervalos resumen demasiado la información acarreando perdida de esta. A más intervalos los cálculos son mas precisos y viceversa. RANGO (RECORRIDO): Es el campo de variabilidad de las observaciones. Se consigue haciendo la diferencia entre el máximo valor de las observaciones y el mínimo valor. minmax ii XXR LIMITES DE CLASE: Son los dos números por los que está determinado el intervalo de clase, al primer número (izquierdo) se le llama Limite Inferior del Intervalo y al segundo número (derecho) se le llama Limite Superior del Intervalo. Podemos distinguir dos clases de límites: Reales o Verdaderos y Aparentes: Limites Reales o Verdaderos: Son aquellos que se obtienen al generar los intervalos de clase de los datos originales. Limites Aparentes: Son aquellos que utilizamos para evitar ambigüedades en la distribución de los datos originales a través de los intervalos de clase. Una de las formas para construir los límites aparentes es sumándole 0.1 ó 0.5 ó 1 a cada límite inferior de cada intervalo, pero teniendo la precaución de que no me quede por fuera ninguna información en el primer intervalo; también podría adoptarse por restarle 0.1, 0.5 ó 1 al límite superior de cada intervalo pero también teniendo la precaución de que no se quede alguna información por fuera en el último intervalo. Si al distribuir las frecuencias en los intervalos me resulta alguna información por fuera de los intervalos (o sean números comprendidos entre el límite superior de un intervalo y el límite inferior del intervalo siguiente) lo aproximo a la décima o digito más cercano y así lo ubico en el intervalo correspondiente. MARCA DE CLASE: (Punto Medio del Intervalo). La marca de clase es el punto medio del intervalo, representa todas las observaciones que están incluidas en el intervalo de clase. Una de las fórmulas para conseguir la marca de clase es: 2 limlim supinf iX AMPLITUD: La amplitud es la diferencia entre los dos límites del intervalo de clase. Se obtiene por la formula: .#Interv Rango S R a CÁLCULO DE LOS INTERVALOS DE CLASE: Para calcular los intervalos de clase se hace lo siguiente: 1.- Organizar la información (datos) de mayor a menor o de menor a mayor y determinar la menor observación y la menor. Colocar al frente de cada observación el número de veces o frecuencias con que se repite, para luego distribuirlas en los intervalos de clase (Dist. de frec. Simple). 2.- Calcular el Rango: minmax ii XXR 3.- Definir o calcular el # de intervalos: S 4.- Calcular la amplitud: S R a 5.- Si la amplitud no me da en número exacto, elegimos un número J que sea pequeño y positivo de modo que la amplitud nueva me resulte un número exacto: ExactoNùmeroS jR S Rampliado nuevaa 6.- Calculando el límite inferior del primer intervalo de clase que vendría a ser la observación más pequeña en el conjunto de observaciones, o el valor de esa observación menos la mitad del valor de j (para el caso en que la amplitud no me resulte en número exacto). Calculamos el límite superior del último intervalo de clase que será la máxima observación en el conjunto de datos ó el valor de esa observación más la mitad del valor de j (para el caso en que la amplitud me resulte un número exacto). 7.- Teniendo definido el límite inferior del primer intervalo de clase se procede a sumar la amplitud hasta que la última clase termine en el límite superior del último intervalo de clase hallado anteriormente. Para construir la tabla de frecuencias con la información agrupada en intervalos de clase, se procede de la misma forma como se hizo para la variable discreta. Ejemplo: En una muestra de 20 alumnos se determino su peso en kilos (para facilitar el trabajo redondeamos las cifras). 741 x 616 x 8211 x 5816 x 672 x 717 x 5512 x 7617 x 943 x 798 x 6513 x 5718 x 704 x 479 x 8814 x 7219 x 695 x 8510 x 5215 x 6620 x Organizar la información en 6 Intervalos de clase y construir la tabla de distribución de frecuencias. . 1) Organizamos la información de menor a mayor con sus respectivas frecuencias: ix in ix in 47 1 71 1 52 1 2 72 1 55 1 74 1 57 1 76 1 4 58 1 79 1 61 1 4 82 1 65 1 85 1 3 66 1 88 1 67 1 94 1 2 69 1 20n 70 1 5 47minix 94maxix 2) minmax ii XXR 4794R 47R 3) Definimos el número de intervalos: 6S 4) Calculamos la amplitud: 833.7 6 47 S R a 5) Como a es inexacto, tomamos 1j Calculamos: 8 6 48147 SS jR S Rampliado nuevaa 6) 5.465.0472.. min jxInfLim 5.945.0942. max jxSupLim 7) Procedemos a construir los intervalos y la tabla de distribución de frecuencias: INTERVALOS DE CLASE (PESOS KILOS) .. IL ------- ..SL FRECUENCIA ABSOLUTA in MARCA DE CLASE ix FRECUENCIA ABSOLUTA ACUMULADA iN FRECUENCIA RELATIVA ih FRECUENCIA RELATIVA ACUMULADA iH 46.5 ------ 54.5 54.5 ------ 62.5 62.5 ------ 70.5 70.5 ------ 78.5 78.5 ------ 86.5 86.5 ------ 94.5 2 4 5 4 3 2 50.5 58.5 66.5 74.5 82.5 90.5 2 6 11 15 18 20 0.10 0.20 0.25 0.20 0.15 0.10 0.10 0.30 0.55 0.75 0.90 1.00 20n ----- ----- 1.00 ----- RERESENTACIÓN GRÁFICA: Para la variable continua la representación gráfica de las frecuencias absolutas y relativas se hace mediante histogramas de frecuencias (para esto se utilizan los límites verdaderos o reales). HISTOGRAMA DE FRECUENCIA ABSOLUTA: Se grafican los ejes coordinados, donde ubicamos los intervalos y las frecuencias respectivamente y sobre el eje horizontal levantamos rectángulos o celdas de la misma amplitud hasta donde indica su respectiva frecuencia en el intervalo de clase. En forma similar se construyen los histogramas de frecuencias relativas. Una distribución de frecuencias puede representarse gráficamente en otra forma, por medio del Polígono de Frecuencias. Para trazar un polígono de frecuencias, se unen los puntos medios en las partes superiores de las celdas o rectángulos del histograma por medio de segmentos de rectas. El polígono se lleva hasta el eje horizontal en los extremos hasta los puntos que serian los untos medios si hubiera una celda adicional en cada extremo. También se puede trazar el polígono de frecuencias marcando los puntos medios o marca de clase en cada intervalo de clase, después sobre la marca de clase marcamos la respectiva frecuencia en cada intervalo, y seguidamente unimos los puntos sucesivos por líneas rectas., Para cerrar el polígono en los lados adicionamos una celda a cada lado de los intervalos, le calculamos su marca de clase a cada uno y unimos estos puntos medios con los extremos de líneas correspondientes a cada lado del polígono. El área total debajo del polígono de frecuencias es igual al área bajo el histograma. El histograma de frecuencias y el polígono de frecuencias sirven para comparar varias distribuciones de frecuencias. Pero cuando se van a comparar varias distribuciones que tienen los mismos límites es mejor superponer polígonos de frecuencias, que histogramas de frecuencias., (VER GRAFICA JUNTO CON EL HISTOGRAMA DE FRECUENCIAS). HISTOGRAMA DE FRECUENCIA ABSOLUTA ACUMULADA: Su gráfica es similar al histograma de frecuencia absoluta, con la diferencia en que aquí cada rectángulo o celda acumula a todas las frecuencias que le preceden hasta la clase donde se ubique. En forma similar se construyen los histogramas de frecuencias relativas acumuladas. La representación gráfica de las frecuencias absolutas acumuladas y relativas acumuladas también se hace a través de una ojiva ascendente. Para ello se determinan los puntos de intervalos entre los límites superiores de cada intervalo y su respectiva frecuencia y luego se unen sucesivamente esos puntos con trazos rectilíneos, empezando en el límite inferior del primer intervalo. Al suavizar el polígono de frecuencias (marcar una línea continua tratando de seguir la forma del polígono), obtenemos las curvas de frecuencias y la curva ojiva.