Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Carlos Vargas Pimentel Estadística General (EST-111) Tema II: Organización y presentación de datos agrupados II. Organización y presentación de datos agrupados Distribución de frecuencia Una distribución de frecuencias es una tabla utilizada para organizar datos. La columna de la izquierda (llamada clases o grupos) contiene todas las respuestas posibles sobre una variable estudiada. La columna de la derecha es una lista de las frecuencias o número de observaciones correspondientes a cada clase. Para decidir los intervalos de una distribución de frecuencias de datos numéricos es necesario responder a ciertas preguntas: ¿cuántos intervalos deben utilizarse? ¿De qué amplitud debe ser cada intervalo? II. Organización y presentación de datos Reglas para la construcción de una distribución de frecuencias 1. Número de intervalos El número de intervalos (clases) utilizados en una distribución de frecuencias se decide de una manera algo arbitraria. La práctica y la experiencia son la mejor guía. Los conjuntos de datos mayores requieren más intervalos; los conjuntos de datos menores requieren menos intervalos. Si seleccionamos excesivamente pocas clases, las pautas y algunas características de los datos pueden quedar ocultas. Si seleccionamos demasiadas clases, descubriremos que algunos intervalos no contienen ninguna observación o tienen una frecuencia muy pequeña. II. Organización y presentación de datos Reglas para la construcción de una distribución de frecuencias 1. Número de intervalos Guía rápida para decidir un número aproximado de intervalos de una distribución de frecuencias Tamaño de la muestra Número de intervalos Menos de 50 5-7 De 50 a 100 7-8 De 101 a 500 8-10 De 501 a 1.000 10-11 De 1.001 a 5.000 11-14 Más de 5.000 14-20 Otras formas de construir intervalos II. Organización y presentación de datos Reglas para la construcción de una distribución de frecuencias 2. Amplitud de los intervalos Después de elegir el número de intervalos, el paso siguiente es elegir la amplitud de los intervalos: 𝑤 = 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑙𝑜𝑠 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 𝑁ú𝑚𝑒𝑟𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑁ú𝑚𝑒𝑟𝑜 𝑚𝑒𝑛𝑜𝑟 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 La amplitud de los intervalos a menudo se redondea a un número entero para facilitar la interpretación. II. Organización y presentación de datos Reglas para la construcción de una distribución de frecuencias 3. Intervalos inclusivos y que no se solapen Los intervalos deben ser inclusivos y no solaparse, cada observación debe pertenecer a uno y sólo un intervalo. Los límites o extremos de cada clase deben estar claramente definidos. Dos distribuciones de frecuencias especiales son la distribución de frecuencias acumuladas y la distribución de frecuencias relativas acumuladas. II. Organización y presentación de datos Distribuciones de frecuencias relativas, acumuladas y relativas acumuladas Se obtiene una distribución de frecuencias relativas dividiendo cada frecuencia por el número de observaciones y multiplicando la proporción resultante por 100 por ciento. Una distribución de frecuencias acumuladas contiene el número total de observaciones cuyos valores son menores que el límite superior de cada intervalo. Se construye sumando las frecuencias de todos los intervalos de la distribución de frecuencias e incluyendo el presente intervalo. En una distribución de frecuencias relativas acumuladas, las frecuencias acumuladas pueden expresarse en proporciones o porcentajes acumulados. II. Organización y presentación de datos Representación gráfica de la distribución de frecuencia a. Histograma Un histograma es un gráfico formado por barras verticales construidas sobre una línea recta horizontal delimitada por los intervalos de la variable mostrada. Los intervalos corresponden a los de una tabla de distribución de frecuencias. La altura de cada barra es proporcional al número de observaciones que hay en ese intervalo. El número de observaciones puede indicarse encima de las barras. b. Ojiva Una ojiva, llamada a veces gráfico de frecuencias acumuladas, es una línea que conecta puntos que son el porcentaje acumulado de observaciones situadas por debajo del límite superior de cada intervalo en una distribución de frecuencias acumuladas. II. Organización y presentación de datos 0 5 10 15 20 25 30 35 230 240 250 260 270 280 290 300 F re c u e n c ia Minutos consumidos Uso del celular (histograma) 0% 20% 40% 60% 80% 100% 230 240 250 260 270 280 290 300 F re c u e n c ia Minutos consumidos Uso del celular (ojiva) II. Organización y presentación de datos Considere los datos siguientes: 22 67 69 60 60 33 56 69 68 68 64 18 61 51 51 17 59 64 54 54 19 61 66 56 52 12 54 59 25 25 II. Organización y presentación de datos 1. Construya una distribución de frecuencias. 2. Construya una distribución de frecuencias relativas. 3. Construya una distribución de frecuencias acumuladas. 4. Construya una distribución de frecuencias relativas acumuladas. 5. Represente gráficamente los resultados con un histograma y un grafico de ojiva.
Compartir