Logo Studenta

2) ESTADISTICA DISTRIBUCION DE FRECUENCIAS, GRAFICOS E INTERPRETACIONES

¡Estudia con miles de materiales!

Vista previa del material en texto

ESTADISTICA 
 
 
2.3. ORGANIZACIÓN DE DATOS 
 
DISTRIBUCIÓN DE FRECUENCIAS: La distribución de frecuencias o tabla de frecuencias es un 
método para organizar y resumir datos. Bajo este método los datos que componen una serie o grupo se 
clasifican y ordenan indicándose el número de veces a frecuencia con que se repite cada valor o variable. 
 
2.3.1. DATOS AGRUPADOS EN FORMA SIMPLE 
 
FRECUENCIA ABSOLUTA: Es el número de veces que se repite el valor de la variable )( ix , la 
representamos por in . 
 
FRECUENCIA ABSOLUTA ACUMULADA: La frecuencia absoluta acumulada muestra las 
frecuencias acumuladas hasta determinada clase o grupo de observaciones, la representamos por iN . Se 
obtiene sumando sucesivamente las frecuencias o por la formula 
iii nNN  1 
 
FRECUENCIA RELATIVA: La frecuencia relativa es aquella en que el número de observaciones 
relacionados con cada clase se convierte en frecuencia relativa al dividirlo por el número total de 
observaciones. 
 
n
n
h ii  
 
FRECUENCIA RELATIVA ACUMULADA: Muestra las frecuencias acumuladas relativas hasta 
determinada clase o grupo de observaciones, la representaremos por iH . Se obtiene sumando 
sucesivamente las frecuencias relativas o por la formula: 
iii hHH  1 
FRECUENCIA PORCENTUAL: Es la frecuencia relativa correspondiente a cada clase multiplicada 
por 100 y representa el porcentaje total de los datos que está incluido en determinada clase. Se obtiene 
por: 
100
n
ni
 
 
FRECUENCIA PORCENTUAL ACUMULADA: Es la frecuencia relativa acumulada multiplicada por 
100, en cada clase y representa el porcentaje total de datos hasta determinada clase. Se obtiene por: 
 
 100
n
Ni
 ó )100( iH 
 
 
ALGUNAS PROPIEDADES DE LAS FRECUENCIAS: 
 
a) La suma de las frecuencias absolutas es igual a n 
 



n
i
inn
1
 
 
 
b) La suma de las frecuencias relativa es igual a 1. 
 



n
i
ih
1
1 
 
c) Las frecuencias absolutas son siempre valores enteros. 
 
d) Las frecuencias relativas son siempre valores fraccionarios. 
 
10  ih 
 
e) El último valor de las frecuencias absolutas acumuladas es igual a n , nNm  
f) El último valor correspondiente a las frecuencias relativas acumuladas debe ser igual a 1, 
1mH 
 
ELABORACIÓN DE LA TABLA DE FRECUENCIAS: 
 
Ejemplo: Suponga que en un hospital se encontraban 200 niños enfermos de gastroenteritis, se saco una 
muestra de 20 niños para determinar la edad de los niños. 
 
Se obtuvieron las siguientes edades de los niños (se consideraron años cumplidos): 3, 2, 0, 2, 3, 3, 1, 1, 0, 
1, 3, 3, 4, 4, 3, 2, 4, 4, 2. 
 
Se ordena las edades de menor a mayor o de mayor a menor, se le anota la frecuencia con que se repite 
cada variable y después se calculan las demás frecuencias como se indicó: 
 
EDADES 
(AÑOS) 
ix 
FRECUENCIA 
ABSOLUTA 
(No. NIÑOS) 
in 
FRECUENCIA 
ABSOLUTA 
ACUMULADA 
iN 
FRECUENCIA 
RELATIVA 
ih 
FRECUENCIA 
RELATIVA 
ACUMULADA 
iH 
FRECUENCIA 
PORCENTUAL
ih % 
FRECUENCIA 
PORCENTUAL 
ACUMULADA 
%iH 
0 
1 
2 
3 
4 
2 
3 
5 
6 
4 
2 
5 
10 
16 
20 
0.10 
0.15 
0.25 
0.30 
0.20 
0.10 
0.25 
0.50 
0.80 
1.00 
10 
15 
25 
30 
20 
10 
25 
50 
80 
100 

 
20n ----- 1.00 ----- 100 ---- 
 
PRESENTACIÓN GRÁFICA: A veces las tablas son demasiado amplias y complejas entonces para 
mayor claridad se hace la representación gráfica que dará mejor comprensión y análisis de los datos. 
 
Para esto graficamos los ejes coordenados (abcisa, ordenada) donde representamos las variables y 
frecuencias respectivamente; y después marcamos la frecuencia que corresponde a determinada variable. 
 
 
 
 
 
 
 
 
 
Nota: El diagrama de frecuencia relativa es similar al diagrama de frecuencia absoluta y el diagrama de 
frecuencia relativa acumulada es similar al diagrama de frecuencia absoluta acumulada. 
 
 
2.3.3. DATOS AGRUPADOS EN INTERVALOS 
 
Cuando tenemos un conjunto de observaciones muy numeroso, las organizamos en arreglos o clases para 
tener una mejor comprensión y lograr una mayor síntesis. 
 
INTERVALOS DE CLASES: Son grupos de observaciones contiguas que no se traslapan o sea que 
cada valor en el conjunto de observaciones pueda colocarse en uno y solo uno de los intervalos. 
 
El número de intervalos de clase depende del juicio personal que se tenga de la información, del tipo de 
información, finalidad del estudio, necesidad de ejecutar comparaciones con otros estudios que obliguen a 
mantener un número de intervalos. 
 
El número de intervalos (S) se puede obtener por la formula: ns 10log3.31 y si da un número fraccionario se aproxima a la cifra inmediatamente superior, pero esta formula no es muy usada. 
a la cifra inmediatamente superior, pero esta formula no es muy usada. 
 
Se recomienda tomar de 5 a 15 intervalos, se debe tratar de no tomar demasiados, ya que no permite ver 
la concentración de la información y muy pocos intervalos resumen demasiado la información acarreando 
perdida de esta. A más intervalos los cálculos son mas precisos y viceversa. 
 
RANGO (RECORRIDO): Es el campo de variabilidad de las observaciones. Se consigue haciendo la 
diferencia entre el máximo valor de las observaciones y el mínimo valor. 
minmax ii XXR  
 
LIMITES DE CLASE: Son los dos números por los que está determinado el intervalo de clase, al primer 
número (izquierdo) se le llama Limite Inferior del Intervalo y al segundo número (derecho) se le llama 
Limite Superior del Intervalo. 
 
Podemos distinguir dos clases de límites: Reales o Verdaderos y Aparentes: 
 
 Limites Reales o Verdaderos: Son aquellos que se obtienen al generar los intervalos de clase 
de los datos originales. 
 
 Limites Aparentes: Son aquellos que utilizamos para evitar ambigüedades en la distribución de 
los datos originales a través de los intervalos de clase. Una de las formas para construir los 
límites aparentes es sumándole 0.1 ó 0.5 ó 1 a cada límite inferior de cada intervalo, pero 
teniendo la precaución de que no me quede por fuera ninguna información en el primer 
intervalo; también podría adoptarse por restarle 0.1, 0.5 ó 1 al límite superior de cada intervalo 
pero también teniendo la precaución de que no se quede alguna información por fuera en el 
último intervalo. 
 
Si al distribuir las frecuencias en los intervalos me resulta alguna información por fuera de los intervalos 
(o sean números comprendidos entre el límite superior de un intervalo y el límite inferior del intervalo 
siguiente) lo aproximo a la décima o digito más cercano y así lo ubico en el intervalo correspondiente. 
 
MARCA DE CLASE: (Punto Medio del Intervalo). La marca de clase es el punto medio del intervalo, 
representa todas las observaciones que están incluidas en el intervalo de clase. 
 
Una de las fórmulas para conseguir la marca de clase es: 
2
limlim supinf
iX 
 
AMPLITUD: La amplitud es la diferencia entre los dos límites del intervalo de clase. Se obtiene por la 
formula: 
 
.#Interv
Rango
S
R
a  
 
CÁLCULO DE LOS INTERVALOS DE CLASE: Para calcular los intervalos de clase se hace lo 
siguiente: 
 
1.- Organizar la información (datos) de mayor a menor o de menor a mayor y determinar la menor 
observación y la menor. 
 
Colocar al frente de cada observación el número de veces o frecuencias con que se repite, para luego 
distribuirlas en los intervalos de clase (Dist. de frec. Simple). 
 
2.- Calcular el Rango: minmax ii XXR  
 
3.- Definir o calcular el # de intervalos: S 
 
4.- Calcular la amplitud: 
S
R
a  
 
5.- Si la amplitud no me da en número exacto, elegimos un número J que sea pequeño y positivo de 
modo que la amplitud nueva me resulte un número exacto: 
 
 ExactoNùmeroS
jR
S
Rampliado
nuevaa 

 
 
6.- Calculando el límite inferior del primer intervalo de clase que vendría a ser la observación más 
pequeña en el conjunto de observaciones, o el valor de esa observación menos la mitad del valor de j 
(para el caso en que la amplitud no me resulte en número exacto). 
 
Calculamos el límite superior del último intervalo de clase que será la máxima observación en el conjunto 
de datos ó el valor de esa observación más la mitad del valor de j (para el caso en que la amplitud me 
resulte un número exacto). 
 
7.- Teniendo definido el límite inferior del primer intervalo de clase se procede a sumar la amplitud hasta 
que la última clase termine en el límite superior del último intervalo de clase hallado anteriormente. 
 
Para construir la tabla de frecuencias con la información agrupada en intervalos de clase, se procede de la 
misma forma como se hizo para la variable discreta. 
 
Ejemplo: En una muestra de 20 alumnos se determino su peso en kilos (para facilitar el trabajo 
redondeamos las cifras). 
 
741 x 616 x 8211 x 5816 x 
672 x 717 x 5512 x 7617 x 
943 x 798 x 6513 x 5718 x 
704 x 479 x 8814 x 7219 x 
695 x 8510 x 5215 x 6620 x 
 Organizar la información en 6 
 Intervalos de clase y construir 
 la tabla de distribución de 
 frecuencias. . 
 
 
1) Organizamos la información de menor a mayor con sus respectivas frecuencias: 
 
ix in ix in 
47 1 71 1 
52 1 2 72 1 
55 1 74 1 
57 1 76 1 4 
58 1 79 1 
61 1 4 82 1 
65 1 85 1 3 
66 1 88 1 
67 1 94 1 2 
69 1 20n 
70 1 5 
 
47minix 94maxix 
 
 
2) minmax ii XXR  
 4794R 
 47R 
 
3) Definimos el número de intervalos: 6S 
 
4) Calculamos la amplitud: 833.7
6
47

S
R
a 
 
 
5) Como a es inexacto, tomamos 1j 
 
Calculamos: 8
6
48147





SS
jR
S
Rampliado
nuevaa 
 
6) 5.465.0472.. min  jxInfLim 
 
 5.945.0942. max  jxSupLim 
 
 
7) Procedemos a construir los intervalos y la tabla de distribución de frecuencias: 
 
 
INTERVALOS DE 
CLASE 
(PESOS KILOS) 
.. IL ------- ..SL 
FRECUENCIA 
ABSOLUTA 
 in 
MARCA DE 
CLASE 
ix 
FRECUENCIA 
ABSOLUTA 
ACUMULADA 
iN 
FRECUENCIA 
RELATIVA 
ih 
FRECUENCIA 
RELATIVA 
ACUMULADA 
iH 
 
46.5 ------ 54.5 
54.5 ------ 62.5 
62.5 ------ 70.5 
70.5 ------ 78.5 
78.5 ------ 86.5 
86.5 ------ 94.5 
 
2 
4 
5 
4 
3 
2 
 
50.5 
58.5 
66.5 
74.5 
82.5 
90.5 
 
2 
6 
11 
15 
18 
20 
 
0.10 
0.20 
0.25 
0.20 
0.15 
0.10 
 
0.10 
0.30 
0.55 
0.75 
0.90 
1.00 
 20n ----- ----- 1.00 ----- 
 
 
RERESENTACIÓN GRÁFICA: Para la variable continua la representación gráfica de las frecuencias 
absolutas y relativas se hace mediante histogramas de frecuencias (para esto se utilizan los límites 
verdaderos o reales). 
 
HISTOGRAMA DE FRECUENCIA ABSOLUTA: Se grafican los ejes coordinados, donde ubicamos 
los intervalos y las frecuencias respectivamente y sobre el eje horizontal levantamos rectángulos o celdas 
de la misma amplitud hasta donde indica su respectiva frecuencia en el intervalo de clase. 
 
 
 
 
En forma similar se construyen los histogramas de frecuencias relativas. 
 
Una distribución de frecuencias puede representarse gráficamente en otra forma, por medio del Polígono 
de Frecuencias. Para trazar un polígono de frecuencias, se unen los puntos medios en las partes 
superiores de las celdas o rectángulos del histograma por medio de segmentos de rectas. 
 
El polígono se lleva hasta el eje horizontal en los extremos hasta los puntos que serian los untos medios si 
hubiera una celda adicional en cada extremo. 
 
También se puede trazar el polígono de frecuencias marcando los puntos medios o marca de clase en cada 
intervalo de clase, después sobre la marca de clase marcamos la respectiva frecuencia en cada intervalo, y 
seguidamente unimos los puntos sucesivos por líneas rectas., Para cerrar el polígono en los lados 
adicionamos una celda a cada lado de los intervalos, le calculamos su marca de clase a cada uno y unimos 
estos puntos medios con los extremos de líneas correspondientes a cada lado del polígono. 
 
El área total debajo del polígono de frecuencias es igual al área bajo el histograma. 
 
El histograma de frecuencias y el polígono de frecuencias sirven para comparar varias distribuciones de 
frecuencias. Pero cuando se van a comparar varias distribuciones que tienen los mismos límites es mejor 
superponer polígonos de frecuencias, que histogramas de frecuencias., (VER GRAFICA JUNTO CON 
EL HISTOGRAMA DE FRECUENCIAS). 
 
HISTOGRAMA DE FRECUENCIA ABSOLUTA ACUMULADA: Su gráfica es similar al 
histograma de frecuencia absoluta, con la diferencia en que aquí cada rectángulo o celda acumula a todas 
las frecuencias que le preceden hasta la clase donde se ubique. 
 
 
En forma similar se construyen los histogramas de frecuencias relativas acumuladas. 
 
La representación gráfica de las frecuencias absolutas acumuladas y relativas acumuladas también se hace 
a través de una ojiva ascendente. Para ello se determinan los puntos de intervalos entre los límites 
superiores de cada intervalo y su respectiva frecuencia y luego se unen sucesivamente esos puntos con 
trazos rectilíneos, empezando en el límite inferior del primer intervalo. 
 
Al suavizar el polígono de frecuencias (marcar una línea continua tratando de seguir la forma del 
polígono), obtenemos las curvas de frecuencias y la curva ojiva.