Logo Studenta

100bmedidas-de-posicic393n-y-dispersion

¡Este material tiene más páginas!

Vista previa del material en texto

1 
 
MEDIDAS DE POSICIÓN Y DISPERSIÓN 
HAMLET MATA MATA 
 
 
El análisis estadístico de una serie de datos se elabora mediante el cálculo de diferentes parámetros y / 
o estadísticos. Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin de 
calcular un número único, que represente o resuma todos los datos. Por lo general, las frecuencias de 
los intervalos centrales de una serie de datos son mayores que el resto, ese número se le denomina 
medida de posición. 
Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas, entre las que se 
encuentran los parámetros y los estadígrafos. Una medida de posición es un número que se escoge 
como orientación para hacer mención a un grupo de datos. 
Uno de los problemas fundamentales que presenta un análisis estadística, es el de buscar el valor más 
representativo de una serie de valores. El primer paso que hay que realizar para que se entienda una 
larga serie de valores u observaciones, es el de resumir los datos en una distribución de frecuencia; esto 
no es suficiente para fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en 
especial cuando se requiere comparar dos o más serie estadísticas. Es necesario continuar el proceso de 
reducción hasta sustituir todos los valores observados por uno solo que sea representativo, de tal forma 
que permita una interpretación global del fenómeno en estudio; para que ese valor sea representativo 
debe reflejar la tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie 
con estas características recibe el nombre de promedio, media o medida de posición, esto es debido a 
su ubicación en la zona central de la distribución. Las medidas de posición son de gran importancia en 
el resumen estadístico, ya que representan un gran número de valores individuales por uno solo. 
El valor más representativo de un conjunto de datos por lo general no es el valor más pequeño ni el más 
grande, es un número cuyo valor se encuentra en un punto intermedio de la serie de datos. Por lo tanto 
un promedio es con frecuencia un valor referido que representará la medida de posición de la serie de 
valores. Las medidas de posición se emplean con frecuencia como mecanismo para resumir un gran 
número de datos o cantidades con la finalidad de obtener un valor que sea representativo de la serie. 
Las Principales Medidas de Posición son: 
 
a) La Media Aritmética, b) La Mediana, c) La Moda, d) Los cuartiles, e) Los Deciles y f) Los 
Percentiles. 
 
CARACTERÍSTICAS DE LAS MEDIDAS DE POSICIÓN 
 
1. – Deben ser definidas rigurosamente y no ser susceptibles de diversas interpretaciones. 
 
2. – Deben depender de todas las observaciones de la serie, de lo contrario no seria una 
característica de la distribución. 
 
3. – No deben tener un carácter matemático demasiado abstracto. 
 
4. – Deben ser susceptibles de cálculo algebraico, rápido y fácil. 
 
SUMATORIA 
 
En esta unidad y en las siguientes se utilizaran sumas de muchos términos, por lo cual es necesario 
introducir una notación denominada sumatoria, para facilitar las sumas. La notación sumatoria implica 
el uso del símbolo, que no es otra cosa que la letra sigma mayúscula del alfabeto griego y que 
corresponde a la letra S de nuestro alfabeto. Siempre que se utilice el signo  se leerá “suma de o 
sumatoria de “. 
Según, Leithold sumatoria se define así: 
...........),.(.).1(.....).2(.).1(.).( nmyenter oss onnymdondenFnFmFmFmFF
n
mi
i 

 
 
 
 
 
 
 
 
 
 
2 
 
 
La ecuación de definición consiste de la suma de (n-m + 1) términos, donde el primer término se 
obtiene sustituyendo i por m en Fi, el segundo se obtiene remplazando i por (m+1) en Fi, y así 
sucesivamente, hasta alcanzar él ultimo término al sustituir i por n en Fi. En la ecuación de 
sumatoria la letra m se le denomina límite inferior de la sumatoria y n se le llama límite superior de la 
sumatoria. El símbolo i se le denomina índice de la sumatoria. Ejemplos: 
4321
4
1
XXXXX
i
i 

 . Observe que las notaciones colocadas arriba y abajo del signo 
sumatoria indican que solo deben ser sumados sucesivamente las primeras cuatro observaciones. 
También puede darse el siguiente caso: 
76543
7
3
XXXXXX
i
i 

. Se puede observar que las notaciones colocadas arriba y abajo del 
signo sumatoria indican que solo deben ser sumados sucesivamente desde la tercera hasta la séptima 
observación 
Generalmente, con el objeto de simplificar más aun las formulas que permiten utilizar el símbolo 
sigma, se pueden suprimir los subíndices, quedando el símbolo de sumatoria expresado de la siguiente 
manera:  X. Esto se puede hacer cuando no hay ambigüedad al referirse a los diferentes valores que 
toma la variable X. 
 
PROPIEDADES DE LA SUMATORIA 
 
1. – La sumatoria de la suma de dos o más términos, es igual a La suma de las sumatorias separadas 
de los términos. 
  


n
i
i
n
i
i
n
i
i
n
i
iii ZYXZYX
1111
. 
 
2. – L a sumatoria de la diferencia de dos o más términos, es igual a la diferencia de las sumatorias 
separadas de los términos. 
  .
1111



n
i
i
n
i
i
n
i
i
n
i
iii ZYXZYX 
 
3 – La sumatoria de una constante multiplicada por una variable, es igual a la constante multiplicada 
por la sumatoria de la variable. 
..............
11
cualquir acons tanteunaesKdondeXKXK
n
i
ii
n
i


 
4. – La sumatoria de una constante es igual a la constante multiplicada por el número de casos que 
indique el limite superior de la sumatoria. 
 ............,
1
cualquier acons tanteunaesKdondenKK
n
i


 
Cuando se trabaja con el término sumatoria es bueno recomendar lo siguiente: 
......,..
111
2
11
2 








n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i YXYXyXX Ejemplos: 
 1.- Resolver las siguientes sumatorias, tomando en cuenta que:  2,..1,..1 321
2  XXXXi 
 
2
3
1
3
1
2 )..,...)... 






 i
i
i
i XbXa , c) 
2
3
2
2 )1( 
i
iX 
 
a) .6411)2()1()1(
222
3
1
2 
i
iX 
 
b)     .4)2(211)2()1()1( 222
2
3
1







i
iX 
 
 
 
 
 
 
 
 
3 
 
c)     .29254)5()2(1)2(1)1()1( 2222222
3
2
2 
i
iX 
2. – Exprese las siguientes operaciones utilizando la notación sumatoria: a) X1+ X2 + X3 +X4. 
b) ....... 227
2
6
2
5 nXXXX  
Estos problemas se resuelven así: 

4
1
)......
i
iXa . b) 

n
i
iX
5
2
. 
MEDIA ARITMÉTICA 
 
La media aritmética ( X) o simplemente la media es el parámetro de posición de más importancia en 
las aplicaciones estadísticas. Se trata del valor medio de todos los valores que toma la variable 
estadística de una serie de datos. Por lo tanto, la medida posicional más utilizada en los estudios 
estadísticos viene a ser la media. Por su fácil cálculo e interpretación, es la medida de posición más 
conocida y más utilizada en los cálculos estadísticos. La media es el valor más representativo de la 
serie de valores, es el punto de equilibrio, es el centro de gravedad de la serie de datos. La media 
aritmética por lo general se le designa con X . 
La media aritmética de una serie de N valores de una variable X1, X2, X3; X4,.........Xn, es el cociente 
de dividir la sumatoria de todos los valores que toma la variable Xi, entre el número total de ellos. La 
formula se puede expresar así: 
N
X
X
n
1i
i
 . 
 Desviaciones o desvíos.- Son diferencias algebraicas entre cada valor de la serie o cada punto 
medio y la media aritmética de dicha serie, o un valor cualquiera tomado arbitrariamente. Los desvíos o 
desviación se designan con la letra di. 
Dado una serie de valores X1, X2, X3, .......Xn , se llama desvío a la diferencia entre un valor cualquiera 
Xide la serie y un valor indicado k de esa misma serie. Si el valor indicado k de la serie corresponde 
precisamente a la media aritmética de esos valores dados, se dice entonces que los desvíos son con 
respecto a la media aritmética. En símbolo: ).( XXd ii  
 
PROPIEDADES DE LA MEDIA ARITMÉTICA 
 
1. – La suma de las desviaciones con respecto a la media aritmética es igual a cero. .0 id 
2. – La suma de las desviaciones al cuadrado de los diversos valores con respecto a la media 
aritmética es menor que la suma de las desviaciones al cuadrado de los diversos valores con 
respecto a cualquier punto K, que no sea la media aritmética.  2 XXi   
2
 KXi . 
3. – La media aritmética total o conjunta de dos o más serie de datos, se puede calcular en función de 
las medias aritméticas parciales y del número de datos de cada una de ellas, mediante la siguiente 
formula: 
,.......
........
3
3
2
2
1
1332211
k
kkk
t
n
X
n
X
n
X
n
X
N
XnXnXnXn
X



 Donde: 
 ,......321 knnnnN  en esta n1, n2, n3 y nk es el número de datos de cada serie. 
Además, sonXyXXX k .,.....,.,.,....,. 3. ,21 las medias de cada una de las series. 
 
4 – La media del producto de una constante por una variable, es igual al producto de la constante por 
la media de la variable. 
 
.XK
N
XK
N
KX
X
ii


 
 
5 – La media de la suma de una constante más una variable, es igual a la media de la variable más la 
constante.  
 
.KX
n
K
n
X
n
KX
X
ii
KX i




 ., de la misma forma se cumple 
esta propiedad para la resta. 
 
 
 
 
 
 
 
4 
 
 
CARACTERÍSTICAS PRINCIPALES DE LA MEDIA ARITMÉTICA 
 
1. – El valor de la media depende de cada una de las medidas que forman la serie de datos, y se halla 
afectada excesivamente por los valores extremos de la serie de datos. 
 
2. – La media se calcula con facilidad y es única para cada caso y permite representar mediante un 
solo valor la posición de la serie de valores. 
 
3. – La media es una medida de posición que se calcula con todos los datos de la serie de valores y es 
susceptible de operaciones algebraicas. 
 
CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS 
 
Para calcular la media de datos no agrupados en clases se aplica la siguiente formula: 
N
X
X
i
 . En donde N es el número total de datos y iX son los valores de la variable. 
Ejemplo: 
1. – Calcule la media aritmética de los siguientes valores:  14.,.11.,9,.8,.7,.5iX 
.9
6
54
6
14119875
N
X
X
i




 Por lo tanto la media es 9. 
 
CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS 
 
Cuando se construye una distribución de frecuencia, los datos se agrupan en clases definidas por unos 
límites. Cuando se trabaja con la distribución de frecuencia se parte del supuesto de que todos los 
datos comprendidos en un intervalo de clase se distribuyen uniformemente a lo largo de este, entonces 
se puede tomar la marca de clase o punto medio ( X ) del intervalo como adecuada representación de 
los valores que conforman el mencionado intervalo. El punto medio se designa con la letra X . Para 
calcular la media en estas condiciones se pueden utilizar tres métodos: El método directo o largo y 
dos métodos abreviados. 
 
MÉTODO DIRECTO 
 
Este método se le conoce también como método largo; el mismo resulta demasiado engorroso cuando 
las magnitudes de los puntos medios o de las frecuencias de clase son muy grandes, debido a que los 
cálculos son demasiados extensos. Los pasos a seguir para calcular la media con este método son los 
siguientes: 
1. – Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos medios de cada 
clase y se colocan en sus respectivas columnas, se determinan las frecuencias de cada clase y se 
ubican en sus respectivas columnas. 
 
2. – Se multiplican los puntos medios de cada clase por sus respectivas frecuencias, luego se obtiene 
la sumatoria de las frecuencias (fi) multiplicadas por el punto medio ( X ) así: ii Xf  . 
3. – Luego se calcula la media aritmética aplicando la fórmula: 
 
NDonde
N
Xf
Nf
Xf
X
i
i
ii
.....







 es igual al número total de datos. Ejemplo: 
 
1.-Calcule la media de la siguiente distribución de frecuencia correspondiente al peso en Kg de un 
grupo de obreros. Realice los cálculos respectivos para completar el siguiente cuadro. 
 
 
 
 
 
 
 
 
 
 
 
5 
 
 
CLASES 
if 
75-------79 20 
80-------84 40 
85-------89 60 
90-------94 100 
95 ------99 140 
 
TOTAL 
 if N =360 
 
 
CLASES X if Xfi  
75-------79 77 20 1540 
80-------84 82 40 3280 
85-------89 87 60 5220 
90-------94 92 100 9200 
95 ------99 97 140 13580 
TOTAL  if N =360  ii Xf  32820 
 
Aplicando la formula se tiene: 
 
 .17.91
360
32820


N
Xf
X
ii

 
 
MÉTODOS ABREVIADOS 
 Los métodos abreviados para calcular la media son preferibles en la mayoría de los casos, 
especialmente cuando el número de clases de las distribuciones de frecuencias son grandes. Es un 
método fácil de aplicar. Existe un método abreviado que se utiliza para cualquier tipo de distribución 
de frecuencia sin importar si tiene o no intervalos constantes de clase y hay otro que se utiliza 
solamente cuando en la distribución el intervalo de clase es constante, en esta cátedra se analizará el 
primero. 
Si se selecciona un punto medio ( X ) de la distribución de frecuencia que sea diferente de la media 
aritmética de esa, entonces la suma algebraica de las desviaciones ( id ) con respecto al valor 
seleccionado será diferente de cero. Si la suma algebraica de las desviaciones es dividida por el número 
de datos totales (N) de la serie y el cociente resultante es sumado al valor seleccionado, el resultado 
final será igual al de la media aritmética de la serie. Este método permite ahorrar una considerable 
cantidad de tiempo cuando en una serie de valores el conjunto de datos es grande. La media 
seleccionada arbitrariamente o media imaginaria se le designará con la letra A y los desvíos di 
vendrán a ser la desviación de cada valor de la serie con respecto a la media imaginaria A. La formula 
para este caso será: 
 
 
N
df
AXo
N
AXf
AX
iiii 


 .......
)( 
 
La fracción 
N
df ii
 se le denomina factor de corrección, A es la media arbitraria o supuesta. 
 El factor de corrección, será positivo o negativo según que A sea menor o mayor que la media 
aritmética de la serie de valores. 
 
PASOS PARA APLICAR EL MÉTODO ABREVIADO 
 
1. – Se organizan los datos de la serie en clases con sus respectivas frecuencias (fi), los mismos se 
colocan en columnas con sus respectivos puntos medios (
iX
 ). 
1. – Se escoge un punto medio cualquiera de la distribución, el cual será una media imaginaria que se 
le denominara A, esta deberá ser lo más central posible para que los cálculos se hagan más fácil, 
se calculan los di de los puntos medios de la distribución con respecto a esa media imaginaria, 
aplicando la formula: )( AXd ii 
 , los mismo se colocan en su columna respectiva. 
 
6 
 
3 – Sé efectúan los productos ii df de cada clase y al final se calcula la sumatoria de estos 
productos aplicando la formula: iidf . 
4 – Finalmente se calcula la media aplicando la formula: 
N
df
AX
ii
 . 
 
1.-Dada la siguiente distribución de frecuencia, correspondiente al peso en Kg de un grupo de obreros, 
calcule la media aritmética, aplicando el método abreviado.Realice los cálculos respectivos para 
completar el siguiente cuadro. 
 
 En este caso se tomará como media arbitraria el punto medio, A =87.0. 
 
 
CLASES 
if 
75------79 20 
80------84 40 
85------89 60 
90------94 100 
95------99 140 
TOTAL N = 360 
 
 
CLASES 
iX
 if (  )AXi
 di ii df 
75------79 77 20 87 – 77 = - 10 - 200 
80------8482 40 87 – 82 = - 5 - 200 
85------89 87 60 87 – 87 = 0 0 
90------94 92 100 87 – 92 = 5 500 
95------99 97 140 87 – 97 = 10 1400 
TOTAL N = 360 1500 iidf 
 
Ahora se aplica la formula así: .17.91
360
1500
87 

N
df
AX
ii
 Como se puede observar la 
media obtenida es idéntica a la obtenida por el método largo. El estudiante puede realizar este 
problema utilizando cualquier punto medio de la distribución, se le deja como practica para que se 
ejercite con este método, siempre obtendrá el mismo resultado utilizando cualquiera media imaginaria 
diferente a la utilizada en la resolución de este problema. 
 
2 – Calcule la media aritmética de la siguiente distribución aplicando el método abreviado. Realice los 
cálculos respectivos para completar el siguiente cuadro. 
 
CLASES 
if 
50------54 5 
55-----59 10 
60-----64 20 
65-----69 40 
70-----74 100 
75-----79 38 
80-----84 22 
85-----89 9 
90-----94 6 
Totales N = 250 
 
Para calcular la media en este caso sé escogió como media imaginaria A = 72, por ser este el punto 
medio más céntrico de la serie, se pudo haber tomado otro punto medio diferente de este y el resultado 
hubiese sido el mismo. Ahora se aplica la formula: 
 
 
7 
 
CLASES 
iX
 if (  )AXi
 di ii df 
50------54 52 5 72 – 52 = - 20 - 100 
55-----59 57 10 72 – 57 = -15 - 150 
60-----64 62 20 72 – 62 = -10 - 200 
65-----69 67 40 72 – 67 = -5 - 200 
70-----74 72 100 72 – 72 = 0 0 
75-----79 77 38 72 – 77 = 5 190 
80-----84 82 22 72 – 82 = 10 220 
85-----89 87 9 72 – 87 = 15 135 
90-----94 92 6 72 – 92 = 20 120 
TOTALES N = 250 15 iidf . 
 
06.7206.072
250
15
72 

N
df
AX
ii
. El estudiante hará como ejercicio el cálculo de la 
media con los restantes puntos medios de la distribución de frecuencia. 
 
LA MEDIANA 
 
La mediana (Md) es una medida de posición que divide a la serie de valores en dos partes iguales, un 
cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que 
ella. Es por lo tanto, un parámetro que esta en el medio del ordenamiento o arreglo de los datos 
organizados, entonces, la mediana divide la distribución en una forma tal que a cada lado de la misma 
queda un número igual de datos. 
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los 
datos en una forma creciente o decreciente y luego se ubica la posición que esta ocupa en esa serie de 
datos; para ello hay que determinar si la serie de datos es par o impar. Si el número N de datos es 
impar, entonces la posición de la mediana se determina por la formula:
2
1N
p
M d

 , luego el número 
que se obtiene indica el lugar o posición que ocupa la mediana en la serie de valores, luego la mediana 
será el número que ocupe el lugar de lo posición encontrada. Para obtener la posición de la mediana en 
una serie de datos no agrupados, en donde el número N de datos es par, se aplica la formula 
2
N
PM d  El resultado obtenido, es la posición que ocupara la mediana, pero en este caso se ubica 
la posición de la mediana por ambos extremos de la serie de valores y los dos valores que se obtengan 
se le saca la media y esta será la mediana buscada, por lo tanto la mediana, en este caso, es un número 
que no se encuentra dentro de la serie de datos dados. Ejemplos: 
1– Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un grupo de trabajadores. 
Determine la mediana. Lo primero que se hace es ordenar los datos en forma creciente o decreciente; 
luego se aplica la formula 
2
1

N
PM d , para ubicar la posición de la mediana. Los datos ordenados 
quedaran así: 5, 6, 7, 8, 9, 10, 12. La posición .4
2
17


Mdp Esto indica que la mediana ocupa la 
posición 4 en la serie de valores y por lo tanto esa posición corresponde a los números 8 y 9 que en 
este caso ocupan la posición por la izquierda y por la derecha, por lo tanto la Md viene a ser la 
semisuma de ambas posiciones 







5.8
2
98
en este caso 8.5 es la mediana buscad, y esto es así, ya 
que el número 8.5 divide la serie de valores en dos partes iguales, una mitad que es mayor que la 
mediana y otra mitad que es menor que esta. 
Cuando los valores de los datos brutos de un conjunto de datos se agrupan en una distribución de 
frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida de una 
distribución de frecuencia de datos puede no ser la misma que la mediana obtenida de los datos sin 
arreglar en clases, pero el resultado será una aproximación. Cuando se obtiene la mediana para datos 
agrupados se utiliza el método de interpolación. La interpolación parte del supuesto de que los datos 
de cada intervalo de la distribución están igualmente distribuidos. 
 
PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS 
 
1. – Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases, se ubican las 
frecuencias fi y se calculan las frecuencias acumuladas Fa de esa distribución. 
 
8 
 
2. – Se determina la ubicación o posición de la mediana en el intervalo de la distribución de 
frecuencia, mediante la formula 
2
N
PM d  . El resultado obtenido determinará la clase donde se 
encuentra ubicada la mediana, lo cual se conseguirá en la clase donde la frecuencia acumulada Fa 
sea igual o superior a este resultado. Luego se aplica la formula: ,2 Ic
fm
Faa
N
LiMd













 en esta 
formula Md es la mediana, Li es el limite real inferior de la clase donde se encuentra ubicada la 
mediana, Faa es el valor de la frecuencia acumulada anterior a la clase donde se encuentra la 
mediana, fm es el valor de la frecuencia fi de la clase donde se encuentra la mediana, Ic es el valor o 
longitud del intervalo de clase y N es el número total de datos de la distribución en estudio. 
 
1.- Dada la siguiente distribución de frecuencia referida a las horas extras laboradas por un grupo 
de obreros. Calcule la mediana. Realice los cálculos respectivos para completar el siguiente cuadro. 
 
N° de horas Extras Obreros 
CLASES fi 
55------59 6 
60------64 20 
65------69 18 
70------74 50 
75------79 17 
80------84 16 
85------89 5 
TOTAL N = 132 
 
 
Cuadro con las frecuencias acumuladas: 
 
N° de horas Extras Obreros Obreros 
CLASES fi fa 
55------59 6 6 
60------64 20 26 
65------69 18 44 
70------74 50 94 
75------79 17 111 
80------84 16 127 
85------89 5 132 
TOTAL N = 132 
 
Ahora se aplica la formula: Ic
fm
Faa
N
LiMd













 2 
 N = 132, ,66
2
132
2
N
 luego la mediana se encuentra en la clase 70----74, por lo tanto el limite 
real inferior de esa clase es 69.5 = Li. La frecuencia fi de esa clase es 50 = fm , Faa = 44 y el 
 Ic = 5. Aplicando la formula se tiene: 
 
.70.712.25.695.
50
22
5.695
50
4466
5.69M d 










 
 
 
Luego la mediana de esa distribución es 71.70. Esto quiere decir que un 50 % de los obreros 
trabajaron horas extras por debajo de 71.70 horas y el otro 50 % trabajaron horas extras por 
encima de 71.70 horas. 
 
 
 
9 
 
CARACTERÍSTICAS DE LA MEDIANA 
 
* La mediana no es afectada por los valores extremos de una serie de valores, puesto que la misma no 
es calculada con todos los valores de la serie. 
 
* La mediana no esta definida algebraicamente, ya que para su cálculo no intervienen todos los valores 
de la serie. 
 
* La mediana en algunos casos no se puede calcular exactamente y esto ocurre cuando en una serie de 
valores para datos no agrupados el número de datos es par, en este caso la mediana se calcula 
aproximadamente. 
 
* La mediana se puede calcular en aquellas distribuciones de frecuencia de clases abierta, siempre y 
cuandolos elementos centrales puedan ser determinados. 
 
* La suma de los valores absolutos de las desviaciones de los datos individuales con respecto a la 
mediana siempre es mínima. 
 
LA MODA 
 
La moda es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia 
en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las 
medias de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por 
una simple observación de los datos en estudio, puesto que la moda es el dato que se observa con 
mayor frecuencia. La moda se designa con las letras Mo. 
 
En las representaciones gráficas la moda es el punto más alto de la gráfica. La obtención de la moda 
para datos agrupados no es un valor exacto, ya que varía con las diferentes formas de agrupar una 
distribución de frecuencia. 
 
En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados se presentan dos o 
más modas, en estos casa se habla de serie de datos bimodales o multimodales, según sea el caso. 
Estos tipos de distribuciones o series de valores se deben a la falta de homogeneidad de los datos. 
 
Cuando una serie de valores es simétrica, la media, la mediana y el modo coinciden, y si la asimetría 
de la serie es moderada, la mediana estará situada entre la media y el modo con una separación de un 
tercio entre ambas. Tomando en cuenta esta relación, cuando se tengan dos de esta medidas se puede 
determinar la tercera; sin embargo es conveniente utilizar esta relación para calcular solamente la moda 
ya que para calcular la media y la mediana existen formulas matemáticas que dan resultados más 
exactos; la formula matemática para calcular la moda por medio de la relación antes mencionada es: 
 MdXXMo  3 . 
 
Para calcular la moda en datos agrupados existen varios métodos; cada uno de los métodos puede dar 
un valor diferente de la moda: En este curso se dará un método el cual se puede considerar uno de los 
más precisos en el cálculo de esta. Es un método matemático que consiste en la interpolación 
mediante la siguiente formula: 
 
IcLiMo .
21
1








 , en donde Mo es la moda, Li es el limite real de la clase que presenta el 
mayor número de frecuencia; la clase que presenta el mayor número de frecuencias fi se le denomina 
clase modal y a las frecuencias de esa clases se les denomina frecuencia modal fm, 1 es la diferencia 
entre la frecuencia de la clase modal ( fm) y la frecuencia de la clase anterior a la modal, la cual se 
designa con fa , entonces, )(1 fafm ; 2 es la diferencia entre la frecuencia de la clase modal 
(fm) y la frecuencia de la clase siguiente a la modal, esta se designa con fs , entonces, 
).(2 fsfm 
 
1. – Dada la siguiente distribución de frecuencia correspondiente al peso en Kg de un grupo de 
trabajadores de una empresa, calcule la moda. 
 
 
 
 
 
10 
 
 CLASES fi 
30-----39 2 
40-----49 2 
50-----59 7 
60-----69 11 
70-----79 12 
80-----89 16 
90-----99 2 
TOTAL 52 
 
La clase modal es 80----89, entonces Li = 79.5 y su fm = 16, fa = 12 y fs = 2, 10Ic  , entonces: 
14216ff;..41216ff
sm21am1
 
Aplicando la formula se tiene: 
.71.8122.25.79
18
40
5.7910.
144
4
5.79MoLMo
21
1
i















 
Este resultado de la moda se interpreta así: La mayoría de los trabajadores tiene un peso 
aproximadamente de 81.71 Kg . 
 
 
CARACTERÍSTICAS DE LA MODA 
 
* El valor de la moda puede ser afectado grandemente por el método de elaboración de los intervalos 
de clases. 
 
* El valor de la moda no se halla afectado por la magnitud de los valores extremos de una serie de 
valores, como sucede en la media aritmética. 
 
* La moda se puede obtener en una forma aproximada muy fácilmente, puesto que la obtención exacta 
es algo complicado. 
 
* La moda tiene poca utilidad en una distribución de frecuencia que no posea suficientes datos 
 y que no ofrezcan una marcada tendencia central. 
 
* No es susceptible de operaciones algebraicas posteriores. 
 
* La moda se utiliza cuando se trabaja con escalas nominales aunque se puede utilizar con las otras 
escalas. 
 
* La moda es útil cuando se esta interesado en tener una idea aproximada de la mayor concentración 
de una serie de datos. 
 
OTRAS MEDIDAS POSICIÓNALES 
 
Cuando se estudio la mediana se pudo detectar que esta divide la serie de valores en dos partes iguales, 
una generalización de esta medida da origen a unas nuevas medidas de posición denominadas: 
 
Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posición surgen por la necesidad de 
requerir de otras medidas que expresen diferentes situaciones de orden, aparte de las señaladas por la 
mediana. Por lo tanto es interesante ubicar otras medidas que fraccionen una serie de datos en 
diferentes partes. Es bueno destacar que los cuarteles, los Deciles y los Percentiles son unas variantes 
de la mediana: De la misma forma los percentiles abarcan tanto a los cuarteles como a los Deciles. 
 
LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia en cuatro 
partes iguales. Se designa por el símbolo Qa en la que a corresponde a los valores 1, 2 y 3., que 
viene a ser el número de Qa que posee una distribución de frecuencia de clase. El Q1 divide la 
distribución de frecuencia en dos partes, una corresponde a 25 % que esta por debajo de Q1 y el otro 75 
% por encima de Q1. El Q2 divide la distribución de frecuencia en dos partes iguales, un 50 % que 
esta por debajo de los valores de Q2 y otro 50 % que esta por encima del valor de Q2. El Q2 es igual 
a la mediana. 
 
 
11 
 
CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad practica 
calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en una distribución de 
frecuencia existe un método por análisis gráfico y otro por determinación numérica, por fines prácticos 
en esta cátedra se utilizara él último método. Para calcular los cuartiles por el método numérico se 
procede de la siguiente manera: 
1 – Se localiza la posición del cuartil solicitado aplicando la formula de posición: 
4
aN
PQa  , en donde 
a viene a ser el número del cuartil solicitado, N corresponde al número total de datos de la 
distribución y 4 corresponde al número de cuartiles que presenta una distribución de frecuencia. 
 2 – Luego se aplica la formula para determinar un cuartil determinado, así: 
 
..4 Ic
fm
Faa
aN
LiQa













 En esta formula, Qa = El cuartil solicitado, en esta a corresponde al 
 
 
número del cuartil solicitado; Li = Limite real inferior de la clase donde se encuentra ubicado el 
cuartil; Faa = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil; fm = Frecuencia 
fi que posee el intervalo de clase donde se encuentra el cuartil; 
4
aN
PQa  = Posición que ocupa el 
cuartil en la distribución de frecuencia, este resultado obtenido determinará la clase donde se encuentra 
ubicado el cuartil, el mismo se encontrará en la clase donde la frecuencia acumulada Fa sea igual o 
superior a este resultado. 
 
DECILES. – Son medidas de posición que dividen la distribución de frecuencia en diez partes iguales 
y estas van desde el número uno hasta el número nueve. Los deciles se les designa con las letras Da, 
siendo a, el número de los diferentes deciles, que en este caso son nueve. El D2 es el punto debajo 
del cual se encuentran ubicados el 20 % de los valores de la distribución o también el punto por sobre 
el cual se encuentra el 80 % de los valores de la serie de datos. La mediana es igual al D5, puesto que 
este decil divide la distribución endos partes iguale tal como lo hace la mediana, de la misma forma el 
decil cinco es igual al cuartil dos. 
 
CÁLCULO DE LOS DECILES – El cálculo de los deciles es similar al cálculo de los cuartiles, 
solo que en estos varía la posición, la misma se calcula con la formula: 
10
aN
PDa  , en esta a corresponde al número del decil que se desea calcular, N equivale al número de 
datos de la distribución y 10 corresponde a las diez partes en la que se divide la serie de valores de la 
distribución. 
 La formula para su cálculo es: Ic
fm
Faa
aN
LiDa .
10













 . En este caso se aplica la formula de la 
misma manera que se hizo para calcular los cuartiles, solo que en esta formula varia la posición de 
ubicación de la clase donde se encuentra ubicado el decil. 
 
LOS PERCENTILES – Son medidas posicióneles que dividen la distribución de frecuencia en 100 
partes iguales. Con estos se puede calcular cualquier porcentaje de datos de la distribución de 
frecuencia. Los percentiles son las medidas más utilizadas para propósitos de ubicación de valor de una 
serie de datos ubicados en una distribución de frecuencia. El número de percentiles de una distribución 
de frecuencia es de 99. El percentil 50 es igual a la mediana, al decil 5 y al cuartil 2, es decir: 
%50.5052  PDQMd por encima y 50 % por de bajo de los datos de la distribución. 
El cálculo de los percentiles es similar al cálculo de los cuartiles y los deciles con una variante en la 
posición de ubicación de estos, que viene expresada por la siguiente formula: 
 
 
100
aN
PPa  . Con esta posición se aplica la formula: Ic
fm
Faa
aN
LiPa .
100













 . 
 
12 
 
1. – Dada la siguiente distribución correspondiente al salario semanal en dólares de un grupo de 
obreros de una empresa petrolera trasnacional. Calcule: a) Q1, b) Q2, c) Compare los resultados con 
la mediana D3, d) D5, e) P25, f) P50, g) P7 
 
SALARIO EN $ fi Fa 
200-----299 85 85 
300-----399 90 175 
400-----499 120 295 
500-----599 70 365 
600-----699 62 427 
700-----799 36 463 
Totales = N 463 
 
 
 
 a) Para calcular Q1, se determina primero la posición así: .75.115
4
463
4
4631
1 
x
PQ 
 PQ1 = 115.75. Con ese valor de la posición encontrado se busca en las frecuencias acumuladas para 
ver cual de esas contiene ese valor. Observando las frecuencias acumuladas se puede detectar que la 
posición 115.75 se encuentra en la clase 300------399, por lo tanto el Li = 299.5, 
 fm = 90, y la Faa = 85 y Ic = 100, aplicando la formula se tiene: 
 
.67.33317.345.299
90
3075
5.299100.
90
8575.115
5.2991 




 
Q 
 
Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan un salario semanal por 
debajo de 333.67 $ y el 75 % restante gana un salario por encima de 333.67 $. 
 b) Para calcular Q2=Md se determina primero la posición de este así. 5.231
4
4632
2 
x
PQ , ahora 
se ubica esta posición en las frecuencias acumulados para determinar la posición de Q2, se puede 
observar en la distribución que esta posición de Q2 esta ubicada en la clase 400----499, entonces, 
Li = 399.5, fm = 120, Faa = 175 y Ic = 100, aplicando la formula se tiene: 
 
.58.44608.475.399
120
5650
5.399100.
120
1755.231
5.3992 




 
Q 
 
Este resultado de Q2 establece que el 50 % de los obreros de este estudio, devengan un salario 
semanal por debajo de 446.58 $ y el otro 50 % devenga un sueldo por encima de 446.58 $. Calcule la 
mediana y compárela con este resultado. 
 c) Para determinar D3 = P30 hay primero que calcular la posición de este así: 9.138
10
4633
3 
x
PD , 
ahora se ubica esta posición en las frecuencias acumuladas para determinar la posición de D3, en la 
tabla de la distribución de frecuencia se observa que D3 se encuentra en la clase 300----399, luego, 
Li = 299.5, fm = 90, Faa = 85 y Ic = 100, aplicando la formula se tiene: 
 
39.35989.595.299100.
90
859.138
5.2993 




 
D . Esto indica que un 30 % de los obreros 
ganan un salario semanal por debajo de 359.39 $ y el 70 % restante devenga un sueldo por encima de 
359.39 $. 
d) Calcular, D5 = Q2 = P50, además P25 = Q1, la comprobación de estos resultados se le deja como 
practica al estudiante. 
g) Para calcular P70 lo primero que se hace es determinar la posición, 10.324
'100
46370
70 
x
PP . 
Ahora se ubica este resultado en la columna de frecuencias acumuladas para encontrar la posición de 
P70 en la distribución de frecuencia. Como se puede observar en la tabla de distribución de frecuencia, 
P70 se encuentra ubicado en la clase 500-------599, entonces, Li = 499.5, fm = 70, Faa = 295 y Ic 
= 100, aplicando la formula se tiene: 
 
 
13 
 
 .07.54157.415.499
70
2910
5.499100.
70
29510.324
5.49970 




 
P 
 
 Esto indica que el 70 % de los obreros devengan un sueldo semanal que esta por debajo de 541.07 $ y 
que el 30 % de los restantes obreros, ganan un salario por encima de 541.07 $. 
 
PORCENTAJES DE VALORES QUE ESTÁN POR DEBAJO O POR ENCIMA DE UN 
VALOR DETERMINADO 
 
Muchas veces necesitamos conocer el porcentaje de valores que están por debajo o por encima de un 
valor determinado; lo que representa un tipo de problema contrario al estudiado anteriormente, esto es, 
dado un cierto valor en el eje de abscisa (X) del plano cartesiano, determinar en la ordenada (Y) el 
tanto por ciento de valores inferiores y superiores al valor dado. Operación que se resuelve utilizando la 
siguiente fórmula matemática: 
 
 
NI
LPf
faap
c
ii 100(





 
 , donde: 
porcentajep que se quiere buscar. 
P Valor dado en el eje de las X (valor que se ubica en las clases). 
faa Frecuencia acumulada de la clase anterior a la clase donde se encuentra ubicado P. 
if Frecuencia de la clase donde se encuentra ubicada P. 
iL Limite inferior de la clase donde se encuentra ubicada P. 
cI Intervalo de clase. 
N = Número total de datos o total de frecuencias. 
 
 
EJEMPLO: Utilizando los datos de la distribución de frecuencia anterior, Determine que porcentaje 
de obreros ganan un salario semanal inferior a 450 $. 
 
Solución: 
Datos: 
?p 
P 450 
faa 175 
iL 400 
cI 100 
N = 463 
Ahora se aplica la formula: 
 
NI
LPf
faap
c
ii 100(





 
 , Sustituyendo valores se tiene: 
 
75.50
463
100
100
400450(120
175 




 
 pp 
 
De acuerdo con el resultado se puede afirmar que el 50.75 % de los obreros devengan un salario 
inferior a 450 $ y el 49.25 % de los obreros ganan un salario superior a 450 $. 
 
 
 
 
 
 
 
 
 
 
 
14 
 
MEDIDAS DE DISPERSIÓN 
HAMLET MATA MATA 
 
 Las medidas de posición central son los valores que de una manera condensada representan una 
serie de datos, pero realmente no son suficientes para caracterizar una distribución de frecuencia. Para 
describir una distribución de frecuencia o serie de datos es necesario, por lo menos otra medida que 
indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las medidas de posición 
central. Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se 
alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varían 
esos valores con respecto al promedio de una distribución de frecuencia. 
 
La dispersión o variabilidad se entiende como el hecho de que los valores de una serie difieran uno 
de otro, es decir, como se están dispersando o distribuyendo en la distribución. De acuerdo con esto es 
necesario encontrar una medida que indique hasta que punto los valores de una variable están dispersosen relación con el valor típico. Las medidas de variabilidad son números que expresan la forma en que 
los valores de una serie de datos cambian alrededor de una medida de posición central la cual por lo 
general es la media aritmética. 
 
La dispersión puede ser mayor o menor, tomando en cuenta esas diferencias. La variabilidad es la 
esencia de la estadística, puesto que las variables y atributos se caracterizan siempre por diferencias de 
valores entre observaciones individuales. Casi siempre en una distribución de frecuencia el promedio 
obtenido difiere de los datos de la serie; por esto es importante determinar el grado de variación o 
dispersión de los datos de una serie de valores con respecto al promedio. Las medidas de dispersión se 
clasifican en dos grandes grupos: a).- Las Medidas de Dispersión Absolutas y las Relativas; las 
Relativas, vienen expresadas en las mismas medidas que se identifican la serie de datos, las mismas 
son: 1).- El Recorrido, 2) La Desviación cuartilica, 3) La Desviación Semicuartilica, 4) La desviación 
Media, 5) La Desviación Típica o Estándar 6) La varianza. 
 
Las Medidas de Dispersión relativa. Son relaciones entre medidas de dispersión absolutas y medidas de 
tendencia central multiplicadas por 100, por lo tanto vienen expresadas en porcentaje, su función es la 
de encontrar entre varias distribuciones la dispersión existente entre ellas. La medida de dispersión 
relativa de mayor importancia es el Coeficiente de Variación. 
 
Se llama Variación o Dispersión de los datos, el grado en que los valores de una distribución o serie 
numérica tiende a acercarse o alejarse alrededor de un promedio. Cuando la dispersión es baja indica 
que la serie de valores es relativamente homogénea mientras que una variabilidad alta indica una serie 
de valores heterogénea. 
 
Cuando los valores observados de una serie están muy concentrados alrededor del promedio, se dice 
que ese promedio es o será muy representativo; pero si están muy dispersos con relación al promedio, 
es decir muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la 
serie o distribución, puesto que no representan adecuadamente los datos individuales de esa 
distribución. Es importante obtener una medida que indique hasta qué punto las observaciones de una 
serie de valores están variando en relación con el valor típico de la serie. 
 
RANGO O RECORRIDO(R) -. Es la primera medida de dispersión, no esta relacionada con ningún 
promedio en particular, ya que este se relaciona con los datos mismos, puesto que su cálculo se 
determina restándole al dato mayor de una serie el dato menor de la misma, más una unidad de medida 
(UM). El rango es el número de variables diferentes que posee una serie de valores. Su formula se 
calcula así: 
 
Rango(R) = Dato mayor (XM)Dato Menor (Xm) + Una unidad de medida (1UM): 
R = XM  Xm + 1 UM. El rango es la medida de dispersión más sencilla e inexacta dentro de las 
medidas de dispersión absoluta. Esta medida tiene bastante uso en el control de calidad de los 
productos manufacturados. 
 
DESVIACIÓN ÍNTERCUARTILICA (DC). - La desviación íntercuartilica es la diferencia que 
existe entre el cuartil tres(Q3) y el cuartil uno(Q1) de una distribución de frecuencia y se expresa así: 
DC = Q3  Q1. 
 
DESVIACIÓN SEMI-ÍNTERCUARTILICA (DSC). - La desviación semi-íntercuartilica es la 
diferencia entre el Q3 y el Q1 dividido entre dos: 
 
 
15 
 
 
2
13 QQDSC

 . 
 
Si los valores de la DC o DSC son pequeños indica una alta concentración de los datos de la 
distribución en los valores centrales de la serie de datos. Estas medidas se utilizan para comparar los 
grados de variación de los valores centrales en diferentes distribuciones de frecuencias. Los mismos no 
son afectados por los valores extremos, no se adaptan a la manipulación algebraica, por tal motivo son 
de poco utilidad. 
 
 
DESVIACIÓN MEDIA.- La desviación media de un conjunto de N observaciones x1, x2, 
x3,.............xn, es el promedio de los valores absolutos de las desviaciones (di) con respecto a la media 
aritmética o la mediana. Si se denomina como DM a la desviación media, entonces su formula 
matemática será la siguiente: 
 
Esta formula es para datos no agrupados. Se toma el valor absoluto en la ecuación, debido a que la 
primera propiedad de la media aritmética establece que los desvíos (di) de una serie con respecto a la 
media aritmética siempre son iguales a cero, es decir: di = 0. 
 
Cuando los datos están en una distribución de clases o agrupados se aplica la siguiente formula: 
 
En esta formula X es el punto medio de cada clase y fi es la frecuencia de cada clase. La 
Desviación Media a pesar de que para su cálculo se toman todas las observaciones de la serie, por el 
motivo de no tomar en cuenta los signos de las desviaciones (di), es de difícil manejo algebraico. Su 
utilización en estadística es muy reducida o casi nula, su importancia es meramente histórica, ya que 
de esta formula es la que da origen a la desviación típica o estándar. 
 
DESVIACIÓN TÍPICA O ESTÁNDAR 
 
Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que 
para su cálculo se utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y 
además, se toman en cuenta los signos de esos desvíos. Se le designa con la letra castellana S cuando 
se trabaja con una muestra y con la letra griega minúscula  (Sigma) cuando se trabaja con una 
población. Es importante destacar que cuando se hace referencia a la población él número de datos se 
expresa con N y cuando se refiere a la muestra él número de datos se expresa con n. La desviación 
típica se define como: 
 
“La raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos de las 
observaciones con respecto a su media aritmética”. La desviación típica es una forma refinada de la 
desviación media”. 
 
Características de la Desviación Típica: 
 
* La desviación típica se calcula con cada uno de los valores de una serie de datos. 
 
* La desviación típica se calcula con respecto a la media aritmética de las observaciones de una serie de 
datos, y mide la variación alrededor de la media. 
 
* La desviación típica es susceptible de operaciones algebraicas, puesto que para su cálculo se 
utilizan los signos positivos y negativos de los desvíos de todas las observaciones de una serie de 
valores, por lo tanto es una medida completamente matemática. 
 
* Es una medida de bastante precisión, que se encarga de medir el promedio de la dispersión de las 
observaciones de una muestra estadística. Las influencias de las fluctuaciones del azar, al momento de 
N
d
N
XX
DM
N
i
i
N
i
i 
 

 11
N
df
N
fXX
DM
N
1i
ii
N
1i
ii 
 



 
16 
 
seleccionar la muestra la afectan muy poco. Le da gran significación a la media aritmética de la serie de 
valores. 
 
* Es siempre una cantidad positiva. 
 
 
INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA 
 
La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación 
de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la 
dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, 
menor desviación típica. 
 
Su mayor utilidad se presenta en una distribución normal, ya que en dicha distribución en el intervalo 
determinado por X se encuentra el 68. 27% de los datos de la serie; en el intervalo determinado 
por la 2X se encuentra el 95,45% de los datos y entre la 3X se encuentra la casi totalidad de 
los datos, es decir, el 99,73% de los datos; además, existe una regla general de gran utilidad para la 
comprobación de los cálculos que dice: “una oscilaciónigual a seis veces la  , centrada en la media 
comprende aproximadamente el 99% de los datos”. Ver gráfica. 
 
95,45%
99,73%
34,14% 34,14%13,59
%
13,59% 2,14%2,14%
Media
68,27%
 
 
A la zona limitada por la X conoce bajo el nombre de zona normal, ya que se considera a los 
datos que caen dentro de esa zona, datos normales en relación con el grupo estudiado; los datos que 
estén por encima o por debajo de dicho intervalo se consideran supranormales e infranormales. 
 
Una regla empírica indica que en cualquier distribución normal las probabilidades delimitadas entre 1 
desviación típica, 2 desviaciones típicas y 3 desviaciones típicas son el 68%, 95% y 99% 
respectivamente. Ver las graficas siguientes. 
 
 
 
 
 
17 
 
 
 
 
 
Cálculo de la Desviación Típica.- La desviación típica para calcularla se procede de dos formas: A).- 
Para datos no agrupados en clases, B). - Para datos agrupados en clases. 
 
A). - Para datos no Agrupados.- Las formulas para determinar la desviación típica de una S y de 
una  son: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
11
)(
..1
22






n
d
n
XX
S
ii
)1(
)(
1
)(
..3
22
2
2






 

nn
XXN
n
n
X
X
S
ii
i
i
22 )(..2 XXd ii 
 
18 
 
 
Es importante recordar que cuando se trabaja con la formula para datos no agrupados y se trata de una 
muestra se utilizará como denominador n1, para corregir el sesgo, pero si en la muestra n  50 
,entonces se utilizará n, simplemente. 
 
Para caular la desviacián tipica de una poblacián para datos no agrupados, se utilizan las siguientes 
formulas: 
 
 
 
 
Método para calcular la Desviación Típica en datos no agrupados: 
 
* Se calcula la media aritmética. 
 
* Se calculan los desvíos (di) de la serie de valores Xi, con respecto a la media aritmética. 
 
* Se elevan al cuadrado cada una de las desviaciones (di)
2 
, y se determina la sumatoria de esos.
 
De la 
misma forma se elevan al cuadrado cada uno de los Xi y se calcula la sumatoria de estos; de igual 
manera se calcula la sumatoria de los Xi y se elevan al cuadrado. Despues de hacer todos estos cálculos 
se elabora un cuadro estadístico con estos cálculos. 
 
* Finalmente se aplica la formula de la desviación típica para datos no agrupados de la muestra o de la 
población, según el caso. 
 
Ej.1 – Los siguientes valores corresponden a la edad de ñiños de una muestra tomada de una 
población: Xi = 3, 4, 5, 6, 7. Determine la desviación típica. 
 
 
 
 Xi ii d)XX(  
2
i
d 
3 3 – 5 = - 2 4 
4 4 – 5 = - 1 1 
5 5 – 5 = 0 0 
6 6 – 5 = 1 1 
7 7 – 5 = 2 4 
 
25X
i

 
0d
i
 
 
 10d i  
 
 
 
 
 
N
d
N
XX ii 



22)(
..4 
2
222
..5 X
N
X
N
X
N
X iii












5
5
25


n
X
X
i
 
19 
 
Este problema se resolverá utilizando la media aritmética y sin utilizar la media, para ello se 
 
utilizarán las formulas 1 y 3. 
 
 
Interpretación.- El resultado obtenido con las formulas 1 y 3 indican que en promedio, las edades de 
los ñiños de esa muestra se desvian o varian con respecto a la media aritméticaen una cantidad igual a 
1.58 años. 
 
Si este problema se resuelve ahora, considerando los datos como si fueran de una población y se 
aplica la formula 4 y 5, entonces se tiene: 
 
 
 
 
 
 
 
 
En la solución del problema con las formula 4 y 5 de la población se observa que la  de la población 
es menor que la S de la muestra, esto es debido a que la S de la muestra utilizó n-1, para corregir el 
error producto del sesgo, y la  de la población no lo utilizó. 
 
2 – Los años de sevicio de 6 obreros son 5, 5, 8, 7, 9, y 11, los mismos corresponde a una muestra 
tomada de una empresa. Cálcule la desviación típica (S y ). 
Se calcula la media 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
58.1
20
50
)4(5
625135(5
)1(
..3
22






 
nn
XXn
S
ii
58.15.2
4
10
1
..1
2




n
d
S
i
.41.12
5
10
..4
2


N
d i

.41.122527
5
625
5
135
..5
22











N
X
N
X ii
5.7
6
45
6
1198755


X
14.258.425.5683.60 
 
20 
 
 
 
i
X 
ii
d)XX(  
2
i
d 
2
i
X 
5 5 – 7.5 = - 2.5 6.25 25 
5 5 – 7.5 = - 2.5 6.25 25 
7 7 – 7.5 = - 0.5 0.25 49 
8 8 – 7.5 = 0.5 0.25 64 
9 9 – 7.5 = 1.5 2.25 81 
11 11 – 7.5 = 3.5 12.25 121 
 Xi = 45 0d i  50.27d i  365X 2i  
 
Con esto datos se aplican las formulas 1, 4 y 5 para calcular la muestra, se deja la formula 3 para que 
sea aplicada por el participante, el resultado será igual al de la formula 1. Calculos: 
 
 
 
Ahora se calculará la  para la población (considerado los datos como de una poblacián). 
 
 
 
 
 
Interpretación.- El resultado obtenido al aplicar la formula 1, 2, 3, 4 y 5 indica que en promedio, los 
años de servicios de los trabajadores de la empresa se desvian o dispersan con respecto a su media 
aritmética en una cantidad igual a 2.35 año según la muestra y de 2.14 años en la poblacion. 
 
B) – Para datos Agrupados en Clases.- Para calcular la desviación típica en datos agrupado existen 
varios criterios en relacion a la corrección del sesgo que se produce al tomar una muestra, en este 
estudio se considerará la formula que corrige el sesgo de aquellas muestras en estudio; sin embargo, 
cuando n sea mayor que 50, no es necesario tal corrección. . Existen muchas formulas matemáticas 
para calcular la desvición típica, queda a juicio del estudiante utilizar la formula que él considere más 
fácil, siempre y cuando su aplicación sea valedera. 
 
B).- Formulas Para calcular la muestra y la población de una desviación típica con datos 
agrupados en clases: 
 
 
 
 
 
 
 
 
 
 
 
.14.258.4
36
2025
6
365
6
45
6
365
N
X
N
X
..5
2
2
i
2
i























.14.258.4
6
5.27
..4
2


N
d i

11
)(
..1
22






n
fd
n
fXX
S
iiii

.35.25.5
5
5.27
16
5.27
1
..1
2






n
d
S
i
 
21 
 
 
 
 
 
 
 
 
 
Para calcular la S de la formula 1 es necesario calcular el punto medio de cada una de las clases de la 
distribución, calcular la media aritmética y luego calcular los desvíos de los puntos medios con 
respecto a la media aritmética. En la formula 2 no es necesario calcular la media. 
 
En la formula 3, 
a
X es un valor arbitrario que se toma de los iX de la distribución, es 
recomrndable que se escoja el iX
 lo más central posible para así facilitar los calculos posteriores. 
 
El término Ki , en esta formula, viene a ser un desvío arbitrario con respecto a una mdia arbitraria 
a
X .Entonces, )XX(K
ai
  . Este método para calcular S en datos agrupados, se fundamenta en la 
propiedad de la desviación típica que establece: “si a cada una de los valores de una serie de datos se le 
suma una constante, la desviación típica no se altera en sus resultados”. 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
..2
2
2





n
n
fX
fX
S
ii
ii


 







1n
n
)XX(f
)XX(f
S..3
2
aii2
aii

  
1n
n
Kf
Kf
2
ii2
ii



N
df
N
XXf iiii 



22)(
..4


2
2
..5 X
N
Xf ii

 

2
2
..6










N
Xf
N
Xf iiii


 
N
N
Kf
Kf
N
Xf
N
)XX(f
..7
2
ii2
ii
2
ii
2
aii 

 













 
22 
 
 
Método para calcular la Desviación Típica en datos Agrupados: 
 * Se calcula la X 
 
 * Se calcula el 
iX
 de cada una de las clases que integran la distribución de frecuencia, se determinan 
los desvíos di de los iX
 con respecto a la X , luego se elevan al cuadrado los di y se multiplican 
por fi, y se calculala 
2
ii
df . 
 
* Se calcula la 
2
ii
Xf  , luego se determina la  ii Xf  2. 
 
 * Se elabora un cuadro estadístico y se llevan a este todas los datos calculados. 
 * Se aplica la formula necesaria para calcular la desviación típica. 
Ejemplos: 3 – Los siguientes datos corresponden a las horas extras trabajadas por los obreros de la 
empresa RINACA, en un mes (se resolverá considerando los datos como de una S y ). 
 
CLASES 
fi 
iX
 Xfi
 di =  XXi  2iidf  2ii Xf  
40 — 44 
1 42 42 - 15.26 232.87 1764 
45 — 49 6 47 282 - 10.26 631.60 13254 
50 — 54 21 52 1092 - 5.26 581.02 56784 
55 — 59 75 57 4275 - 0.26 5.07 243675 
60 — 64 23 62 1426 4.74 516.75 88412 
65 — 69 7 67 469 9.74 664.07 31423 
70 — 74 2 72 144 14.74 434.54 10368 
TOTALES 135 
ii
Xf  =7730 82.1d i 
 
 2iidf =3065.92 2iiXf  =445680 
 
Para resolver el problema lo primero que se debe hacer es calcular la media aritmética así: 
26.57
135
7730


n
Xf
X
i

 
Ahora se calculan los diferentes 
iX
 , para determinar los otro parámetros necesarios (es recomendable 
que el estudiante realice todos los cálculos) para resolver el problema planteado, en el cuadro de 
arriba se colocaron los cálculos realizados que son necesarios para resolver el mismo; este se resolverá 
aplicando las formulas 1, 2, y 3 de la S, considerando los datos como los de una muestra, ya que esta 
claro que estos pertenecen a una población determinada, luego se calculará la  de la distribución 
aplicando: 
 
 
 
 
 
78.488.22
134
92.3065
1135
92.3065
1
.1
2






n
df
S
ii
   
.78.488.22
134
93.3065
1135
135
7730
445680
1n
n
Xf
Xf
S..2
2
2
ii2
ii








 
 
23 
 
 
 
Para aplicar la formula 3 se toma una media arbitraria 
a
X que en este caso la más céntrica es 57, 
luego se calculan los desvíos de los puntos medios con respecto a la 
a
X así: 
 Ki = ( iX
  
a
X ) se elabora un cuadro estadístico para resumir los datos y finalmente se procede a 
buscar la desviación 
 
 
fi 
iX
 ( 
iX
  
a
X ) =Ki fi . Ki fi (ki)
2
 
1 42 - 15 - 15 225 
6 47 - 10 - 60 600 
21 52 - 5 - 105 525 
75 57 0 0 0 
23 62 5 115 575 
7 67 10 70 700 
2 72 15 30 450 
 135 if 35 iiKf 3075
2  ii Kf 
 
 
 
 
 
Interpretación.- Los resultados obtenidos con las formulas 1, 2, y 3, indican que el promedio de las 
horas extras laboradas por los trabajadores se desvían o varían con respecto a su media aritmética en 
una cantidad igual a 4.78 y 4.76 respectivamente. La misma interpretación se obtiene con los 
resultados obtenidos con las formulas 4, 5 y 6. 
 
 
 
 
 
 
 
 
 
 
 
 
 
   







135
135
35
3075
..3
22
2
N
N
Kf
Kf
ii
ii

.76.471.22
135
93.3065
135
07.93075
135
135
1225
3075





76.471.22
135
92.3065
..4
2


N
df ii

.76.471,2262.3278
135
445680
..5 2
2


X
N
Xf ii


.76.4
135
7730
135
445680
..6
2
2
2

















N
Xf
N
Xf iiii


 
24 
 
 
 
 
 
La aplicación de la formula 7 se deja para que el participante la aplique y resuelva el mismo 
problema, el cual tendrá resultados idénticos a los anteriores. 
 
1 – Los siguientes datos corresponden al número de panes consumidos por un grupo de familia de 
una urbanización de la ciudad, durante una semana determinada. 
 
Para resolver el problema se calcula la media y se procede a llenar el cuadro estadístico .siguiente(el 
estudiante debe realizar los cálculos): 
 
Clases fi 
30—32 10 
33—35 18 
36—38 60 
39—41 100 
42—44 80 
45—47 14 
48—50 6 
 288 
 
 
.0.40
288
11520


n
Xf
X
ii

 
 
Clases fi 
iX
 
ii Xf
 2
ii Xf
  XXd ii   2iidf 
30—32 10 31 310 9610 -9 810 
33—35 18 34 612 20808 -6 648 
36—38 60 37 2220 82140 -3 540 
39—41 100 40 4000 160000 0 0 
42—44 80 43 3440 147920 3 720 
45—47 14 46 644 29624 6 504 
48—50 6 49 294 14404 9 486 
 288 11520 464508 3708 
 
 
 
 
 
 
 
Interpretación.- Los resultados obtenido con las formulas 1 y 6 indican que en promedio, el consumo 
de pan de trigo del grupo de familias de esa urbanización se dispersa con respecto a su media 
aritmética en una cantidad igual a 3.59. 
 
 
 
 
.59.392.12
287
3708
1288
3708
1
..1
2






n
df
S
ii

















222
1
288
11520
288
464508
..6
N
Xf
N
Xf iii


.59.388.12160088.1612 
 
25 
 
 
 
La aplicación de las formulas 2, 3, 4, 5 y 7 quedan como ejercicios de practica para el participante, los 
resultados tienen que ser idénticos a los obtenidos con las formulas 1 y 6. Es muy importante que 
observe el resultado obtenido con la formula 1 para él cálculo de S y el obtenido con la formula 6 para 
calcular la , ambos resultados son idénticos, lo que indica que cuando la muestra es grande tanto la 
formula para calcular S como la utilizada para calcular la población produce al final el mismo 
resultado. 
 
Es importante señalar que expertos en la materia consideran que cuando las muestras son superiores a 
50 datos el error de sesgo ya no se produce o es insignificante y en consecuencia no es necesario 
utilizar la formula que se encarga de corregir el mismo, por tal razón es conveniente utilizar n y no, 
n-1. 
 
VARIANZA – Es otra de las variaciones absolutas y la misma se define como el cuadrado de la 
desviación típica; viene expresada con las mismas letras de la desviación típica pero elevadas al 
cuadrado, así S
2
 y 
2
. Las formulas para calcular la varianza son las mismas utilizadas por la 
desviación típica, exceptuando las respectivas raíces, las cuales desaparecen al estar elevados el primer 
miembro al cuadrado. La varianza general de la población se expresa de la forma siguiente: 
 
 
La varianza general de la muestra se expresa así: 
 
 
 
 
La mayor utilidad de la varianza se presenta en la estadística inferencial. 
 
 
Propiedades de la Desviación Típica: 
 
1 – La desviación típica de una constante k es cero. Si se parte de que la media aritmética de una 
constante es igual a la constante, esto es así, debida a que al ser todos los datos iguales no habrá 
dispersión en la serie de datos con respecto a la media aritmética, por lo tanto (k) = 0. 
 
2 – Si a cada uno de los valores de una serie de variables se le suma o se le resta una constante K, la 
desviación típica no se altera. Esta se apoya en la propiedad de la media aritmética que establece “si a 
cada valor de la serie se le suma una constante, la media de la nueva serie es igual a la media de la 
serie original más la constante”, igual sucede con la resta, la nueva media vendrá disminuida en el valor 
de dicha constante. 
 
3 – Si a cada uno de los términos de la serie de valores se le multiplica por una constante K, la 
desviación típica de la serie quedará multiplicada por K, y la nueva desviación típica será igual a la 
constante K tomada en valor absoluto por la desviación típica original. Esta propiedad se apoya en la 
propiedad del producto de la media aritmética 
 
 
.... )().( ii XKX K  
)()( ii XKX
 
......,
)(
..1
2
2 agr upadosnodatospar a
N
X i 



.....,.
)(
..2
2
2 agrupadosdatospara
N
Xf ii 




......,.
1
)(
..3
2
2 agrupadosnodatospara
n
XX
S
i




.....,.
1
)(
..4 2 agr upadosdatospar a
n
XXf
S
ii



 
 
26 
 
2 Para distribuciones normales siempre se cumple que: 
 
68.27 % de los datos se encuentran en el intervalo ( X  ). 
 
95.45 % de los datos se encuentran en el intervalo ( X  2). 
 
99.73 % de los datos se encuentran en el intervalo ( X  3). 
 
Estos valores se cumplen con bastante aproximación, para distribuciones que son Normales y para 
las que son ligeramenteasimétricas 
 
5 – Para dos series de valores, de tamaño n1 y n2, con variaciones S
2
1 y S
2
2, respectivamente, la 
varianza combinada S
2
T de ambas series será 
 
 
DISPERSIÓN RELATIVA. 
 
Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las dispersiones absolutas de 
los términos de la muestra. Las medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se 
trata de analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas 
muestras, será necesario expresar tales medidas en valores relativos, que pueden ser proporciones o 
porcentajes. 
 
Las medidas de dispersión relativas permiten comparar grupos de series distintas en cuanto a su 
variación, independientemente de las unidades en que se midan las diferentes características en 
consideración. Generalmente las medidas de dispersión relativas se expresan en porcentajes, 
facilitando así el estudio con medidas procedentes de otras series de valores La dispersión relativa 
viene a ser igual a la dispersión absoluta dividida entre el promedio. 
 
Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de variación de 
Pearson, este es un índice de variabilidad sin dimensiones, lo que permite la comparación entre 
diferentes distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variación de 
Pearson se designa con las letras CV. La formula matemática es: 
 
 
 
El CV pierde utilidad, cuando la  es muy cercana a cero. Una serie de valores será más dispersa 
que otra respecto a su  , mientras que su CV sea mayor. 
 
5 – La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro. Determine el CV 
de cada uno y diga cuál de ellos presenta mayor variación y cuál la menor. 
 
 
Producto X S Unidades CV 
 1 45 5 Bs. 11.11 % 
 2 450 40 Bs. 8.87 % 
 3 4500 350 Bs. 7.78 % 
 
Para resolver el problema se calcula el CV de cada producto y luego sé determina cuál presenta mayor 
o menor variación 
 
 CV = Sx100/ X 
 
 CV1 = 5x100/45 = 11.11 %. 
.100x
X
CV


21
2
22
2
112
nn
SnSn
ST



 
27 
 
 
 CV2 = 40x100/450 = 8.87 %. 
 
 CV3 = 350x100/4500 = 7.78 %. 
 
Se puede observar que la menor dispersión la presenta el producto 3, por lo tanto, de los 3 productos el 
que menos varia es ese; por otro lado el de mayor dispersión o variabilidad es el producto 1. 
 
 
TEORÍA DE LOS MOMENTOS.- Los momentos son indicadores matemáticos de diversos valores. 
Los diversos valores, están es función del parámetro estadístico o valor que se tome, para ser fijado 
como punto de referencia. 
 
 Sean X1, X2, X3, ..........Xn, los valores que toma la variable Xi; se define entonces, momento mi de orden 
r con respecto al promedio aritmético ( X ) de los valores de la variable Xi elevados a la potencia r; 
siendo r cualquier valor comprendido entre,1 , 2, 3,....,n. Matemáticamente: 
 
Los momentos se pueden definir también como las potencias de los desvíos di con respecto a un 
determinado valor, que puede ser la media aritmética, el origen cero o una media arbitraria. En 
estadística son importantes los momentos 1, 2, 3 y 4 con respecto a la media aritmética y el momento 1 
con respecto al origen que viene a ser igual a la media aritmética 
 
FORMULAS PARA DETERMINAR LOS MOMENTOS CON RESPECTO A LA MEDIA 
ARITMÉTICA 
 
 
A) – Para datos no agrupados 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
n
d
n
)XX(
m
r
i
r
i
i




0
)(
..1
11
1 



n
d
n
XX
m
ii
2
22
2
)_(
..2 S
n
d
n
XX
m
ii


n
d
n
XX
m
ii 



33
3
)(
..3
n
d
n
XX
m
ii 



44
4
)(
..4
 
28 
 
B) – Para datos agrupados 
 
 
 
 
 
 
 
 
Descripción de los Momentos: 
 
1. - El primer momento con respecto a la X es siempre igual a cero, este momento es similar a la 
primera propiedad de la X . 
 
2. – El segundo momento con respecto a la X es siempre igual a la varianza. 
 
3 – El tercer momento con respecto a la media aritmética se utiliza para determinar el coeficiente de 
asimetría SKm. 
 
3 – E l cuarto momento con respecto a la media aritmética es un valor que se utiliza para determinar 
el coeficiente de kurtosis, de una serie de valores. 
 
Formula de los momentos con respecto al origen cero: 
 
 
 
 
 
Procedimiento para Calcular los mi de una serie de datos: 
 
1 – Se calcula la media aritmética. 
 
2 – Se determinan los mi de los Xi y de los iX
 de la serie de valores con respecto a la media 
aritmética. 
 
3 – Se determinan las di con respecto X para los datos no agrupados y la fidi para los datos 
agrupados según el caso. 
 
4 – Se elabora un cuadro estadístico con los datos calculados. 
 
5 – Se aplican las formulas para calcular los momentos según el caso. 
 
 
1 – Sean los siguientes datos los años de servicio de un grupo de trabajadores. Determine el m1, m2, m3 
y m4 con respecto a la media aritmética. 
0
)(
..1
11
1 



n
df
n
XXf
m
iiii

2
22
2
)(
..2 S
n
df
n
XXf
m
iiii



 
n
df
n
XXf
m
iiii 



33
3
)(
..3.

n
df
n
XXf
m
iiii 



44
4
)(
..4.

.....,.
)0(
..5
1
1 agrupadosnodatosenX
n
X
n
X
m
ii




agrupadosdatosparaX
n
Xf
n
Xf
m
iiii
.,...
)0(
..6
1
1 


 
 
29 
 
 
Solución.- Lo primero que se hace es calcular la X y luego se procede a calcular los d1, d2, d3 y d4 con 
respecto a la X después se aplica la formula para calcular los momentos de datos no agrupados. 
 
Xi (Xi- X)
 
= d
1
 Xi- X)
2 
= d
2
 (Xi- X)
3 
= d
3
 (Xi- X )
4 
= d
4
 
5 (5 – 8) = -3 9 -27 81 
6 (6 – 8) = -2 4 -8 16 
7 (7 – 8) = -1 1 -1 1 
9 (9 – 8) = 1 1 1 1 
13 (13 – 8) = 5 25 125 625 
Xi =40 d
 
 = 0 d
2
 = 40 d
3
 =90 d
4
 = 724 
 
 
 
 
 
2 – La siguiente distribución de frecuencia corresponde al consumo de azúcar trimestral de un grupo 
de familias. Determine el m1, m2, m3 y el m4 con respecto a la media aritmética. 
 
CLASES fi 
 5 —7 5 
8 —10 10 
11 —13 15 
14 —16 30 
17 —19 15 
20 —22 10 
23 —25 5 
 90 
 
Solución.- Lo primero que se hace es elaborar un cuadro estadístico, luego se calcula la X y 
posteriormente se determinan los desvíos d1, d2, d3 y d4 con respecto a la media y finalmente con los 
datos obtenidos en el cuadro se aplica la formula para obtener los momentos en datos agrupados. 
 
CLASES fi 
iX
 
ii Xf
 fi di fi .di fi .d
2
 fi .d
3
 fi .d
4
 
5 —7 5 6 30 -9 -45 405 -3645 32805 
8 —10 10 9 90 -6 -60 360 -2160 12960 
11 —13 15 12 180 -3 -45 135 -405 1215 
14 —16 30 15 450 0 0 0 0 0 
17 —19 15 18 270 3 45 135 405 1215 
20 —22 10 21 210 6 60 360 2160 12960 
23 —25 5 24 120 9 45 405 3645 32805 
 90 1350 0 0 1800 0 93960 
.0
5
0)(
11
1 



n
d
n
XX
m
ii
8
5
40


n
X
X
i
8
5
40)(
22
2 



n
d
n
XX
m
ii
.18
5
90)(
33
3 



n
d
n
XX
m
ii
.8.144
5
724)(
44
4 



n
d
n
XX
m
ii
 
30 
 
 
 
 
 
 
 
 
 
 
4.- La siguiente distribución de frecuencia corresponde al consumo de azúcar de un grupo de familias. 
Determine el m1 con respecto al origen. 
 
CLASES fi 
5—7 5 
8—10 10 
11—13 15 
14—16 30 
17—19 10 
20—22 15 
23—25 5 
 90 
 
Cuadro resumen 
CLASES fi 
iX
 
ii XX
 0 ii Xf
 
5—7 5 6 6-0 = 6 30 
8—10 10 9 9-0 = 9 90 
11—13 15 12 12-0 =12 1 80 
14—16 30 15 15-0 = 15 450 
17—19 15 18 18-0 = 18 270 
20—22 10 21 21-0 = 21 210 
23—25 5 24 24-0 = 24 120 
 90 1350 
 
 
 
 
.0.15
90
1350


n
Xf
X
i

.0
90
0)(
11
1 



n
df
n
XXf
m
iiii

.20
90
1800)(
22
2 



n
df
n
XXf
m
iiii

0
90
0)(
33
3 



n
df
n
XXf
m
iiii

.1044
90
93960)(
44
4 



n
df
n
XXf
m
iiii
31 
 
 
 
El momento m1 con respecto al origen cero (0), siempre es igual a la media aritmética. 
Medidas de Asimetría y Kurtosis 
Simetría.- Según el Diccionario de la Real Academia Española es la “Regularidad en la disposición de 
las partes o puntos de un cuerpo o figura, de modo que posea un centro, un eje o un plano de 
referencia”. Es por lo tanto la armonía de posición de las partes o puntos similares uno respecto de 
otros y con referencia a puntos, líneas o planos determinados. Se puede generalizar diciendo que es 
una proporción de las partes entre sí y con el todo. 
 
En estadística se dice que una distribución de datos es simétrica si se le puede doblar a lo largo de un 
eje vertical de una manera tal que coincidan los dos lados de la distribución. Las distribuciones que no 
tienen simetría con respecto al eje vertical se les llama sesgada o asimétrica. Una distribución sesgada 
a la derecha tiene una cola prolongada del lado derecho de la distribución y una cola más corta del lado 
izquierdo de la misma; esta asimetría se le denomina positiva, cuando la cola de la distribución del lado 
izquierdo es más larga que la del lado derecho, entonces la asimetría es negativa. 
 
En una distribución simétrica la media, la mediana y la moda son iguales. La simetría se mide por 
medio del coeficiente de asimetría. Una distribución simétrica tiene un coeficiente de asimetría igual a 
cero. Cuando una distribución de frecuencia es asimétrica, la media, la mediana y la moda se alejan 
una de otra, es decir, las tres medidas de posición son diferente; mientras más se separe la media de la 
moda, mayor es la asimetría. Si la distribución de frecuencia es asimétricamente negativa, la cola de la 
curva de distribución se encuentra hacia los valores más pequeños de la escala de las X y si la 
distribución es asimétricamente positiva la cola de la distribución se ubica hacia los valores más 
grandes de la escala de las X. 
 
 Karl Pearson un estudioso de la estadística designo el coeficiente de asimetría con las letras SK 
y determinó la formula para su cálculo, al cual se le denominó primer coeficiente de asimetría de 
Pearson 
 
Esta formula se puede transformar por medio de la relación: 
 
     .333 MdXMoXMdXXMoMdXXMo  
 
 MdXMoX  3 , si ahora se sustituye 3( X - Md) en el primer coeficiente de asimetría de 
Pearson, se tiene otro coeficiente de asimetría utilizando la mediana que se le denomina segundo 
coeficiente de asimetría de Pearson, este es más preciso que el primero 
 
 
Arthur Bowley otro estudioso de la estadística determinó que el coeficiente de asimetría se podía 
calcular por medio de los cuartiles y utilizó el coeficiente de asimetría por medio de cuartiles (skq), y 
la formula es 
 
 
.0.15
90
1350)0(
1
1 



X
n
Xf
n
Xf
m
iiii

S
MoX
SK
)(
1


S
MdX
SK
)(3
2


13
231 2
QQ
QQQ
SKq



 
32 
 
En donde, Q1, Q2 y Q3 son los cuartiles 1, 2 y 3 respectivamente. El valor de SKq varia entre 1 y 1; 
según Bowley una distribución de frecuencia con un coeficiente de asimetría igual a 0.1, se considera 
como ligeramente asimétrica y con un valor mayor 0.3 se le considera marcadamente asimétrica. 
 
El coeficiente de asimetría se puede calcular también en función de los momentos, siendo el momento 
m3 el parámetro utilizado para tal efecto. El coeficiente de asimetría según los momentos se designa 
con las letras SKm y sé calcula mediante la formula 
 
En esta formula m3 es el momento tres con respecto a la media aritmética y S
3
 es la desviación típica 
elevada a la potencia tres. Este coeficiente es el más confiable de todos los antes descritos, asi que para 
cualquier calculo se debería utilizar este, ya que es un parámetro que utiliza todos los datos de la serie 
de valores. 
 
Si en una serie de valores la X  Md  Mo, entonces la distribución de frecuencia presenta una curva 
asimétrica positiva; si la X =Md = Mo = 0 , la curva de la distribución es simétrica y si la 
distribución presenta una curva en la que el Mo  Md  X , entonces se dice que la curva de la 
distribución asimétrica negativa. 
 
Sí la curva de una distribución de frecuencia es sesgada, la media tratara de ubicarse hacia el extremo o 
lado opuesto, de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en 
una asimetría positiva la X  Md y en una asimetría negativa la X  Md. 
 
Si en una distribución de frecuencia, los intervalos de las clases que la conforman presentan frecuencias 
balanceadas en cada uno de ellos y no presentan ninguna aglomeración especial en los extremos y, 
además, presenta una concentración de los datos en el centro de la distribución, entonces se dice que la 
distribución de frecuencia es simétrica. Cuando la curva de una distribución de datos es simétrica el 
SK = 0, esta es una de las características de la curva Normal o Campana de Gauss. 
 
Si la mayoría de los datos de una serie de valores están ubicados en el centro de la distribución y, 
además existe una dispersión medianamente hacia los extremos mayores o menores de las variables, 
entonces se afirma que la curva de la distribución es Ligeramente Asimétrica. Ejemplo 
 
CLASES 1 f1 CLASES 2 f2 
3—5 5 3—5 8 
6—8 10 6—8 12 
9—11 25 9—11 20 
12—14 40 12—14 40 
15—17 20 15—17 25 
18—20 12 18—20 10 
21—23 8 21—23 5 
TOTAL 120 TOTAL 120 
 
 
En este ejemplo la distribución 1 es ligeramente asimétrica positiva y la distribución 2 es ligeramente 
asimétrica negativa. La mayoría de las distribuciones de casos reales por lo general son ligeramente 
asimétricas. 
 
Una distribución de datos es marcadamente asimétrica si la mayoría de los datos de la misma se 
encuentran ubicados en los extremos mayores o menores de las variables que conforman la 
distribución. Si la mayoría de los de los datos de una serie de valores se encuentra situados en el 
extremo de las clases menores de la distribución, entonces la curva de la distribución de frecuencia 
presenta una asimetría positiva, siendo en este caso el SK  0; y si por el contrario esa mayoría se 
encuentra en los extremos de las clases mayores de las variables, entonces la serie de valores presenta 
una curva con una asimetría negativa, luego el Coeficiente de asimetría será mayor que cero, es decir, 
SK0 Ejemplos: 
 
 
3
3
S
m
SKm 
 
33 
 
 
 
 
 
CLASES 3 f3 CLASES 4 f4 
3—5 15 3—5 5 
6—8 25 6—8 10 
9—11 40 9—11 15 
12—14 60 12—14 60 
15—17 15 15—17 40 
18—20 10 18—20 25 
21—23 5 21—23 15 
TOTAL 170 TOTAL 170 
 
 
En la distribución 3 los datos presentan una curva marcadamente asimétrica positiva y el caso 4 la 
curva de la distribución es marcadamente asimétrica negativa. 
 
Existen distribuciones de frecuencias que presentan curvas fuertemente marcadamente asimétricas y 
otras que las curvas son ligeramente asimétricas. Considerar la asimetría de una curva de frecuencia 
marcadamente o ligeramente asimétrica, es un asunto de criterio del investigador, puesto que no 
existen reglas rígidas establecidas que determinen las líneas divisorias o parámetros entre ligeramente 
o marcadamente asimétrica; Sin embargo cuando la mayoría de los datos de una distribución de 
frecuencia se ubican en los extremos mayores o menores de las variables se puede afirmar con certeza 
que la curva de la distribución es marcadamente asimétrica. 
 
Algunos investigadores como Arthur Bowley determinaron que si se aplica el SKq y ese coeficiente 
de asimetría obtenido es menor que 0.3 (sin considera el signo) se puede afirmar que la curva de la 
distribución es ligeramente asimétrica, en caso contrario la curva de la distribución sería 
marcadamente asimétrica. Otros investigadores utilizan el coeficiente de asimetría según los momentos 
(SKm) para tales efectos, pero no existe criterio en cual ha de ser el coeficiente

Otros materiales