Logo Studenta

estadistica_descriptiva

¡Este material tiene más páginas!

Vista previa del material en texto

ESTADÍSTICA 1 
 
EEJJEERRCCIICCIIOOSS 
DDEE EESSTTAADDÍÍSSTTIICCAA 
 
MMAATTEEMMÁÁTTIICCAASS AAPPLLIICCAADDAASS CCCC.. SSSS.. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Juan Fernández Maese 
 Angeles Juárez Martín 
 Antonio López García 
 
 
 
 ESTADÍSTICA 2 
 
 
 ESTADÍSTICA 3 
 
 ÍNDICE TEMÁTICO 
 
 
CAPÍTULO 1: TABLAS Y GRÁFICOS ....................................................................................................5 
1.1.- INTRODUCCIÓN A LA ESTADÍSTICA ............................................................................ 5 
1.2.- TABLAS ESTADÍSTICAS. FRECUENCIAS ...................................................................... 8 
1.3.- REPRESENTACIONES GRÁFICAS ................................................................................. 11 
1.4.- COMPARACIÓN DE DIAGRAMAS................................................................................. 17 
1.5.- EJERCICIOS FINALES ...................................................................................................... 20 
CAPÍTULO 2: DISTRIBUCIONES UNIDIMENSIONALES .................................................................23 
2.1.- MEDIDAS DE CENTRALIZACIÓN ................................................................................. 23 
2.2.- MEDIDAS DE POSICIÓN.................................................................................................. 32 
2.3.- REPRESENTACIÓN BOX-WHISKER.............................................................................. 38 
2.4.- MEDIDAS DE DISPERSIÓN ............................................................................................. 40 
2.5.- COMPARACIÓN DE DISTRIBUCIONES ........................................................................ 46 
2.6.- SIMETRÍA........................................................................................................................... 55 
2.7.- EJERCICIOS FINALES ...................................................................................................... 59 
CAPÍTULO 3: DISTRIBUCIONES BIDIMENSIONALES ....................................................................63 
3.1.- VARIABLES ESTADÍSTICAS BIDIMENSIONALES ..................................................... 63 
3.2.- TABLAS BIDIMENSIONALES DE FRECUENCIAS ...................................................... 64 
3.3.- REPRESENTACIONES GRÁFICAS ................................................................................. 67 
3.4.- CALCULO DE PARÁMETROS ESTADÍSTICOS............................................................ 72 
3.5.- EJERCICIOS FINALES ...................................................................................................... 77 
CAPÍTULO 4: CORRELACIÓN Y REGRESIÓN...................................................................................79 
4.1.- CORRELACIÓN ................................................................................................................. 79 
4.2.- DEPENDENCIA Y COEFICIENTE DE CORRELACIÓN................................................ 82 
4.3.- REGRESIÓN ....................................................................................................................... 88 
4.4.- EJERCICIOS FINALES ...................................................................................................... 93 
 
 
 
 
 ESTADÍSTICA 5 
 
CAPÍTULO 1: 
 
TABLAS Y GRÁFICOS 
 
1.1.- INTRODUCCIÓN A LA ESTADÍSTICA 
 
 
1.- Objeto de la estadística 
 
La Estadística es el conjunto de métodos necesarios para recoger, clasificar, representar y 
resumir datos así como para inferir (extraer consecuencias) a partir de ellos. 
 
Se divide en dos ramas principales: 
 
• Estadística descriptiva. Su objetivo es examinar a todos los individuos de un conjunto. 
Trata del recuento, ordenación y clasificación de datos obtenidos mediante observaciones. 
Se organizan los datos en tablas, se realizan gráficos y se obtienen parámetros estadísticos 
que caracterizan la distribución de población estudiada. 
 
• Estadística inferencial. Establece previsiones y conclusiones generales sobre una población 
a partir de los resultados obtenidos de una muestra de la misma. 
 
 
2.- Población y muestra 
 
• Población es el conjunto formado por todos los elementos que tienen una determinada 
característica que vamos a estudiar. 
• Individuos son cada uno de los elementos de una población. 
• Muestra es el subconjunto extraído de una población, con objeto de reducir el campo de 
experiencias. 
• Tamaño de la muestra es el número de elementos de la muestra. 
• Muestreo es el proceso mediante el cual se extrae una muestra de la población. 
 
 
3.- Caracteres 
 
Carácter 
 
Carácter o atributo estadístico es la propiedad que estudiamos en los individuos de una 
población. 
 
 
Variable 
 
Variable es el conjunto de los valores que puede tomar un carácter o atributo. Son variables la 
edad y la talla de las personas y también el color de sus ojos o su profesión. 
 
Atendiendo al tipo de valores de que toman pueden ser: 
• Cualitativas: no numéricas. 
• Cuantitativas: numéricas. 
 
Las variables numéricas pueden ser: 
• Discretas: Las toman valores que podemos ordenar. Entre cada dos valores no hay valores 
intermedios. 
 
 ESTADÍSTICA 6 
 
• Continuas: Las que pueden tomar todos los valores posibles dentro de un intervalo de la 
recta real. 
 
Las variables cualitativas pueden ser: 
• Ordinales: Las que tienen un orden implícito. 
• Nominales (cardinales): Las que no tienen un orden implícito. 
• Dicotómicas: Las que sólo presentan dos modalidades. 
 
 
EJEMPLOS 
 
1.- Deseamos conocer la estatura de todos los soldados que forman el 
ejército. Enuncia la población, los individuos y la muestra. 
 
Resolución: 
• La población está formada por todos los soldados. 
• Los individuos son cada uno de los soldados. 
• La muestra es el subconjunto de los soldados que se tallan. 
 
 
2.- En una fabrica de bombillas se efectúa un control de calidad sobre 100 
unidades para averiguar cuántas son defectuosas. Enuncia la población, 
los individuos y la muestra. 
 
Resolución: 
• La población está formada por las bombillas fabricadas. 
• Los individuos son cada una de bombillas fabricadas. 
• La muestra son las100 bombillas examinadas. 
 
 
3.- Enuncia dos caracteres cuantitativos. 
 
Resolución: 
• La talla de un individuo de una determinada población. 
• El diámetro de una pieza de precisión de un lote fabricado. 
 
 
4.- Enuncia dos caracteres cualitativos. 
 
Resolución: 
• La profesión de las personas mayores de 20 años de Ceuta. 
• El estado civil de los habitantes de Ceuta. 
 
 
5.- Enuncia dos modalidades de una variable estadística cualitativa. 
 
Resolución: 
Si consideramos la variable cualitativa profesión son modalidades: 
• economista. 
• sociólogo. 
 
 
6.- Enuncia dos variables estadísticas discretas. 
 
Resolución: 
Son variables estadística discretas: 
• Números de empleados de una fábrica de la PYME. 
• Número de hijos de 20 familias. 
 
 
 ESTADÍSTICA 7 
 
7.- Enuncia dos variables estadísticas continuas. 
 
Resolución: 
Son variables estadística continuas: 
• Peso de las personas. 
• Temperaturas de una ciudad. 
 
 
8.- Enuncia dos variables estadísticas nominales. 
 
Resolución: 
Son variables estadísticas nominales. 
• Color de los ojos. 
• Sabor de un helado. 
 
 
 
EJERCICIOS PROPUESTOS 
 
1.- Enuncia la población, los individuos y la muestra del experimento estadístico consistente en 
hallar el peso de todos los alumnos de un instituto si se pesan solamente a los delegados/as y 
subdelegados/as. 
 
2.- Enuncia la población, los individuos y la muestra del experimento estadístico consistente en 
hallar la anchura de los tornillos de una caja si sólo se miden 10 tornillos. 
 
3.- Considera los siguientes caracteres: el peso de un individuo, el sexo de un individuo, la 
longitud de un tornillo, el color de los ojos de una persona, el número de gajos deuna naranja, la 
profesión de un individuo. 
¿Cuáles de los anteriores caracteres son cuantitativos? 
 
4.- Considera los siguientes caracteres: el peso de un individuo, el sexo de un individuo, la 
longitud de un tornillo, el color de los ojos de una persona, el número de gajos de una naranja, la 
profesión de un individuo. 
¿Cuáles de los anteriores caracteres son cualitativos? 
 
5.- Considera las siguientes modalidades: cincuenta kilos, mujer, doce centímetros, azules, 13 
gajos, profesor. 
¿Cuáles pertenecen a una variable cuantitativa? 
 
6.- Considera las siguientes modalidades: cincuenta kilos, mujer, doce centímetros, azules, 13 
gajos, profesor. 
¿Cuáles pertenecen a una variable cualitativa? 
 
7.- Considera las siguientes variables: alumnos de un instituto, talla de un conjunto de personas, 
hijos de una familia, peso de los alumnos de un instituto, espectadores de un partido de fútbol, 
temperaturas de una ciudad. 
¿Cuáles de las anteriores son continuas? 
¿Cuáles de las anteriores son discretas? 
 
8.- Considera las siguientes variables: opinión sobre un partido político, color del pelo, trato 
recibido en un hotel, sabor de una comida, calificación de un examen, olor de una habitación. 
¿Cuáles de las anteriores son ordinales? 
¿Cuáles de las anteriores son cardinales? 
 
9.- Considera las siguientes variables: opinión sobre el sabor de una comida, opinión sobre si 
está salada una comida, estar en posesión de una tarjeta de crédito, calificación de un examen, 
olor de una habitación. 
¿Cuáles de las anteriores son dicotómicas? 
 
 ESTADÍSTICA 8 
 
1.2.- TABLAS ESTADÍSTICAS. FRECUENCIAS 
 
1.- Tablas estadísticas 
 
Las tablas estadísticas son una forma de presentar la información acerca de una variable 
estadística. En la primera columna se colocan los valores (xi), marcas de clase o modalidades de 
la variable y en las siguientes las frecuencias respectivas. 
 
Para tabular los datos procederemos de la siguiente manera: 
• Recogida de datos 
• Ordenación de los datos de menor a mayor, si son numéricos, o en el orden natural, si se 
trata de una variable cualitativa nominal. 
• Recuento de frecuencias o veces que se repite cada dato. 
• Agrupación de los datos. Se agrupan cuando la variable es continua o discreta pero con un 
número muy grande de datos. Existen varios criterios para establecer el número de clases, 
pero éstas no deben ser menos de 5 ni más de 20. Se debe procurar que todas las clase 
tengan el mismo tamaño a no ser que haya datos muy dispersos. 
Marcas de clase: es el punto medio de los extremos de cada clase. Los valores extremos son 
los límites de clase: Li, y superior, Li+1, 
Las clases no deben solaparse ni tener huecos, es decir, el límite inferior de una clase, ha de 
ser igual al límite superior de la anterior pero cada extremo sólo pertenece a una clase, para 
ello se toman intervalos cerrados por la izquierda y abiertos por la derecha. 
• Construcción de la tabla estadística: En la tabla aparecerán diversas columnas, siendo 
habitual colocar de izquierda a derecha el valor de la variable, la marca de clase (para datos 
agrupados) y las frecuencias absolutas y relativas. 
 
2.- Frecuencia absoluta 
 
• Frecuencia absoluta del valor xi de una variable estadística y lo representamos por ni es el 
número de veces que se repite dicho valor. 
• Frecuencia absoluta acumulada del valor xi, y la representamos por Ni, a la suma de las 
frecuencias absolutas de todos los valores anteriores a xi más la frecuencia absoluta de xi: 
Ni = n1 + n2 + ... + ni = ∑
=
n
1i
in 
 
3.- Frecuencia relativa 
 
• Frecuencia relativa de un valor xi, y la representamos por fi, es el cociente entre la 
frecuencia absoluta de xi, y el número total de datos de la distribución: fi = N
ni . Se trata de 
un tanto por uno ∑
=
n
1i
if = 1. A veces se utilizan los tantos por ciento y tantos por mil. 
• Frecuencia relativa acumulada del valor xi, y la representamos por Fi, es el cociente entre 
la frecuencia absoluta acumulada de xi y el número total de datos que intervienen en la 
distribución: 
Fi = f1 + f2 + ... + fi = N
Nn
N
1 i
n
1i
i =∑
=
 
 
4.- Observaciones 
 
• Las tablas deben llevar un enunciado que las explique sin tener un texto que las acompañe. 
• Deben incluir los totales de cada columna. 
• Deben indicarse las unidades de medida. 
• Siempre hay que utilizar el mismo número de decimales ya que nos informa de la precisión 
del dato. 
• Suele haber redundancias para facilitar la lectura. 
 
 ESTADÍSTICA 9 
 
EJEMPLOS 
 
1.- Las notas de los 25 alumnos de una clase de Matemáticas de 1º de 
Bachillerato son las siguientes: 
5 3 4 1 2 8 9 8 3 6 5 4 1 
7 2 1 9 5 10 1 8 3 8 3 2 
Efectúa la tabla adecuada a dichos datos con frecuencias absolutas, 
relativas y acumuladas. 
 
Resolución: 
xi ni Ni fi Fi 
1 4 4 0,16 0,16 
2 3 7 0,12 0,28 
3 4 11 0,16 0,44 
4 2 13 0,08 0,52 
5 3 16 0,12 0,64 
6 1 17 0,04 0,68 
7 1 18 0,04 0,72 
8 4 22 0,16 0,88 
9 2 24 0,08 0,96 
10 1 25 0,04 1,00 
 25 1 
 
 
2.- Las edades de un grupo de personas son: 
 3 2 11 13 4 3 2 4 5 6 7 3 4 22 4 5 3 2 5 6 
27 15 4 21 12 4 5 3 6 29 13 6 17 6 13 6 5 12 26 12 
construye la tabla estadística de datos agrupados 
 
Resolución: 
Clase Marca de clase ni Ni fi Fi 
[0-5) 2,5 14 14 0,350 0,350 
[5-10) 7,5 12 26 0,300 0,650 
[10-15) 12,5 7 33 0,175 0,825 
[15-20) 17,5 2 35 0,050 0,875 
[20-25) 22,5 2 37 0,050 0,925 
[25-30) 27,5 3 40 0,075 1 
 40 1 
 
 
3.- Completa los datos que faltan en la siguiente tabla estadística, donde 
n, N y f representan las frecuencias absoluta, acumulada y relativa, 
respectivamente. 
xi ni Ni fi 
1 4 
2 6 0,12 
3 15 
4 6 0,12 
5 31 
6 9 0,18 
7 4 
8 
 
 ESTADÍSTICA 10 
 
Resolución: 
Para completar la tabla sabemos que la columna de frecuencias absolutas 
acumuladas Ni es la suma de los valores acumulados de la frecuencia absoluta 
ni que la frecuencia relativa fi = ni/N siendo N = ∑
=
n
1i
in y ∑
=
n
1i
if = 1. 
 
 xi ni Ni fi 
1 4 4 0,08 
2 6 10 0,12 
3 5 15 0,10 
4 6 21 0,12 
5 10 31 0,20 
6 9 40 0,18 
7 4 44 0,08 
8 6 50 0,12 
 50 1,00 
 
 
 
EJERCICIOS PROPUESTOS 
 
1.- Las notas de los 30 alumnos de una clase de Filosofía de 1º de Bachillerato son las siguientes: 
6 3 5 1 2 8 9 8 3 7 6 4 5 2 1 
9 5 10 2 10 3 8 3 9 10 7 2 1 7 8 
Efectúa la tabla adecuada a dichos datos con frecuencias absolutas y relativas. 
 
2.- Las edades de un grupo de personas son: 
3 2 11 13 4 3 2 4 5 6 4 5 3 2 5 
3 6 29 13 6 17 6 13 6 5 6 27 15 4 21 
construye la tabla estadística de datos agrupados 
 
 3.- Completa la siguiente tabla 
xi 1 2 3 4 5 
ni 2 1,5 
Ni 7 
fi 0,1 0,5 
 
4.- Sea X una variable estadística que indica el tiempo de permanencia de quince empleados 
en una empresa. Construye 4 intervalos de igual amplitud siendo el primero [10, 15). 
X 20 15 16 20 22 24 20 29 24 15 12 21 12 16 13 
 
 5.- Completa la siguiente tabla: 
 
Clases [25-30) [40-45) [45-50) 
Marcas 17,5 27,5 32,5 
ni 2 13 5 
Ni 2 31 39 
fi 0,05 0,20 
 
 
 ESTADÍSTICA 11 
 
1.3.- REPRESENTACIONES GRÁFICAS 
 
Las tablas estadísticas contienen la información, pero a veces se expresa mediante un gráfico, 
para hacerla más clara y evidente, su finalidad es entrar por los ojos, han de ser muy fáciles de 
interpretar. No estudiamos pirámides de población, series temporales y gráficos espirales. 
 
 
1- Diagrama de barras 
 
Son útiles para datos cualitativos o datos 
cuantitativos de tipo discreto. 
 
Para trazarlos se representa en el eje de 
abscisas los valores de la variable, y en el de 
ordenadas las frecuencias absolutas o 
relativas. Por los puntos marcados en 
abscisas, se levantan trazos gruesos o barras 
de altura igual a la frecuencia y de la misma 
anchura. 
 
• En algunos casos interesaque las barras 
representen las frecuencias acumuladas con lo cual se tendrán diagrama de barras 
acumuladas. 
• Si los datos son ordinales hay que colocarlos en el eje de abscisas en el orden lógico. 
• Las alturas pueden ser proporcionales a las frecuencias, no estrictamente iguales a ella (en es 
caso debe advertirse) 
 
 
2.- Polígono de frecuencias 
 
Son útiles para datos cualitativos ordinales o 
cuantitativos de tipo discreto. 
 
Para trazarlos se representa en el eje de 
abscisas los valores de la variable, y en el de 
ordenadas las frecuencias absolutas o 
relativas. A cada punto de la variable se le 
asigna un punto del plano de abscisa el valor 
de la variable y de ordenada su frecuencia. 
Los puntos se unen mediante segmentos. 
 
• En algunos casos nos interesa que el polígono una los extremos de las frecuencias 
acumuladas y no de las frecuencias. 
• Se utilizan sobre todo, cuando se quiere ver la evolución de las frecuencias al ir tomando 
valores la variable (si la variable X no está ordenada no interesa). 
 
 
3.- Histogramas 
 
Se utilizan para representar distribuciones 
cuantitativas de variable continua. 
 
Para construirlo se representa sobre el eje de 
abscisas los límites de la clase. Sobre el 
mismo eje se construyen unos rectángulos 
que tienen por base la amplitud de la clase y 
por altura la necesaria para que las áreas de 
estos rectángulos sean proporcionales a las 
frecuencias respectivas. 
 
 ESTADÍSTICA 12 
 
• En algunos casos nos interesa que los histogramas representen las frecuencias acumuladas y 
no las frecuencias absolutas. 
• Si alguna de las clases extremas es abierta se dibujan con la misma amplitud que los demás. 
• Es el gráfico más utilizado en la investigación científica. 
 
 
4.- Diagrama de sectores 
 
Se utilizan para distribuciones de variable cualitativa o cuantitativo de tipo discreto. 
 
Para dibujarlo debemos tener en cuenta que 
cada sector representa los distintos valores 
de la variable. El ángulo central de cada 
sector ha de ser proporcional a la frecuencia 
absoluta o relativa correspondiente. Es decir: 
α = 360°.h 
 
En ocasiones sólo se utiliza un semicírculo, 
en ese caso el ángulo será α = 180°.h 
 
 
5.- Pictogramas 
 
Son dibujos alusivos a una distribución 
estadística y ofrecen una descripción, de ésta 
mediante su forma o tamaño. 
 
Para construirlo se representa en el eje de 
abscisas los valores de la variable y en el eje 
de ordenadas un dibujo cuyo tamaño es 
proporcional a la frecuencia de las clases. 
 
Para lograrlo se puede hacer por repetición (de la figura base) o por amplificación (complicado 
de lograr la proporcionalidad del tamaño). 
 
 
6.- Cartograma 
 
Son gráficos que se realizan sobre un mapa, 
señalando sobre determinadas zonas con 
distintos colores o tramas la información se 
trata de poner de manifiesto. 
 
Estos tipos de diagramas se utilizan para 
representar datos relacionados con un área 
geográfica. Por ejemplo el cartograma de 
información del tiempo. 
 
 
7.- Diagramas lineales 
 
Son muy utilizados para mostrar las 
fluctuaciones de un determinado carácter 
estadístico con el paso del tiempo. 
 
Se suele aprovechar para representar sobre la 
misma escala varios diagramas lineales. Por 
ejemplo, nacimientos y defunciones, 
ingresos y gastos. 
 
 ESTADÍSTICA 13 
 
8.- Observaciones 
 
En las gráficas: 
 
• Se debe indicar claramente las escalas y 
unidades de medida. 
 
• Deben explicarse por si solas, por lo 
tanto, el título ha de ser totalmente 
explicativo. 
 
• Deben servir para clarificar (no pueden 
ser de difícil interpretación tal como la 
figura adjunta) 
 
 
EJEMPLOS 
 
1. Con las notas de 30 alumnos dadas en la tabla adjunta. 
xi 0 1 2 3 4 5 6 7 8 9 
ni 2 3 1 1 1 3 2 5 7 5 
 
a) Construye los diagramas de barras absolutas y acumuladas. 
b) Construye el polígono de frecuencias absolutas y acumuladas 
 
Resolución: 
a) Son los diagramas de las figuras adjuntas 
b) Son los polígonos de las figuras adjuntas 
 
2. Construye el polígono de frecuencias absolutas y acumuladas de las 
notas de 30 alumnos dadas en la siguiente tabla. 
Edades [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) 
ni 13 11 6 2 1 3 
Resolución: 
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5 6 7
TVE-1 La 2 Autonómicas
Antena 3 Tele5 Canal +
 
 ESTADÍSTICA 14 
 
 
3.- La tasa anual de crecimiento del PIB durante el período 1985-92, en la 
UE fue la indicada en la tabla. Construye el cartograma correspondiente. 
Países % 
Reino Unido 1 
Dinamarca 1 
Suecia 1 
Finlandia 1 
Grecia 1 
Francia 2 
Holanda 2 
Bélgica 2 
Alemania 2 
Austria 2 
Italia 2 
España 3 
Portugal 5 
Irlanda 5 
 
Resolución: Es la de la figura adjunta 
 
 
4.- Construye el pictograma correspondiente a la tabla que muestra la 
deuda externa de los países de América Latina en 1987: 
Países Millones $ 
Brasil 101.750 
México 100.000 
Venezuela 35.880 
Chile 20.690 
Bolivia 3.340 
Resolución: Figura de la derecha. 
 
 
6.- Representa mediante un diagrama lineal los parados existentes y 
parados que no reciben ninguna ayuda durante los años 1982-85. 
Año Parados Parados sin ayuda 
1982 1.872 1.243 
1983 2.207 1.627 
1984 2.475 1.822 
1985 2.623 1.759 
Resolución: Es la de la figura adjunta. 
 
 ESTADÍSTICA 15 
 
4.- Construye el diagrama de sectores correspondiente a la tabla que 
muestra la inversión publicitaria (en millones de dólares) en la Unión 
Europea (datos de 1986): 
Países Inversión 
Alemania 8.234 
Gran Bretaña 6.915 
Francia 4.663 
España 3.000 
Holanda 2.970 
Italia 2.846 
Dinamarca 1.084 
Bélgica 464 
Grecia 164 
Irlanda 127 
 
Resolución: Figura de la derecha. 
 
 
EJERCICIOS PROPUESTOS 
 
1.- Se ha tabulado el peso de los recién nacidos durante una semana en una maternidad, 
obteniéndose los siguientes resultados: 
Peso en kg. [2.5, 2.8) [2.8, 3.1) [3.1, 3.4) [3.4, 3.7) [3.7, 4.3) 
Nº de niños 2 2 4 10 16 
Teniendo en cuenta que todos los intervalos no tiene igual amplitud, representa gráficamente 
estos datos mediante el procedimiento más adecuado. 
 
2.- Los valores de los datos una distribución viene dados en la siguiente tabla. A partir de los 
resultados obtenidos representa el diagrama de barras y de barras acumuladas de la distribución. 
x 1 2 3 4 5 6 7 8 
n 4 5 8 7 5 10 7 4 
 
3. La siguiente tabla recoge el tiempo de retraso que sufren en la incorporación a clase los 
alumnos de un instituto: 
Retraso en minutos [0,4) [4,8) [8,12) [12,16) [16,20) 
nº de alumnos 5 15 18 10 4 
a) Representa los datos mediante un histograma. 
b) A continuación representa los datos mediante un sector circular. 
c) ¿Es adecuado el uso de este diagrama para la distribución? 
 
4.- El diagrama de la figura estudia la evolución de la inflación medida según el IPC en España 
en loa años que median desde 1962 a 1997. Con estos datos representa un diagrama de barras. 
 
Anuario el País 98 
 
 ESTADÍSTICA 16 
 
5.- En la figura adjunta se muestra la venta 
de ordenadores de diferentes marcas en 
España durante los años 1993 y 1994. 
 
a) ¿Qué empresas han aumentado ventas y 
cuáles han disminuido ventas?. 
b) Si se mantuvieran la misma tasa de 
aumento de ventas ¿cuánto se vendería de 
cada marca en el año 1995?. 
c) Dibuja un diagrama lineal en que 
aparezcan los mismos datos de este gráfico. 
 
6.- Las ventas (en millones de pta.) de una empresa en el año 1997 fueron las dadas en la figura. 
 
a) Halla la tabla y a partir de ésta un diagrama de sectores 
b) ¿Cuál es el más útil? 
 
7.- El gráfico siguiente muestra la distribución de la población ocupada en España en 1996. 
 
Teniendo en cuenta que la población ocupada en España es de 12,5 millones halla la tabla 
correspondiente a dicho gráfico. 
¿Es posible hallar la media de tal distribución?. 
 
8.- Interpreta analíticamente el siguiente diagrama que muestra la evolución de la cotización 
peseta - dólar en los años 1991-97. 
 
¿Cuálha sido la media de la cotización?. ¿Cuál ha sido el valor máximo?, ¿cuál ha sido el 
mínimo?. Si tenemos un millón de pesetas, ¿en que año tenemos más y menos dólares?. 
0 20.000 40.000 60.000 80.000 100.000
IBM
HP
Fujitsu
Compaq
Inves
Apple
Digital
SNI
 
 ESTADÍSTICA 17 
 
1.4.- COMPARACIÓN DE DIAGRAMAS 
 
• Para comparar dos o más distribuciones se dibujan todas ellas en una misma gráfica. 
 
• Se pueden dibujar diagramas de barras agrupados o, si queremos analizar la evolución de las 
frecuencias se representan los polígonos de frecuencias en la misma gráfica. 
 
• En ambos casos las frecuencias deben ser relativas para que las gráficas sean comparables. 
 
 
EJEMPLOS 
 
1.- Los siguientes diagramas de sectores corresponden a la composición 
de la Cámara del Parlamento de Andalucía (número de escaños obtenidos 
por cada partido) en las elecciones celebradas en 1994 y 1996: 
Representa estos resultados mediante otro procedimiento gráfico. 
 
Resolución: 
Recogemos los datos de las elecciones celebradas en 1994 y 1996 en la 
siguiente tabla estadística: 
 PSOE PP IU PA TOTAL 
94 45 41 20 3 109 
96 52 40 13 4 109 
dando lugar al diagrama de barras de la figura: 
 
 
 
 ESTADÍSTICA 18 
 
2.- Se ha medido la altura (en cm) de un grupo de 100 alumnos de COU y 
posteriormente se han agrupado los datos en intervalos (abiertos por la 
derecha). Los resultados se representan en el histograma siguiente. 
 
a) Halla la correspondiente tabla de frecuencias (absolutas y relativas). 
b) Representa el polígono de frecuencias acumuladas. 
 
Resolución: 
En un histograma la frecuencia (relativa o absoluta) de cada clase es 
proporcional a las áreas de los rectángulos que aparecen. 
 
Sea: 
- ai = amplitud de cada clase. 
- hi = altura de cada rectángulo. 
- ni = frecuencia absoluta de cada clase. 
- hi = frecuencia relativa de cada clase. 
 
Podemos formar la siguiente tabla: 
Clases Marcas: xi ai hi ni=hi.n fi=hi.ai Fi 
(150-165] 157,5 15 0,004 6 0,06 6 
(165-170] 167,5 5 0,02 10 0,1 16 
(170-175] 172,5 5 0,04 20 0,2 36 
(175-180] 177,5 5 0,08 40 0,4 76 
(180-190] 185 10 0,016 16 0,16 92 
(190-210] 200 20 0,004 8 0,08 100 
 0,164 100 1 
 
 
b) El polígono de frecuencias acumuladas es el de la figura siguiente, donde 
para dibujarla hemos utilizado los datos hallados en la tabla anterior. 
 
 
 
 ESTADÍSTICA 19 
 
EJERCICIOS PROPUESTOS 
 
1.- El diagrama de la figura compara 
la inflación en un cuatrimestre en 
España y en la Unión Europea. 
 
Halla la tabla correspondiente a 
dichos datos. 
 
A partir de la tabla creada con estos 
datos representa un diagrama de 
barras donde se comparen ambas 
distribuciones. 
 
2.- Los diagramas de la figura presentan la distribución del comercio minorista en España en los 
años 1976 y 1979. 
a) Haz una tabla que resuma los datos de los diagramas. 
b) Representa estos resultados mediante otro procedimiento gráfico. 
 
 
3.- En la siguiente gráfica se presenta la 
evolución anual de la flota pesquera 
española en los años 1977-1986 en 
porcentaje respecto al existente en 1977 
a) Representa un diagrama de barras 
donde se comparen ambas 
distribuciones. 
b) ¿En que año disminuye más el 
porcentaje de tripulantes ? 
c) ¿En que año disminuye más el 
porcentaje de tonelaje de 
embarcaciones? 
d) ¿Crees que existe una relación entre el 
número de tripulantes y el número de 
embarcaciones? 
0
0,5
1
1,5
2
2,5
3
Enero Febrero Marzo Abril Mayo
España Unión Europea
100
98 97 96 95
93 92
90
85
82
100
95 94 93 92
88
86 85
80
78
75
80
85
90
95
100
105
77 78 79 80 81 82 83 84 85 86
Tripulantes Tonelaje
 
 ESTADÍSTICA 20 
 
1.5.- EJERCICIOS FINALES 
 
1.- Se ha tabulado el peso de los recién nacidos durante una semana en una maternidad, 
obteniéndose los siguientes resultados: 
Peso en kg. [2.5, 2.8) [2.8, 3.1) [3.1, 3.4) [3.4, 3.7) [3.7, 4.3) 
Nº de niños 2 2 4 10 16 
Teniendo en cuenta que todos los intervalos no tiene igual amplitud, representa gráficamente 
estos datos mediante el procedimiento más adecuado. 
 
2. Completa los datos que faltan en la siguiente tabla estadística, donde n, N y f representan 
las frecuencias absoluta, acumulada y relativa, respectivamente: 
x n N f 
1 4 0,08 
2 4 
3 16 0,16 
4 7 0,14 
5 5 28 
6 38 
7 7 45 0,14 
8 
A partir de los resultados obtenidos representa el diagrama de barras y de barras acumuladas 
de la distribución. 
 
3. La siguiente tabla recoge el tiempo de retraso que sufren en la incorporación al trabajo los 
empleados de una empresa: 
Retraso en minutos [0,4) [4,8) [8,12) [12,16) [16,20) 
nº de empleados 5 15 18 10 4 
Representa los datos mediante un histograma. A continuación representa los datos mediante 
un sector circular. ¿Es adecuado el uso de este diagrama para la distribución? 
 
4.- La población en algunos países de la Unión Europea durante 1993 es la dada en la tabla 
adjunta. Haz una representación tipo pictograma de dicha distribución. 
Países Población (miles) 
R. F. Alemana 80.614 
Gran Bretaña 57.959 
Francia 57.530 
Italia 56.933 
España 39.114 
Holanda 15.239 
Bélgica 10.068 
 
5.- Interpreta analíticamente el siguiente diagrama que muestra la evolución de la cotización 
peseta- dólar en los últimos años. 
 
 ESTADÍSTICA 21 
 
 
 
¿Cuál ha el valor máximo de la cotización?. ¿Cuál ha el valor mínimo de la cotización?. Si 
tuviéramos un millón de pesetas, ¿en que año hubiéramos tenido más dólares?, ¿y menos?. 
 
6.- En el siguiente gráfico se muestra la evolución del PIB en España en los últimos 27 años: 
 
 
a) ¿En qué años ha crecido dicho PIB por encima del 4%? 
b) ¿En qué años ha crecido dicho PIB por debajo del 0%? 
c) ¿Cuál ha sido la media de crecimiento en dichos años? 
d) Si en el año 1994 el PIB era de 60 billones de pesetas, ¿cuánto vale en 1997? 
 
7.- Las puntuaciones obtenidas por 20 personas en una prueba quedan reflejadas en el 
siguiente histograma. 
 
 
 
a) Construye la tabla adecuada a los siguientes datos. 
b) Efectúa aun diagrama de sectores a partir de dicha tabla. 
c) ¿Es adecuado dicho diagrama? 
 
8.- Un jugador de baloncesto anota, cada domingo, el número de puntos que encesta en el partido 
de liga. Las anotaciones de los diez últimos encuentros son las siguientes: 
Anotaciones 10 18 17 8 10 9 19 10 7 10
Representa en un diagrama de barras la distribución utilizando las frecuencias absolutas 
acumuladas. 
 
 
 ESTADÍSTICA 22 
 
9.- Los siguientes datos indican el tiempo, en años, de permanencia de 15 empleados en una 
empresa: 
Permanencia 10 15 16 20 22 24 5 12 21 2 6 13 
a) Construye 6 intervalos de clase de igual amplitud siendo el primero (0, 5]. 
b) Representa el histograma de frecuencias absolutas. 
 
10.- El diagrama de barras muestra las calificaciones 
obtenidas por un grupo de 50 alumnos. Calcula la 
calificación media, teniendo en cuenta el siguiente 
cuadro de equivalencias: 
Notas Intervalo 
Suspenso [0,5) 
Aprobado [5,7) 
Notable [7,9) 
Sobresaliente [9,10) 
 
 
 
11.- El gráfico muestra la distribución de la población activa en España. 
 
 
 
Teniendo en cuenta que la población activa en España es de 15,2 millones halla la tabla 
correspondiente a dicho gráfico. 
 
12.- Los siguientes datos corresponden a la altura en centímetros de los alumnos de una 
determinada clase: 
151, 153, 156, 157, 157, 160, 161, 162, 163, 164, 165 
167, 168, 169, 170, 171, 172, 177, 178, 182, 183 
Realiza una representación gráfica. 
 
13.- Los pesos de los 100 alumnos de una clase vienen dados por la siguiente tabla: 
Peso [40-48] [48-56] [56-64] [64-72] [72-80] 
Frecuencia 12 23 25 18 22 
Efectúa una representación tipo histograma de dicha distribución. 
 
14.- En un estudio sobre la edad de 100 personas se han obtenido los siguientes datos: 
Edad [15-25] [25-35] [35-45] [45-55] [55-65] [65-75] 
Frecuencia 8 17 35 20 18 2 
Representa gráficamente los datos. 
 
 ESTADÍSTICA 23 
 
CAPÍTULO 2: 
 
DISTRIBUCIONES UNIDIMENSIONALES 
 
2.1.- MEDIDASDE CENTRALIZACIÓN 
 
Las medidas de centralización de una distribución estadística son las que indican como se 
encuentran el resto de valores de la variable con respecto a él. 
 
Las medidas de centralización más importantes son media aritmética, moda, mediana. Existen 
otras que no estudiaremos, como media geométrica o media armónica. 
 
 
1.- Media aritmética 
 
La media aritmética de una variable estadística es el cociente entre la suma de todos los valores 
de dicha variable y el número de valores. Se representa por x . 
 
La fórmula para su cálculo es: 
 x = 
n +...+ n +n
nx +...+nx +nx 
n21
nn2211 = nxN
1
ii
n
1=i
∑ 
 
Siendo: x media aritmética 
 xi valores de la variable 
 ni frecuencia absoluta asociada a los valores anteriores 
 N número total de datos de la distribución 
 
Consideraciones: 
• Es la medida de centralización más empleada en la Estadística. 
• En el caso de distribuciones continuas el cálculo de la media se efectúa con la misma 
fórmula pero tomando como valor de la variable la marca de clase de cada intervalo. 
• La media viene dada en las mismas unidades que la variable 
• Si la distribución posee valores extremos raros y poco significativos se produce una 
distorsión de la media. Por ejemplo si queremos hallar la talla media de los alumnos de una 
clase y un alumno mide 1,45 m dicho valor alterará la talla media de la clase. A veces se 
eliminan los valores extremos para hallar la media de forma significativa. 
• No es posible calcular la media: 
- Si los datos de la distribución son cualitativos. 
- Cuando la distribución es continua con alguna clase abierta. Se puede calcular la media 
tomando extremos ficticios de la clase abierta que haga todas las clases del mismo tamaño. 
• Si a todos los valores de una distribución se les suma un mismo valor la media aumenta en 
dicho valor. nCx(N
1
ii
n
1=i
)+∑ = CnxN
1
ii
n
1=i
+∑ 
• Si todos los valores de una distribución se multiplican por un mismo valor la media se 
multiplica por dicho valor nCx(N
1
ii
n
1=i
).∑ = .CnxN
1
ii
n
1=i
⎥
⎦
⎤
⎢
⎣
⎡
∑ 
• La suma de las desviaciones de los valores de la variable respecto de la media aritmética es 
siempre nula. n)xx( ii
n
1=i
−∑ 
 
 
 ESTADÍSTICA 24 
 
2.- Moda 
 
Moda de una variable estadística es el valor de dicha variable que presenta la mayor frecuencia 
absoluta. La moda se representa por Mo 
 
La moda no tiene por qué ser única, puede haber varios 
valores de la variable (2, 3, etc..) con la mayor frecuencia. 
En este caso se dice que es bimodal, trimodal, etc.. 
 
A veces se considera moda al valor que es mayor que los 
próximos aunque no sea el de mayor frecuencia. 
 
 
Cálculo: 
• Datos simples: 
Mo será el valor xi de mayor frecuencia ni. Si todos los datos de una distribución tienen la 
misma frecuencia, esa distribución no tiene moda. 
 
• Datos agrupados: 
El intervalo modal será el intervalo de mayor frecuencia ni, la moda Mo será el valor: 
M0 = 
21
1
i D+D
DC + L 
donde: 
Li límite inferior de la clase modal. 
c amplitud de los intervalos. 
D1 frecuencia absoluta de la clase modal menos la de la clase anterior (ni - ni-1) 
D2 frecuencia absoluta de la clase modal menos la de la clase siguiente (ni - ni+1) 
 
 
Consideraciones: 
• La moda es menos representativa que la media aritmética, pero es se puede hallar cuando se 
trata de distribuciones de datos cualitativos. 
• En la moda no intervienen todos los datos de una distribución. 
• Aunque es una medida de centralización, es frecuente encontrarla en los extremos de la 
distribución, en cuyo caso no es demasiado representativa de los valores centrales. 
 
 
Cálculo gráfico 
Para distribuciones continuas se puede 
obtener la moda con cierta aproximación de 
forma gráfica. 
 
Para ello se representa el histograma de 
frecuencias absolutas y a continuación se 
unen cada extremo de la clase modal con el 
extremo correspondiente de las contiguas, 
tal como se ve en la figura. La moda Mo 
viene dada por la abscisa del punto de corte. 
 
 
3.- Mediana 
 
Mediana de una variable estadística un valor de la variable, tal que el número de observaciones 
menores que él es igual al número de observaciones mayores que él. La mediana de una variable 
se representa por Me. 
 
La mediana siempre es un valor único, al contrario que la moda. En caso de existir un número 
par de datos se toma la media de los dos valores centrales como mediana. 
0
2
4
6
8
10
M0 M1
 
 ESTADÍSTICA 25 
 
Cálculo: 
• Datos simples: Se ordenan los datos de menor a mayor, la mediana será. 
− Si el valor central de la variable es único, el término central. 
− Si hay dos valores centrales, se toma como mediana la semisuma de esos dos valores 
centrales. 
 
• Datos agrupados: La mediana viene dada por el primer valor de la variable cuya frecuencia 
absoluta acumulada (Fi) excede a la mitad del número de datos. Para ello se construye la 
columna de frecuencias acumuladas y se calcula donde está el valor medio. 
Si la mitad del número de datos coincide con la frecuencia absoluta acumulada (Fi) de un 
valor, Me es la semisuma entre ese valor y el siguiente de la tabla. 
 
Si la variable es continua: Calculamos la clase mediana de forma similar al caso discreto. 
Para obtener un valor aproximado de la mediana seleccionamos primero la clase mediana y 
luego aplicamos la fórmula: 
Me =
n
N-2
N
 c+L 
i
1-i
i
⎟
⎠
⎞
⎜
⎝
⎛
 
donde: 
Li límite inferior de la clase mediana 
c amplitud del intervalo 
N nº de datos 
Ni-1 frecuencia absoluta acumulada de la clase anterior a la clase mediana 
ni frecuencia absoluta de la clase mediana. 
 
 
Consideraciones 
• La mediana es muy útil cuando: 
- existe algún valor raro que afecta a la media. 
- los datos están agrupados en clases, siendo alguna de ellas abierta. 
• La mediana es un parámetro que depende del orden en que estén situados los datos y no 
de su valor. 
• Para distribuciones continuas o agrupadas que se puedan representar mediante un 
histograma, la mediana es el valor de la variable que divide al histograma en dos partes 
de igual área. 
 
 
Cálculo gráfico 
Para hallar gráficamente la mediana se 
representa el polígono de frecuencias 
relativas acumuladas (Fi). 
 
Situamos en el eje de abscisas la variable y 
en el eje de ordenadas los porcentajes 
correspondientes. 
 
Se traza una paralela al eje X por el punto 
correspondiente al 50 %. La abscisa del 
punto de corte de esa paralela con la gráfica 
nos da la mediana. 
 
 
EJEMPLOS 
 
1.- Un jugador de baloncesto anota, cada domingo, el número de puntos 
que encesta en el partido de liga. Las anotaciones de los últimos diez 
encuentros, jugados por su equipo, se muestran en el siguiente cuadro 
 
 ESTADÍSTICA 26 
 
Encuentro 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 
Anotaciones 10 18 17 8 10 9 19 10 7 10 
Halla la media de las anotaciones. 
 
Resolución: 
Para hallar la media utilizamos la siguiente tabla 
xi ni xi ni 
7 1 7 
8 1 8 
9 1 9 
10 4 40 
17 1 17 
18 1 18 
19 1 19 
 10 118 
 
Siendo su valor: 
 x = nxN
1
ii
n
1=i
∑ = 10
118 = 11,8 puntos 
 
 
2.- Dada la distribución estadística 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
ni 4 6 7 10 2 1 
Calcula la media. 
 
Resolución: 
Construimos la siguiente tabla auxiliar. 
Clases Marcas: xi ni xini 
(0-5] 2,5 4 10 
(5-10] 7,5 6 45 
(10-15] 12,5 7 87,5 
(15-20] 17,5 10 175 
(20-25] 22,5 2 45 
(25-30] 27,5 1 27,5 
 30 390 
De ella obtenemos: 
 x = nxN
1
ii
n
1=i
∑ = 30
390 = 13 
 
 
3.- Halla la media de siguiente distribución estadística 
Color de ojos azul verde negro castaño 
ni 4 6 5 10 
 
 
 ESTADÍSTICA 27 
 
Resolución: 
No es posible calcular la media ya que son datos de tipo cualitativo 
 
 
4.- Dada la distribución estadística. Calcula la media. 
edad menor de 18 18 a 40 40 a 60 mayor que 60 
nº 250 1254 756 243 
 
Resolución: 
No es posible calcular la media ya que hay dos clase (menores de 18 años y 
mayores de 60) que son abiertas,además las clases intermedias no tiene el 
mismo tamaño y el número de clases es muy reducido para la cantidad de 
datos que hay. El valor de la media así obtenida no tendría ningún interés. 
 
 
5.- Considera los datos 1, 2, 3, 4 y 5. 
a) Calcula su media. 
b) Si sumas 10 a cada uno de los datos anteriores, ¿cuánto vale la media? 
c) Si multiplicas por 5 cada uno de los datos anteriores, ¿cuánto vale la 
media? 
 
Resolución: 
a) Su media es: x = nxN
1
ii
n
1=i
∑ = 5
15 = 5 
 
b) Si a los valores de la distribución se les suma una constante la media 
aumenta en dicho valor: x n = x + 10 = 5+10 = 15. 
c) Si todos los valores de una distribución se multiplican por una constante la 
media se multiplica por dicho valor: x n = 5. x = 5.5 = 25. 
 
 
6.- Un jugador de baloncesto anota, cada domingo, el número de puntos 
que encesta en el partido de liga. 
Las anotaciones de los últimos diez encuentros, jugados por su equipo, 
se muestran en el siguiente cuadro 
Encuentro 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 
Anotaciones 10 18 17 8 10 9 19 10 7 10 
Halla la moda de las anotaciones. 
 
Resolución: 
Para hallar la moda utilizamos la siguiente tabla 
xi 7 8 9 10 17 18 19 
ni 1 1 1 4 1 1 1 
La moda es el valor más frecuente, por lo tanto Mo = 10 puntos. 
 
 
7. Dada la siguiente distribución: Calcula su moda. 
xi 1 2 3 4 5 6 
ni 6 7 14 10 14 9 
 
Resolución: 
Las modas son Mo= 3 y Mo'= 5. La distribución es por lo tanto bimodal. 
 
 ESTADÍSTICA 28 
 
8.- Dada la distribución estadística 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
ni 4 6 7 10 2 1 
Calcula la moda. 
 
Resolución: 
El Intervalo modal es el de mayor frecuencia absoluta (15-20]. 
Para hallar el valor de la moda aplicamos la fórmula de interpolación: 
M0 =
21
1
i D+D
DC + L =
2)-(107)-(10
7-105+ 15
+
= 16,36 
 
 
9.- La superficie sembrada (en miles de Ha) de lenteja en España durante 
los años de 1970 a 1974 fue: 
Año 1970 1971 1972 1973 1974 1975 
Superficie 68 75 87 99 105 115 
calcula la superficie modal. 
 
Resolución: 
No existe moda ya que no hay ningún valor cuya frecuencia se repita. 
 
 
10.- La superficie sembrada (en miles de Ha) de lenteja en España durante 
los años de 1970 a 1974 fue: 
Año 1970 1971 1972 1973 1974 
Superficie 68 75 87 99 105 
calcula la superficie mediana. 
 
Resolución: 
Se colocan los valores de la superficie ordenados. La mediana se obtiene 
buscando el valor que deja la mitad de la distribución a la izquierda; como 
N/2= 2,5 el primer valor de la variable cuya frecuencia absoluta acumulada 
excede a 2,5 es Me = 87. 
 
 
11.- La superficie sembrada (en miles de Ha) de lenteja en España durante 
los años de 1970 a 1974 fue: 
Año 1970 1971 1972 1973 1974 1975 
Superficie 68 75 87 99 105 115 
calcula la superficie mediana. 
 
Resolución: 
Calculamos N/2 = 3 (valor par), el valor de la mediana es: 
Me = 2
99+87 = 93 
 
 
12.- Dada la distribución de frecuencias de la tabla adjunta, se pide: 
 xi 1 2 3 4 5 
ni 1 2 4 2 1 
Calcula el valor de la mediana. 
 
 ESTADÍSTICA 29 
 
Resolución: 
Para calcular la mediana utilizamos la tabla adjunta: 
 xi 1 2 3 4 5 
Ni 1 3 7 9 10 
 
La mediana, Me, se promediando los valores intermedios ya que el resultado es 
par, N/2 = 5. 
 
Observamos en la columna de frecuencias absolutas agrupadas los valores 
que ocupan los lugares 5º y 6º: Me = 2
3+3 = 3 
 
 
13.- Dada la distribución estadística 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
ni 4 6 7 10 2 1 
Calcula la mediana. 
 
Resolución: 
Utilizamos la tabla auxiliar: 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
Ni 4 10 17 27 29 30 
La clase mediana es (10, 15], pues la frecuencia absoluta acumulada es 17, 
mayor que 30/2, por lo tanto tenemos: 
Me =
n
F-2
N
 . c+L
i
1i-
i
⎟
⎠
⎞
⎜
⎝
⎛
 = 
7
10-
2
30
5. +10 = 13,57 
 
 
14.- Dada la distribución estadística 
Ii (38, 44] (44, 50] (50,56] (56,62] (62,68] (68, 74] (74, 80] 
ni 7 8 15 25 18 9 6 
Calcula la mediana gráficamente. 
 
Resolución: 
Utilizamos la tabla adjunta, siendo la mediana la del segmento de la figura . 
Ii Ni 
(38-44] 7 
(44-50] 15 
(50-56] 30 
(56-62] 55 
(62-68] 73 
(68-74] 82 
(74-80] 90 
 
 
 ESTADÍSTICA 30 
 
EJERCICIOS PROPUESTOS 
 
1.- El número de goles anotados por un equipo de fútbol en los partidos de liga, se muestran en el 
siguiente cuadro 
Encuentro 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 
Anotaciones 1 2 1 4 1 3 2 0 1 3 
Halla la media, mediana y moda de las anotaciones. 
Solución: x = 1,8; Me = 1,5; M0 = 1. 
 
2.- Dada la distribución estadística 
xi (0, 6] (6, 12] (12, 18] (18,24] (24,30] 
ni 2 6 7 10 5 
Calcula la media, mediana y moda. 
Solución: x =17; Me = 18; M0 = 20,25. 
 
3.- Halla la media de la siguiente distribución estadística 
Color del cabello rubio pelirrojo negro castaño 
ni 4 6 5 10 
Solución: No se puede hallar. 
 
4.- Dada la distribución estadística 
edad menor de 15 15 a 30 30 a 50 mayor que 50 
nº 450 1254 656 143 
Calcula la media. 
Solución: No se puede hallar. 
 
5.- Considera los datos 2, 4, 6, 8 y 10. 
a) Calcula su media. 
b) Si sumas 5 a cada uno de los datos anteriores, ¿cuánto vale la media? 
c) Si multiplicas por 10 cada uno de los datos anteriores, ¿cuánto vale la media? 
Solución: a) x = 6, b) x +5 = 11, c)10 x = 60. 
 
6. Dada la siguiente distribución: 
xi 1 2 3 4 5 6 
ni 6 5 4 10 4 1 
Calcula su moda y mediana. 
Solución: Me = 3,5; M0 = 4. 
 
7. Dada la siguiente distribución: 
xi 1 2 3 4 5 
ni 6 5 4 10 4 
Calcula su moda y mediana. 
Solución: Me = 3, M0 = 4. 
 
8.- Dada la distribución estadística 
 
 ESTADÍSTICA 31 
 
Ii (0, 10] (10,20] (20, 30] (30,40] (40,50] 
ni 1 6 7 4 2 
Calcula la moda y mediana. 
Solución: Me = 24,3; M0 = 22,5. 
 
9.- Dada la distribución estadística 
Ii (30, 40] (40, 50] (50,60] (60,70] (70,80] 
ni 7 8 15 25 20 
Calcula la moda gráficamente. 
Solución: M0 = 66,7. 
 
10.- Dada la distribución estadística 
Ii (30, 40] (40, 50] (50,60] (60,70] (70,80] 
ni 7 8 15 25 20 
Calcula la mediana gráficamente. 
Solución: Me = 63. 
 
11.- Completa los datos que faltan en la siguiente tabla de distribución de frecuencias, donde ni, 
Ni y fi representan, respectivamente, la frecuencia absoluta, la frecuencia absoluta acumulada y 
la frecuencia relativa de la variable X . 
 
X 1 2 3 4 5 6 7 8 
ni 4 4 7 5 7 
Ni 23 38 45 
fi 0,08 0,16 
 
Calcula la media y moda de la distribución anterior. 
Solución: x = 4,76; M0 = 6; Me = 5. 
 
 
12. Completa la siguiente tabla de distribución de frecuencias, sabiendo que la media de la 
variable de X es 3, (ni representan las frecuencias absolutas y Ni las frecuencias absolutas 
acumuladas). 
X 1 2 3 4 5 
ni 16 8 
Ni 9 52 
 
Calcula la moda y mediana de la distribución anterior. 
Solución: Me = 3; M0 = 3. 
 
13.- Se considera la tabla estadística siguiente: 
 X 2 4 a 3 5 
Y 1 2 1 1 3 
 donde a es una incógnita. Calcula el valor de a sabiendo que la media de X es 3. 
Solución: a = 1. 
 
 
 ESTADÍSTICA 32 
 
2.2.- MEDIDAS DE POSICIÓN 
 
1.- Definición 
 
Las medidas de posición se llaman cuantiles o percentiles y sirven para indicar la posición de 
algunos puntos importantes de la distribución. Dividen a la muestra ordenada en partes iguales. 
Los percentiles son los 99 valores que dividen la distribución en 100 partes iguales. Se denotan 
por P1, P2 ,....P99 y se designan por percentil primero, segundo, etc... 
Algunos percentiles concretos son la mediana y los cuartiles, quintiles y deciles. 
• Mediana: Es una medida de posición que deja por debajo de ella el 50% de los valores de 
la distribución. Si la variable no es cuantitativa o cualitativa ordinal no se puede calcular. 
Corresponde al percentil Me = P50. 
 
• Cuartiles: Se llaman cuartiles a los tres valores que dividen a la serie de datos en cuatro 
partes iguales. Se representan por Q1 , Q2 , Q3 y se designan cuartil primero, segundo y 
tercero respectivamente. 
Corresponden a los percentiles Q1=P25, Q2 = P50, Q3= P75. 
 
• Quintiles: Se llaman quintiles a los cuatro valores que dividen a la serie de datos en cinco 
partes iguales. Se representan por K1 , K2 , K3 , K4 y se designan quintil primero, segundo, 
tercero y cuarto, respectivamente. 
Corresponden a los percentiles K1= P20, K2 = P40, K3= P60, K4= P80, 
 
• Deciles: Se llaman deciles a los nueve valores que dividen a la distribución en 10 partes 
iguales. Se representan por D1, D2,..., D9 y de designan decil primero, segundo, etc... 
Corresponden a los percentiles D1= P10, ..., D9 = P90, 
 
 
2.- Cálculo 
 
Todos los cuantiles se expresan a partir de un percentil, es suficiente aprender a calcular estos. 
 
• Datos simples: Un percentil Pi viene dado por el primer valor de la variable cuya frecuencia 
absoluta acumulada (Ni) excede a ⎟
⎠
⎞
⎜
⎝
⎛
100
Ni. . Para ello se construye la columna de frecuencias 
absolutas acumuladas y se calcula donde está dicho valor. Si coincide con la frecuencia 
absoluta acumulada de un valor, Pi es la semisuma entre ese valor y el siguiente. 
 
• Datos agrupados: Calculamos la clase del percentil de forma similar al caso discreto. Para 
obtener el valor concreto del percentil aplicamos la fórmula: 
Pi = 
n
N-
100
Ni.
 c+L 
i
1-i
i
⎟
⎠
⎞
⎜
⎝
⎛
 
Donde: 
 Li = límite inferior de la clase a la que pertenece el percentil 
 c = amplitud del intervalo 
 N = nº de datos 
Ni-1 = frecuencia absoluta acumulada de la clase anterior a la que pertenece el percentil 
ni = frecuencia absoluta de la clase a la que pertenece el percentil 
 
 
3.- Observaciones 
 
• Aunque a veces se incluyen los cuantiles dentro de los parámetros de centralización por ser 
la mediana un parámetro de posición situado en el centro, pueden estar situados en los 
extremos de la distribución, por ejemplo P90, de ahí que no los consideremos como tales y 
los llamemos parámetros de posición. 
 
 ESTADÍSTICA 33 
 
• Son parámetros estadísticos muy usados, sobre todo en las Ciencias Sociales y Biosanitarias. 
• Se les suele llamar parámetros de posición porque sitúan la distribución respecto de ellos. 
 
 
4.- Cálculo gráfico 
 
Se representa el polígono de frecuencias 
relativas acumuladas (Fi ) en %, situando en 
el eje de las X la variable (si es discreta) o 
los intervalos, y en el eje Y los porcentajes 
correspondientes. 
 
Se traza una paralela al eje X por el punto 
correspondiente al cuantil deseado, esta 
recta corta al polígono de frecuencias en un 
punto; por éste se traza una paralela al eje Y. 
El punto del eje X donde corta esta última 
paralela es el cuantil buscado 
 
 
EJEMPLOS 
 
1.- Dada la distribución de frecuencias de la tabla adjunta, se pide: 
xi 1 2 3 4 5 
ni 1 2 4 2 1 
el valor de la expresión E = Q3-Mo+Q1-Me, donde Q3 y Q1 son 
respectivamente el tercer y primer cuartil, MO es la moda y Me la mediana. 
 
Resolución: 
Para hallar los valores pedidos utilizamos la tabla adjunta: 
xi ni Ni 
1 1 1 
2 2 3 
3 4 7 
4 2 9 
5 1 10 
 10 
• Q3 es el tercer cuartil, para hallarlo buscamos el valor que deja las tres 
cuartas parte de la distribución a la izquierda; como 3N/4 =7,5 el primer 
valor de la variable cuya frecuencia absoluta acumulada excede a 7,5 es 4. 
• Q1 es el primer cuartil, para hallarlo buscamos el valor que deja la cuarta 
parte de la distribución a la izquierda; como N/4 = 2,5 el primer valor de la 
variable cuya frecuencia absoluta acumulada excede a 2,5 es 2. 
• Me, mediana, es el valor central. El primer valor de la frecuencia absoluta 
acumulada que supera 
2
N = 5 es 3 
• Mo, moda, es el valor más frecuente, por lo tanto Mo = 3. 
 
El valor de la expresión pedida es: 
Q3-Mo+Q1-Me = 4 - 3 + 2 - 3 = 0 
 
 
 
 ESTADÍSTICA 34 
 
2.- Dada la distribución de frecuencias de la tabla adjunta, se pide: 
xi 1 2 3 4 5 6 7 8 
ni 4 6 5 6 10 9 4 6 
el segundo decil y los percentiles P40 y P70. 
 
Resolución: 
Para calcular los parámetros pedidos utilizamos la tabla siguiente. 
xi ni Ni 
1 4 4 
2 6 10 
3 5 15 
4 6 21 
5 10 31 
6 9 40 
7 4 44 
8 6 50 
 50 
• El segundo decil D2 deja el 20% de la distribución a la izquierda; como 
2.N/10 = 10 coincide con la frecuencia absoluta acumulada del valor 2, D2 
será la semisuma entre ese valor y el siguiente: D2 = 2
3+2 = 2,5. 
• P40 deja a la izquierda el 40% de los datos: 100
N40 = 
100
5040 = 20. 
Por lo tanto P40 = 4 
 
• P70 deja a la izquierda el 70% de los datos: 100
N70 = 
100
5070 = 35. 
Por lo tanto P70 = 6 
 
 
3.- Se ha aplicado un test sobre satisfacción en el trabajo a 90 empleados 
de una fábrica, obteniéndose los siguientes resultados: 
Puntuaciones (38-44] (44-50] (50-56] (56-62] (62-68] (68-74] (74-80] 
Nº trabajadores 4 12 10 30 20 8 6 
Calcula el primer y tercer cuartil. 
 
Resolución: 
Utilizamos la tabla auxiliar: 
Clases ni Ni 
(38-44] 4 4 
(44-50] 12 16 
(50-56] 10 26 
(56-62] 30 56 
(62-68] 20 76 
(68-74] 8 84 
(74-80] 6 90 
 90 
 
 ESTADÍSTICA 35 
 
El intervalo correspondiente al primer cuartil es (50,56]. La fórmula para 
calcularlo es: 
Q1 = 
n
F-
4
N
 . c+L 
i
1i-
i
⎟
⎠
⎞
⎜
⎝
⎛
 = 
10
16-
4
90
6. + 50 = 53,9 
 
y el correspondiente al tercer cuartil es (62,68]. La fórmula para calcularlo es: 
Q3 = 
n
F-
4
N 3
 . c+L 
i
1i-
i
⎟
⎠
⎞
⎜
⎝
⎛
 = 
20
56-
4
903
6. + 62
⎟
⎠
⎞
⎜
⎝
⎛
= 65,45 
 
Siendo en ambos casos: 
Li = límite inferior de la clase del cuartil correspondiente 
Fi-1 = frecuencia absoluta acumulada de la clase anterior a la del cuartil 
correspondiente 
ni = frecuencia absoluta de la clase del cuartil correspondiente 
 
 
4.- Un test aplicado a 50 alumnos de 1º de Bachillerato ha dado los 
siguientes resultados: 
Puntuaciones [20,25) [25,30) [30.35) [35,40) [40,45) [45,50) 
Nº de alumnos 8 13 18 5 4 2 
a) Calcula la puntuación mediana. 
b) Calcula a partir de que puntuación se encontrará el 25 % de la clase 
con puntuación más baja. 
 
Resolución: 
Para hallar los valores pedidos en este ejercicio utilizamos la siguiente tabla: 
Clases ni Ni 
[20,25) 8 8 
[25-30) 13 21 
[30,35) 18 39 
[35-40) 5 44 
[40,45) 4 48 
[45-50) 2 50 
 50 
 
a) La mediana deja a ambos lados el 50% de la distribución. El intervalo 
correspondiente a la mediana se busca mediante N/2 = 25 y resulta ser el 
intervalo [30,35). 
 
La fórmula para hallar la mediana es: 
Me = 
n
N-
2
N
 . c+L 
i
1-i
i = 18
21-
2
50
.5+ 30 = 31,11 
 
siendo: 
Li = límite inferior de la clase mediana. 
Ni-1 = frecuencia absoluta acumulada de la clase anterior a la de la 
mediana. 
ni = frecuencia absoluta de la clase mediana. 
 
 
 
 ESTADÍSTICA 36 
 
b) El valor pedido es el percentil 25 o primer cuartil. El intervalo 
correspondiente al primer cuartil se busca mediante N/4 = 12,5 que pertenece 
al intervalo [25, 30). La fórmula para hallarlo es: 
Q1 = 
n
N-
4
N
 . c+L 
i
1-i
i = 13
8-
4
50
.5+ 25 = 26,73 
 
 
5.- Dada la distribución estadística 
Ii (38, 44] (44, 50] (50,56] (56,62] (62,68] (68, 74] (74, 80] 
ni 7 8 15 25 18 9 6 
Calcula gráficamente el primer y tercer cuartil. 
 
Resolución: 
Utilizamos la tabla auxiliar: 
Ii ni Ni Ni 
(38, 44] 7 7 7 
(44, 50] 8 15 15 
(50,56] 15 30 30 
(56,62] 25 55 55 
(62,68] 18 73 73 
(68, 74] 9 82 82 
(74, 80] 6 88 88 
Los cuartiles son los dados por los segmentos rayados en la figura adjunta. 
 
 
 
EJERCICIOS PROPUESTOS 
 
1.- La superficie sembrada (miles de Ha) de lentejas en España en los años de 1970 a 1974 fue: 
Año 1970 1971 1972 1973 1974 
Superficie 68 75 87 99 105 
 Calcula la producción mediana y el percentil 60 de la superficie. 
Solución: Me = 87, P60 = 93. 
 
2.- Dada la distribución estadística 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
ni 4 6 7 10 2 1 
Calcula el primer y tercer cuartil. 
Solución: Q1 = 7,9; Q3 = 17,75. 
 
3.- La tabla siguiente representa la distribución de las calificaciones obtenidas por 150 
estudiantes de un curso 
Calificaciones (0,2] (2-4] (4-6] (6-8] (8-10] 
Nº de estudiantes 10 50 5525 10 
Calcula la mediana y el primer cuartil. 
Solución: Me = 4,54; Q1 = 3,1. 
 
 ESTADÍSTICA 37 
 
4.- Se ha medido la altura (en cm) de un 
grupo de 100 alumnos y posteriormente se 
han agrupado los datos en intervalos 
(abiertos por la derecha). Los resultados se 
representan en el histograma siguiente. 
a) Halla la mediana y el tercer cuartil. 
b) Encuentra un intervalo que abarque el 
60% de la población. 
Solución: a) Me =176,12 cm, Q3=178,69 cm, 
b) Un posible intervalo es (150,178]. 
 
5.- Se ha preguntado a un grupo de deportistas las horas que dedican a entrenamiento durante el 
fin de semana. Los resultados aparecen en la siguiente distribución de frecuencias 
 Horas [0,0.5) [0.5,1.5) [1.5,2.5) [2.5,4) [4,8] 
Personas 10 10 18 12 12 
 Calcula el tercer cuartil. 
Solución: La clase del cuartil es [2.5,4). Q3 = 3,56 horas. 
 
 6.- Sea X una variable estadística que indica el tiempo, en años, de permanencia de quince 
empleados en una empresa 
X 10 15 16 20 22 24 30 29 24 5 12 21 2 6 13 
a) Construye 6 intervalos de clase de igual amplitud siendo el primero (0,5]. 
b) Calcula la mediana. 
Solución: Me = 16 años. Si se calcula con clase obtenemos el valor aproximado 16,25 años. 
 
7.- Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, 
elegidos al azar en un barrio de la ciudad, y se han encontrado los siguientes precios: 
95 108 97 112 99 106 105 100 99 98 104 110 107 111 103 110 
a) Construye 4 intervalos de clase de igual amplitud siendo el primero [95, 100) 
b) Calcula la mediana y el percentil 40. 
Solución: Me = 105; P40 = 102,3. 
 
8.- Se ha aplicado un test sobre satisfacción en los estudios a 100 estudiantes, obteniéndose los 
siguientes resultados. Calcula el primer y tercer cuartil gráficamente. 
Puntuaciones (38-44] (44-50] (50-56] (56-62] (62-68] (68-74] (74-80] 
Estudiantes 10 12 16 30 20 8 6 
Solución: Q1 = 51,7; Q3 = 64,7. 
 
9.- Un test aplicado a 100 alumnos de 2º de Bachillerato ha dado los siguientes resultados: 
Puntuaciones [20,25) [25,30) [30.35) [35,40) [40,45) [45,50) 
Nº de alumnos 18 23 28 15 9 7 
a) Calcula la puntuación mediana. 
b) Calcula a partir de que puntuación se encontrará el 40 % de la clase con menor puntuación. 
Solución: 
 
10.- Dada la distribución estadística de la superficie de las fincas de un pueblo 
Superficie (0, 5] (5, 10] (10, l5] (15,20] (20,25] 
nº de fincas 2 10 3 4 1 
Calcula y explica el significado de los cuartiles. 
Solución: Q1 = 6; Q2 = 8,2; Q3 = 15. 
 
 ESTADÍSTICA 38 
 
2.3.- REPRESENTACIÓN BOX-WHISKER 
 
1.- Definición 
 
La traducción del termino Box-Whisker es 
la de caja con bigotes., en ocasiones se dice 
simplemente gráfico de caja. Realiza una 
síntesis gráfica de cinco parámetros de una 
distribución: la mediana, los cuartiles 
primero y tercero y los valores máximo y 
mínimo. 
 
 
2.- Cálculo 
 
Para construir una caja con bigotes se llevan a una escala graduada los siguientes datos: Q1, 
Me, Q3, y los valores máximo y mínimo de la variable x. 
 
Se efectúan los pasos siguientes 
• Se dibuja una caja estrecha que una los cuartiles 1º y 3º de la distribución. 
• Se dibuja una barra vertical que atraviese la caja en la posición de la mediana. 
• Se dibujan dos segmentos horizontales que unan los extremos de la caja con los valores 
mínimo y máximo de la distribución. 
 
 
3.- Observaciones 
 
• Un gráfico Box-Whisker da una aproximación rápida a ciertas características de la 
distribución: localización, dispersión y simetría. 
• La barra de la mediana muestra la localización o centro de los datos. 
• La longitud de la caja muestra la dispersión de la mitad central de los datos, los segmentos 
muestran la dispersión de la mitad extrema de los datos. 
• Si el gráfico es simétrico respecto de la barra central, los datos serán aproximadamente 
simétricos respecto de la mediana. Si la distancia entre la barra y el extremo derecho es 
mayor que con el lado izquierdo la distribución presenta asimetría hacia la derecha y 
viceversa. 
• Los gráficos de caja con bigote son especialmente efectivos para comparar dos o más 
conjuntos de datos. 
 
 
EJEMPLOS 
 
1.- Obtén las representaciones Box-Whisker que comparan las 
distribuciones de las calificaciones de los alumnos y alumnas en una 
prueba de idioma. 
Alumnos: Alumnas: 
68, 65, 65, 70, 72, 73, 74, 79, 79, 
79, 80, 81, 82, 84, 85, 88, 89, 90, 
91, 91, 92, 96 
65, 73, 78, 78, 82, 83, 87, 88, 89, 
89, 90, 91, 91, 92, 93, 94, 95, 95, 
96, 97, 98. 
Resolución: 
La representación Box-Whisker es la de la figura adjunta: 
 
 ESTADÍSTICA 39 
 
 
 
 
 
EJERCICIOS PROPUESTOS 
 
1.- Obtén las representaciones Box-Whisker que comparan las distribuciones de las 
calificaciones de chicos y chicas en una prueba de inteligencia. 
Chicos: Chicas: 
68, 65, 65, 74, 73, 72, 70, 79, 
79, 80, 81, 82, 84, 85, 88, 89, 
90, 91, 92, 96. 
65, 73, 78, 78, 83, 87, 88, 89, 
89, 90, 91, 91, 92, 93, 94, 95, 
95, 96, 97, 98. 
En de las dos distribución dadas estudia a) localización, b) dispersión, c) simetría. 
 
2. Dada la distribución estadística: 
Ii [0, 5) [5, 10) [10, 15) [15, 20) [20,25) 25 o más 
ni 3 5 7 8 2 5 
realiza una representación Box-Whisker e interprétela. 
 
3. Las puntuaciones obtenidas por 20 personas en una prueba quedan reflejadas en el 
siguiente histograma. 
 
Haz una interpretación Box-Whisker e interprétela. 
 
4.- De una muestra de 10 alumnos se han obtenido los siguientes datos sobre la puntuación en un 
examen en puntos: 
Puntos 85 95 90 88 114 97 98 88 89
Realiza un diagrama Box-Whisker de estos datos e interprétalo. 
 
5.- Los siguientes datos corresponden a al altura en centímetros de los alumnos de una 
determinada clase: 
151, 153, 156, 157, 157, 160, 161, 162, 163, 164, 165 
167, 168, 169, 170, 171, 172, 177, 178, 182, 183 
Realiza un diagrama Box-Whisker de estos datos e interprétalo. 
 
 
 ESTADÍSTICA 40 
 
2.4.- MEDIDAS DE DISPERSIÓN 
 
Para que la investigación acerca de una distribución quede completa es imprescindible saber si 
los datos numéricos están agrupados o no alrededor de los valores centrales. A los parámetros 
que miden estas desviaciones respecto a la media se les llama medidas o parámetros de 
dispersión. 
 
 
1.- Rango 
 
Se llama rango o recorrido de una distribución, y se denota R, a la diferencia entre los valores 
extremos de la variable. Además existen otros rangos: 
• Rango intercuartílico: diferencia entre el primer y tercer cuartil. Ri = Q3. -Q1 
• Rango intercuartílico superior: diferencia entre el mayor valor de la variable y el tercer 
cuartil. 
• Rango intercuartílico inferior: diferencia entre el primer cuartil y el menor valor de la 
variable. 
• Rango entre percentiles: diferencia entre dos percentiles determinados, por ejemplo P = P90 
–P10. 
 
 
Observaciones: 
 
• Cuanto menor es el recorrido de una distribución mayor es el grado de representatividad de 
los valores centrales. 
• Es sencillo de calcular. 
• Viene dado en las mismas unidades que la variable. 
• Presenta el inconveniente de que sólo depende de los valores extremos; de forma que basta 
que uno de ellos se separe mucho, para que el rango se vea afectado, es por lo que se han 
definido los otros rangos. 
 
 
2.- Desviación media 
 
Se llama desviación media de una variable a la media aritmética de las desviaciones absolutas 
respecto de la media. Se representa por dm. 
 
 
Cálculo: Se obtiene mediante la fórmula: 
dm = x- xn N
1
ii
n
1=i
∑ 
Siendo: 
 x media aritmética 
 xi valores de la variable 
 ni frecuencia absoluta asociada a los valores anteriores 
 N número total de datos de la distribución 
 
 
Observaciones: 
 
• La desviación media depende de todos los valores de la distribución. 
• Si no es posible hallar la media no es posible hallar la desviación media. 
• Viene expresada en las mismas unidades que los datos. 
 
 
 ESTADÍSTICA 41 
 
3.- Varianza 
 
Se llama varianza de una variable ala media aritmética de los cuadrados de las desviaciones 
respecto a la media. Se representa por S2 y a veces se llama desviación cuadrática media. 
 
 
Cálculo: 
 
Se obtiene mediante la fórmula: 
S2 = ) x-(xn N
1 2
ii
n
1=i
∑ 
 
Es una fórmula incómoda, sobre todo si los cálculos son manuales, ya que al ser la media un 
número con decimales los cálculos suelen ser laboriosos, por lo que se usa esta otra expresión: 
S2 = x - xn N
1 22
ii
n
1=i
∑ 
 
 
Observaciones: 
 
• La varianza depende de todos los valores de la distribución y de la media. 
• Si no es posible hallar la media no es posible hallar la varianza. 
• La varianza viene expresada en distintas unidades que los datos. Por lo tanto es más 
interesante la desviación típica que la varianza. 
• Por la propia definición de varianza esta es siempre positiva. 
 
 
4.- Desviación típica 
 
Se llama desviación típica de una variable a la raíz cuadrada positiva de la varianza de dicha 
variable. Se representa por S. 
 
Cálculo: 
 
Se obtiene mediante la fórmula: 
S = ) x-(xn N
1 2
ii
n
1=i
∑ 
 
Al igual que en la varianza es más rápido usar la fórmula: 
S = x - xn N
1 22
ii
n
1=i
∑ 
 
Observaciones: 
 
• La desviación típica dependen de todos los valores de la distribución. 
• Si no es posible hallar la media no es posible hallar la desviación típica. 
• Viene expresada en las mismas unidades que los datos. 
• Conviene dar la varianza con un decimal menos que la desviación típica. 
• Si a los valores de una distribución se les suma un número la desviación típica no varía. 
• Si todos los valores de una distribución se multiplican por un mismo valor la desviación 
típica queda multiplicada por dicho valor 
 
 ESTADÍSTICA 42 
 
EJEMPLOS 
 
1.- Dada la distribución de frecuencias de la tabla adjunta, se pide: 
 xi 1 2 3 4 5 6 7 8 
ni 4 6 5 6 10 9 4 6 
Calcula los diversos rangos. 
 
Resolución: 
Para calcular los parámetros pedidos necesitamos hallar los cuartiles primero 
y tercero y para ello utilizamos la tabla siguiente: 
 xi 1 2 3 4 5 6 7 8 
ni 4 6 5 6 10 9 4 6 
Ni 4 10 15 21 31 40 44 50 
 
• Q1 deja a la izquierda el 25% de los datos: 100
N52 = 
100
5052 = 12,5. 
Por lo tanto Q1 = 3 
 
• Q3 deja a la izquierda el 75% de los datos: 100
N57 = 
100
5057 = 37,5. 
Por lo tanto Q3 = 6 
 
• Los rangos pedidos son: 
− Rango = 8-1 = 7 
− Rango intercuartílico = 6 - 3 = 3 
− Rango intercuartílico superior = 8- 6 = 2 
− Rango intercuartílico inferior = 3-1 = 2 
 
 
2.- Se ha aplicado un test sobre satisfacción en el trabajo a 90 empleados 
de una fábrica, obteniéndose los siguientes resultados: 
Puntuaciones (38-44] (44-50] (50-56] (56-62] (62-68] (68-74] (74-80] 
Nº trabajadores 4 12 10 30 20 8 6 
Calcula los diversos rangos. 
 
Resolución: 
Utilizamos la tabla auxiliar: 
Clases ni Ni 
(38-44] 4 4 
(44-50] 12 16 
(50-56] 10 26 
(56-62] 30 56 
(62-68] 20 76 
(68-74] 8 84 
(74-80] 6 90 
 90 
 
El intervalo correspondiente al primer cuartil es (50,56]. 
La fórmula para calcularlo es: 
 
 ESTADÍSTICA 43 
 
Q1 = 
n
F-
4
N
 . c+L 
i
1i-
i
⎟
⎠
⎞
⎜
⎝
⎛
 = 
10
16-
4
90
6. + 50 = 53,9 
 
y el correspondiente al tercer cuartil es (62,68]. 
La fórmula para calcularlo es: 
Q3 = 
n
F-
4
N 3
 . c+L 
i
1i-
i
⎟
⎠
⎞
⎜
⎝
⎛
 = 
20
56-
4
903
6. + 62
⎟
⎠
⎞
⎜
⎝
⎛
= 65,45 
 
Los diversos rangos son: 
• Rango = 80-38 = 42 
• Rango intercuartílico = 65,45 - 53,90 = 11,55 
• Rango intercuartílico superior = 80- 65,45 = 14,55 
• Rango intercuartílico inferior = 53,9-38 = 15,9 
 
 
3.- Dada la distribución de frecuencias de la tabla adjunta, se pide: 
 xi 1 2 3 4 5 6 7 8 
ni 4 6 5 6 10 9 4 6 
Calcula la media, varianza y desviación típica. 
 
Resolución: 
Para calcular los parámetros pedidos utilizamos la tabla siguiente. 
xi ni Ni xi ni xi2ni 
1 4 4 4 4 
2 6 10 12 24 
3 5 15 15 45 
4 6 21 24 96 
5 10 31 50 250 
6 9 40 54 324 
7 4 44 28 196 
8 6 50 48 384 
 50 235 1323 
 
Siendo: 
• La media es: 
 x = nxN
1
ii
n
1=i
∑ = 50
235 = 4,70 
 
• La varianza: 
S2 = x -x n N
1 22
ii
n
1=i
∑ = 2)7,4(- 50
3231 = 4,4 
 
• La desviación típica: 
S = x -x n N
1 22
ii
n
1=i
∑ = 2)7,4(- 50
3231 = 2,09 
 
 ESTADÍSTICA 44 
 
4.- Dada la distribución estadística 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
ni 4 6 7 10 2 1 
Calcula la media, rango, varianza y desviación típica. 
 
Resolución: 
Para calcular los parámetros pedidos utilizamos la tabla siguiente. 
Clases Marcas ni xini xi2ni 
(0-5] 2,5 4 10 25 
(5-10] 7,5 6 45 337,5 
(10-15] 12,5 7 87,5 1093,75 
(15-20] 17,5 10 175 3062,5 
(20-25] 22,5 2 45 1012,5 
(25-30] 27,5 1 27,5 756,25 
 30 390 6287,5 
 
• La media es: 
 x = nxN
1
ii
n
1=i
∑ = 13 
 
• El rango es 
R = 30-0 = 30 
 
• La varianza: 
S2 = x -x n N
1 22
ii
n
1=i
∑ = 13 - 30
6288 2 = 40,6 
 
• Desviación típica: 
S = x -N
nx
 2
i
2
i
n
1=i
∑
 = 13 - 30
6288 2 = 6,37 
 
 
 
EJERCICIOS PROPUESTOS 
 
1.- Halla los recorridos intercuartílicos de la distribución que representa la superficie sembrada 
(en miles de Ha) de lenteja en España durante los años de 1970 a 1974 fue: 
Año 1970 1971 1972 1973 1974 
Superficie 68 75 87 99 105 
Solución: Ri = 24; Risup = 6; Riinf = 7. 
 
2.- Dada la distribución estadística 
Ii (0, 5] (5, 10] (10, l5] (15,20] (20,25] (25, 30] 
ni 4 6 7 10 2 1 
a) Calcula para esta distribución, el rango (recorrido). 
b) Calcula para esta distribución, el rango intercuartílico. 
Solución: a) R = 30-0 = 30, b) Ri = 17,75-7,90 = 9,85. 
 
 ESTADÍSTICA 45 
 
3.- La tabla siguiente representa la distribución de las calificaciones obtenidas por 150 
estudiantes de un curso 
Calificaciones (0,2] (2-4] (4-6] (6-8] (8-10] 
Nº de estudiantes 10 50 55 25 10 
Calcula los diversos rangos. 
Solución: R = 10; Ri = 2,81; Risup = 4,09; Riinf = 3. 
 
4.- Se ha medido la altura (en cm) de un 
grupo de 100 alumnos y posteriormente se 
han agrupado los datos en intervalos 
(abiertos por la derecha). Los resultados se 
representan en el histograma siguiente. 
Halla la media, varianza y desviación típica. 
Solución: x = 17,7 cm; S2 = 88,5 cm2 ; 
S=9,40 cm . 
 
5.- Se ha preguntado a un grupo de deportistas las horas que dedican a entrenamiento durante el 
fin de semana. Los resultados aparecen en la siguiente distribución de frecuencias 
 Horas [0,0.5) [0.5,1.5) [1.5,2.5) [2.5,4) [4,8] 
Personas 10 10 18 12 12 
Calcula el rango, la media, varianza y desviación típica. 
Solución: R = 8; x = 2,57 h; S2 = 3,74 h2 ; S = 1,93 h . 
 
6.- Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, 
elegidos al azar en un barrio de la ciudad, y se han encontrado los siguientes precios: 
95 108 97 112 99 106 105 100 99 98 104 110 107 111 103 110 
Construye 4 intervalos de clase de igual amplitud siendo el primero [95, 100) y calcula la media 
y la desviación típica. 
Solución: x = 104,69; S =5,85. 
 
7.- La suma de unos datos es de 25 unidades y la de sus cuadrados 250 unidades cuadradas. si la 
media y desviación típica coinciden, ¿cuánto valen? 
Solución: s = x = 5. 
 
8.- Sea la distribución formada por 1, 3, 5, 7 y 9. 
a) Calcula la media, varianza y desviación típica. 
b) Calcula la media, varianza y desviación típica si añadimos 12 a cada uno de los datos 
anteriores. 
c) Calcula la media, varianza y desviación típica si multiplicamos por 7 cada uno de los datos 
anteriores. 
Solución: a) s = x = 2,82; b) x = 17, s = 2,82. 
 
9.- Una distribución posee varianza S2. Prueba que: 
a) S2 disminuye si se añaden valores iguales a la media. 
b) S2 no varía si se añaden valores iguales a x + S. 
c) S2 no varía si se añaden valores iguales a x - S. 
 
10.- Los valores a y –a son las modas de una distribución bimodal simétrica 
a) Halla su media y su mediana. 
b) Decide si su varianza es nula o no. 
Solución: 
 
 
 
 ESTADÍSTICA 46 
 
2.5.- COMPARACIÓN DE DISTRIBUCIONES 
 
1.- Coeficiente de variación 
 
Definición• El coeficiente de variación de Pearson es la desviación típica por unidad de media 
multiplicada por 100. 
 
• Mide la dispersión relativa de la muestra. 
 
 
Cálculo 
 
El coeficiente de variación de Pearson, CV, viene dado por: 
 
CV = vp =
x
sx .100 
 
 
Observaciones 
 
• El coeficiente de variación no depende de la unidad utilizada puesto que es el cociente entre 
la media y la desviación típica y viene dadas en las mismas unidades. 
 
• Un coeficiente de variación del 30% indica que la media es poco representativa como 
medida del promedio, debiéndose optar por la mediana o la moda. 
 
• Dadas dos variables aleatorias aquella que tenga un coeficiente de variación mayor es más 
heterogénea y el que la tenga menor más homogénea, siendo su media más representativa de 
la variable en este caso. 
 
• El coeficiente de variación no debe usarse cuando la media esté próxima a cero, pues el 
denominador pequeño distorsiona el cociente. 
 
 
2.- Puntuaciones típicas. 
 
De modo similar a como usamos el coeficiente de variación de Pearson usamos los datos de 
media y desviación típica para hallar los valores normalizados o puntuaciones típicas de la 
variable: 
 
xin = S
x-xi 
 
Estas puntuaciones típicas sirven para comparar los valores de dos distribuciones diferentes. 
 
 
3.- Observaciones 
 
En una distribución simétrica o ligeramente asimétrica se cumple: 
• en el intervalo ( x -S, x +S) se encuentran el 68 % de los datos de la distribución, 
• en el intervalo ( x -2S, x +2S) se encuentran el 95 % de los datos de la distribución 
• en el intervalo ( x -3S, x +3S) se encuentran el 99 % de los datos de la distribución. 
 
 
 ESTADÍSTICA 47 
 
EJEMPLOS 
 
1.- Compara las puntuaciones obtenidas por un alumno en Matemáticas e 
Historia sabiendo que en ambas ha obtenido un 7, estando caracterizadas 
las puntuaciones en ambas asignaturas por los parámetros: 
 x s 
Matemáticas 4 4 
Historia 5 4 
Resolución: 
La nota normalizada en Matemáticas es 
4
4-7 = 0,75 y en Historia es 
4
5-7
 = 0,5, luego comparativamente es mayor la nota en Matemáticas. 
 
 
2.- Tenemos seis distribuciones cuya representación viene dada en las 
siguientes figuras. 
(a) (b) (c) 
(d) (e) (f) 
a) Ordena de mayor a menor distribución típica las distribuciones. 
b) Sabiendo que los parámetros de esas distribuciones son: 
1) x = 58, s =12 2) x = 46, s =5,5 3) x = 41, s =16 
4) x = 16, s =5 5) x = 33, s =13 6) x = 25, s =8 
asocia los parámetros a la gráfica correspondiente. 
 
Resolución: 
a) Observando la dispersión de las distribuciones la ordenación es: 
(a), (b), (c), (f), (d), (e). 
 
b) Asociando cada gráfica con su distribución tenemos: 
• La gráfica (a) corresponde a la distribución 3. 
• La gráfica (b) corresponde a la distribución 1. 
• La gráfica (c) corresponde a la distribución 4. 
• La gráfica (d) corresponde a la distribución 5. 
• La gráfica (e) corresponde a la distribución 2. 
• La gráfica (f) corresponde a la distribución 6. 
 
 ESTADÍSTICA 48 
 
3.- En un Instituto de Bachillerato hay dos grupos de Matemáticas. Las 
calificaciones de la primera evaluación en cada grupo fueron las 
siguientes: 
Grupo A 1 1 1 3 5 5 6 8 8 9 
Grupo B 2 2 4 4 4 5 5 6 6 8 
Utilizando la medida adecuada, di qué grupo es más homogéneo. 
 
Resolución: 
Para determinar qué grupo es más homogéneo, utilizamos el coeficiente de 
variación que mide la desviación típica respecto a la media de una variable, es 
decir, su homogeneidad. Para hallarla utilizamos las tablas adjuntas: 
Xi ni xini xi2ni yi ni yi ni yi2ni 
1 3 3 3 2 2 4 8 
3 1 3 9 4 3 12 48 
5 2 10 50 5 2 10 50 
6 1 6 36 6 2 12 72 
8 2 16 128 8 1 8 64 
9 1 9 81 10 46 242 
 10 47 307 
 
• Media de x: 
x = nx 
N
1
ii
n
1=i
∑ = 10
47 = 4,7 
 
• Desviación típica de x: 
Sx = x - nxN
1 2
i
2
i
n
1=i
∑ = )(4,7 - 10
307 2 = 2,93 
 
• Media de y: 
y = ny 
N
1
ii
n
1=i
∑ = 10
46 = 4,6 
 
• Desviación típica de y: 
Sy = y - nyN
1 2
i
2
i
n
1=i
∑ = )6(4, - 10
242 2 = 1,74 
 
Como la medida más adecuada para comparar las dos distribuciones es el 
coeficiente de variación de Pearson, de fórmula vp =
x
sx .100, con valores: 
vp = 4,7
2,93 .100 = 62,3, para el primer grupo 
vp = 4,6
1,74 .100 = 37,8, para el segundo grupo 
 
Luego el segundo grupo es más homogéneo, ya que su coeficiente de 
variación es menor. 
 
 ESTADÍSTICA 49 
 
4.- Dos fabricantes de baterías de automóviles ofrecen sus productos a 
una fábrica de automóviles, al mismo precio. Ésta, para elegir la más 
duradera, hace una prueba con 50 baterías de cada marca, obteniendo los 
siguientes resultados: 
 
Vida de la batería 
(en meses) 20 22 24 26 28 30 
Marca A 
(frec. absoluta) 5 8 12 15 7 3 
Marca B 
(frec. absoluta) 1 7 18 19 5 0 
 
Realiza los cálculos que consideres necesarios para justificar la elección 
efectuada por la fábrica. 
 
Resolución: 
Llamemos X a la variable que mide la vida media de la batería A e Y a la 
variable que mide la vida media de la batería B. Tenemos las tablas: 
xi ni xini xi2ni yi ni yi ni yi2ni 
20 5 100 2.000 20 1 20 400 
22 8 176 3.872 22 7 154 3.388 
24 12 288 6.912 24 18 432 10.368 
26 15 390 10.140 26 19 494 12.844 
28 7 196 5.488 28 5 140 3.920 
30 3 90 2.700 Suma 50 1240 30920 
Suma 50 1240 31112 
 
A partir de ella hallaremos los valores. 
• Media de x: 
x = fx N
1
ii
n
1=i
∑ = 50
1240 = 24,8 
 
• Media de y: 
y = fy N
1
ii
n
1=i
∑ = 50
1240 = 24,8 
 
• Desviación típica de x: 
sx = x -fxN
1 2
i
2
i
n
1=i
∑ = )(24,8 - 50
31112 2 = 2,68 
 
• Desviación típica de x: 
sy = y -fyN
1 2
i
2
i
n
1=i
∑ = )(24,8 - 50
30920 2 = 1,83 
 
Ambas marcas tienen una vida media igual a 24,8 meses de duración, luego 
este parámetro no es válido para tomar decisiones; sin embargo, la desviación 
típica de la primera es de 2,68 y la de la segunda es 1,83, luego si queremos 
tener mayor probabilidad de que una batería, elegida al azar, tenga una 
duración similar a la media, debemos elegir la marca B, pues tiene una 
dispersión menor respecto de la media. 
 
 
 ESTADÍSTICA 50 
 
5.- Los siguientes datos corresponden a los salarios mensuales, en miles 
de pesetas, de un grupo de trabajadores de un hospital: 
110 110 120 150 90 80 115 100 125 600 
a) Calcula el porcentaje de salarios de esta muestra que están en el 
intervalo ( x -S, x +S) donde x es la media y S la desviación típica. 
b) Razona si se deben utilizar estos datos con el propósito de estimar la 
media salarial de todos los trabajadores españoles. 
 
 Resolución: 
Para calcular el porcentaje de salarios de la muestra que están en el intervalo 
( x -S, x +S) debemos construir la siguiente tabla: 
xi ni xini xi2ni 
80 1 80 6.400 
90 1 90 8.100 
100 1 100 10.000 
110 2 220 24.200 
115 1 115 13.225 
120 1 120 14.400 
125 1 125 15.625 
150 1 150 22.500 
600 1 600 360.000 
Suma 10 1.600 474.450 
 
Obteniendo los valores: 
• Media: 
x = nx N
1
ii
n
1=i
∑ = 10
1600 = 160 
 
• Desviación típica 
S = x -nxN
1 2
i
2
i
n
1=i
∑ = )(160 - 10
47445 2 = 147,8 
 
• El intervalo pedido es 
( x -S, x +S) = (160-147,8; 160+1478) = (12,2; 307,8) 
 
como en este intervalo se encuentran nueve valores (todos menos el 600) 
el porcentaje de valores es del 90%. 
 
 
6.- Se ha realizado un estudio estadístico de los pesos de los alumnos de 
tres aulas, siendo sus resultados redondeados los siguientes 
 A B C 
x 65 64,3 67,1 
S 6,5 3,2 4,5 
Identifica qué gráfica corresponde a cada clase. Justifica la respuesta. 
 
 ESTADÍSTICA 51 
 
Gráfico 1 Gráfico 2 Gráfico 3 
 
Resolución: 
El gráfico 1 es el de la clase B (tiene la menor desviación típica de las tres 
y su media es algo menor que 65) 
El gráfico 2 es el de la clase C (tiene la desviación típica intermedia de las 
tres y su media es algo mayor que 65) 
El gráfico 3 es el de la clase A (tiene la mayor desviación típica de las tres 
y su media es 65) 
 
• La menor desviación

Continuar navegando

Materiales relacionados