Logo Studenta

Florencio Bustillo_U2_T1_PERCENTILESDIAGCAJA - Iván Florencio

¡Estudia con miles de materiales!

Vista previa del material en texto

MEDIDAS DE POSICIÓN: (Datos agrupados y no agrupados) 
Las medidas de posición son aquellas en donde puedes dividir los datos en dos partes iguales, 
llamada mediana, lo puedes dividir en cuatro partes iguales llamado cuartiles, en diez partes 
iguales llamados deciles y en percentiles dividir en 100 partes iguales. La mediana es una 
medida de posición con respecto a los datos centrales porque se divide en dos partes ( 50%). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
OTRAS MEDIDAS DE POSICIÓN 
Y DIAGRAMA DE CAJA 
UNIDAD II 
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE HIDALGO 
FLORENCIO BUSTILLO MARIO IVAN 
ACTIVIDAD 1 
24/09/2021 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Diagrama De Caja: 
Es una representación de una variable cuantitativa o categórica con el propósito 
de identificar rápidamente los cuartiles del conjunto de datos. En otras palabras, 
un diagrama de caja es un gráfico que representa una variable cuantitativa o 
cualitativa a través de los cuartiles. 
- En estadística, es una herramienta útil para representar conjuntos de datos tanto 
discretos como continuos. 
¿Para qué se utiliza? 
El diagrama de caja es un gráfico utilizado para representar una variable 
cuantitativa (variable numérica). El gráfico es una herramienta que permite 
visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, 
los valores extremos, la posición de la mediana, etc. 
Construcción: 
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran 
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica 
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y 
tercero(recordemos que el segundo cuartil coincide con la mediana). 
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y 
máximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes 
tienen tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre 
dentro de este rango es marcado e identificado individualmente 
EJEMPLO DISTRIBUCIÓN DE EDADES 
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de 
un colectivo de 20 personas. 
 36 25 37 24 39 20 36 45 31 31 
 
 39 24 29 23 41 40 33 24 34 40 
 
 
ORDENAR LOS DATOS 
Para calcular los parámetros estadístico, lo primero es ordenar la distribución 
 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 
41 45 
CALCULO DE CUARTILES 
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 
20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: 
Q1=(24 + 25) / 2 = 24,5 
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la 
variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la 
mediana es la media aritmética de dicho valor y el siguiente: 
me= Q2 = (33 + 34)/ 2 =33,5 
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En 
nuestro caso, como 3N / 4 = 15, resulta 
Q2=(39 + 39) / 2 = 39 
DIBUJAR LA CAJA Y LOS BIGOTES 
 
El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1) 
La primera parte de la caja a (Q1, Q2), 
La segunda parte de la caja a (Q2, Q3) 
El bigote de la derecha viene dado por (Q3, Xmáx). 
 
 
INFORMACIÓN DEL DIAGRAMA 
Podemos obtener abundante información de una distribución a partir de estas representaciones. 
Veamos alguna: 
 
• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las 
edades comprendidas entre el 25% y el 50% de la población está más dispersa que 
entre el 50% y el 75%. 
• El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% 
de los más jóvenes están más concentrados que el 25% de los mayores. 
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está 
comprendido en 14,5 años. 
CASO 2 DE CONSTRUCCIÓN: 
1. Ordenar los datos. 
2. Calcular los tres cuartiles (Q1, Q2 y Q3). Después, dibujamos el rectángulo (caja) 
delimitado por el primer y tercer cuartil, dibujando entre los dos cuartiles una 
línea para indicar donde está la mediana (segundo cuartil). 
3. Calcular el rango intercuartílico, que es el tercer cuartil menos el primero. 
 
4. Se calculan los límites admisibles inferior y superior (LI y LS) para identificar los 
valores extremos. 
 
Los límites marcarán los datos atípicos de la variable. Todos aquellos puntos 
que sean menores que LI (x < LI) o mayores que LS (x > LS) son valores extremos. 
Es decir, son todos aquellos valores que no están en el intervalo [LI,LS]. 
https://www.universoformulas.com/estadistica/descriptiva/cuartiles/
https://www.universoformulas.com/estadistica/descriptiva/mediana/
https://www.universoformulas.com/estadistica/descriptiva/rango-intercuartilico/
5. El mínimo es el menor valor del conjunto que sea mayor o igual que LI. 
El máximo es el mayor valor del conjunto que es menor o igual que LS. 
Dibujamos los dos brazos. El primero va desde el primer cuartil hasta el mínimo. 
El segundo, desde el tercer cuartil hasta el máximo. 
6. Se dibujan los valores extremos, representados por puntos o círculos pequeños. 
Ejemplo 
En un bosque plantaron veinte (N=20) árboles y, al cabo de unos años, se mide la altura 
para ver su evolución. Un muy buen método para ver cómo han crecido y comprobar si existen 
valores extremos es el diagrama de caja. Mediante esta representación gráfica podemos ver si 
hay árboles que han crecido más o menos de lo habitual. 
 
1. Se ordenan los datos 
2. Se calculan los tres cuartiles. 
 
A partir del conjunto ordenado calculamos los cuartiles: 
 
 
 
Los tres cuartiles son Q1=4,20, Q2=5,50 y Q3=6,42. 
3. Se calculan los límites admisibles inferior y superior (LI y LS) para determinar los 
valores extremos. 
El rango intercuartílico es: 
https://www.universoformulas.com/estadistica/descriptiva/cuartiles/
https://www.universoformulas.com/estadistica/descriptiva/cuartiles/
https://www.universoformulas.com/estadistica/descriptiva/rango-intercuartilico/
 
A partir del rango calculamos los límites: 
 
 
Los valores extremos serán todos los árboles que midan menos de 0,96m o 
más de 9,59m. Tenemos dos árboles, uno de 0,94m y otro de 10,14m que serán 
valores extremos. Estos valores los representamos con puntos en el diagrama de 
caja. 
4. El mínimo es el menor elemento del conjunto que sea mayor o igual al límite 
inferior. El máximo es el mayor elemento que sea menor o igual al límite 
superior. En este caso, el mínimo es 2,98 y el máximo 7,13. 
5. Se dibujan los brazos del diagrama de caja. El brazo inferior irá desde el primer 
cuartil hasta el mínimo (desde el 4,20 a 2,98). El brazo superior abarcará desde el 
tercer cuartil hasta el máximo (desde el 6,42 hasta el 7,13). 
6. Los dos puntos extremos se representan mediante un punto o círculo. 
El diagrama de caja del conjunto de la altura de estos veinte árboles es: 
 
Esta representación proporciona una visión rápida de la distribución, apreciándose 
una asimetría al no estar Q2 en el centro, en este caso porque hay árboles más altos que 
la mediana cuya altura está más separada de la mediana que los que tienen una altura inferior 
a ella, que están más agrupados. También se puede apreciar la existencia de valores extremos. 
 
Fuentes: 
Ayala, S. & UAEH. (2020, 26 junio). ESTADÍSTICA, CUARTILES, DECILES Y PERCENTILES. UAEH. 
https://www.uaeh.edu.mx/division_academica/educacion-media/repositorio/2010/6-
semestre/estadistica/cuartiles-deciles-y-ercentiles.pdfSerra, B. R. (2020, 26 octubre). Diagrama de caja. Universo Formulas. 
https://www.universoformulas.com/estadistica/descriptiva/diagrama-
caja/#:%7E:text=Para%20construir%20el%20diagrama%20de,la%20mediana%20(segundo%20cuart
il). 
https://www.universoformulas.com/estadistica/descriptiva/mediana/
https://www.universoformulas.com/estadistica/descriptiva/mediana/
https://www.uaeh.edu.mx/division_academica/educacion-media/repositorio/2010/6-semestre/estadistica/cuartiles-deciles-y-ercentiles.pdf
https://www.uaeh.edu.mx/division_academica/educacion-media/repositorio/2010/6-semestre/estadistica/cuartiles-deciles-y-ercentiles.pdf
https://www.universoformulas.com/estadistica/descriptiva/diagrama-caja/#:%7E:text=Para%20construir%20el%20diagrama%20de,la%20mediana%20(segundo%20cuartil)
https://www.universoformulas.com/estadistica/descriptiva/diagrama-caja/#:%7E:text=Para%20construir%20el%20diagrama%20de,la%20mediana%20(segundo%20cuartil)
https://www.universoformulas.com/estadistica/descriptiva/diagrama-caja/#:%7E:text=Para%20construir%20el%20diagrama%20de,la%20mediana%20(segundo%20cuartil)

Continuar navegando

Materiales relacionados

20 pag.
Clase 3_analisis exporatorio

User badge image

Estudiando Ingenieria

16 pag.
26 pag.
04-EstadisticaI-unidad3

ESTÁCIO

User badge image

yuran gujamo gujamo

29 pag.
Teoria AED

UNAM

User badge image

isabelpb64