Logo Studenta

Sesion2_3_Medidas

¡Este material tiene más páginas!

Vista previa del material en texto

Dr. Guillermo Pastor Morales Romero
Estadística Descriptiva. Medidas descriptivas.
UNIVERSIDAD NACIONAL DE EDUCACIÓN
ENRIQUE GUZMÁN Y VALLE
Alma Máter del Magisterio Nacional
SEMINARIO DE ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EDUCACIONAL
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas descriptivas
Cuando se trabaja con tablas y gráficos o estos ya han sido construidos a partir de una colección de datos, se requieren medidas más exactas que faciliten el análisis de los datos. Existen cuatro tipos de medidas de resumen:
Medidas de tendencia central
Media aritmética, mediana y moda.
Medidas de dispersión
Rango, varianza, desviación estándar y el coeficiente de variación.
Medidas de distribución (forma)
Asimetría y curtosis
Medidas de posición
Cuartiles, quintiles, y deciles.
‹Nº›
 Taller de Estadística Aplicada
 
Medidas descriptivas que pueden aplicarse
		Nominal	Ordinal	Intervalo/Razón
	Medidas de posición		Todos	Todos
	Medidas	de	tendencia
central	Moda	·	Moda
·	Mediana	·	Moda
·	Mediana
·	Media
	Medidas de dispersión			·	Mínimo
·	Máximo
·	Desvíación estándar
·	Varianza
·	Rango
·	Error estándar de la media
	Medidas de distribución			·	Asimetría
·	Curtosis
‹Nº›
 Taller de Estadística Aplicada
 
Gráficos que pueden realizarse
	1º Tipo	2º Nivel	3º Característica	4º Representación
	Cualitativa	Nominal	Clasifica	Gráfico de Barras
Gráfico de Sectores
		Ordinal	Clasifica
Orden	Gráfico de Barras
	Cuantitativa	Discreta	Enteros
Clasifica
Distancia	Gráfico de Bastones
		Continua	Clasifica
Distancia
Decimales	Histograma
Polígono
Análisis exploratorio: Tallos y hojas
‹Nº›
 Taller de Estadística Aplicada
 
Agenda
Medidas de Tendencia Central
Medidas de Dispersión 
Medidas de Distribución
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de Tendencia Central
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de tendencia central
Media
Es el promedio del conjunto de datos.
Mediana 
Es un valor del conjunto de datos que mide el elemento central: La mitad de los elementos se encuentran por arriba y la otra mitad por debajo de él.
Moda
Es el valor que se repite más dentro de un conjunto de datos.
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de tendencia central
Análisis
La media, la mediana y la moda son idénticas en una distribución simétrica.
La mediana puede ser la idónea en distribuciones sesgadas, ya que no se afecta tanto por valores extremos.
La moda es recomendable usar en variables cualitativas
‹Nº›
 Taller de Estadística Aplicada
 
Media o promedio
‹Nº›
 Taller de Estadística Aplicada
 
Mediana
‹Nº›
 Taller de Estadística Aplicada
 
Mediana
‹Nº›
 Taller de Estadística Aplicada
 
Mediana para datos agrupados
Donde:
n : número de datos de la muestra.
Li : límite inferior del intervalo que contiene a la mediana.
Fi-1: Frecuencia absoluta acumulada inmediata inferior a la frecuencia acumulada Fi.
fi : frecuencia absoluta del intervalo de la clase mediana (es aquel que contiene a Fi ).
Ci : amplitud del intervalo de la clase mediana.
Se considera el menor intervalo i, tal que Fi >n/2
‹Nº›
 Taller de Estadística Aplicada
 
Pasos para calcular la mediana para datos agrupados
1ro.	Se determinan las frecuencias acumulada absolutas (Fi).
2do.	Se halla n/2. 
3ro.	Ubicar n/2 en la columna de las Fi.
4to. 	Si n/2 no coincide con algún Fi, ubicar un Fi como la inmediata superior a n/2, para determinar el dato Xi o el intervalo Mediano correspondiente.
Fi =Es la Frecuencia absoluta acumulada inmediata superior a n/2.
Fi-1= es la Frecuencia absoluta acumulada inmediata anterior a Fi.
‹Nº›
 Taller de Estadística Aplicada
 
Pasos para calcular la mediana para datos agrupados
Punto medio 
del intervalo
Intervalo 
mediano
‹Nº›
 Taller de Estadística Aplicada
 
Pasos para calcular la mediana para datos agrupados
‹Nº›
 Taller de Estadística Aplicada
 
Moda
Es la medida de tendencia central, que se define como el valor que se presenta con mayor frecuencia en una serie o distribución de datos.
Ejemplo 1: Encontrar la Moda en la serie: 6, 8, 6, 9, 10, 3, 6, 3
La moda es 6, porque se repite con mayor frecuencia, es una serie unimodal.
Ejemplo 2: Hallar la Moda en la serie: 4, 7, 8, 9, 10, 3, 8, 4
Presenta dos modas, que son 4 y 8, porque se repite con mayor frecuencia, es una serie bimodal.
‹Nº›
 Taller de Estadística Aplicada
 
Moda para datos agrupados
La clase modal es el intervalo con mayor frecuencia
Li =Límite inferior de la clase Modal
d1 = Diferencia de la frecuencia simple de la clase Modal y la frecuencia de la clase inmediata inferior.
d2 =Diferencia de la frecuencia simple de la clase Modal y la frecuencia de la clase inmediata superior.
C =Tamaño o amplitud del intervalo.
‹Nº›
 Taller de Estadística Aplicada
 
Moda para datos agrupados
Punto medio 
del intervalo
Intervalo 
modal
d1
d2
‹Nº›
 Taller de Estadística Aplicada
 
Moda para datos agrupados
Luego:
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. 
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. 
Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Hay varias medidas de dispersión, siendo las más comunes las siguientes: 
El rango
Desviación media
La varianza 
La desviación estándar
El coeficiente de variación
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Rango
R = X máx – X min
El rango es el resultado de restar el máximo valor menos el mínimo valor.
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Desviación Media
Datos no agrupados		Datos no agrupados
Se define como la media de las diferencias en valor absoluto de los valores de la variable a la media.
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Varianza
Datos no agrupados		Datos agrupados
La varianza cuantifica la variabilidad de los datos con respecto a la media aritmética. 
En el caso de tratarse de una muestra n se disminuye en 1 (n-1). Si fuera la población se divide entre N.
Población (N)
Muestra (n)
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Desviación estándar
Datos no agrupados		Datos agrupados
La desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética. Es la raíz cuadrada de la varianza
Población (N)
Muestra (n)
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de dispersión
Coeficiente de variación
 El CV es igual al cociente entre la desviación típica y la media. Se expresa como porcentaje 
Si encontramos que el coeficiente de variación es próximo o mayor que 0.5 y no puede haber datos negativos, la distribución no es normal.
Según el porcentaje de coeficiente de variación:
CV<10% 	 Poca dispersión
10%<CV<33% 	 Dispersión aceptable
33%<CV<50% 	 Dispersión alta
CV>50% 	 La dispersión es muy alta 
‹Nº›
 Taller de Estadística Aplicada
 
Ejemplo 1
Sea una distribución estadística de una muestra que viene dada por la siguiente tabla:
	xi 	61	64	67	70	73
	fi 	5	18	42	27	8
Calcular:
1. La moda, mediana y media.
2. El rango, desviación media, varianza, desviación típica y el coeficiente de variación.
3. Interpretar.
‹Nº›
 Taller de Estadística Aplicada
 
Solución 1
Tabla de frecuencias
Moda
Mo = 67 
Mediana
100/2 = 50 Me = 67 
Media
Desviación media
Rango
r = 73 − 61 = 12
Desviación estándar
Coeficiente de Variación 
2.93
‹Nº›
 Taller de Estadística Aplicada
 
Solución 1
InterpretaciónEl dato que más se repite es 67 (Moda=67), el 50% de los datos están sobre 67 y el 50% de los datos debajo de este valor (Mediana=67). El promedio de los datos es 67.45 (Media=67.45). El mínimo dato es 61 y el máximo dato es 73. La mediana y la media están próximos esto indica que los datos tienden a ser homogéneos. En promedio los datos se desvían de la media en 2.265(Desviación media=2.265). Existe poca dispersión de los datos (4%). Los datos se dispersan en un promedio de 2.93 (Desviación estándar). 
‹Nº›
 Taller de Estadística Aplicada
 
Ejemplo 2
Hallar la media, desviación media, la varianza y la desviación típica de la series de números : 2, 3, 6, 8, 11.
	Media:
	Desviación media
	Varianza ó 
	
 Desviación típica
‹Nº›
 Taller de Estadística Aplicada
 
Práctica dirigida 2
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Simetría
	Se establece que la distribución es simétrica cuando los datos de una población se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media aritmética. 
Si la distribución de frecuencias es unimodal, entonces:
	Mediana = Moda = Media
 Mas medidas de distribución son aplicadas en función a la representación gráfica de los datos. Comparan la forma gráfica con la distribución normal. 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Simetría
Si la distribución de frecuencia es simétrica, entonces Mediana = Moda = Media (el recíproco no siempre es cierto)
La simetría determina que la población es homogénea en relación a la variable de estudio.
Para distribuciones bimodales y rectangulares sólo la media y la mediana son idénticas:
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Asimetría
Se clasifica como asimétrica la distribución donde los datos por debajo de la medias más frecuentes que aquellos por encima de la media, o viceversa. En este caso, establece que la población es heterogénea para la variable en estudio.
1. Distribución asimétrica a la derecha: los datos por encima de la media son menos frecuentes
La media tiene el valor más grande de las tres medidas de tendencia central en una distribución asimétrica positiva.
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Asimetría
2. Distribución asimétrica a la izquierda: los datos por debajo de la media son menos frecuentes.
La media tiene el valor más pequeño de las tres medidas de tendencia central en una distribución asimétrica negativa
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Coeficiente de Asimetría
Resultados:
Si Sk > 0 distribución es asimétrica positiva 
	 (sesgada a la derecha)
Si Sk < 0 distribución es asimétrica negativa
 		 (sesgada a la izquierda)
Si Sk = 0 la distribución puede 
 ser simétrica
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Ejemplo 1: 
	En la tabla que se presenta:
	¿Qué grupo tiene mejor rendimiento?
	¿Qué grupo es más homogéneo?
	Grupo 1	Grupo 2
	8	11
	8	8
	12	12
	13	13
	15	15
	9	9
	5	10
	10	16
	11	11
	8	8
	7	9
	11	11
	9	9
	14	13
	9	14
	12	
‹Nº›
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Curtosis
Las medidas de apuntamiento o curtosis tratan de estudiar la distribución de frecuencias en la zona media. El mayor o menor número de valores de la variable alrededor de la media dará lugar a una distribución más o menos apuntada.
Para estudiar el apuntamiento hay que definir una distribución tipo que nos sirva de referencia. Esta distribución es conocida como distribución Normal o curva de Gauss y se corresponde con numerosos fenómenos de la naturaleza. Su forma es la de una campana en donde la gran mayoría de los valores se encuentran concentrados alrededor de la media, siendo escasos los valores que están muy distanciados de ésta.
Al tomar como referencia la distribución normal se dice que otra distribución es más apuntada que la distribución normal (leptocúrtica) o menos apuntada (platicúrtica).
‹Nº›
 Taller de Estadística Aplicada
 
Medidas de distribución
Curtosis
A las distribuciones que se asemejan a la distribución normal se les denomina mesocúrticas.
Dependiendo entonces del valor del coeficiente de curtosis g llamamos:
Mesocúrtica	(Normal) 	si 	g = 0
Leptocúrtica 			si	g > 0	(positivo)
Platicúrtica 			si	g < 0	(negativo)
‹Nº›
 Taller de Estadística Aplicada
 
Curtosis
‹Nº›
 Taller de Estadística Aplicada
 
Calcular la curtosis
Donde:
g2 : Coeficiente de curtosis 
n: Número de datos
Xi : dato i-ésimo
X : Media
s : Desviación estándar
Cuando los datos están agrupados en clases, se calcula la curtosis usando la marca de clase en xi
‹Nº›
 Taller de Estadística Aplicada
 
Calcular la curtosis (Datos agrupados en clases)
	INTERVALOS	xi	fi	Fi	hi	Hi	hi%	Hi%	xifi	(xi-x)2fi
	[60-70[	65	3	3	0.1	0.1	10%	10%	195	1633.33
	[70-80[	75	6	9	0.2	0.3	20%	30%	450	1066.67
	[80-90[	85	7	16	0.23	0.53	23%	53%	595	77.78
	[90-100[	95	9	25	0.3	0.83	30%	83%	855	400.00
	[100-110[	105	2	27	0.07	0.9	7%	90%	210	555.56
	[110-120]	115	3	30	0.1	1	10%	100%	345	2133.33
	TOTAL	----	30	----	1	------	100%	------	2650	5866.67
1.- Se calcula la media y la desviación estándar.
‹Nº›
 Taller de Estadística Aplicada
 
Calcular la curtosis (Datos agrupados en clases)
	INTERVALOS	xi	fi	Fi	hi	Hi	hi%	Hi%	xifi	(xi-x)2fi
	[60-70[	65	3	3	0.1	0.1	10%	10%	195	1633.33
	[70-80[	75	6	9	0.2	0.3	20%	30%	450	1066.67
	[80-90[	85	7	16	0.23	0.53	23%	53%	595	77.78
	[90-100[	95	9	25	0.3	0.83	30%	83%	855	400.00
	[100-110[	105	2	27	0.07	0.9	7%	90%	210	555.56
	[110-120]	115	3	30	0.1	1	10%	100%	345	2133.33
	TOTAL	----	30	----	1	------	100%	------	2650	5866.67
2.- Se calcula la curtosis
Como el coeficiente de curtosis es mayor que cero g2 > 0, entonces la distribución es Leptocúrtica 
‹Nº›
 Taller de Estadística Aplicada
 
Practica dirigida 3
 Taller de Estadística Aplicada
 
‹Nº›
 Taller de Estadística Aplicada
 
Práctica dirigida 3
1. Dados los siguientes valores de la tendencia central :
 	 Media = 14, Mediana = 12, Moda = 10.
Media = 14, Mediana = 16, Moda = 18.
Media = 14, Mediana = 14, Moda = 14.
Media = 14, Mediana = 17, Moda = 14.	
Para cada caso:
	 a) Determine si la distribución es simétrica. 
	 b) ¿Está sesgada en forma positiva o negativa?. 
	Explique.
‹Nº›
 Taller de Estadística Aplicada
 
Práctica dirigida 3
2. La edades de un grupo de personas se reflejan en la siguiente tabla:
	Intervalos	fi
	7 – 9	4
	9 - 11	18
	11 - 12	14
	12 - 13	27
	13 - 14	42
	14 – 15	31
	15 – 17 	20
	17 – 19	1
a) Estudie la simetría de la variable. Halle la curtosis e interprete .
‹Nº›
 Taller de Estadística Aplicada
 
n
x
X
n
i
i
å
=
=
1
_
n
x
f
X
n
i
i
i
å
=
=
1
_
i
i
i
i
C
f
F
n
L
Me
ú
ú
ú
û
ù
ê
ê
ê
ë
é
-
+
=
-
1
2
i
i
i
i
C
f
F
n
L
Me
ú
ú
ú
û
ù
ê
ê
ê
ë
é
-
+
=
-
1
2
85
,
80
85
,
0
80
7
6
80
7
9
15
80
10
7
9
2
30
80
=
+
=
+
=
-
+
=
ú
ú
ú
û
ù
ê
ê
ê
ë
é
-
+
=
Me
i
i
o
C
d
d
d
L
M
ú
û
ù
ê
ë
é
+
+
=
2
1
1
C
d
d
d
L
M
i
o
ú
û
ù
ê
ë
é
+
+
=
2
1
1
10
7
2
9
2
7
9
90
2
1
=
=
-
=
=
-
=
=
c
d
d
L
i
22
,
92
22
,
2
90
9
20
90
10
7
2
2
90
=
+
=
+
=
ú
û
ù
ê
ë
é
+
+
=
o
M
å
=
-
=
n
i
i
m
x
x
n
D
1
1
i
k
i
i
m
f
x
x
n
D
å
=
-
=
1
1
estándar
 
Desviación
Mediana)
3(media
S
k
-
=
estándar
 
Desviación
Moda)
3(media
S
k
-
=

Continuar navegando

Materiales relacionados