Logo Studenta

Descripción de Datos Usando Medidas Numéricas

¡Este material tiene más páginas!

Vista previa del material en texto

Describiendo los Datos, Usando Medidas Numéricas
3-1
Datos en Información
Descripción gráfica, diagramas y tablas
Descripción numérica de los datos
¿Cómo compara la duración de los neumáticos de un fabricante A y la de un fabricante B?
En forma gráfica:	Tomar una muestra y producir los histogramas 			respectivos.
Se requiere más:	Medidas numéricas que resuman la 					información
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
3-2
Objetivos del Capítulo
Calcular e interpretar la media, mediana, y moda para un conjunto de datos
3-3
Técnicas Descriptivas
3-4
Centro y Ubicación
Media
Mediana
Moda
Otras Medidas de Ubicación
Media Ponderada
Describiendo Numéricamente los Datos
Variación
Varianza
Desviación Estándar
Coeficiente de Variación
Rango
Percentiles
Rango Intercuartílico
Cuartiles
Medidas de Centro y Ubicación
3-5
Centro y Ubicación
Media
Mediana
Moda
Media Ponderada
Punto de
equilibrio
Punto medio
Punto de mayor
frecuencia
Media (Promedio Aritmético)
La medida más común de tendencia central
Media = Suma de valores divididos por el número de valores
Afectado por valores extremos (atípicos)
3-6
0 1 2 3 4 5 6 7 8 9 10
Media = 3
 0 1 2 3 4 5 6 7 8 9 10
Media = 4
Media (Promedio Aritmético)
La Media es el promedio aritmético de los valores de los datos
Media poblacional
Media muestral
3-7
n = Tamaño de la Muestra
N = Tamaño de la Población
(continuación)
Mediana
En un arreglo ordenado (de menor a mayor), la mediana es el número “medio”, es decir, el número que parte numéricamente a la distribución por la mitad
50% de los datos están arriba de la mediana, 50% están debajo
Se representa como Md
La mediana no está afectada por valores extremos
3-8
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
 0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
 Mediana
3-9
Para obtener la mediana, ordenar los n valores (datos) de menor a mayor. El conjunto de datos ordenados es llamado arreglo ordenado de datos
Encontrar el valor en la ubicación i = (1/2)n
La ima ubicación es el Punto de la Mediana
Si i no es un entero, redondear hacia arriba
Si i es un entero, la mediana es el promedio de los valores en las ubicaciones “i ” e “i + 1”
(continuación)
 Mediana: Ejemplo
3-10
Observe que n = 13
Busque la ubicación = (1/2)n: 
		i = (1/2)(13) = 6.5
Desde que 6.5 no es un entero, redondea hacia arriba (7)
La mediana es el valor en la 7ma ubicación:
				Md = 12
Arreglo ordenado de datos:
4, 4, 5, 5, 9, 11, 12, 14, 16, 19, 22, 23, 24
Forma de una Distribución
Describir cómo los datos están distribuídos
Simetrica o asimétrica
A mayor diferencia entre la media y la mediana, mayor es la asimetría de la distribución
3-11
Media = Mediana
 
Media < Mediana
 Mediana < Media
Asimétrica a la Izquierda
Simétrica
(Cola larga hacia la izquierda)
Asimétrica a la Derecha
(Cola larga hacia la derecha)
 Mediana vs Media
3-12
	Se tenía: Md = 12
	De otro lado, se puede verificar que la media es: 12.9. Se tiene un sesgo hacia la derecha.
	Considere que los datos corresponden a niveles de salarios mensuales en miles de dólares. Suponga que en lugar del salario de 24 se tiene 200. La media pasa a ser 26.5, más del doble, por la variación de un solo salario. Aún más la media es más grande que todos los valores, excepto el más alto.
	Sin embargo, se puede verificar que este cambio no afecta la mediana que sigue siendo 12. La mediana no se ve afectada por valores extremos, a diferencia de la media.
Arreglo ordenado de datos:
4, 4, 5, 5, 9, 11, 12, 14, 16, 19, 22, 23, 24
Moda
Una medida de ubicación
El valor que ocurre con mayor frecuencia
No está afectado por valores extremos
Usado para datos numéricos y categóricos
Podría no haber moda
Podría haber varias modas (2 modas = bimodal)
3-13
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 
Moda = 5
0 1 2 3 4 5 6
No hay moda
Moda: Ejemplo
Una pizería está rediseñando su comedor, para lo cual está interesada en los tamaños de grupos más frecuentes.
Toma una muestra de 20 grupos, en los cuales la cantidad de individuos por grupo fue:
{2, 4, 1, 2, 3, 2, 4, 2, 3, 6, 8, 4, 2, 1, 7, 4, 2, 4, 4, 3}
Se elaboró una distribución de frecuencias:
Se determinó los valores que ocurren con mayor frecuencia, en este caso se tuvo dos modas: 2 y 4, cada una con una frecuencia de 6 casos.
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
3-14
	Frecuencia	2	6	3	6	0	1	1	1
	Ind.x Grupo	1	2	3	4	5	6	7	8
Media Ponderada
Usado cuando los valores son agrupados por frecuencia o importancia relativa
3-15
	Días para Culminar	Frecuencia
	5	4
	6	12
	7	8
	8	2
Ejemplo: Muestra de 26 proyectos de reparación
Media Ponderada de Días para Culminar
 Ejemplo
3-16
Cinco casas en una colina cerca a la playa 
Precios de las casas (Dólares): 
 2,000,000
 500,000
 300,000
 100,000
 100,000
Estadísticos de Resumen
3-17
Media: ($ 3,000,000/5) 
		 m = $ 600,000
Mediana: Valor medio de los datos 
 ordenados
 Md = $ 300,000
Moda: Valor de mayor frecuencia
 Moda = $ 100,000
Precios de las casas (Dólares): 
 2,000,000
 500,000
 300,000
 100,000
 100,000
Suma 3,000,000
 Qué medida de ubicación es la “mejor”?
3-18
La media es generalmente usada, a menos que existan valores extremos (atípicos)
Luego la mediana es a menudo usada, desde que la mediana no es sensible a valores extremos
Ejemplo: La mediana de los precios de las casas podrían ser reportados para una región – menos sensibles a valores extremos
La moda es buena para determinar lo más probable a ocurrir
Resumen
	Tipo de medida central	Método de cálculo	Nivel de medida de los datos	Ventajas y desventajas
	Media	Suma de valores dividida entre número de valores	Ratio
Intervalo	Centro numérico de los datos.
Suma de desviaciones respecto de la media es cero.
Sensible a valores extremos
	Mediana	Valor medio de la data ordenada de menor a mayor	Ratio
Intervalo
Ordinal	No sensibles a valores extremos.
Calculado solo en base a posición media de los valores.
No usa la información total de los datos.
	Moda	Valor de mayor frecuencia de ocurrencia en la data	Ratio
Intervalo
Ordinal
Nominal	Puede no reflejar el centro de los datos.
Puede no existir.
Pueden ser múltiples. 
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
3-19
image1.png
oleObject1.bin
image2.wmf
N
x
n
x
x
N
i
i
n
i
i
å
å
=
=
=
m
=
1
1
oleObject2.bin
image3.wmf
å
å
å
å
=
m
=
i
i
i
W
i
i
i
W
w
x
w
w
x
w
X
oleObject3.bin
image4.wmf
3
5
15
5
5
4
3
2
1
=
=
+
+
+
+
oleObject4.bin
image5.wmf
4
5
20
5
10
4
3
2
1
=
=
+
+
+
+
oleObject5.bin
image6.wmf
n
x
x
x
n
x
x
n
n
i
i
+
+
+
=
=
å
=
L
2
1
1
oleObject6.bin
image7.wmf
N
x
x
x
N
x
N
N
i
i
+
+
+
=
=
m
å
=
L
2
1
1
oleObject7.bin
image8.wmf
días
 
6.31
 
 
26
164
 
 
2
8
12
4
8)
(2
7)
(8
6)
(12
5)
(4
w
x
w
X
i
i
i
W
=
=
+
+
+
´
+
´
+
´
+
´
=
=
å
å
image9.png

Continuar navegando