Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Describiendo los Datos, Usando Medidas Numéricas 3-1 Datos en Información Descripción gráfica, diagramas y tablas Descripción numérica de los datos ¿Cómo compara la duración de los neumáticos de un fabricante A y la de un fabricante B? En forma gráfica: Tomar una muestra y producir los histogramas respectivos. Se requiere más: Medidas numéricas que resuman la información Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 3-2 Objetivos del Capítulo Calcular e interpretar la media, mediana, y moda para un conjunto de datos 3-3 Técnicas Descriptivas 3-4 Centro y Ubicación Media Mediana Moda Otras Medidas de Ubicación Media Ponderada Describiendo Numéricamente los Datos Variación Varianza Desviación Estándar Coeficiente de Variación Rango Percentiles Rango Intercuartílico Cuartiles Medidas de Centro y Ubicación 3-5 Centro y Ubicación Media Mediana Moda Media Ponderada Punto de equilibrio Punto medio Punto de mayor frecuencia Media (Promedio Aritmético) La medida más común de tendencia central Media = Suma de valores divididos por el número de valores Afectado por valores extremos (atípicos) 3-6 0 1 2 3 4 5 6 7 8 9 10 Media = 3 0 1 2 3 4 5 6 7 8 9 10 Media = 4 Media (Promedio Aritmético) La Media es el promedio aritmético de los valores de los datos Media poblacional Media muestral 3-7 n = Tamaño de la Muestra N = Tamaño de la Población (continuación) Mediana En un arreglo ordenado (de menor a mayor), la mediana es el número “medio”, es decir, el número que parte numéricamente a la distribución por la mitad 50% de los datos están arriba de la mediana, 50% están debajo Se representa como Md La mediana no está afectada por valores extremos 3-8 0 1 2 3 4 5 6 7 8 9 10 Mediana = 3 0 1 2 3 4 5 6 7 8 9 10 Mediana = 3 Mediana 3-9 Para obtener la mediana, ordenar los n valores (datos) de menor a mayor. El conjunto de datos ordenados es llamado arreglo ordenado de datos Encontrar el valor en la ubicación i = (1/2)n La ima ubicación es el Punto de la Mediana Si i no es un entero, redondear hacia arriba Si i es un entero, la mediana es el promedio de los valores en las ubicaciones “i ” e “i + 1” (continuación) Mediana: Ejemplo 3-10 Observe que n = 13 Busque la ubicación = (1/2)n: i = (1/2)(13) = 6.5 Desde que 6.5 no es un entero, redondea hacia arriba (7) La mediana es el valor en la 7ma ubicación: Md = 12 Arreglo ordenado de datos: 4, 4, 5, 5, 9, 11, 12, 14, 16, 19, 22, 23, 24 Forma de una Distribución Describir cómo los datos están distribuídos Simetrica o asimétrica A mayor diferencia entre la media y la mediana, mayor es la asimetría de la distribución 3-11 Media = Mediana Media < Mediana Mediana < Media Asimétrica a la Izquierda Simétrica (Cola larga hacia la izquierda) Asimétrica a la Derecha (Cola larga hacia la derecha) Mediana vs Media 3-12 Se tenía: Md = 12 De otro lado, se puede verificar que la media es: 12.9. Se tiene un sesgo hacia la derecha. Considere que los datos corresponden a niveles de salarios mensuales en miles de dólares. Suponga que en lugar del salario de 24 se tiene 200. La media pasa a ser 26.5, más del doble, por la variación de un solo salario. Aún más la media es más grande que todos los valores, excepto el más alto. Sin embargo, se puede verificar que este cambio no afecta la mediana que sigue siendo 12. La mediana no se ve afectada por valores extremos, a diferencia de la media. Arreglo ordenado de datos: 4, 4, 5, 5, 9, 11, 12, 14, 16, 19, 22, 23, 24 Moda Una medida de ubicación El valor que ocurre con mayor frecuencia No está afectado por valores extremos Usado para datos numéricos y categóricos Podría no haber moda Podría haber varias modas (2 modas = bimodal) 3-13 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Moda = 5 0 1 2 3 4 5 6 No hay moda Moda: Ejemplo Una pizería está rediseñando su comedor, para lo cual está interesada en los tamaños de grupos más frecuentes. Toma una muestra de 20 grupos, en los cuales la cantidad de individuos por grupo fue: {2, 4, 1, 2, 3, 2, 4, 2, 3, 6, 8, 4, 2, 1, 7, 4, 2, 4, 4, 3} Se elaboró una distribución de frecuencias: Se determinó los valores que ocurren con mayor frecuencia, en este caso se tuvo dos modas: 2 y 4, cada una con una frecuencia de 6 casos. Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 3-14 Frecuencia 2 6 3 6 0 1 1 1 Ind.x Grupo 1 2 3 4 5 6 7 8 Media Ponderada Usado cuando los valores son agrupados por frecuencia o importancia relativa 3-15 Días para Culminar Frecuencia 5 4 6 12 7 8 8 2 Ejemplo: Muestra de 26 proyectos de reparación Media Ponderada de Días para Culminar Ejemplo 3-16 Cinco casas en una colina cerca a la playa Precios de las casas (Dólares): 2,000,000 500,000 300,000 100,000 100,000 Estadísticos de Resumen 3-17 Media: ($ 3,000,000/5) m = $ 600,000 Mediana: Valor medio de los datos ordenados Md = $ 300,000 Moda: Valor de mayor frecuencia Moda = $ 100,000 Precios de las casas (Dólares): 2,000,000 500,000 300,000 100,000 100,000 Suma 3,000,000 Qué medida de ubicación es la “mejor”? 3-18 La media es generalmente usada, a menos que existan valores extremos (atípicos) Luego la mediana es a menudo usada, desde que la mediana no es sensible a valores extremos Ejemplo: La mediana de los precios de las casas podrían ser reportados para una región – menos sensibles a valores extremos La moda es buena para determinar lo más probable a ocurrir Resumen Tipo de medida central Método de cálculo Nivel de medida de los datos Ventajas y desventajas Media Suma de valores dividida entre número de valores Ratio Intervalo Centro numérico de los datos. Suma de desviaciones respecto de la media es cero. Sensible a valores extremos Mediana Valor medio de la data ordenada de menor a mayor Ratio Intervalo Ordinal No sensibles a valores extremos. Calculado solo en base a posición media de los valores. No usa la información total de los datos. Moda Valor de mayor frecuencia de ocurrencia en la data Ratio Intervalo Ordinal Nominal Puede no reflejar el centro de los datos. Puede no existir. Pueden ser múltiples. Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 3-19 image1.png oleObject1.bin image2.wmf N x n x x N i i n i i å å = = = m = 1 1 oleObject2.bin image3.wmf å å å å = m = i i i W i i i W w x w w x w X oleObject3.bin image4.wmf 3 5 15 5 5 4 3 2 1 = = + + + + oleObject4.bin image5.wmf 4 5 20 5 10 4 3 2 1 = = + + + + oleObject5.bin image6.wmf n x x x n x x n n i i + + + = = å = L 2 1 1 oleObject6.bin image7.wmf N x x x N x N N i i + + + = = m å = L 2 1 1 oleObject7.bin image8.wmf días 6.31 26 164 2 8 12 4 8) (2 7) (8 6) (12 5) (4 w x w X i i i W = = + + + ´ + ´ + ´ + ´ = = å å image9.png
Jossenka Lisbeth Pin Tomalo
Desafío México Veintitrés
Compartir