Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
PROBABILIDAD Y ESTADÍSTICA Estadística DESCRIPTIVA M.M. RODRIGO M.C. DEFINICIÓN DE ESTADÍSTICA 1. Conceptos Básicos de estadística (Lind, Marchal y Wathen, 2008) Fuente: https://www.espn.com.mx/basquetbol/nba/estadisticas Población de 18 años y más por sexo y grupos de edad, según interés en desarrollos científicos y tecnológicos ESTADÍSTICA E. DESCRIPTIVA E. INFERENCIAL La Estadística es la ciencia encargada de recoger, analizar e interpretar los datos relativos a un conjunto de elementos. Población es el conjunto de elementos sobre los cuales se va a estudiar una determinada característica. Muestra es una parte de la población. Variable estadística el aspecto que se va a estudiar. Si se puede medir se llama variable cuantitativa si no se pueden medir se llama variable cualitativa (categórica o atributo). Si la variable estadística toma un número determinado de valores se llama discreta. Si la variable estadística puede tomar cualquier valor entre dos valores dados se llama continua. Ejercicio: Escriba dos ejemplos de variables cuantitativa discreta, cuantitativa continua y cualitativa. 2. Recopilación y Descripción de Datos Fuente: Johnson R.;Kuby P. (2012). Estadística elemental. 11ª. Edic. México: CENGAGE Learning Distribución de frecuencias Definición Una distribución de frecuencias (o tabla de frecuencias) lista valores de los datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes. Datos agrupados en intervalos Datos no agrupados Datos obtenidos de la recopilación que aún no tienen ningún tratamiento estadístico u organización. Vida útil (en años) de las laptop de 20 personas 3, 4, 3, 2, 2, 3, 4, 2, 5, 3, 3, 5, 6, 2, 5, 3, 4, 1, 3, 1 Un primer tratamiento estadístico, sería ordenar los datos de menor a mayor o viceversa. Gráficos MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DE DATOS SIN AGRUPAR 3. Medidas de Tendencia Central Después de la recolección de los datos, comienza el tratamiento estadístico desde el análisis hasta la interpretación de los resultados. Las técnicas empleadas dependerán de la cantidad de datos que se requieren trabajar ya sea utilizando una computadora o agrupando los datos. La lista de los datos obtenidos o recolectados al inicio de la investigación son llamados datos crudos o sin procesar. El proceso estadístico puede consistir en el ordenamiento de los datos. ORDENAMIENTO ASCENDENTE DESCENDENTE Ejemplo: Ordenar los siguientes datos 1.23, 1.56, 1.20, 1.19, 1.45, 1.32, 1.46,1.20 1.19 1.20 1.20 1.23 1.32 1.45 1.46 1.56 1.56 1.46 1.45 1.32 1.23 1.20 1.20 1.19 Datos no agrupados Se utilizan para indicar un valor que tiende a tipificar o ser el más representativo de un conjunto de números. LA MEDIA O PROMEDIO Ejemplo: Un alumno presentó cuatro exámenes y obtuvo calificaciones de 83, 94, 95 y 86, la calificación promedio del alumno es x: valor de cada uno de los datos u observación n: total de observaciones o tamaño de la muestra Para calcular la media de la población los símbolos que se usan son: x: valor de cada uno de los datos u observación N: total de la población Medidas de tendencia central para datos no agrupados LA MEDIANA Divide al grupo en dos partes iguales. La mitad del conjunto de datos será menor y la otra mitad será mayor a la mediana. Procedimiento para obtener la mediana: Ordenar los datos Verificar si el total de los datos es Par: la mediana será el promedio de los dos valores centrales Impar: la mediana será el valor intermedio Se puede utilizar la siguiente fórmula para encontrar la posición de la mediana en un conjunto de datos: Por ejemplo, si tenemos un total de 5 datos (número impar) , la mediana será el dato que se encuentre en la posición 3; (5+1)/2=3. Si tenemos un total de 8 datos (número par), la mediana será el promedio de los dos datos centrales que ocupan la posición 4 y 5; (8+1)/2=4.5. Ejemplo 1. Encuentre la mediana del conjunto de datos siguiente 4, 5, 2, 6, 1 1 2 4 5 6 Número de datos impar Indica la posición del dato El 50% de los datos son menores a 4 y el otro 50% son mayores a 4. Ejemplo 2. Encuentre la mediana del conjunto de datos siguiente 4, 5, 10, 2, 6, 1 1 2 4 5 6 10 Número de datos par La mediana será el promedio de los valores centrales 4 y 5: El 50% de los datos son menores a 4.5 y el otro 50% son mayores a 4.5. se toman los datos que ocupan la posición 3 y 4 LA MODA Es el dato que con más frecuencia se presenta en un conjunto de datos. La moda es indicativa del valor “típico” en términos del valor que se presenta con mayor frecuencia Ejemplo 1. Obtenga la moda del siguiente grupo de datos 3, 4, 3, 5 ,6 La moda es 3 Ejemplo 1. Obtenga la moda del siguiente grupo de datos 6, 4, 3, 5 ,6,4,2,4,6,1,4,6 Existen dos modas el 4 y 6 (bimodal) EJERCICIO 1.2. Se inspeccionaron 15 radios antes de enviarlos para su venta. El número de defectos por radio es 1, 0, 3, 4, 2, 1, 0, 3, 1, 2, 0, 1, 1, 0, 1 Obtenga la media, la mediana y la moda para el número de defectos. EJERCICIO 1.3. Su firma está introduciendo un nuevo chip de computadora del cual se promociona que realiza cálculos estadísticos mucho más rápidamente que los que actualmente se encuentran en el mercado. Se hacen veinte cálculos diferentes, produciendo los tiempos en segundos que se ven más adelante. Aunque usted no puede tergiversar su producto, usted desea presentar los resultados de la manera más favorable para su empresa. Determine la media, la mediana y la moda. 3.2 4.1 6.3 1.9 0.6 5.4 5.2 3.2 4.9 6.2 1.8 1.7 3.6 1.5 2.6 4.3 6.1 2.4 2.2 3.3 MEDIDAS DE DISPERSIÓN PARA UN CONJUNTO DE DATOS SIN AGRUPAR Para describir en forma adecuada un conjunto de datos, son necesarios dos tipos de medidas de resumen. Además, para obtener información respecto a la parte media de un conjunto de números, es conveniente también tener un método para expresar la cantidad de dispersión o difusión que hay entre los números. Por ejemplo, las medidas de dispersión indican si los valores están relativamente cercanos uno del otro o si se encuentran dispersos. Vea las figuras. BAJA DISPERSIÓN ALTA DISPERSIÓN La Dispersión mide cuán próximos están los valores de un grupo entre sí Medidas de dispersión o variación para datos no agrupados RANGO El rango de un conjunto de datos es la diferencia entre el valor máximo y el valor mínimo EJEMPLO: Halle el rango de la muestra 3, 3, 5, 6, 8 El rango 5 indica que todos estos valores caen en un intervalo de 5 unidades. 3 8 5 6 3 Mínimo Máximo Rango(“distancia”) Es conveniente considerar cuatro variables de dispersión: la amplitud de variación (rango), la desviación media, la varianza y la desviación estándar. VARIANZA La varianza de una muestra es la desviación promedio de valores obtenidos a partir de la media, elevada al cuadrado y calculada mediante n-1 en lugar de n. EJEMPLO: Calcule la varianza para esta muestra: 2, 4, 6, 8, 10 2 6 -4 16 4 6 -2 4 6 6 0 0 8 6 2 4 10 6 4 16 Suma 0 40 Calculamos la varianza DESVIACIÓN ESTÁNDAR Se define como la raíz cuadrada de la varianza. EJEMPLO: Calcule la desviación estándar para esta muestra: 2, 4, 6, 8, 10 El valor de la varianza en el ejercicio anterior fue 10, para obtener la desviación estándar solo obtenemos la raíz cuadrada de 10: EJERCICIO 1.5.: A 15 estudiantes universitarios, elegidos aleatoriamente, se les solicitó mencionar el número de horas que durmieron la noche anterior. Los datos resultantes fueron 5, 6, 6, 8, 7, 7, 9, 5, 4, 8, 11, 6, 7, 8, 7. Encuentre todas las medidas de dispersión. EJERCICIO 1.6.: A los reclutas de una academia de policía se les solicitó presentar un examen que mide su capacidad para hacer ejercicio. Esta capacidad medida en minutos, se obtuvo para cada uno de los 20 reclutas. 25 27 30 33 30 32 30 34 30 27 25 29 31 31 32 34 32 33 30 Calcule todas las medidas de tendencia central y de dispersión. MEDIDAS DE TENDENCIA CENTRALY MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS EN UNA DISTRIBUCIÓN DE FRECUENCIAS MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA UNA DISTRIBUCIÓN DE FRECUENCIAS FÓRMULAS: MEDIDAS DE TENDENCIA CENTRAL FÓRMULAS: DISPERSIÓN O VARIACIÓN 6 9 2 7 0 8 2 5 4 2 5 4 4 4 4 2 5 6 3 7 3 8 8 4 4 4 7 7 6 5 4 7 5 3 7 1 3 8 0 6 5 1 2 3 6 0 5 6 6 3 Número de accidentes que ocurren diariamente (durante 50 días) en un enorme estacionamiento (Fuente: Stevenson) Accidentes (x) Número de días(f) 0 3 1 2 2 5 3 6 4 9 5 7 6 7 7 6 8 4 9 1 Total f = n =50 Distribución de frecuencias f = frecuencia n = tamaño de la muestra Media o promedio La moda se obtiene por definición La mediana se obtiene por definición. Localice la posición del elemento. Rango se obtiene por definición Varianza Desviación estándar Nombre de rango Funciones contar.si, suma, promedio Ficha: Datos -> Análisis de datos Medidas de tendencia central Medidas de dispersión Tablas de frecuencias 1.- Datos sobre el número de artículos defectuosos por lote en el caso de 40 de ellos. Calcule las medidas de tendencia central y de dispersión. Interprete los resultados. 2.- Recopile al menos 25 datos sobre una característica de interés y obtenga las medidas de tendencia central y de variación. Interprete los resultados. 5 12 9 1 10 11 8 7 7 3 8 0 9 8 2 3 8 4 4 3 3 4 5 4 0 7 5 6 5 3 0 1 10 8 3 7 2 6 2 5 EJERCICIOS REFERENCIAS Lind, D.; Marchal, W. y Wathen, S. (2008). Estadística aplicada a los negocios y la economía. McGraw Hill. n x x å = - 5 . 89 4 86 95 94 83 = + + + N x å = m 2 1 + = n Posición 3 2 1 5 = + = Posición 5 . 3 2 1 6 = + = Posición 5 . 4 2 5 4 = + = mediana RangovalorMáximovalorMenor =- 835 Rango =-= ( ) 2 2 1 i xX s n - = - å i x X ( ) i xX - ( ) 2 i xX - ( ) 2 40 10 51 s == - 2 ss = 103.1622 s ==
Compartir