Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Docente: Ing. Marta Almada Análisis de los datos no agrupados y agrupados (medida de dispersión) RETROALIMENTACIÓN • Estadística descriptiva • Clasificación de Variables • Organización de los datos en la tabla de frecuencias • Análisis de los datos no agrupados y agrupados: (Medidas de Tendencia Central) BIOESTADISTICA E Informática En estadística, las medidas de dispersión es el grado en que una distribución se estira o exprime. La varianza: Es la desviación cuadrada de la media. Medidas de Dispersión DATOS NO AGRUPADOS DATOS AGRUPADOS S²= ∑(𝐱−𝐱 )² 𝐧−𝟏 muestra σʹ= ∑(𝐱−𝐱 )² 𝐧 poblacion S²= ∑ 𝐱− 𝐱 2∗𝐟𝐢 𝐧−𝟏 muestra σʹ= ∑ 𝐱− 𝐱 2∗𝐟𝐢 𝐧 población S²: es el símbolo de la varianza X: es el punto medio de la clase f: es la frecuencia de clase. n: es el número de observaciones 𝐱 : designa la media muestral. La desviación estándar: Es la raíz cuadrada de la varianza. Rango: Es la más elemental de las medidas, es la diferencia entre el dato mayor y el dato menor. Medidas de Dispersión FORMULAS S= S² muestra σ= σ² poblacion R= Vmax-Vmin Coeficiente de variación: es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión. Cv= 𝒔 𝐱 *100 Medidas de Dispersión EJEMPLO 01 Banco continental seleccionó una muestra de 20 cuentas de cheques de estudiantes. A continuación aparecen sus saldos en dólares de fin de mes. Determine la media, la varianza y la desviación estándar de la siguiente distribución de frecuencias. 5 7 8 9 8 10 8 5 7 5 9 10 20 9 15 15 20 9 15 9 Saldos x 5 7 8 9 10 15 20 sumatoria Frecuencia Ab. fi 3 2 3 5 2 3 2 20 D A T O S N O A G R U P A D O S RESOLUCION Producto (x*fi) 15 14 24 45 20 45 40 203 Saldos x 5 7 8 9 10 15 20 sumatoria (𝐱 − 𝐱 )² (5 − 10)²= 25 7 − 10 2 =9 8 − 10 2= 4 9 − 10 2=1 10 − 10 2= 0 15 − 10 2=25 20 − 10 2 =100 164 Frecuencia fi 3 2 3 5 2 3 2 20 Rango R= Vmax-Vmin 20-5= 15 Coeficiente de variación: Cv= 𝒔 𝐱 *100 (3/10)*100= 30% Media (𝐱 )= ∑ 𝐱∗𝐟𝐢 𝐧 203 20 = 10 Varianza S²= ∑(𝐱−𝐱 )² 𝐧−𝟏 muestra = 164 19 = 9 Desviación estándar S= S² 9 = 3 x − x 2 ∗ fi 911,25 650,25 147 33,75 464,75 1058 3265 Media (𝐱 )= ∑ 𝒙 ∗ 𝒇𝒊 𝒏 𝟏𝟓𝟔𝟎 𝟔𝟎 = 𝟐𝟔 𝒂ñ𝒐𝒔 Varianza S²ʹ= ∑ 𝐱− 𝐱 2∗𝐟𝐢 𝐧−𝟏 S²= 𝟑𝟐𝟔𝟓 𝟓𝟗 = 55 años Desviación estándar S= S² S= 55 = 7 años Coeficiente de variación Cv= S 𝐱 *100 Cv= 𝟕 𝟐𝟔 ∗ 𝟏𝟎𝟎 = 27% heterogéneos Rango R= vmax-vmin R=37,5-12,5= 25 Obtenemos una muestra de la edad de 60 personas, con los datos disponibles calcular: la media, varianza, desviación estándar, rango y coeficiente de variación Intervalos de Clases Edades L. I L. S [10 15) [15 20) [20 25) [25 30) [30 35) [35 40] Total Marca de Clase x 12,5 17,5 22,5 27,5 32,5 37,5 Frecuencias Absoluta fi 5 9 12 15 11 8 60 (x*fi) 62,5 157,5 270 412,5 357,5 300 1560 x − x 2 12,5 − 26 2=182,25 72,25 12,25 2,25 42,25 132,25 EJEMPLO 02 EJERCICIOS 02 Obtenemos una muestra de peso en kilo gramo de 40 personas a) Los datos aparecen en la siguiente tabla a continuación: b) Determine la media, la varianza, desviación estándar, coeficiente de variación y el rango. PESO Li - Ls Frecuencia fi [33 - 36) 4 [36 – 39) 9 [39 - 42) 11 [42 - 45) 7 [45 - 48) 4 [48 - 51) 3 [51 - 54] 2 sumatoria 40 PESO Li - Ls Frecuencia fi Marca de C x (x*fi) 𝐱 − 𝐱 2 𝐱 − 𝐱 2 ∗ 𝐟𝐢 [33 - 36) 4 34,5 138 𝟑𝟒, 𝟓 − 𝟒𝟐 2=56,25 56,25*4=225 [36 – 39) 9 37,5 337,5 𝟑𝟕, 𝟓 − 𝟒𝟐 2=20,25 20,25*9=182,25 [39 - 42) 11 40,5 445,5 𝟒𝟎, 𝟓 − 𝟒𝟐 2=2,25 2,25*11=24,75 [42 - 45) 7 43,5 304,5 𝟒𝟑, 𝟓 − 𝟒𝟐 2=2,25 2,25*7=15,75 [45 - 48) 4 46,5 186 𝟒𝟔, 𝟓 − 𝟒𝟐 2=20,25 20,25*4=81 [48 - 51) 3 49,5 148,5 𝟒𝟗, 𝟓 − 𝟒𝟐 2=56,25 56,25*3=168,75 [51 - 54] 2 52,5 105 𝟓𝟐, 𝟓 − 𝟒𝟐 2=110,25 110,25*2=220,5 sumatoria 40 918 Media (𝐱 )= ∑ 𝒙 ∗ 𝒇𝒊 𝒏 𝟏𝟔𝟔𝟓 𝟒𝟎 = 42 Varianza S²ʹ= ∑ 𝐱− 𝐱 2∗𝐟𝐢 𝐧−𝟏 𝟗𝟏𝟖 𝟑𝟗 = 24 Desviación estándar S= S² 24 = 5 Coeficiente de variación Cv= S 𝐱 *100 𝟓 𝟒𝟐 *100 = 12% Rango R= vmax-vmin 52,5-34,4= 18,1 Conceptos básicos VARIABLE: Es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra. Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajadores de empresa de comunicación Variables: genero, edad, salario, Nº de horas de trabajo, etc. Población: “Las personas que trabajan en una empresa de comunicación” Muestra 11 TIPOS DE VARIABLES Variables Cuantitativas DISCRETA Variables Cualitativas CONTINUA Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas aprobadas en un semestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso; Estatura; Temperatura, etc. ORDINALNOMINAL Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Genero, Deporte Favorito, etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (E, MB, B, A, I); Grado de Interés por un tema, etc. Se apoya en las siguientes herramientas medidas de tendencias central y medidas de dispersión. Los datos referentes al peso de un grupo de 40 personas, tal como aparecen a continuación, no revelan fácilmente ninguna característica del grupo: 58, 52, 58, 50, 54, 54, 52, 58, 52, 54, 58, 54, 52, 58, 52, 50, 54, 58, 54, 56, 54, 56, 58, 52, 58, 54, 60, 54, 52, 56, 54, 60, 56, 50, 58, 52, 54, 58, 50 , 54 En cambio, los mismos datos ya elaborados, presentados en la forma que sigue, permite formarse juicio bastante exacto, sobre el conjunto de personas estudiadas: EJEMPLO Distribución de Datos en la tabla de frecuencias 58, 52, 58, 50, 54, 54, 52, 58, 52, 54, 58, 54, 52, 58, 52, 50, 54, 58, 54, 56, 54, 56, 58, 52, 58, 54, 60, 54, 52, 56, 54, 60, 56, 50, 58, 52, 54, 58, 50 , 54 Al resumir los datos en tal forma, algunos detalles sobre las variaciones individuales se han perdido, pero las características generales del grupo se han conservado y son mas aparentes. Peso en kg (x) Nº de personas (fi ) 50 4 52 8 54 12 56 4 58 10 60 2 Sumatoria (n) 40 Medidas de tendencias central La medida de centralización es un número situado hacia en el centro de la distribución de los valores de una serie de observaciones. El propósito de esta medida consiste en señalar el centro de un conjunto de valores mediante la moda, mediana, media aritmética. Aplicación en datos no agrupados MODA (Mo): es el valor de la variable con mayor frecuencia absoluta. Se puede calcular para cualquier tipo de variable. Para calcularla basta con observar la columna de frecuencias absolutas (fi). Medidas de tendencias central Medidas de tendencias central Aplicación en datos no agrupados MEDIANA: es el valor de la serie de datos que se sitúa justamente en el centro de la muestra. Cálculo de la mediana: Se busca en la columna de la frecuencia absoluta acumulada el primer valor que supere la mitad de los datos (n/2) si es par, o si es un numero impar se calcula de la siguiente manera (n+1)/2 , la mediana será el valor que se corresponda con esta frecuencia absoluta acumulada, si no se encuentra exactamente ese valor, entonces el primer valor que supera al resultado de la n/2 o n+1/2 Media aritmética (x)̄: también llamada promedio o media, es la medida de centralización más conocida, pero no se puede calcular para variables cualitativas. Formula x̄ = ∑ (x*fi) n Medidas de tendencias central Aplicación en datos no agrupados EJEMPLO Los datos referentes al peso de una muestra de 40 personas, tal comoaparecen a continuación. 58, 52, 58, 50, 54, 54, 52, 58, 52, 54, 58, 54, 52, 58, 52, 50, 54, 58, 54, 56, 54, 56, 58, 52, 58, 54, 60, 54, 52, 56, 54, 60, 56, 50, 58, 52, 54, 58, 50 , 54. Realizar los cálculos aplicando la formulas de las medidas de tendencias central Peso en kg (x) Nº de personas (fi ) F. Acumulada (Fi) (x*fi) 50 4 4 200 52 8 12 416 54 12 24 648 56 4 28 224 58 10 38 580 60 2 40 120 Sumatoria (n) 40 2188 Media ( x )= ∑ 𝑥∗𝑓𝑖 𝑛 x = 2188 40 = 55kg Moda (Mo) 54 kg Mediana Me= 𝑛 2 Me= 40 2 = 20 Me= 54 Kg Moda: Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos agrupados, hablaremos de intervalo modal. La moda se representa por Mo. Todos los intervalos tienen la misma amplitud • Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta). • fi Frecuencia absoluta del intervalo modal. • fi-1 Frecuencia absoluta del intervalo anterior al modal. • fi+1 Frecuencia absoluta del intervalo posterior al modal. • ti Amplitud de los intervalos. Medidas de tendencia central Aplicación en datos agrupados 𝑀𝑜 = 𝐿𝑖 + (𝑓𝑖−𝑓𝑖−1) 𝑓𝑖−𝑓𝑖−1 +(𝑓𝑖−𝑓𝑖+1) *ti Medidas de tendencia central Aplicación en datos agrupados EDAD Frecuencia fi [0-10) 3 [10-20) 6 [20-30) 6 [30-40) 12 [40-50] 4 sumatoria 31 𝑀𝑜 = 𝐿𝑖 + (𝑓𝑖−𝑓𝑖−1) 𝑓𝑖−𝑓𝑖−1 +(𝑓𝑖−𝑓𝑖+1) *ti 𝑀𝑜 = 30 + (12−6) 12−6 +(12−4) *10 𝑀𝑜 = 30 + 6 6+8 *10 =34 Mediana: Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas. Cálculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre si N es par N / 2, si n es impar N+1/2 Medidas de tendencia central Aplicación en datos agrupados 𝑀𝑒 = 𝐿𝑖 + ( 𝑛 2 −𝐹𝑖−1) 𝑓𝑖 *ti N / 2 N +1/ 2 = 31+1 / 2 ⇒ 16 Observación: Li-1 es el límite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. fi es la frecuencia absoluta del intervalo mediano. ti es la amplitud de los intervalos. EDAD Frecuencia fi F. Acumulada Fi [0-10) 3 3 [10-20) 6 9 [20-30) 6 15 [30-40) 12 27 [40-50] 4 31 sumatoria 31 𝑀𝑒 = 𝐿𝑖 + ( 𝑛+1 2 − 𝐹𝑖−1 ) 𝑓𝑖 *ti 𝑀𝑒 = 30 + (16−15) 12 *10 𝑀𝑒 = 30 + 1 12 *10= 31 PROMEDIO O MEDIA ARIMETICA: Se calcula sumando todos los productos de marca de clase con la frecuencia absoluta respectiva y su resultado dividirlo por el número total de datos, es decir: MARCA DE CLASE(x): Corresponde al promedio de los extremos de los intervalos Media (𝐱 )= ∑ 𝒙∗𝒇𝒊 𝒏 Medidas de tendencia central Aplicación en datos agrupados Medidas de tendencia central Aplicación en datos agrupados Media (𝐱 )= ∑ 𝒙∗𝒇𝒊 𝒏 EDAD Frecuencias fi F. Acumulada Fi Marca de clase (x) Producto (x*fi) [0-10) 3 3 5 15 [10-20) 6 9 15 90 [20-30) 6 15 25 150 [30-40) 12 27 35 420 [40-50) 4 31 45 180 sumatoria 31 855 Media (𝐱 )= 𝟖𝟓𝟓 𝟑𝟏 = 𝟐𝟖 Marca de C (𝐱 )= 𝑳𝑺+𝑳𝑰 𝟐 Google realiza una prueba de mercado de su sitio web y le interesa saber con qué facilidad se navega en su diseño de página web. Selecciona al azar 200 usuarios frecuentes de internet y les pide que lleven a cabo una búsqueda en la página web. A cada uno de ellos le solicita que califique la relativa facilidad para navegar como mala, buena, excelente, regular. Los resultados aparecen en la siguiente tabla: a) ¿Qué tipo de escala de medición se emplea para facilitar la navegación? b) Elabore una gráfica de barras con los resultados de la encuesta. c) Construya una gráfica de pastel con los resultados de la encuesta. Excelente 102 Buena 58 Regular 30 Mala 10 Total 200 EJERCICIOS Nº 02
Compartir