Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística para Ciencias Sociales Juan José Hernández Ocaña Semana dos Objetivos Determinar los procedimientos para la agrupación y representación de datos de variables. Estadística Descriptiva para Variables Cualitativas Escala Nominal y Ordinal 1.- Empleo de Tablas de Distribución 2.- Uso Gráfica de barras o sectores 3.- Estadístico descriptivo: MODA Tabla de frecuencias Juan José Hernández Ocaña Estadística descriptiva para variables cualitativas Clase : Es un conjunto de valores o categorías en que son agrupados los datos. En el caso de género : hombre , mujeres Colores : rojo, verde, azul … Agrupar valores 1 a 10 11 a 20 21 a 30 Estadística descriptiva para variables cualitativas Frecuencia.- Es la cantidad de datos que están incluidos en cada una de las clases Por ejemplo, cuántos hombres y cuántas mujeres? La frecuencia es Contar ¡¡¡¡ Tabla Distribución de frecuencias Una distribución de frecuencias es el resumen tabular de un conjunto de datos que muestra el número o frecuencia de artículos en cada una de las clases. Estadística descriptiva para variables cualitativas ¿Qué información debe tener una tabla de frecuencias ? 1.- Distribución de frecuencia individual ( absoluta) 2.- Distribución de frecuencia acumulada 3.- Distribución de Frecuencias relativas 4.- Distribución de frecuencias relativa acumuladas Pregunta de investigación ¿ Qué porcentaje de mujeres y de hombres se han vacunado en su país Señala que tipo de gráfico se emplea para porcentajes Señala que tipo de gráfico se emplea para cantidades de un variable cualitativa Frecuencia relativa= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 Una bolsa de cacahuates de N&N contiene 21 dulces de diferentes colores y la distribución de los datos es la siguiente: Categoría o clase frecuencia Café 6 anaranjado 5 verde 3 amarillo 3 rojo 2 azul 2 Total (N) 21 Frecuencia acumulada Frecuencia relativa 6 6/21= 0.2857 6+5=11 5/21=0.2380 11+3=14 3/21=0.1428 14+3= 17 3/21=0.1428 17+2=19 2/21=0.0952 19+2=21 2/21=0.0952 1 Frecuencia acumulada Frecuencia relativa 6 6/21= 0.2857 6+5=11 5/21=0.2380 11+3=14 3/21=0.1428 14+3= 17 3/21=0.1428 17+2=19 2/21=0.0952 19+2=21 2/21=0.0952 1 PORCENTAJE PORCENTAJE ACUMULADO fr x 100 28.57 28.57 23.8 52.37 14.28 66.65 14.28 80.93 9.52 90.45 9.52 99.97 ejercicio La siguiente tabla muestra las preferencias de los usuarios de Internet sobre los buscadores de la Web. buscador Frecuencia GOOGLE 35 YAHOO 28 AOL TIME 19 MSN 15 ASK 10 OTROS 3 total (110) Frecuencia acumulada 35 63 82 97 107 110 Frecuencia relativa 0.3181 (35/110) 0.2545 0.1727 0.1363 0.0909 0.0272 1.000 Frecuencia relativa acumulada .3181 31.81% .5726 57.26% .7453 74.53% .8816 88.16% .9725 97.25% 0.9997 99.97% buscador Frecuencia GOOGLE 35 YAHOO 28 AOL TIME 19 MSN 15 ASK 10 OTROS 3 total (110) Venta de autos en el mes de julio Categoría frecuencia Compacto 38 Subcompacto 23 Sedan 20 Deportivo 15 Camioneta 8 4 x 4 2 Total (N) 106 Frecuencia acumulada 38 61 81 96 104 106 frecuencia 38 23 20 15 8 2 106 Frecuencia relativa 38/106 = 0.3584 23/106 = 0.2169 20/106= 0.1886 15/106= .1415 8/106= .0754 2/106= 0.0188 106 Frecuencia relativa acumulada 0.3584 0.5753 0.7639 0.9054 0.9808 0.9996 Porcentaje acumulado 35.84 57.53 76.39 90.54 98.08 99.96 Venta de autos en el mes de julio Categoría frecuencia Compacto 38 Subcompacto 23 Sedan 20 Deportivo 15 Camioneta 8 4 x 4 2 Total (N) 106 Frecuencia relativa 38/106 = 0.3584 23/106 = 0.2169 20/106= 0.1886 15/106= .1415 8/106= .0754 2/106= 0.0188 106 Frecuencia relativa acumulada 0.3584 0.5753 0.7639 0.9054 0.9808 0.9996 Porcentaje acumulado 35.84 57.53 76.39 90.54 98.08 99.96 Categoría frecuencia Mal etiqueta 120 Ralladura 50 Fuga 30 Bajo volumen 18 rotura 10 Otros 2 Total (N) 230 Frecuencia acumulada 120 170 200 218 228 230 La siguiente tabla muestra el número de defectos que se han detectado en una línea de producción, por lo que se le pide que se haga una tabla de distribución de frecuencias frecuencia 120 50 30 18 10 2 230 Frecuencia relativa 120/230 = 0.5217 50/230 = 0.2173 30/230= 0.1304 18/230= .0782 10/230= .0434 2/230= 0.0086 Frecuencia relativa acumulada 0.5217 0.739 0.8694 0.9476 0.991 0.9996 Porcentaje acumulado 52.17 73.90 86.94 94.76 99.1 99.96 Gráficas para variables cualitativas Una bolsa de cacahuates de N&N contiene 21 dulces de diferentes colores y la distribución de los datos es la siguiente: Categoría frecuencia Café 6 anaranjado 5 verde 3 amarillo 3 rojo 2 azul 2 Total (N) 21 Frecuencia acumulada Frecuencia relativa 6 6/21= 0.2857 6+5=11 5/21=0.2380 11+3=14 3/21=0.1428 14+3= 17 3/21=0.1428 17+2=19 2/21=0.0952 19+2=21 2/21=0.0952 1 Empleemos el ejercicio de los dulces Si representamos frecuencias se recomienda una gráfico de barras Variable cualitativa 0 1 2 3 4 5 6 frecuencia 6 5 3 3 2 2 Café anaranjado verde amarillo rojo azul Si es porcentaje lo que se quiere representar Se recomienda un gráfico de sectores 29% 24%14% 14% 9% 10% frecuencia Café anaranjado verde amarillo rojo azul Frecuencia relativa PORCENTAJE PORCENTAJE ACUMULADO fr x 100 6/21= 0.2857 28.57 28.57 5/21=0.2380 23.8 52.37 3/21=0.1428 14.28 66.65 3/21=0.1428 14.28 80.93 2/21=0.0952 9.52 90.45 2/21=0.0952 9.52 99.97 1 0 20 40 60 80 100 120 CAFÉ ANARANJADO VERDE AMARILLO ROJO AZUL TÍTULO DEL GRÁFICOPORCENTAJE ACUMULADO CAFÉ 28.57 ANARANJADO 52.37 VERDE 66.65 AMARILLO 80.93 ROJO 90.45 AZUL 99.97 Gráficos para variables cuantitativas Diagrama de líneas Permite mostrar el comportamiento de variables cuantitativas a través del tiempo En el eje horizontal va el tiempo En el eje vertical van los valores 0 50 100 150 200 250 300 350 400 ENERO MARZO ABRIL MAYO JUNIO JULIO Ventas en miles Serie 1 Diagrama de dispersión Es una representación gráfica que muestra la relación entre dos variables cuantitativas Horas de estudio puntos en examen 0 4 0.5 5 1 6 1.5 8 2 10 0 2 4 6 8 10 12 0 0.5 1 1.5 2 2.5 Histograma Es una representación gráfica que permite organizar datos cuantitativos que han sido divididos en intervalos 0 5 10 15 20 25 30 35 40 21 a 30 31 a 40 41 a 50 51 y mayores frecuencia frecuencia edad frecuencia 21 a 30 20 31 a 40 30 41 a 50 35 51 y mayores 15 EjerciciOS Práctica para la tarea de Actividades y de Examen Los siguientes datos son la distribución de frecuencias de los tiempos de espera en las cajas de un banco. Determine Frecuencia acumulada Frecuencia relativa Porcentaje individual Porcentaje acumulado Tiempo de espera frecuencia 1 a 5 5 6 a 10 6 11 a 15 13 16 a 20 9 21 a 25 7 total 40 ¿ Qué porcentaje representa la cantidad de personas que tardaron de 1 a 10 minutos? ¿Cuál es la cantidad de personas que tardan de 6 a 20 minutos ? Determine la frecuencia relativa de las personas que tardan de 11 a 15 minutos Gráficos 1. Primero hay que determinar si la variable es cualitativa o es cuantitativa Recordemos que los datos de una variable cualitativa no tiene un promedio . Ahora si ya determinamos que es cualitativa 1.- Si se desea representar frecuencia ( las cantidades ) se emplean gráficos de barras 2.- Si se desea representar porcentajes entonces se recomienda gráficas de círculos Si son variables cuantitativas 1.- Si se desea representar la frecuencia de datos se elige el histograma 2.- Si se desea representar los cambios en el tiempo, se elige la línea de tiempo 3.- Si se desea representar la relación entre variables, se elige el diagrama de dispersión 34 35 33 45 56 22 23 46 48 57 28 32 31 39 59 51 52 53 56 45 46 47 45 22 44 21 45 44 43 55 F1 fr fra % acumulado 21 a 27 28 a 34 35 a 41 42 a 48 49 a 55 56 a 62 K = 1 + 3.322 log = 1 + 3.322 log30 = 5.90 59-21= rango= 38 38/6= 6.3 Ajustar a inmediato superior 7
Compartir