Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA Dpto. de Estadística e Informática Semana 1. Conceptos básicos y Organización de datos cualitativos Inicio • Motivación • Logros • Saberes previos Desarrollo • Definición de Estadística • Conceptos básicos • Ejercicios resueltos Cierre • Ejercicios propuestos • Autoevaluación (Moodle) 2 3 ¿Por qué la estadística es la gran asignatura del siglo XXI? Te lo explicamos en el siguiente enlace. La estadística entiende de datos. Y el mundo de hoy está hecho fundamentalmente de datos. https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi Fuente: blogs GobernArte (https://cutt.ly/xiztQNA) https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://www.xataka.com/otros/por-que-la-estadistica-es-la-gran-asignatura-del-siglo-xxi https://blogs.iadb.org/administracion-publica/es/estadisticas-oficiales-en-tiempos-del-coronavirus-continuidad-sin-contacto/ https://blogs.iadb.org/administracion-publica/es/estadisticas-oficiales-en-tiempos-del-coronavirus-continuidad-sin-contacto/ https://blogs.iadb.org/administracion-publica/es/estadisticas-oficiales-en-tiempos-del-coronavirus-continuidad-sin-contacto/ 4 Al término de la sesión, el estudiante estará en capacidad de: Comprender e identificar los conceptos básicos de la estadística en una serie de contextos del mundo real. Resolver ejercicios sobre conceptos básicos, integrándolos en diferentes contextos. Resolver ejercicios propuestos. ¿Qué es la estadística? ¿Cuál es la importancia de la estadística? ¿Cómo la estadística apoya la toma de decisiones? 5 Autoevaluación (Aula virtual) Ejemplos, ejercicios resueltos y propuestos Medidas estadísticas (parámetro y valor estadístico) Variables (cuantitativas y cualitativas) Población, unidad elemental y muestra Definición de la estadística y su división 6 La Estadística es la ciencia del aprendizaje a partir de los datos y de medición, control y comunicación de la incertidumbre, proporcionando los medios esenciales para el avance científico y social. Estadística Descriptiva. Se ocupa de la clasificación, descripción, simplificación y presentación de los datos; así como del cálculo de medidas estadística. Estadística Inferencial. Se ocupa de la estimación y prueba de hipótesis de los parámetros de una población, a partir de una muestra aleatoria extraída de dicha población. 1. Población. Es el conjunto de unidades elementales con características similares. El estudio de toda la población constituye un censo. 2. Unidad elemental. Es el elemento particular de la población. 3. Muestra. Es un subconjunto de la población. Al proceso de obtención de una muestra se le llama muestreo. 7 Población Muestra U. Elemental Muestra representativa: Debe haber sido obtenida al azar. Su tamaño y sus elementos seleccionados con un método de muestreo. Ejemplo 2. Población: Todos los centros educativos de la región Lima. Unidad elemental: Un centro educativo de la región Lima. Muestra: 90 centros educativos de la región Lima Ejemplo 3. Población: Todos los deportistas del XVIII juegos Panamericanos Lima 2019. Unidad elemental: Un deportista del XVIII juegos Panamericanos Lima 2019. Muestra: 350 deportistas del XVIII Juegos Panamericanos Lima 2019. Ejemplo 4. Población: Todos las semanas de ventas del año 2020 de pasajes de la agencia de viajes “El Vuelo”. Unidad elemental: Una semana de venta del año 2020 de pasajes de la agencia de viajes “El Vuelo”. Muestra: 20 semanas de ventas del año 2020 de pasajes de la agencia de viajes “El Vuelo”. 8 4. Variable. Es la característica que toma diferentes valores cuando son evaluadas las unidades elementales de una muestra o población. Se representa por letras mayúsculas (X, Y, Z, W, X1, X2, Y1, Y2). 9 Un cliente X=Edad (años) Y=Peso (Kgs.) Z=Sexo W=Grado de instrucción Una parcela Y1=Rendimiento (Kgrs./parcela) Y2=Número de mazorcas de maíz Y3=Tamaño de mazorcas (cm) Y4=Variedad de maíz Una vaca X1=Producción de leche (litros) X2=Raza de ganado vacuno X3=Peso (Kgs.) X4=Edad (meses) Cuantitativas. Son aquellas en que se registra un valor numérico y por lo tanto pueden realizarse operaciones matemáticas. Pueden ser: Continuas. Pueden tomar cualquier valor numérico dentro de un intervalo continuo (valores reales). Discretas. Son representadas por el conjunto de valores enteros. Se registran por conteo. 10 Ejemplo 5. V. cuantitativas continuas 1. Costo de inventario de una empresa farmacéutica (soles) 2. Longitud del langostino de río (cm) 3. Tiempo para atender un pedido en una pizzería (minutos) Ejemplo 6. V. cuantitativas discretas 1. Número de pacientes atendidos cada 15 minutos en el área ambulatoria 2. Número de predios que posee un agricultor de un valle 3. Número de quejas de los clientes de una aseguradora Cualitativas. Son aquellas en que se registra un valor no numérico, tales como un atributo, categoría o clase. Pueden ser: Nominales. Sus valores no son factibles de ser clasificados a través de un criterio de orden o jerarquía. Jerárquicas. Si se puede establecer un criterio de orden o jerarquía entre sus valores. 11 Ejemplo 7. V. cualitativas nominal 1. Sexo de los estudiantes (Masculino o Femenino) 2. Estado civil de una persona (Soltero, Casado, viudo o Conviviente) 3. Las zonas de las sucursales de un banco (Sur, Centro o Norte) 4. Los estados del agua (Sólido, Líquido o Gaseoso) Ejemplo 8. V. cualitativas jerárquica 1. Calificación del servicio del comedor UNALM (Bueno, Regular o Malo) 2. Nivel de instrucción (Sin instrucción, Primaria, Secundaria o Superior) 3. Nivel socioeconómico de un cliente (Alto, Medio o Bajo) 4. Rango de ingreso familiar (500 - 2500, 2501 – 5000, 5001 – 7500, Más de 7500) 5. 0bservación. Es un valor posible que puede tomar una variable. A las observaciones se les representa con las letras minúsculas subindicadas: xi, yi, zi, etc. 12 Ejemplo 9. Indicar el tipo de variable y la observación. Variables Tipo de variable Observación Costo de inventario (soles) Cuantitativa continua 10560.5 Zonas de las sucursalesde un banco Cualitativa nominal Sur Número de predios de un agricultor Cuantitativa discreta 4 Sexo Cualitativa nominal Femenino Longitud del langostino de río (cm) Cuantitativa continua 15.5 Nivel socioeconómico de un cliente Cualitativa jerárquica Alto Rango de ingreso familiar Cualitativa jerárquica 2501-5000 13 6. Medidas estadísticas. Son calculadas con la finalidad de describir el comportamiento de una variable en una población o en una muestra. Pueden ser: Parámetro. Son medidas estadísticas que permiten describir el comportamiento de una variable en la población. Son calculadas con los datos de toda la población. Es un valor constante. Se representan con letras griegas. Valor estadístico o Estadígrafo. Son medidas estadísticas que permiten describir el comportamiento de una variable en la muestra. Se calculan con los datos obtenidos de una muestra. Son valores variables (varían de muestra a muestra). Los estadísticos sirven para estimar a los parámetros. Se representan con letras latinas. 14 Medidas estadísticas En una población (Parámetro) En una muestra (Estadístico) Media o Promedio Mediana ME me Moda MO mo Proporción p Variancia 2 S2 Desviación Estándar S Coeficiente de Variabilidad CV cv X 15 Ejemplo 10 1.Suponga que el número promedio de cocinas vendidas en todos los meses de venta es 15.4 ( = 15.4). 2.El Censo Nacional 2007: XI de Población y VI de Vivienda indica que en el grupo edad de 20 a 29 años, el 1.4% de los hombres no sabe leer y escribir mientras que el 3.1% de las mujeres no sabe leer y escribir (1 = 0.014 y 2 = 0.031). Ejemplo 11 1.En una muestra de 30 meses de venta se encontró que el número promedio de cocinas vendidas fue de 14.9. 2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no sabe leer y ni escribir. )011.0( p )9.14( x 16 Ejercicio 1. Una agencia de turismo está haciendo un estudio con la finalidad de mejorar los servicios al turista. Para esto, se seleccionaron al azar 200 turistas franceses que arribaron a nuestro país en julio del 2020. Los resultados de la encuesta son los siguientes: El número promedio de días que permanecieron en el país es 8.0. El 60% tiene como ciudad de destino al Cusco, el 20% Arequipa, el 15% Huaraz y el 5% Trujillo. El monto promedio gastado durante el tiempo de estadía es 4560.6 soles. En cuanto al servicio de alimentación, el 30% lo calificó de excelente, el 20% muy bueno y el 50% bueno. Identificar la población, unidad elemental, muestra, variables, tipos de variables, observación, parámetros y valor estadístico 17 Población: Todos los turistas franceses que arribaron a nuestro país en julio del 2020. Unidad elemental: Un turista francés que arribó a nuestro país en julio del 2020. Muestra: 200 turistas franceses que arribaron a nuestro país en julio del 2020. Variables Tipo de variables Observación Valor estadístico Número de días que permanece en el país Cuantitativa discreta 10 días Ciudad destino Cualitativa nominal Cusco p=0.60 Monto gastado durante el tiempo de estadía Cuantitativa continua S/. 4002.8 Opinión sobre el servicio de alimentación Cualitativa jerárquica Excelente p=0.30 Solución. Ejercicio 2. La Dirección de Salud (DISA) de una zona rural desea realizar un estudio para evaluar la calidad del servicio de sus puestos de salud. Con esta finalidad se extrae aleatoriamente 30 puestos de la DISA con lo cual se obtiene la siguiente información: El 45% de los puestos de salud registraron como enfermedad principal las respiratorias. El número promedio de niños menores de 6 años atendidos por mes es 20.5 El 75% de los puestos fue calificado su atención como buena, el 20% regular y el 5% mala. El pago promedio por consulta ambulatoria es 10.5 soles Identificar la población, unidad elemental, muestra, variables, tipos de variables, observación, parámetros y valor estadístico 18 19 Solución. Población: Todos los puestos de salud de una DISA de una zona rural Unidad elemental: Un puesto de salud de una DISA de una zona rural Muestra: 30 puestos de salud de una DISA de una zona rural Variables Tipo de variables Observación Valor estadístico Enfermedad principal Cualitativa nominal Respiratorias p=0.45 Número de niños atendidos menores a 6 años por mes Cuantitativa discreta 15 Calificación de su atención Cualitativa jerárquica Bueno p=0.75 Pago por consulta ambulatoria Cuantitativa continua 8.5 1. Con el fin de realizar una modificación en el Impuesto al Valor del Patrimonio Predial del Municipio de La Molina, se hace un estudio socioeconómico sobre una muestra aleatoria de 300 familias residentes en el distrito. Del presente estudio se encontraron los siguientes resultados: El área promedio por predio es de 280 mt2. El 25% de las viviendas tiene piscina. El 40% de ellos afirmaron que el estado de conservación de su vivienda era excelente, 20% muy buena, 20% buena, 10% regular y 10% en pésimas condiciones. El número promedio de personas que viven por predio es 3.2 Identificar la población, unidad elemental, muestra, variables, tipos de variables, observación, parámetros y valor estadístico. 20 2. La microempresa “Milglen”, fabrica yogurt y va a lanzar al mercado un nuevo sabor de yogurt; como desea conocer la necesidad de los consumidores realiza una encuesta a 90 consumidores de yogurt que acuden al supermercado “Metro” de La Molina, encontrándose los siguientes resultados: El 75% de los encuestados consume yogurt por costumbre, frente a un 20% que lo hace por gusto y un 5% que lo hace por dieta. El 33% consume la marca “Gloria”. El precio promedio que estarían dispuestos a pagar por un yogurt de 1 litro es de 4.50 nuevos soles. El 95% prefiere el yogurt con fruta frente a un 5% que lo prefiere natural. 21 UNIVERSIDAD NACIONAL AGRARIA LA MOLINA Dpto. de Estadística e Informática Semana 1. Organización de datos cualitativos La tabla de frecuencia está organizada por las categorías que corresponden a los distintos valores que toma la variable cualitativa. 23 fi=Número de observaciones en la categoría i. Se cumple: fri%=Porcentaje de observaciones con respecto al total. Categoría o Clase Frecuencia Absoluta (fi) Frecuencia Relativa (fri%) Categoría 1 f1 fr1 Categoría 2 f2 fr2 . . . Categoría k fk frk Total n 100.0 k= Número de categorías n= Número de observaciones Tipo de gráficos Se pueden usar las frecuencias absolutas (fi) o relativas porcentuales (fri). Gráfico de barras vertical u horizontal Gráfico circular 𝐟𝐢 𝐧 𝐢=𝟏 = 𝐧 𝐟𝐫𝐢 = 𝐟𝐢 𝐧 𝐱𝟏𝟎𝟎 Ejemplo 1. La gerencia financiera de una entidad bancaria esta analizando el comportamiento del uso de las tarjetas de crédito de sus clientes. Con esta finalidad extrae una muestra de 45 clientes. 24 Caso Ingreso Mensual (miles soles) Nº de viajes (mensual) Tarjeta de crédito usada Caso Ingreso Mensual (miles soles) Nº de viajes (mensual) Tarjeta de crédito usada 1 3.00 3 Ta1 24 8.80 1 Ta1 2 1.99 3 Ta2 25 10.00 4 Ta5 3 2.90 2 Ta3 26 10.10 2 Ta1 4 4.70 0 Ta2 27 13.40 2 Ta2 5 3.00 1 Ta4 28 3.90 0 Ta5 6 5.80 2 Ta1 29 5.84 1 Ta5 7 4.50 4 Ta4 30 3.50 1 Ta4 8 7.09 0 Ta3 31 4.40 2 Ta2 9 4.40 1 Ta5 32 3.70 0 Ta5 10 6.82 0 Ta2 33 4.50 1 Ta1 11 5.30 3 Ta1 34 5.63 1 Ta1 12 5.80 2 Ta4 35 4.60 4 Ta1 13 5.70 1 Ta2 36 5.79 0 Ta5 14 4.70 4 Ta4 37 2.93 3 Ta5 15 6.60 1 Ta5 38 6.60 1 Ta3 16 6.60 2 Ta4 39 4.60 0 Ta3 17 5.74 1 Ta1 40 6.60 0 Ta4 18 4.23 0 Ta5 41 2.90 4 Ta1 19 5.50 3 Ta1 42 4.69 2 Ta2 20 6.60 1 Ta4 43 3.99 1 Ta4 21 3.85 1 Ta4 44 6.70 2 Ta1 22 6.70 3 Ta6 45 2.58 1 Ta4 23 3.50 0 Ta5 25 a) Elaboreuna tabla de frecuencias y un gráfico de barras de frecuencias relativas porcentual para la variable tipo de tarjeta de crédito. Tipo TC fi fri% Ta1 12 26.7 Ta2 7 15.6 Ta3 4 8.9 Ta4 11 24.4 Ta5 10 22.2 Ta6 1 2.2 Total 45 100.0 Tipo de tarjeta de crédito Fuente: Elaboración propia f3 = 4 Existen 4 clientes que utilizan la tarjeta de crédito Ta3 fr2 = 15.6 El 15.6% de los clientes utilizan la tarjeta de crédito Ta2. Tarjeta de crédito % Ta6Ta5Ta4Ta3Ta2Ta1 30 25 20 15 10 5 0 Tarjetas de crédito usada Ejercicio 1. Se ha realizado una encuesta para evaluar el nivel de satisfacción de cuatro planes de seguro familiar (A, B, C y D). Los resultados para una muestra de 40 clientes se muestra en la siguiente tabla. 26 A Bueno A Regular A Malo D Regular C Bueno A Malo A Malo A Malo C Malo B Bueno B Regular D Regular D Regular B Regular D Regular C Regular C Bueno B Regular C Malo C Bueno B Malo B Bueno C Malo B Regular C Malo D Malo C Malo B Regular D Bueno A Bueno A Regular B Regular D Bueno A Bueno C Malo D Regular B Malo B Bueno D Malo B Regular a) Elabore una tabla de frecuencias y un gráfico de barras de frecuencias absolutas para la variable plan de seguro familiar. b) Elabore una tabla de frecuencias y un gráfico circular de frecuencias porcentual para la variable nivel de satisfacción Solución. n=40 clientes a) Elabore una tabla de frecuencias y un gráfico de barras de frecuencias absolutas para la variable plan de seguro familiar. 27 Distribución de clientes por plan de seguro familiar Planes fi fri% A 9 22,5 B 12 30,0 C 10 25,0 D 9 22,5 Total 40 100,0 9 12 10 9 0 2 4 6 8 10 12 14 A B C D N ú m e r o Planes de seguro familiar f2 = 12 Existen 12 clientes que tienen el plan de seguro familiar B. fr2 = 30.0 El 30.0% de los clientes tienen el plan de seguro familiar B Solución. n=40 clientes b) Elabore una tabla de frecuencias y un gráfico circular de frecuencias porcentual para la variable nivel de satisfacción 28 Distribución de clientes por nivel de satisfacción Niveles fi fri% Bueno 11 27,5 Regular 15 37,5 Malo 14 35,0 Total 40 100,0 27,5 37,5 35,0 Niveles de satisfacción Bueno Regular Malo f3 = 14 Existen 14 clientes cuyo nivel de satisfacción es malo. fr3 = 35.0 El 35.0% de los clientes tienen un nivel de satisfacción malo Ejercicio 2 En el siguiente gráfico se presenta la distribución porcentual del tamaño de pizzas vendidas para una muestra de 250 pedidos. Construya la tabla de frecuencias respectiva. 10.0% 20.0% 30.0% 40.0% Distribución del tamaño de pizza vendida Chica Mediana Grande Familiar 29 Referencias bibliográficas Anderson D., Sweendy D., Williams T. (2016) Estadística para Administración y Economía. 12ª. Edición. México. Cengage Learning Editores. Capítulo 2. Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para Administración y Economía (6ta. ed.) Madrid: Pearson Education. Prentice Hall 30
Compartir