Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNA La Molina - Dpto. de Estadística e Informática Estadística General 1 CAPÍTULO I CONCEPTOS BÁSICOS La Estadística proporciona una serie de métodos y técnicas que permiten analizar información de las diferentes especialidades como Agronomía, Industrias Alimentarias, Zootecnia, Economía, etc. con la finalidad de analizarla y tomar decisiones. Objetivo. Entender conceptos básicos y los alcances de la estadística, que servirán de base para la comprensión y desarrollo de los capítulos posteriores. 1.1 Definición de Estadística La Estadística es la ciencia del aprendizaje a partir de los datos y de medición, control y comunicación de la incertidumbre, proporcionando los medios esenciales para el avance científico y social. Los estadísticos proporcionan una guía crucial para determinar qué información es fiable y que predicciones son confiables. Ayudan a la búsqueda de pistas sobre la solución de un misterio científico y, a veces a evitar que los investigadores sean engañados por falsas impresiones. Fuente: Davidian, M. and Louis, T. Whats is Statistics?. Consultado el 24 de Julio de 2014, página web de la American Statistical Association. http://www.amstat.org/careers/whatisstatistics.cfm División de la Estadística La Estadística puede ser dividida en: La Estadística Descriptiva. Parte de la estadística que se ocupa de la clasificación, descripción, simplificación y presentación de los datos. Comprende el uso de tablas de frecuencias, gráficos y el cálculo de medidas estadísticas. La Estadística Inferencial. Parte de la estadística que se ocupa de la estimación y prueba de hipótesis de los parámetros de una población, a partir de una muestra aleatoria extraída de dicha población. Ejemplo 1 Se ha hecho estudio del medio de transporte que usan los estudiantes de la UMALM. Para lo cual se tomó una muestra aleatoria de 350 estudiantes. Se aplicó la Estadística Descriptiva: con la finalidad de organizar y presentar en una tabla de frecuencias y en forma gráfica los datos recogidos de la encuesta. Fuente: Elaboración propia Medio de transporte Número Porcentaje Propia 100 28,6 Público 180 51,4 Privado 30 8,6 Bicicleta 40 11,4 Total 350 100,0 Fuente: Elaboración propia Distribución del medio de transporte que usan los estudiantes 28.6 51.4 8.6 11.4 00 10 20 30 40 50 60 Propia Público Privado Bicicleta % Distribución del medio de transporte UNA La Molina - Dpto. de Estadística e Informática Estadística General 2 Además, se calculó la medida estadística: el gasto promedio por el medio de transporte usado fue de S/. 35.5 semanal Se aplica la Estadística Inferencial: se estimó que la proporción de estudiantes de la UNALM que usan el medio de transporte público es 51.4% y tienen un gasto promedio de S/. 42.5 semanal. Se desea probar si proporción de estudiantes de la UNALM que usan el medio de transporte público es mayor al 62.0% y que el gasto promedio es menor a S/. 42.0. 1.2. Conceptos básicos 1) Población. Es el conjunto de unidades elementales con características similares. El estudio de toda la población constituye un censo. Ejemplo 2 1. Todos los ganaderos del valle de Cajamarca. 2. Todos los futbolistas que participarán en el campeonato descentralizado de fútbol 2018. 3. Todas las semanas de venta en una comercializadora de PC entre el 2010-2017. 2) Unidad Elemental. Es un elemento particular de la población o muestra. Ejemplo 3 1. Un ganadero del valle de Cajamarca 2. Un futbolista que participará en el campeonato descentralizado de fútbol 2018. 3. Una semana de venta en una comercializadora de PC entre el 2010-2017. 3) Muestra. Es un subconjunto de la población. Al proceso de obtención de una muestra se le llama “muestreo”. Para que una muestra sea representativa debe cumplir con las siguientes condiciones: a) Debe haber sido obtenida al azar. b) Su tamaño y sus elementos deben haber sido seleccionados aplicando un método de muestreo. Ejemplo 4 1. 420 ganaderos del valle de Cajamarca. 2. 380 futbolistas que participarán en el campeonato descentralizado de fútbol 2018. 3. 25 semanas de venta en una comercializadora de PC entre el 2010-2017. Ejercicio 1. Se desea realizar un estudio sobre el consumo de agua de los estudiantes de la UNALM matriculados en el ciclo de verano 2017. Para el estudio se obtuvo una muestra aleatoria de 260 estudiantes. Defina población, unidad elemental y muestra. UNA La Molina - Dpto. de Estadística e Informática Estadística General 3 Ejercicio 2. El instituto Nacional Agraria e Innovación (INAI), va realizar un estudio de reforestación en la Selva Central del Perú. Para el estudio se desea evaluar una muestra de 650 árboles que tengan más de 10 años de edad. Defina población, unidad elemental y muestra. 4) Variable. Son las características que toman diferentes valores cuando son evaluadas en las unidades elementales de una población o muestra. Se representan por las últimas letras mayúsculas del alfabeto, por ejemplo: X, Y, Z, W, P, T, X1, X2, Y1, etc. Tipos de Variables Pueden ser de dos tipos: Cuantitativas y Cualitativas. Variables Cuantitativas. Son aquellas que se expresan en forma numérica y tiene sentido realizar operaciones matemáticas con ellas. Pueden ser: Continuas o Discretas. Variable Cuantitativa Continua. Son aquellas que pueden tomar cualquier valor numérico dentro de un intervalo continuo. Se utiliza un instrumento de medición para generar sus valores: balanza, termómetros, test, escalas, cronómetros, winchas, etc. Ejemplo 5 1. Costo de inventario (soles) 2. Longitud del langostino de río (cm) 3. Tiempo para atender un pedido en una pizzería (minutos) Variable Cuantitativa Discreta. Son aquellas que cumplen con la condición de que entre un valor cualesquiera y su consecutivo no es posible que existan valores intermedios. Generalmente son representados por el conjunto de números enteros. Las observaciones cuantitativas discretas se registran por conteo. Ejemplo 6 1. Número de pacientes atendidos cada 15 minutos en el área ambulatoria 2. Número de predios que posee un agricultor de un valle 3. Número de quejas de los clientes de una aseguradora Variable Cualitativa. Son aquellas que permiten que una unidad elemental pueda ser clasificada como poseedora o no de cierta cualidad, propiedad o atributo. No tiene sentido realizar operaciones matemáticas con ellas. Son aquellas cuyos valores posibles son atributos o categorías. Pueden ser: Nominal o Jerárquica. Variable Cualitativa Nominal. Son aquellas cuyos valores (cualidades, propiedades o atributos) no son factibles de ser clasificados a través de un criterio de orden o jerarquía. Sus valores posibles no tienen un orden de importancia. UNA La Molina - Dpto. de Estadística e Informática Estadística General 4 Ejemplo 7 1. Sexo de los estudiantes (Masculino o Femenino) 2. Estado civil de una persona (Soltero, Casado, Divorciado, Viudo o Conviviente) 3. Las zonas de las sucursales de un banco (Sur, Centro o Norte)4. Los estados del agua (Sólido, Líquido o Gaseoso) Variable Cualitativa Jerárquica u Ordinal. Son aquellas donde sí se puede establecer un criterio de orden o jerarquía entre sus atributos de la variable. Ejemplo 8 1. Calificación del servicio del comedor de la UNALM (Bueno, Regular o Malo) 2. Nivel de instrucción (Sin instrucción, Primaria, Secundaria o Superior) 3. Nivel socioeconómico de un cliente (Alto, Medio o Bajo) 4. Rango de ingreso familiar (500 - 2500, 2501 – 5000, 5001 – 7500, Más de 7500) 5) Observación. Es el valor posible que toma una variable. A las observaciones se les suele representar con las letras minúsculas subindicadas, como por ejemplo ix , iy , iz Ejemplo 9 1. X = Peso del langostino de río (en gr). Observaciones: 2.3,..,0.3,5.2 1021 xxx 2. Y = Calificación de un servicio. Observaciones: MaloygularyBuenoy 321 ,Re, Ejercicio 3. En un estudio para evaluar la satisfacción de los socios de un club social- deportivo, se aplicó la siguiente encuesta. Complete el siguiente cuadro: Variable Tipo de variable Observación Edad Tipo de socio Estado de los campos deportivos Frecuencia que encuentra libre los campos deportivos Número de veces que viene al club mensualmente Pago mensual Encuesta de satisfacción 1. Edad 2. ¿Qué tipo de socio es? 1=Principal 2=Asociado 3=Condicionado 3. ¿Cómo encuentra el estado de los campos deportivos? 1=Muy bueno 2=Bueno 3=Regular 4=Malo 4. ¿Con qué frecuencia encuentra libre los campos deportivos? 1=Siempre 2=Casi siempre 3=Raramente 4=Nunca 5. Número de veces que viene al club mensualmente 6. Pago mensual (S/.) UNA La Molina - Dpto. de Estadística e Informática Estadística General 5 Ejercicio 4. Con la finalidad de establecer una línea base, para evaluar un programa productivo a los agricultores de la sierra central, se ha aplicado la siguiente encuesta. Complete el siguiente cuadro: Variable Tipo de variable Observación Nivel tecnológico usado Usa fungicidas Usa insecticidas Número de meses que está en el programa Tamaño del predio Ingreso mensual 6) Medidas estadísticas. Son calculadas con la finalidad de describir el comportamiento de una variable en la población o en la muestra. Notación de los principales parámetros y estadísticos Medidas estadísticas Parámetro (población) Valor estadístico (muestra) Media o Promedio X Mediana ME me Moda MO mo Proporción p Variancia o Varianza 2 S2 Desviación Estándar S Coeficiente de Variabilidad CV cv Parámetro. Son medidas estadísticas, para describir el comportamiento de una variable en la población. Son calculadas con los datos de toda la población. Es un valor constante. Se representan con letras griegas. Ejemplo 10 1. Suponga que el número promedio de cocinas vendidas en todos los meses de venta es 15.4 ( = 15.4). 2. El Censo Nacional 2007: XI de Población y VI de Vivienda indica que en el grupo edad de 20 a 29 años, el 1.4% de los hombres no sabe leer y escribir mientras que el 3.1% de las mujeres no sabe leer y escribir (1 = 0.014 y 2 = 0.031). Encuesta para la evaluación del programa productivo 1. Nivel tecnológico usado 1=Alto 2=Medio 3=Bajo 2. Usa fungicidas 1=Si 2=No 3. Usa insecticidas 1=Si 2=No 4. Número de meses que está en el programa 5. Tamaño de su predio (has) 6. Ingreso mensual (en soles) UNA La Molina - Dpto. de Estadística e Informática Estadística General 6 3. Suponga que en todo Breña la proporción del nivel de instrucción resultó: Instrucción Proporción (i) Primaria 0.455 Secundaria 0.445 Superior 0.100 TOTAL 1.000 Valor estadístico o Estadígrafo. Son medidas estadísticas, para describir el comportamiento de una variable en la muestra. Se calculan con los datos obtenidos de una muestra. Son valores variables (varían de muestra a muestra). Los estadísticos sirven para estimar a los parámetros. Se representan con letras latinas. Ejemplo 11 4. En una muestra de 30 meses de venta se encontró que el número promedio de cocinas vendidas fue de 14.9 )9.14( x . 2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no sabe leer y ni escribir )011.0( p . 2. Suponga que en distrito de Breña se ha seleccionado una muestra de 500 personas encontrándose los siguientes resultados: Instrucción Proporción (pi) Primaria 0.460 Secundaria 0.430 Superior 0.110 TOTAL 1.000 Ejemplo 12 En el siguiente ejercicio, identificar: la población, la muestra, unidad elemental, la variable, tipo de variable, observación, parámetro y valor del estadístico. La Oficina de Servicios Generales de la UNALM desea conocer los medios en los cuales con mayor frecuencia se transportan los alumnos de la UNALM. Para ello, realiza una encuesta a 50 alumnos de pregrado en el semestre 2013-II y encuentra los siguientes resultados: a) El 70% de los encuestados usa el transporte público y un 20% usa el transporte de la universidad y el resto propio. b) El 20% de los encuestados consideran que el estado de las unidades de transporte de la UNALM es bueno, el 35% que es regular y el 45% que es malo. c) El número promedio de unidades que toma para llegar a la universidad es de 1.5. d) El tiempo promedio de traslado de su casa a la universidad es de 39.70 minutos. Solución Población: Todos los alumnos de la UNALM La Molina de pregrado del semestre 2013-II Unidad elemental: Cada alumno de la UNALM La Molina de pregrado del semestre 2013-II Muestra: 50 alumnos de la UNALM La Molina de pregrado del semestre 2013-II UNA La Molina - Dpto. de Estadística e Informática Estadística General 7 Variable Tipo de Variable Observación Valor del Estadístico (estimación) Parámetro a) X= Medio de transporte usado para llegar a la UNALM. Cualitativa nominal 22x público 0.70pp 0.20up 0.10op La proporción de alumnos según el medio de transporte usado para llegar a la UNALM. b) Y= Opinión sobre el estado de las unidades de transporte de la UNALM. Cualitativa jerárquica 40y bueno 0.20bp 0.35rp 0.45mp La proporción de alumnos según la opinión sobre el estado de las unidades de transporte de la UNALM. c) Z= Número de unidades de transporte que toma para llegar a la UNALM. Cuantitativa discreta 4 1z 1.45z El número promedio de unidades de transporte que toma para llegar a la UNALM d) V= Tiempo de traslado de la universidad a su casa. Cuantitativa continua 48 55v 39.70v El tiempo promedio de traslado de la universidad a su casa Ejemplo 13 Se presentaron algunos resultados del informe gerencial de marketing “Perfil del adulto joven” elaborado por Apoyo Opinión y Mercado. (www.apoyo.com). El informe fue elaborado a partir de los resultados de una encuesta realizada el 25 Abril del 2010 a una muestra aleatoria conformada por 2000 jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas edades fluctúan entre los 21 y 35 años de edad. El ingreso medio mensual es de 1320 nuevos soles. El 5% tiene estudios de postgrado, el 17% universitaria completa, el 33% universitaria incompleta, el 35% secundaria completa y el resto secundaria incompleta. El 42% de jóvenes trabaja en empresas estatales. Solución Población. Todos los jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas edades fluctúan entre los 21 y 35 años. Muestra. 2000 jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas edades fluctúan entre los 21 y 35años. Unidad Elemental. Un joven de Lima Metropolitana de cualquier nivel socioeconómicos y cuya edad fluctúa entre los 21 y 35 años. Variables Tipo de variable Observación Ingreso mensual de los jóvenes Variable cuantitativa continua 1000 Grado de instrucción Variable cualitativa jerárquica Superior Tipo de empresa que trabaja Variable cualitativa nominal Estatal UNA La Molina - Dpto. de Estadística e Informática Estadística General 8 Valores estadísticos El ingreso medio mensual es de 1320 nuevos soles. El 17% universitaria completa El 42% de jóvenes trabaja en empresas estatales. Parámetros El ingreso promedio mensual Porcentaje de jóvenes que tienen cierto grado de instrucción. Porcentaje de jóvenes que trabajan en cierto tipo de empresa. Ejemplo 14 Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200 turistas franceses al azar que arribaron a nuestro país el 2013 y se les aplicó una encuesta en la que se preguntó por: Número de días que permanecieron en el país, obteniéndose un promedio de 8 días. Medio de transporte que utilizaron para viajar, a lo que el 20% respondió que viajó en avión, el 30% en tren y el 50% en bus. Monto gastado durante el tiempo de estadía, de lo que se obtuvo un promedio de 4560.6 soles por encuestado. En cuanto al servicio de alimentación el 30% lo calificó de excelente, el 20% muy bueno y el 50% bueno. Solución: Población: Todos los turistas franceses que arribaron a nuestro país el 2013 Muestra: 200 turistas franceses que arribaron a nuestro país el 2013 Unidad elemental: Un turista francés que arribó a nuestro país el 2013 Variables: Tipo de variables: Observación: X1 : Número de días de permanencia en el país Cuantitativa discreta 10 días X2 : Medio de transporte para trasladarse Cualitativa nominal Avión X3 : Monto gastado durante el tiempo de estadía Cuantitativa continua S/. 3520 X4: Opinión sobre el servicio de alimentación Cualitativa jerárquica Excelente Valor estadístico: Número promedio de días de permanencia en el país )8( díasx Porcentaje del medio de transporte para trasladarse en avión %)0.20( p Monto gastado promedio durante el tiempo de estadía ( / .4560.6)x S Porcentaje que opinaron sobre el servicio de alimentación excelente %)0.30( p Parámetros: Número promedio de días de permanencia en el país Porcentaje del medio de transporte para trasladarse Monto gastado promedio durante el tiempo de estadía Porcentaje que opinaron sobre el servicio de alimentación UNA La Molina - Dpto. de Estadística e Informática Estadística General 9 Ejercicio 5. La Dirección de Salud (DISA) de una zona rural desea realizar un estudio para evaluar la calidad de servicio de las postas de salud. Con esta finalidad se extrae aleatoriamente 45 postas de la DISA con lo cual se obtiene la siguiente información: El 45% de las postas de salud registraron como enfermedad principal las respiratorias, 35% estomacales y el resto de la piel. El número promedio de niños menores de 6 años atendidos fue de 120.5 Sólo el 25% de las postas tienen como turno de atención mañana y tarde. Identificar la población, unidad elemental, muestra, variables, tipos de variables, observación, parámetros y valor estadístico. Variable Tipo de Variable Observación Valor del Estadístico Parámetro Ejercicio 6. Una empresa distribuidora desea evaluar su eficiencia para atender los pedidos de sus clientes. Selecciona aleatoriamente 30 pedidos realizados en el 2013 y registra los siguientes datos: Tiempo que se tarda para atender el pedido, nivel de satisfacción del cliente (Completamente satisfecho, satisfecho, poco satisfecho, nada satisfecho) y el distrito en el que se encuentra el cliente. Algunos resultados fueron: El tiempo promedio de atención es de 52 minutos, el 40% está completamente satisfecho y el 30% de los pedidos son del distrito de Ate. Identificar la población, unidad elemental, muestra, variables, tipos de variables, observación, parámetros y valor estadístico. Variable Tipo de Variable Observación Valor del Estadístico Parámetro UNA La Molina - Dpto. de Estadística e Informática Estadística General 10 EJERCICIOS PROPUESTOS 1. Indique el tipo de variable que sea la más apropiada para cada una de las siguientes variables: Edad Tamaño de bebida (pequeño, mediano, grande) Ventas anuales Número de camiseta de un jugador Placa del automóvil. Número de DNI Forma de pago ( efectivo, cheque, tarjeta de crédito) Tipo de medalla( Oro, Plata, Bronce) Puesto de llegada en una competencia. Número de celular. Número de personas a favor del aborto. Número de hermanos. Para cada ejercicio, identificar: la población, la muestra, unidad elemental, la variable, tipo de variable, observación, parámetro y valor del estadístico. 2. Se presentaron algunos resultados del informe gerencial de marketing “Perfil del adulto joven” elaborado por Apoyo Opinión y Mercado. (www.apoyo.com). El informe fue elaborado a partir de los resultados de una encuesta realizada el 14 Julio del 2011 a una muestra aleatoria conformada por 2000 jóvenes de Lima Metropolitana, de todos los niveles socioeconómicos y cuyas edades fluctúan entre los 21 y 35 años de edad. El ingreso medio mensual es de 850 nuevos soles. El 1% tiene estudios de postgrado, el 12% educación universitaria completa, el 15% educación universitaria incompleta y el 2% educación primaria incompleta. El 42% de jóvenes trabaja en empresas estatales. 3. Con el fin de realizar una modificación en el Impuesto al Valor del Patrimonio Predial del Municipio de La Molina, se hace un estudio socioeconómico sobre una muestra aleatoria de 300 familias residentes en el distrito. Del presente estudio se encontraron los siguientes resultados: El ingreso familiar promedio es de S/ 2500.00 nuevos soles. El tipo de material predominante usado en la construcción de la vivienda, 24 de ellos dijeron que era de material noble. El 40% de ellos afirmaron que el estado de conservación de su vivienda era excelente, 20% muy buena, 20% buena, 10% regular y 10% en pésimas condiciones. Identificar la población, unidad elemental, muestra, variables, tipos de variables, observación, parámetros y valor estadístico. 4. En un estudio de preferencia de bebidas gaseosas realizado en una muestra de 100 alumnos de la universidad peruana de las Américas en el semestre 2011-II se han obtenido los siguientes resultados: El 52% de los encuestados fueron de sexo masculino El 47% de los encuestados prefieren la gaseosa en presentación de plástico El 40% de los encuestados prefiere la marca Inca Kola y el 30% prefiere Coca Cola. La edad promedio de los encuestados es de 20.47 años El número promedio de gaseosas tamaño mediano consumidas por alumno semanalmente es de 3.4 UNA La Molina - Dpto. de Estadística e Informática Estadística General 11 5. Estudios realizados sobre la contaminación ambiental coinciden en que los principales causantes de la contaminación del aire son la combustión en los vehículos con motores diesel y la falta de un mantenimiento técnico. Para tener información cuantitativa de lo mencionado anteriormente,se ha tomado una encuesta a una muestra de 30 choferes de la ruta Portada del Sol-Santa Anita (Línea P) encontrándose los siguientes resultados: El número promedio de veces que los choferes realizan una revisión técnica a sus vehículos es 1.36 veces al año. La ganancia promedio por día es de 97.73 nuevos soles 20 choferes poseen un grado de instrucción secundario, 5 choferes poseen primaria completa, 5 choferes poseen nivel universitario. 6. La microempresa “Milglen”, fabrica yogurt y va a lanzar al mercado un nuevo sabor de yogurt; como desea conocer la necesidad de los consumidores realiza una encuesta a 90 consumidores de yogurt que acuden al supermercado “Metro” de La Molina, encontrándose los siguientes resultados: El 75% de los encuestados consume yogurt por costumbre, frente a un 20% que lo hace por gusto y un 5% que lo hace por dieta. El 33% consume la marca “Gloria”. El precio promedio que estarían dispuestos a pagar por un yogurt de 1 litro es de 4.50 nuevos soles. El 95% prefiere el yogurt con fruta frente a un 5% que lo prefiere natural. 7. Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200 turistas al azar y se les aplicó una encuesta en la que se preguntó por: Número de días que permanecieron en el país, obteniéndose un promedio de 8 días. Medio de transporte que utilizaron para viajar, a lo que el 20% respondió que viajó en avión, el 30% en tren y el 50% en bus. Dinero gastado durante el tiempo de estadía, de lo que se obtuvo un promedio de 1253.6 nuevos soles por encuestado. En cuanto al servicio de alimentación el 30% lo calificó de excelente, el 20% muy bueno y el 50% bueno. 8. El Departamento de Estadística e Informática de la Universidad Nacional Agraria La Molina con la finalidad de contar con mayor información sobre los alumnos matriculados en el curso de Estadística General, aplicó una encuesta a dichos alumnos en la que se preguntó por: Facultad a la que pertenece, a lo que el 35% respondió pertenecer a Agronomía. Número de veces que ha llevado el curso. Promedio ponderado, obteniéndose un promedio para todos los alumnos de 12.10. Expectativa sobre la dificultad del curso (muy fácil, fácil, difícil, muy difícil). UNA La Molina - Dpto. de Estadística e Informática Estadística General 12 Preguntas de Autoevaluación 1. Las medidas estadísticas calculadas con los datos de una población se llaman ___________________ y las calculadas con los datos de una muestra ___________________________. 2. La parte de la estadística que permite la estimación y prueba de hipótesis de los parámetros se llama ____________________ y el cálculo de medidas estadística se denomina ___________________. 3. El valor posible que toma una variable de denomina _____________________. 4. Una ONG que brinda asistencia técnica a productores de truchas en el valle de Huancayo ha aplicado una encuesta para establecer una línea de base en tres zonas (A, B y C). Los resultados obtenidos indicaron que la edad promedio de los productores es de 35.8 años; el peso promedio de las truchas en la zona A, B y C son 1.2, 1.8 y 1.6 kgrs. respectivamente. Entonces las variables son _______________________________________________________________. 5. Si el ganadero Juan Pérez, desea registrar el número diario de litros de leche producidas, entonces la unidad elemental es ____________________. 6. Si se han definido cuatro rangos de las edades de una muestra de 100 agricultores: de 18 a 25, de 26 a 40, de 41 a 60 y de 61 a más años, entonces la variable rango de edades es del tipo ______________________________________. 7. Para un estudio sobre la contaminación de un reservorio de agua, se extraen 400 muestras de dos litros de agua y se halló que el número promedio de bacterias fue de 10.5. Entonces: Población: __________________________________________. Unidad elemental: ____________________________________. Variable: ___________________________________________. 8. En la ENAHO (Encuesta Nacional de Hogares) del 2011, respecto al material predominante en las viviendas, el 65% es de material noble, el 20% de calamina, el 10% de esteras y 5% otros. La variable en estudio es de tipo _________________. 9. Si un establecimiento de salud del MINSA registra trimestralmente el número de niños atendidos menores a 5 años, entonces la unidad elemental es __________ y la variable es del tipo _______________________. 10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: Item Enunciado V/F a. La población y una muestra extraída de ella pueden tener diferentes unidades elementales b. Las medidas estadísticas que se pueden calcular con los datos de un censo son parámetros y valores estadísticos. c. Las poblaciones pueden ser finitas e infinitas d. Una condición para que una muestra sea representativa de una población es que sea aleatoria. e. Los valores de las variables sólo pueden ser obtenidos de las unidades elementales de una población. UNA La Molina - Dpto. de Estadística e Informática Estadística General 13 CAPÍTULO II ORGANIZACIÓN DE DATOS La organización de datos consiste en la elaboración de tablas de frecuencias y gráficos con la finalidad de clasificar, agrupar y presentar la información en forma resumida, facilitando el análisis descriptivo de los conjuntos de datos. La elaboración de una tabla de frecuencia y su gráfico respectivo dependerá del tipo de variable definida. Objetivo. Aplicar en forma adecuada los procedimientos de la estadística descriptiva para tabular, clasificar, analizar, graficar y presentar información según sea la variable cualitativa o cuantitativa. 2.1 Organización para variables cualitativas (nominal o jerárquica) La tabla de frecuencia es organizada por clases o categorías que corresponden a los distintos valores (atributos) que toma la variable cualitativa. Tabla de frecuencias N° de clase Clase o categoría Frecuencia Absoluta (fi) Frecuencia Relativa (fri) Frecuencia Porcentual (pi) 1 Atributo 1 f1 fr1 p1 2 Atributo 2 f2 fr2 p2 . . . K Atributo k fk frk pk Total n 1 100 Donde: k= Número de clases n= Número de observaciones o unidades elementales Frecuencia absoluta (fi). Es el número de observaciones que existen en la clase o categoría i. Se cumple: nf k i i 1 Frecuencia relativa (fri). Es la proporción de observaciones con respecto al total (n) que existen en la clase o categoría i. Se calcula: n f fr ii . Se cumple: 1 1 k i ifr . Frecuencia porcentual (pi). Es el porcentaje de observaciones con respecto al total (n) que existen en la clase o categoría i. Se tiene: 100i ip fr . Se cumple: %100 1 k i ip Tipo de gráficos Se pueden usar las frecuencias absolutas (fi), relativas (fri) o porcentuales (pi) para elaborar dos tipos de gráficos: Gráfico de barras vertical u horizontal Gráfico circular UNA La Molina - Dpto. de Estadística e Informática Estadística General 14 Ejemplo 1 Se hizo una encuesta a una muestra de 45 clientes del Banco Comercial y se obtuvo los siguientes resultados: Caso Edad Ingreso Mensual (miles de S/.) Nº de viajes (mensual) Tarjeta de crédito usada Lugar de uso de tarjeta de crédito Monto de deuda (miles de S/.) Sexo 1 29 3.00 3 Ta1 centros comerciales 1.80 F 2 34 1.99 3 Ta2 discotecas 1.10 F 3 61 2.90 2 Ta3 restaurantes 0.60 M 4 28 4.70 0 Ta2 grifos 2.70 M 5 41 3.00 1 Ta4 centros comerciales 1.30 F 6 57 5.80 2 Ta1 otros 0.80 F 7 30 4.50 4 Ta4 grifos 0.64 M 8 43 7.09 0 Ta3 centro de estudios 0.90 F 9 45 4.40 1 Ta5 centros comerciales 1.40 M 10 35 6.82 0 Ta2 grifos 2.46 F 11 425.30 3 Ta1 restaurantes 1.10 F 12 28 5.80 2 Ta4 discotecas 0.20 M 13 28 5.70 1 Ta2 grifos 0.80 F 14 24 4.70 4 Ta4 restaurantes 0.50 M 15 35 6.60 1 Ta5 discotecas 0.40 F 16 42 6.60 2 Ta4 restaurantes 3.46 F 17 48 5.74 1 Ta1 discotecas 1.20 M 18 34 4.23 0 Ta5 centros comerciales 1.90 F 19 66 5.50 3 Ta1 restaurantes 2.35 M 20 36 6.60 1 Ta4 centros comerciales 1.90 F 21 59 3.85 1 Ta4 restaurantes 0.30 M 22 37 6.70 3 Ta6 centros comerciales 0.70 F 23 53 3.50 0 Ta5 restaurantes 0.67 F 24 35 8.80 1 Ta1 discotecas 0.50 F 25 63 10.00 4 Ta5 restaurantes 1.50 M 26 28 10.10 2 Ta1 centro de estudios 0.70 F 27 43 13.40 2 Ta2 discotecas 1.50 F 28 60 3.90 0 Ta5 otros 1.99 M 29 59 5.84 1 Ta5 restaurantes 0.60 M 30 63 3.50 1 Ta4 grifos 1.50 M 31 55 4.40 2 Ta2 centro de estudios 0.40 M 32 42 3.70 0 Ta5 centros comerciales 1.80 F 33 51 4.50 1 Ta1 otros 0.70 M 34 39 5.63 1 Ta1 otros 0.80 M 35 55 4.60 4 Ta1 discotecas 1.25 M 36 35 5.79 0 Ta5 discotecas 1.60 M 37 42 2.93 3 Ta5 grifos 0.20 M UNA La Molina - Dpto. de Estadística e Informática Estadística General 15 Caso Edad Ingreso Mensual (miles de S/.) Nº de viajes (mensual) Tarjeta de crédito usada Lugar de uso de tarjeta de crédito Monto de deuda (miles de S/.) Sexo 38 36 6.60 1 Ta3 grifos 4.37 F 39 49 4.60 0 Ta3 centros comerciales 2.00 M 40 27 6.60 0 Ta4 grifos 0.90 F 41 36 2.90 4 Ta1 discotecas 0.47 M 42 42 4.69 2 Ta2 centros comerciales 0.80 F 43 25 3.99 1 Ta4 restaurantes 4.32 F 44 32 6.70 2 Ta1 centros comerciales 0.60 M 45 28 2.58 1 Ta4 otros 1.70 M Organización de datos cualitativos Organicemos las observaciones de la variable tarjeta de crédito usada. Tabla de frecuencias del tipo de tarjeta de crédito usada N° de clase Tarjeta de crédito usada Frecuencia Absoluta fi Frecuencia Relativa fri Frecuencia Porcentual pi 1 Ta1 12 0.2667 26.67 2 Ta2 7 0.1556 15.56 3 Ta3 4 0.0889 8.89 4 Ta4 11 0.2444 24.44 5 Ta5 10 0.2222 22.22 6 Ta6 1 0.0222 2.22 Total 45 1.0000 100.00 Fuente: Elaboración propia f3 = 4 indica que 4 de los clientes del Banco Comercial utilizan la tarjeta de crédito Ta3 fr1 = 0.2667 indica la proporción de clientes del Banco Comercial que utilizan la tarjeta de crédito Ta1. p2 = 15.56 indica que el 15.56% de clientes del Banco Comercial utilizan la tarjeta de crédito Ta2. Gráfico de barras de frecuencia porcentual Tarjeta de crédito % Ta6Ta5Ta4Ta3Ta2Ta1 30 25 20 15 10 5 0 Tarjetas de crédito usada Fuente: Elaboración propia En el gráfico de barras, se aprecia que la tarjeta Ta1 es la de uso más frecuente. UNA La Molina - Dpto. de Estadística e Informática Estadística General 16 Gráfico Circular 1, 2.2% Ta6 10, 22.2% Ta5 11, 24.4% Ta4 4, 8.9% Ta3 7, 15.6% Ta2 12, 26.7% Ta1 Category Ta5 Ta6 Ta1 Ta2 Ta3 Ta4 Tarjetas de crédito usada Fuente: Elaboración propia En el gráfico circular, se aprecia que la tarjeta de crédito Ta6 es la de uso menos frecuente. Ejercicio 1. Se ha realizado una encuesta para evaluar el grado de satisfacción de cuatro planes de seguro familiar (A, B, C y D). Los resultados para una muestra de 40 clientes que adquirieron el seguro familiar en los dos últimos años se muestra en la siguiente tabla. A Bueno A Regular A Malo D Regular C Bueno A Malo A Malo A Malo C Malo B Bueno B Regular D Regular D Regular B Regular D Regular C Regular C Bueno B Regular C Malo C Bueno B Malo B Bueno C Malo B Regular C Malo D Malo C Malo B Regular D Bueno A Bueno A Regular B Regular D Bueno A Bueno C Malo D Regular B Malo B Bueno D Malo B Regular a. Elabore una tabla de frecuencias y un gráfico de barras de frecuencias absolutas para la variable plan de seguro familiar. UNA La Molina - Dpto. de Estadística e Informática Estadística General 17 b. Elabore una tabla de frecuencias y un gráfico circular de frecuencias porcentual para la variable grado de satisfacción del plan de seguro familiar. Tabulaciones cruzadas También llamadas tablas de contingencia o de doble entrada. Se usan para resumir y presentar de manera simultánea los datos para dos variables cualitativas. Ejercicio 2. En el 2010 el Instituto Nacional de Estadística e Informática (INEI) en convenio con la Asamblea Nacional de Rectores (ANR) realizó el II Censo Nacional Universitario. A continuación se presentan los resultados de dos características generales. Distribución de los alumnos de pre-grado según el sexo y edad Sexo Edad Total De 15 a 20 años De 21 a 25 años De 26 a 30 años De 31 a 35 años De 36 a 40 años Más de 40 años Masculino 126214 169306 60006 21465 10651 12503 400145 Femenino 150859 159091 42243 15313 7333 7986 382825 Total 277073 328397 102249 36778 17984 20489 782970 Fuente: PERÚ, II Censo Nacional Universitario 2010 Las variables utilizadas esta tabla de contingencia son: ______________________ ___________________________________________________________________ El total de alumnos de pre-grado del sexo masculino es ______________________ El total de alumnos de pre-grado de 31 a 35 años es _________________________ El % de los alumnos de pre-grado del sexo masculino que tienen 26 a 30 años es ___________________ El % de alumnos de pre-grado de 21 a 25 años que son del sexo femenino es ___________________ El % de alumnos de pre-grado de 26 a 30 años y que son del sexo femenino es ___________________ UNA La Molina - Dpto. de Estadística e Informática Estadística General 18 2.2 Organización para variables cuantitativas discretas La tabla de frecuencia es organizada por clases o categorías que corresponden a los distintos valores (números) que toma la variable cuantitativa discreta. Se usa cuando el conjunto de valores posible de la variable cuantitativa discreta es pequeño. Tabla de frecuencias N° de clase Valor de la variable Frecuencia Absoluta (fi) Frecuencia Relativa (fri) Frecuencia Porcentual (pi) 1 x1 f1 fr1 p1 2 x2 f2 fr2 p2 . . . k xk fk frk pk Total n 1 100 Tipo de gráfico. Se elabora el gráfico de bastones o varas con las frecuencias absolutas, relativas o porcentual. Ejemplo 2. Organización de datos cuantitativos discretos Organicemos las observaciones de la variable número de viajes al mes de los clientes. Tabla de frecuencias del número de viajes al mes N° de viajes al mes Frecuencia Absoluta No de clientes fi Frecuencia Relativa fri Frecuencia Porcentual pi 0 10 0.2222 22.22 1 15 0.3333 33.33 2 9 0.2000 20.00 3 6 0.1333 13.33 4 5 0.1111 11.11 Total 45 1.0000* 100.00* Fuente: Elaboración propia Interprete: f2 = 15 Existen 15 clientes del Banco Comercial que hacen un viaje al mes. p1 = 22.22 El 22.22% de los clientes no han realizado viajes. Gráfico de bastones o varas de frecuncia porcentual Viajes % 43210 35 30 25 20 15 10 5 0 Viajes al mes Fuente:Elaboración propia En el gráfico de varas, se aprecia que en la variable número de viajes al mes, el número 1 (un viaje al mes) es el más frecuente. UNA La Molina - Dpto. de Estadística e Informática Estadística General 19 Ejercicio 3. En una estación experimental se ha determinado el número de larvas de insectos encontrados en 40 parcelas, en un cultivo de frijol. Los datos se muestran a continuación: 1 3 3 5 6 6 9 9 10 10 1 3 5 5 6 3 9 10 3 1 10 3 5 5 6 5 9 10 1 1 3 3 5 6 6 5 9 5 3 1 a. Elabore una tabla de frecuencias y su respectivo gráfico de bastones. b. Interprete f3 y p3 c. ¿Qué número y porcentaje de parcelas muestran al menos 6 larvas? 2.3 Organización para variables cuantitativas continuas El conjunto de datos es agrupado por intervalos de clase que conforman las clases o categorías de la tabla de frecuencias. Tabla de frecuencias N° de clases Intervalos de clase [LI-LS> Marca de clase ' ix Frec. Absoluta fi Frec. Relativa fri Frec. Porc. pi Frec. Acumulada Absoluta Fi Frec. Acumulada Relativa Fri Frec. Acum. Porc. Pi 1 [LI1-LS1> x’1 f1 fr1 p1 F1 Fr1 P1 2 [LI2-LS2> x’2 f2 fr2 p2 F2 Fr2 P2 . . . k [LIk-LSk] x’k fK frK pk FK FrK Pk Total N 1 100 1 100 UNA La Molina - Dpto. de Estadística e Informática Estadística General 20 Donde: LIi = Límite inferior de la clase i (Límite cerrado) LSi= Límite superior de la clase i (Límite abierto, salvo la última clase que es cerrado) Marcas de Clase ( ' iX ). Es el punto medio del intervalo de clase. Se considerada como el valor representativo de los valores que pertenecen al intervalo de clase. Se calcula: TICXXo LSLI X ii ii i ' 1 '' 2 , donde TIC es el tamaño del intervalo de clase Frecuencia Porcentual (pi). Indica el porcentaje de observaciones o unidades elementales que hay en la clase i. Se cumple: 1 100% k i i p Frecuencia Acumulada Absoluta (Fi). Indica el número de observaciones o unidades elementales que hay desde la primera clase hasta la clase i. Se calcula por: 1 2 1 ... k k i k i F f f f f . Frecuencia Acumulada Relativa (Fri). Indica la proporción de observaciones o unidades elementales que hay desde la primera clase hasta la clase i. Se calcula por: i j j i j j fr n f n Fi Fri 1 1 Frecuencia Acumulada Porcentual (Pi). Indica el porcentaje de observaciones o unidades elementales que hay desde la primera clase hasta la clase i. Pasos para la construcción de una tabla de frecuencias: Paso 1. Hallar el rango o amplitud (r). MínimoMáximor Paso 2. Hallar el número de intervalos de clase (k). Se aplica la regla de Sturges: )log(3.31 nk . Eligiendo un valor: 3 ≤ k ≤ 15 Se aplica el redondeo normal a entero. Si el primer dígito decimal: es 5, se redondea al entero inmediato superior y si es < 5, se considera el entero obtenido. Paso 3. Hallar el tamaño de Intervalo de Clase (TIC). k r TIC El número de decimales debe ser igual al de las observaciones. Se aplica el redondeo por exceso. Si la posición del decimal es 1, se redondea al valor inmediato superior, de lo contrario no se redondea. Paso 4. Hallar los límites inferiores y superiores de cada intervalo de clase. LI1 = Mínimo LS1= LI1 + TIC LI2 = LI1 + TIC = LS1 LS2= LI2 + TIC LI3 = LI2 + TIC = LS2 LS3= LI3 + TIC . . . LIk = LIk-1 + TIC = LSk-1 LSk= LIk + TIC UNA La Molina - Dpto. de Estadística e Informática Estadística General 21 Paso 5. Realizar el conteo del conjunto de datos, como el resultado de asignar cada observación a alguno de los intervalos de clase. Luego completar la tabla hallando x’i , fi , fri , Fi , Fri . Tipos de gráficos Histograma. Se usan las frecuencias absolutas o relativas en el eje vertical y los intervalos de clase en el eje horizontal. Polígono. Se usan las frecuencias absolutas o relativas en el eje vertical y las marcas de clase en el eje horizontal. Ejemplo 3. Organización de datos cuantitativos continuos Organicemos las observaciones de la variable ingreso mensual de los clientes (en miles de nuevos soles). Paso 1. Calcule el rango ( R ). R = xmax - xmin En el ejemplo R = 13.40 – 1.99 = 11.41 Paso 2. Determine el número de intervalos de clase ( k ). Utilice la regla de Sturges k = 1 + 3.3 log n = 1 + 3.3 log 45 = 6.4556 Redondeo estadístico: Se toma en consideración el primer valor decimal, si es: 5 se redondea al entero inmediato superior < 5 se considera el entero obtenido En nuestro ejemplo, k = 6.4556, estamos en el segundo caso, por lo que el número de clases que se debe considerar es k = 6. Paso 3. Halle el tamaño de los intervalos de clase (TIC) 11.41 1.90167 6 R TIC k Redondeo por exceso: se toma en consideración el número mayor de decimales que tienen las observaciones. Considerando la posición de este decimal, se presentan 2 casos: Si existe alguna cifra significativa a la derecha de este valor, se redondea al valor inmediato superior Si no existe ninguna cifra significativa a la derecha de este valor, entonces no se realiza ningún redondeo 1.90167TIC Como las observaciones tienen 2 decimales en el TIC también se considerará con 2 decimales y como hay al menos un valor diferente de cero a la derecha de las centésimas se incrementa en una centésima quedando TIC = 1.91 UNA La Molina - Dpto. de Estadística e Informática Estadística General 22 Paso 4. Construya la tabla de frecuencias. Tener en cuenta que en la última clase el intervalo es cerrado en el lado derecho. Tabla de frecuencias del ingreso mensual N° de clases Ingreso mensual [LI-LS> Marca de clase ' ix Frec . Abs. fi Frec. Rel. fri Frec. Porc. pi Frec. Acum. Abs. Fi Frec. Acum. Rel. Fri Frec. Acum. Porc. Pi 1 [1.99 - 3.90> 2.945 11 0.2444 24.44 11 0.2444 24.44 2 [3.90 - 5.81> 4.855 20 0.4444 44.44 31 0.6888 68.88 3 [5.81 - 7.72> 6.765 10 0.2222 22.22 41 0.9110 91.10 4 [7.72 - 9.63> 8.675 1 0.0222 2.22 42 0.9332 93.32 5 [9.63 -11.54> 10.585 2 0.0444 4.44 44 0.9776 97.76 6 [11.54-13.45] 12.495 1 0.0222 2.22 45 1.000 100 45 1.0000 100 Fuente: Elaboración propia Interprete: f2 = 20; 20 de los clientes tienen un ingreso mensual de por lo menos S/. 3900 pero menos de S/. 5810. fr4 = 0.0222; 0.0222 es la proporción de clientes que ganan por lo menos S/. 7720 pero menos de S/. 9630 p5 = 4.44; 4.44% de los clientes ganan por lo menos S/. 9630 pero menos de S/. 11540. 3 3 i 1 2 3 i 1 F f f f f 11 20 10 41 41 de los clientes ganan mensualmente por lo menos S/. 1990 pero menos de S/. 7720 F5 – F2 = 44 – 31 =13 F5 – F2 = 5 3 4 5 3 10 1 2 13i i f f f f 13 de los clientes ganan por lo menos S/. 5810 pero menos de S/. 11540 4 4 i 1 2 3 4 i 1 Fr fr fr fr fr fr 0.2444 0.4444 0.2222 0.0222 0.9332 , indica que 0.9332 es la proporción de clientes que ganan por lo menos S/. 1990 pero menos de S/. 9630. Fr5 – Fr3 =0.9776 – 0.9110 = 0.0666 Fr5 – Fr3 = 5 4 5 4 0.0222 0.0444 0.0666i i fr fr fr , indica que 0.0666 es la proporción de los clientes que ganan por lo menos S/.7720 pero menos de S/.11540. 3 3 i 1 2 3 i 1 P p 24.44 44.44 22.22 91.10p p p , indica que el 91.10% de los clientes tienen ingresos mensuales de por lo menos S/.1990 pero menos de S/.7720 UNA La Molina - Dpto. de Estadística e Informática Estadística General 23 P5 – P2 = 97.76 – 68.88 = 28.88 P5 – P2 = 5 3 4 5 3 22.22 2.22 4.44 28.88i i p p p p , indica que el 28.88% de los clientes de ese banco tienen ingresos mensuales por lo menos S/. 5810 pero menos de S/. 11540. ' 3 6.765x es el valor representativo de los clientes que ganan por lo menos S/.5810 pero menos de S/.7720. Las diez observaciones (f3 = 10) que hay en la clase 3 son representadas por el valor S/. 6765. Histograma de frecuencias porcentuales Ingreso % 13.4511.549.637.725.813.901.99 50 40 30 20 10 0 Ingreso Mensual Fuente: Elaboración propia En el histograma se puede apreciar que la clase más frecuente es la segunda esto indica que los ingresos más frecuentes son de por lo menos S/. 3900 pero menores a S/. 5810. Polígono de frecuencias absolutas Ingreso Mensual Fuente: Elaboración propia En el polígono de frecuencias se observa que son pocos los clientes con ingresos mensuales altos. Series1, 1.035, 0 Series1, 2.945, 11 Series1, 4.855, 20 Series1, 6.765, 10 Series1, 8.675, 1Series1, 10.585, 2Series1, 12.495, 1Series1, 14.405, 0 UNA La Molina - Dpto. de Estadística e Informática Estadística General 24 Ejercicio 4. Con la finalidad de evaluar la viabilidad de un proyecto de reforestación de una zona sometida a estrés turístico, para el que se ha solicitado una subvención pública, se ha tomado muestras sobre la composición en mg/cm3 de desechos orgánicos en el suelo. Los datos obtenidos fueron: Composición de desechos orgánicos (mg/cm3) 8.2 12.9 15.3 18.8 20.8 9.2 12.9 15.8 19.7 21.0 9.4 14.0 15.9 20.3 21.4 10.8 14.2 16.9 20.3 22.2 10.8 14.4 18.2 20.3 22.5 11.1 15.1 18.4 20.2 23.2 11.2 15.1 18.6 20.7 25.8 a. Construir la tabla de frecuencias usando la regla de Sturges. b. A partir de la tabla de frecuencias interprete: f3, fr3, p3, F4 , Fr4, P4 c. ¿Entre qué niveles de composición se encuentra aproximadamente el 51.4% de las observaciones con menores niveles registrados? UNA La Molina - Dpto. de Estadística e Informática Estadística General 25 Ejercicio 5. La gerencia de marketing del Supermercado ABC desea realizar un estudio con la finalidad de evaluar la satisfacción de sus clientes. Para el estudio se selecciona aleatoriamente a 40 clientes que acudieron al supermercado en un día y se registró los siguientes datos. N° Tipo pago Estado de los productos Número de compras semanal Monto (nuevos soles) N° Tipo pago Estado de los productos Número de compras semanal Monto (nuevos soles) 1 1 2 2 200.5 21 3 4 2 350.5 2 2 2 4 200.3 22 3 2 4 250.3 3 2 1 1 136.0 23 3 4 5 180.4 4 2 2 2 150.2 24 2 3 1 320.8 5 2 2 3 300.6 25 2 1 2 150.6 6 1 1 2 320.8 26 3 4 3 190.8 7 3 2 2 310.8 27 1 3 2 240.5 8 3 1 4 229.2 28 2 1 3 275.8 9 1 2 3 180.5 29 3 2 3 130.8 10 2 3 5 110.6 30 3 3 1 180.2 11 3 1 1 140.8 31 2 4 4 315.4 12 1 3 3 368.6 32 1 2 2 290.6 13 2 2 2 160.2 33 2 3 2 265.8 14 3 1 3 180.9 34 3 4 1 360.8 15 3 2 1 190.5 35 1 1 3 260.2 16 2 3 2 210.4 36 2 2 3 140.5 17 3 2 3 89.4 37 1 3 2 180.2 18 1 3 3 110.6 38 3 4 3 220.5 19 2 1 4 100.5 39 3 1 2 345.8 20 1 1 1 120.3 40 3 2 3 95.4 Considerar: Tipo de pago: 1=Contado 2=Tarjeta de crédito 3=Crédito ABC Estado de los productos: 1=Muy bueno 2=Bueno 3=Regular 4=Malo a. Elabore una tabla de frecuencias y un gráfico de barras de frecuencia relativa de la variable tipo de pago. UNA La Molina - Dpto. de Estadística e Informática Estadística General 26 b. Elabore la tabla de frecuencias para la variable número de compras semanal. Elabore el respectivo gráfico de varas. c. Elabore la tabla de frecuencias usando la regla de Sturges para la variable monto semanal. d. Interprete f4, F5-F2, 1- Fr4 , 100-P2 UNA La Molina - Dpto. de Estadística e Informática Estadística General 27 e. Elabore el respectivo histograma y polígono de frecuencias. Ejercicio 6. Se ha recolectado información de 20 sacos de papa tomados al azar, cosechados para un trabajo experimental. Se muestra a continuación el número de papas que están comenzando descomponerse por saco y las variedades de papas cosechadas. Número de papas descomponiéndose Variedades de papa cosechadas 8 12 Variedad de papa Fuente: Estudio Experimental. 8 12 8 12 9 16 9 16 9 16 12 16 12 17 12 17 12 18 a. Elabore una tabla de frecuencias para la variable cuantitativa.b. Elabore un cuadro que resuma la información de la variable cualitativa. 0 2 4 6 8 10 Serie1 3 5 9 2 1 amarilla negra blanca tomasa serrana UNA La Molina - Dpto. de Estadística e Informática Estadística General 28 Práctica Dirigida N° 1 1. Una fábrica textil para su próxima campaña de verano debe decidir la fabricación de tres tipos de diseños de polos (D1, D2 y D3). Para apoyar su decisión la gerencia de producción realizó un estudio extrayendo una muestra aleatoria de 60 clientes potenciales, registrándose los siguientes resultados: El 45.5% de los clientes prefieren el diseño D1, el 35.5% el D2 y el resto el diseño D3. El 55% tienen la talla S, el 25% M y el resto L. El número promedios de polos que comprarían es de 1.8 El precio promedio que pagarían es de S/. 45.5 La edad promedio es de 35.8 años a) De acuerdo al enunciado identifique la población de estudio, unidad elemental y muestra. b) Identifique las variables, tipos, observación, estadístico o parámetro. Variable Tipo de Variable Observación Estadístico Parámetro UNA La Molina - Dpto. de Estadística e Informática Estadística General 29 2. El ministerio de la Producción está realizando un estudio sobre las embarcaciones de pesca de la zona norte el país y que abastecen a los mercados locales. Para el análisis seleccionó una muestra aleatoria de 30 embarcaciones en el último mes y se registra la producción de pesca (en decenas de kgs), el tipo de embarcación y el número de días de pesca. Los datos se presentan en la siguiente tabla: Producción Tipo de paquete Número de días de pesca Producción Tipo de paquete Número de días de pesca 22.0 T1 4 39.8 T1 3 23.7 T1 2 40.0 T2 2 24.6 T2 2 40.3 T3 2 24.8 T2 4 40.6 T3 4 25.0 T3 2 42.8 T3 5 26.4 T3 4 43.0 T4 6 26.6 T4 6 44.1 T4 5 27.5 T3 6 44.5 T4 4 29.9 T2 2 44.8 T2 3 31.1 T1 4 45.6 T2 4 32.5 T2 3 46.0 T3 3 34.8 T3 5 46.4 T1 2 35.0 T2 6 48.0 T2 6 38.4 T4 3 52.0 T1 3 38.5 T4 3 54.0 T1 5 39.1 T3 4 56.0 T2 6 a) Con respecto a la información proporcionada, identifique la población, unidad elemental y muestra. b) Elabore una tabla de frecuencias sobre el tipo de embarcación y un gráfico de barras de frecuencias porcentuales. UNA La Molina - Dpto. de Estadística e Informática Estadística General 30 c) Elabore la tabla de frecuencias para la producción de pesca. Use la regla de Sturges. d) Interprete f4, p4, F5, y 100-P5. UNA La Molina - Dpto. de Estadística e Informática Estadística General 31 e) Elabore el respectivo histograma de frecuencias porcentuales. f) Elabore la tabla de frecuencias para la variable número de días de pesca y su gráfico respectivo. UNA La Molina - Dpto. de Estadística e Informática Estadística General 32 EJERCICIOS PROPUESTOS 1. En Marzo del 2009 la empresa de investigación de mercados “CONTHEOS”, fue contratada por el banco “Nuevo Horizonte” para que realice un estudio sobre la aceptación de los créditos anuales que ofrecen a sus clientes en sus sucursales de los distritos de La Molina y Surco. La empresa “CONTHEOS” después de hacer un estudio de las características de los clientes activos del banco, seleccionó una muestra de 36 clientes de la sucursal de La Molina, y recolectó de ellas información para un conjunto de variables seleccionadas para tal fin. Los resultados se muestran a continuación: Nº Cliente Tipo de crédito Nº de solicitudes Monto de crédito. (miles de soles) Tipo de cliente 1 1 1 30.0 2 2 2 2 35.3 3 3 3 1 48.4 2 4 1 2 50.1 2 5 2 1 55.3 3 6 4 2 57.2 2 7 5 1 58.1 1 8 3 1 60.4 3 9 5 2 65.3 3 10 4 1 66.0 2 11 3 3 68.0 2 12 4 1 69.1 2 13 2 3 70.2 3 14 5 3 72.5 2 15 4 1 73.1 3 16 2 4 75.3 3 17 3 4 77.2 3 18 4 1 79.1 3 19 4 3 82.7 2 20 5 7 84.3 3 21 3 1 86.0 1 22 4 5 90.3 1 23 1 6 95.2 2 24 3 1 100.1 3 25 4 2 101.2 3 26 1 4 102.2 1 27 3 1 102.2 3 28 4 2 104.3 2 29 1 4 110.1 2 30 3 1 115.3 3 31 4 3 118.4 2 32 1 2 119.1 1 33 3 1 125.1 3 34 1 3 128.0 2 35 1 1 130.2 2 36 2 2 140.0 3Tipo de Crédito: (1) Inversión en negocio, (2) Compra de inmuebles, (3) Compra de maquinarias, (4) Inversión en bolsa de valores (5) Compra de autos. Tipo de cliente: (1) Casado (a), (2) Soltero (a), (3) Divorciado(a) UNA La Molina - Dpto. de Estadística e Informática Estadística General 33 a) Elabore una gráfica adecuada para la variable cualitativa. b) Haciendo uso de la regla de Sturges construya un cuadro de distribución de frecuencias para la variable Monto de crédito (miles de soles). c) Interprete según enunciado los valores de f2, p3, F4, P5 y (p5+p6). d) Construya el polígono de frecuencias para la variable Monto de crédito. e) Construya un cuadro de distribución de frecuencias para la variable cuantitativa discreta. 2. La siguiente información se tomó de los registros del Hospital Centro de Salud Materno Infantil San Bartolomé. Sección Maternidad entre el 18 y el 22 de Mayo del 2012. Madre Hijo Caso Edad Estado Civil No de partos Peso Sexo 1 25 conv 2 2.90 F 2 22 conv 2 2.90 F 3 32 conv 4 4.04 M 4 22 conv 1 4.35 F 5 18 casada 1 3.60 M 6 21 casada 3 3.50 M 7 20 soltera 2 3.20 M 8 19 casada 1 3.00 F 9 23 casada 3 3.60 M 10 26 casada 2 2.80 M 11 36 casada 5 3.00 M 12 30 conv 5 3.30 F 13 23 soltera 3 3.10 F 14 29 conv 4 3.30 F 15 22 conv 2 3.30 F 16 23 casada 1 3.50 F 17 27 conv 2 3.62 M 18 28 conv 3 3.30 F 19 19 conv 1 2.65 F 20 32 casada 2 2.86 F 21 17 conv 1 2.62 M 22 21 conv 2 3.56 F 23 18 casada 2 3.10 M 24 27 conv 3 3.62 F 25 21 casada 1 3.18 M 26 19 casada 1 2.95 M 27 19 conv 2 3.90 M 28 31 casada 3 3.00 F 29 32 casada 4 4.00 F 30 21 conv 2 3.85 M 31 23 casada 2 2.75 F 32 19 casada 1 3.18 F 33 19 conv 1 3.14 F 34 26 conv 3 3.08 F 35 18 casada 1 2.80 F 36 24 casada 2 3.40 M 37 30 casada 3 3.00 F 38 26 casada 3 3.05 F 39 19 casada 1 2.90 F 40 34 casada 3 3.10 F UNA La Molina - Dpto. de Estadística e Informática Estadística General 34 Madre Hijo Caso Edad Estado Civil No de partos Peso Sexo 41 28 casada 3 3.40 M 42 24 casada 2 2.97 F 43 26 casada 2 2.94 F 44 22 casada 2 3.80 M 45 34 casada 5 4.65 F a) Elabore una tabla y grafica adecuada para la variable ESTADO CIVIL. b) Haciendo uso de la regla de Sturges construya un cuadro de distribución de frecuencias para la variable PESO DEL RECIEN NACIDO. c) Interprete según enunciado los valores de f2, fr4, p5, F3, P3 y (P5-P2) del cuadro de distribución de frecuencias anterior. d) Construya el polígono de frecuencias para la variable PESO DEL RECIEN NACIDO. e) Construya un cuadro de distribución de frecuencias para la variable Nº DE PARTOS. 3. Con el objeto de determinar el número de horas diarias que los alumnos de la facultad de ciencias se dedican a estudiar en la biblioteca de la UNALM, se llevó a cabo una encuesta a 49 de ellos, obteniéndose los siguientes resultados expresados en horas: 1.2 1.8 2.3 2.6 3.0 3.1 3.6 1.2 1.8 2.3 2.7 3.0 3.1 3.6 1.3 2.3 2.3 2.7 3.0 3.1 3.6 1.3 2.3 2.4 2.8 3.0 3.4 4.0 1.5 2.3 2.4 2.8 3.1 3.4 4.1 1.8 2.3 2.6 2.8 3.1 3.4 4.5 1.8 2.3 2.6 2.9 3.1 3.4 4.5 a) Construya una tabla de frecuencia completa, usando la regla de Sturges. b) Interpretar la marca de clase del tercer intervalo de clase. c) Interpretar la frecuencia relativa del tercer intervalo de clase. 4. Tomando como base la información tomada en la pregunta 3, se encuestó también a 35 alumnos de la facultad de Agronomía obteniéndose los siguientes resultados en horas: 2 2 2.1 2.1 2.2 2.5 2.6 2.6 2.7 2.7 3 3 3.1 3.2 3.3 3.4 3.4 3.5 3.6 3.6 3.6 3.8 4 4 4 4.1 4.3 4.3 4.4 4.5 4.5 4.6 4.7 4.7 4.7 Construya la tabla de frecuencias comparativa entre las dos facultades. Mencionar tres conclusiones importantes en términos del enunciado. UNA La Molina - Dpto. de Estadística e Informática Estadística General 35 5. Los siguientes datos corresponden a la longitud de la cabeza del feto a los 45 días de gestación de un total de 60 ovejas que produjeron un solo feto y de las cuales el día de apareamiento es conocido. Las medidas están en mm y fueron obtenidas con imágenes de ultrasonido: 19.4 20.4 21.0 21.6 21.9 21.9 22.0 22.1 22.1 22.2 22.3 22.3 22.6 22.7 22.7 22.7 22.8 22.9 23.0 23.1 23.2 23.2 23.4 23.6 23.6 23.6 23.7 24.0 24.0 24.0 24.0 24.0 24.1 24.1 24.3 24.4 24.5 24.6 24.7 24.7 24.8 24.8 25.0 25.0 25.0 25.2 25.3 25.3 25.5 25.5 25.5 25.6 25.6 25.6 25.8 25.9 26.0 26.4 26.9 27.5 a) Defina variable y unidad elemental. b) Construya la tabla de frecuencias. Utilice la regla de Sturges para determinar el número de intervalos. Presente 3 decimales para sus frecuencias relativas. c) Interprete fr3, Fr5, F5 – F2. d) Grafique el histograma de frecuencias y el polígono de frecuencias. 6. Una compañía manufacturera tiene a prueba a 48 nuevos trabajadores. Para evaluar su rendimiento, se les asignó una tarea rutinaria y se midió el tiempo que tardaron en realizarla. Los tiempos en minutos son los siguientes: 105 105 107 108 108 108 109 109 110 111 111 111 113 114 114 117 118 119 121 121 123 125 126 126 126 126 128 129 130 131 134 134 137 145 145 150 150 152 153 154 157 157 158 164 170 171 179 183 a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el número de intervalos. Presente 3 decimales para sus frecuencias relativas. b) Interprete F5 - F2, 1 - Fr4, fr5+fr6. 7. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día) de los establecimientos comerciales de un distrito de Lima. Para ello se eligieron al azar 36 establecimientos encontrándose los siguientes resultados: 1.5 2.1 2.5 3.2 3.7 4.4 4.5 4.6 4.6 4.6 4.7 5.2 5.3 5.4 5.7 5.7 5.8 6.1 6.4 6.7 6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.4 8.5 8.7 9.1 9.8 10.1 11.7 12.1 15.4 a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el número de intervalos. b) Interprete f4, F3, p5 c) Graficar el histograma y el polígono de frecuencias. 8. En una fábrica de pernos se desea estimar el número de pernos defectuosos por caja para verificar si estos valores están dentro de los límites permisibles. Se selecciona una muestra de 40 cajas y se obtienen los siguientes resultados: 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 7 7 a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el número de intervalos. b) Interprete f2, p4 UNA La Molina - Dpto. de Estadística e Informática Estadística General 36 9. Un profesor decide registrar el mes de nacimiento de cada uno de los 40 estudiantes de su clase. junio julio noviembre abril enero febrero septiembre julio agosto septiembre diciembre julio junio noviembre mayo abril febrero agosto junio mayo octubre agosto noviembre enero junio abril septiembre diciembre agosto junio julio marzo diciembre marzo junio noviembre septiembre junio marzo noviembre Construya la tabla de frecuencias, elabore e interprete el diagrama de barras. ¿Cuál es el mes que presenta la mayor y cuál la menor frecuencia de nacimientos? 10. Un Ing. Pesquero está realizando un estudio sobre el salmón plateado con la finalidad de introducirlo al país. Una de las variables de interés es la longitud (en centímetros). El resultado luego de la evaluación a 45 peces elegidos al azar de esta especie se presenta a continuación: 93.30 93.36 94.48 94.68 95.76 95.95 96.31 96.37 96.43 96.53 96.58 96.60 96.61 96.80 96.86 96.93 97.29 97.40 97.41 97.45 97.58 97.66 97.66 97.88 97.92 98.22 98.40 98.47 98.49 98.53 98.56 98.63 98.76 98.79 99.21 99.29 99.32 99.44 99.68 100.08 100.22 100.82 101.24 101.31 102.79 a) Construya la tabla de frecuencias usando la regla de Sturges. b) Presenteel polígono de frecuencias. 11. La empresa Nicronics S.A. se dedica a la venta de placas circulares plásticas de policarbonato, que importa de Alemania, Holanda y Japón. Las cantidades porcentuales que importa de cada país son 16%, 64% y 20% respectivamente. Las longitudes de los diámetros de dichas placas se expresan en pulgadas y los pesos de los mismos varían de 480 a 920 gramos. En los últimos tres meses, los clientes nacionales, le han devuelto sus productos debido a la baja resistencia encontrada, por ello, el área de control de calidad ha seleccionado al azar 500 placas circulares (en cantidades proporcionales a lo que importa de cada país) y analizado en un laboratorio, la resistencia a las ralladuras y a los impactos (en ambos casos la resistencia puede ser alta, media o baja). Si la empresa encuentra que efectivamente las placas no satisfacen las condiciones del cliente, se verán obligados a cambiar de proveedores. En base a la variable país de importación elabore un cuadro de frecuencias de la muestra seleccionada y su respectivo gráfico 12. Una fábrica textil para su próxima campaña de verano debe decidir la fabricación de tres tipos de diseños de polos (D1, D2 y D3). Para apoyar su decisión la gerencia de producción realizó un estudio extrayendo una muestra aleatoria de 60 clientes potenciales, registrándose los siguientes resultados: El 45.5% de los clientes prefieren el diseño D1, el 35.5% el D2 y el resto el diseño D3. El 55% tienen la talla S, el 25% M y el resto L. El número promedios de polos que comprarían es de 1.8 El precio promedio que pagarían es de S/. 45.5 La edad promedio es de 35.8 años a. De acuerdo al enunciado identifique la población de estudio, unidad elemental y muestra. UNA La Molina - Dpto. de Estadística e Informática Estadística General 37 b. Identifique las variables, tipos, observación, estadístico o parámetro. Variable Tipo de Variable Observación Estadístico Parámetro 13. El ministerio de la Producción está realizando un estudio sobre las embarcaciones de pesca de la zona norte el país y que abastecen a los mercados locales. Para el análisis seleccionó una muestra aleatoria de 32 embarcaciones en el último mes y se registra la producción de pesca (en decenas de kgs), el tipo de embarcación y el número de días de pesca. Los datos se presentan en la siguiente tabla: Producción Tipo de paquete Número de días de pesca Producción Tipo de paquete Número de días de pesca 22.0 T1 4 39.8 T1 3 23.7 T1 2 40.0 T2 2 24.6 T2 2 40.3 T3 2 24.8 T2 4 40.6 T3 4 25.0 T3 2 42.8 T3 5 26.4 T3 4 43.0 T4 6 26.6 T4 6 44.1 T4 5 27.5 T3 6 44.5 T4 4 29.9 T2 2 44.8 T2 3 31.1 T1 4 45.6 T2 4 32.5 T2 3 46.0 T3 3 34.8 T3 5 46.4 T1 2 35.0 T2 6 48.0 T2 6 38.4 T4 3 52.0 T1 3 38.5 T4 3 54.0 T1 5 39.1 T3 4 56.0 T2 6 a) Con respecto a la información proporcionada, identifique la población, unidad elemental y muestra. b) Elabore una tabla de frecuencias sobre el tipo de embarcación y un gráfico de barras de frecuencias porcentuales. c) Elabore la tabla de frecuencias para la producción de pesca. Use la regla de Sturges. d) Interprete f4, p4, F5, y 100-P5. e) Elabore el respectivo histograma de frecuencias porcentuales. f) Elabore la tabla de frecuencias para la variable número de días de pesca y su gráfico respectivo. UNA La Molina - Dpto. de Estadística e Informática Estadística General 38 Preguntas de Autoevaluación 1. Para graficar un polígono, en el eje de ordenadas se usa _________________ y en el eje de abscisas _____________________. 2. Si en una tabla de frecuencias las marcas de clases: X’1=25 y X’6=75, entonces el valor del TIC es ___________________ y el valor del LI1 es _________________. 3. El gráfico asociado a una variable cuantitativa discreta se conoce como ______________________. 4. El valor representativo de un intervalo de clase se conoce como _________________________ 5. Para graficar un histograma, en el eje de ordenadas se usa ________________ y en el eje de abscisas _____________________. 6. La frecuencia acumulada relativa 4r F puede ser calculada en términos de la frecuencia relativa por ____________________ y en términos de la frecuencia acumulada absoluta por _________________________. 7. Los gráficos que se pueden elaborar para la variable estado civil son llamados __________________________________ 8. Para los siguientes valores del TIC, halle el valor usando el redondeo por exceso para los casos de un entero, un decimal y dos decimales. 9. El número de decimales del Tamaño de Intervalo de Clase (TIC), debe ser siempre igual a _________________________________ 10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: Item Enunciado V/F a. Para hallar el número de intervalos de clase se aplica el redondeo por exceso. b. El número de decimales de la marca de clase es igual a la de las observaciones. c. Para una muestra de 55 clientes, la frecuencia absoluta acumulada de la última clase es mayor a 55. d. El gráfico circular se elabora usando las frecuencias absolutas e. Es posible que el límite superior de la última clase sea menor que el máximo valor. TIC Entero Un decimal Dos decimales 4.051 12.106 35.09 UNA La Molina - Dpto. de Estadística e Informática Estadística General 39 CAPÍTULO III MEDIDAS ESTADÍSTICAS Las medidas estadísticas pueden ser calculadas con los datos provenientes de una población (N: Tamaño de la población) o muestra (n: Tamaño de la muestra) para evaluar diferentes variables (cuantitativas y cualitativas), cuya finalidad es resumir y representar el conjunto de datos. Observaciones Las medidas estadísticas asumen las mismas unidades de medida de la variable en estudio, con la excepción de ciertas medidas estadísticas relativas. Para las variables cuantitativas, se pueden calcular medidas estadísticas como: media, mediana, moda, rango, rango intercuartílico, varianza, desviación estándar, coeficiente de variabilidad, y otras. En el caso de las variables cualitativas, sólo es posible calcular las medidas como la moda y la proporción. Objetivo. Reconocer las características básicas de una distribución de datos a través de las principales medidas de tendencia central, de posición y variabilidad. 3.1 Medidas de tendencia central Son medidas estadísticas que se localizarían en la parte central de la distribución de los datos. Permiten resumir y representar en un sólo valor el conjunto de datos. Las medidas de tendencia central revisadas en este texto son las siguientes: La media aritmética La media ponderada La mediana La moda La media aritmética o Promedio La media aritmética simple o promedio de un conjunto de datos provenientes de una población (N) o muestra (n), es igual al cociente entre la suma total de sus valores y el número de observaciones. Media poblacional: 1 1 N j j X N Media muestral: 1 1 n j j X X n Ejemplo 1 Suponga que se tiene los datos de las ventas semanales (en dólares) de una muestra de 8 vendedores. Calcule la venta promedio semanal. 150 120 300 280 350 250 160 280 Solución La venta promedio semanal por vendedor fue de $ 236.3 3.236 8 890,1 8 280160250350280300120150 8 1 8 1 i ixX ParámetrosXXXNPoblacion EstadìstiValoresXXXnMuestra N n ,...,,:)( cos,...,,:)( 21 21 UNA La Molina - Dpto. de Estadística e Informática Estadística General 40 Ejercicio 1. Los siguientes datos corresponden a una muestra de 12 apicultores sobre su producción
Compartir