Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 UNIVERSIDAD PRIVADA TELESUP 2 UNIVERSIDAD PRIVADA TELESUP L Prefacio: a asignatura es de naturaleza práctico – teórico, orientado a desarrollar en el estudiante habilidades superiores del pensamiento para el razonamiento lógico y creativo, solución de problemas y la toma de decisiones. El curso está orientado a proporcionar al estudiante conocimientos estadísticos fundamentales sobre las técnicas de investigación estadística para recoger, analizar y mostrar información confiable y de calidad necesaria para la toma de decisiones. La asignatura está diseñada para que el alumno al final de cada clase desarrolle casos prácticos en base a datos reales. Comprende cuatro Unidades de Aprendizaje: Unidad I: Introducción, Organización Y Presentación De Datos. Unidad II: Medidas De Tendencia Central Y Medidas De Dispersión. Unidad III: Análisis De Regresión Y Correlación Lineal. Unidad IV: Probabilidades. 3 UNIVERSIDAD PRIVADA TELESUP Estructura de los Contenidos Introducción , Organización y Presentación de Datos Introducción, Concepto, Etapas del Desarrollo de la Estadística. Variables Cualitativas y Cuantitativas. Organización de Datos y Distribución de Frecuencias. Gráficas Estadísticas. Medidas de Tendencia Central y Medidas de Dispersión Medidas de Tendencia Central para datos no Agrupados. Medidas de Tendencia Central para datos Agrupados Medidas de Dispersión. Medidas de Posición. Análisis de Regresión y Correlación Lineal La Recta De Regresión Lineal Simple Por El Método De Mínimos Cuadrados. El Coeficiente de Correlación. El Coeficiente de Determinación. Diagrama De Dispersión. Probabilidades Experimento aleatorio, espacio muestral y suceso Definición de Probabilidad Valor, Eventos Mutuamente Excluyentes y Eventos no Excluyentes Probabilidad Condicional Probabilidad Total, Teorema De Bayes Y Técnicas De Conteo La competencia que el estudiante debe lograr al final de la asignatura es: “Aplicar técnicas estadísticas para la recolección, presentación, análisis e interpretación de datos estadísticos.” Índice del Contenido 4 UNIVERSIDAD PRIVADA TELESUP I. PREFACIO 02 II. DESARROLLO DE LOS CONTENIDOS 03 - 151 UNIDAD DE APRENDIZAJE 1: INTRODUCCIÓN , ORGANIZACIÓN Y PRESENTACIÓN DE DATOS 05-45 1. Introducción a. Presentación y contextualización b. Competencia (logro) c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Introducción, Concepto, Etapas del Desarrollo de la Estadística. b. Tema 02: Variables Cualitativas y Cuantitativas. c. Tema 03: Organización de Datos y Distribución de Frecuencias. d. Tema 04: Gráficas Estadísticas. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen 06 06 06 06 06 06 07-39 07 14 19 28 40 40 41 45 UNIDAD DE APRENDIZAJE 2: MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSION 46-83 1. Introducción a. Presentación y contextualización b. Competencia (logro) c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Medidas de Tendencia Central para datos no Agrupados. b. Tema 02: Medidas de Tendencia Central para datos Agrupados. c. Tema 03: Medidas de Dispersión. d. Tema 04: Medidas de Posición. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen 47 47 47 47 47 47 48-77 48 54 66 73 78 78 79 83 UNIDAD DE APRENDIZAJE 3: ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL 84-114 1. Introducción a. Presentación y contextualización b. Competencia (logro) c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: La Recta De Regresión Lineal Simple Por El Método De Mínimos Cuadrados. b. Tema 02: El Coeficiente de Correlación. c. Tema 03: El Coeficiente de Determinación. d. Tema 04: Diagrama De Dispersión. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen 85 85 85 85 85 85 86-105 86 90 84 95 106 107 108 114 UNIDAD DE APRENDIZAJE 4: PROBABILIDADES 115-148 1. Introducción a. Presentación y contextualización b. Competencia c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Experimento aleatorio, espacio muestral, suceso b. Tema 02: Definición De Probabilidad, Valor, Eventos Mutuamente Excluyentes Y Eventos No Excluyentes c. Tema 03: Probabilidad Condicional. d. Tema 04: Probabilidad Total, Teorema de Bayes y Tecnicas de Conteo. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen 116 116 116 116 116 116 117-143 117 122 127 121 133 144 145 148 III. GLOSARIO 149 IV. FUENTES DE INFORMACIÓN 150 V. SOLUCIONARIO 151 UNIVERSIDAD PRIVADA TELESUP 5 Introducción 6 UNIVERSIDAD PRIVADA TELESUP a)Presentación y contextualización Los temas que se tratan en la presente unidad temática, tiene por finalidad que el estudiante comprenda, las nociones básicas de la estadística, tablas y gráficos estadísticos. Para poder hacer que el alumno pueda usar estos conocimientos en su vida diaria, problemas simples, y dar un enfoque más analítico con respecto a los problemas. b)Competencia Recopila, organiza, sistematiza la información estadística, y representa mediante gráficos estadísticos. c) Capacidades 1. Define y explica la importancia de la estadística y sus etapas. 2. Describe y aplica los diferentes tipos de variables en la estadística descriptiva. 3. Explica las maneras de cómo organizar datos y distribuir frecuencias. 4. Explica la estructura de cada uno de los gráficos usados en la estadística descriptiva. d)Actitudes Toma iniciativa y lidera al equipo en el cumplimiento de las actividades asignadas a su vez promueve actividades y toma de decisiones pertinentes. Planifica y cumple oportunamente sus tareas o actividades diarias y presenta sus trabajos en forma organizada. e) Presentación de Ideas básicas y contenido esenciales de la Unidad: La Unidad de Aprendizaje 01: Introducción, Organización Y Presentación De Datos, comprende el desarrollo de los siguientes temas: TEMA 01: Introducción, Concepto, Etapas del Desarrollo de la Estadística. TEMA 02: Variables Cualitativas y Cuantitativas. TEMA 03: Organización de Datos y Distribución de Frecuencias. TEMA 04: Gráficas Estadísticas. UNIVERSIDAD PRIVADA TELESUP 7 Introducción Concepto Etapas TEMA 1 del Desarrollo de la Estadística Competencia: Definir y explicar la importancia de la estadística y sus etapas. 8 UNIVERSIDAD PRIVADA TELESUP Desarrollo de los Temas Tema 01: Introducción, Concepto, Etapas Del Desarrollo De La Estadística A. Introducción: La palabra "estadística" suele utilizarse bajo dos significados distintos, a saber: 1º Como colección de datos numéricos.- Esto es el significado más vulgar de la palabra estadística. Se sobrentiende que dichos datos numéricoshan de estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación. 2º Como ciencia.- En este significado, La Estadística estudia el comportamiento de los fenómenos de masas. Como todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento. Al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y obtener después la proporción de varones. Es muy frecuente enfrentarnos con fenómenos en los que es muy difícil predecir el resultado; así, no podemos dar una lista, con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo. El objetivo de la estadística como ciencia es recopilar, e interpretar datos que en el futuro servirán para proyectar posibles problemáticas futuras, consiguiendo según estos datos, la solución más viable y rápida. 9 UNIVERSIDAD PRIVADA TELESUP B. Concepto: Es una ciencia aplicada que nos proporciona un conjunto de métodos o técnicas para: Recopilar. Organizar. Presentar Datos. Analizar Datos. ¿Quienes Usan La Estadística? Los métodos estadísticos han encontrado en la actualidad aplicación en el Gobierno, la administración de negocios, las Ciencias Sociales, la Sicología, las Ingenierías, las Ciencias Físicas y Naturales y en muchos otros campos de la actividad intelectual. Algunos ejemplos: En Los Organismos De Gobierno. Los diferentes indicadores económicos, tales como índices de precios al por mayor y al consumidor, las tasas de interés, las fluctuaciones del mercado bursátil y el índice de producción industrial, no solamente describen el estado actual de la economía, sino que proporcionan pistas acerca de sus futuras tendencias. Con el auxilio de tales indicadores, los encargados de las políticas de los distintos organismos serían capaces de tomar decisiones más racionales con respecto a sus operaciones. 10 UNIVERSIDAD PRIVADA TELESUP En La Administración De Negocios. La creciente complejidad de la economía ha provocado un terrible grado de incertidumbre acerca de las operaciones futuras de cualquier empresa de negocios. Más y más compañías están usando el análisis estadístico como herramienta para la toma de decisiones, especialmente en áreas tales como investigación de mercados, predicciones y planeación a largo plazo en lo referente a recursos financieros y humanos. En La Educación Y En La Psicología. La necesidad de analizar e interpretar datos numéricos ha hecho necesario para educadores y para sicólogos tener al menos alguna comprensión básica de los métodos estadísticos. La necesidad del sicólogo de herramientas estadísticas especiales ha llevado al desarrollo de nuevas técnicas estadísticas en las últimas décadas. En las Ciencias Biológicas y en la Medicina. En la agricultura, se utilizan para determinar los efectos de clases de semillas, de insecticidas y de fertilizantes en los campos. Se emplea también para determinar los posibles efectos laterales o la efectividad de las medicinas y para proporcionar mejores métodos para controlar la diseminación de enfermedades contagiosas. En la Sociología, en la Antropología y en las Ciencias del Comportamiento. Las técnicas estadísticas se han aplicado a una amplia variedad de proyectos de investigación que impliquen el estudio de individuos y de grupos. En La Ingeniería. La aplicación de los principios estadísticos al control de calidad ha sido una práctica aceptada durante varias décadas. UNIVERSIDAD PRIVADA TELESUP C. Etapas de Desarrollo de la Estadística La historia de la estadística está resumida en tres grandes etapas o fases: 1.- Los Censos: Desde el momento en que se constituye una autoridad política, la idea de inventariar de una forma más o menos regular la población y las riquezas existentes en el territorio está ligada la conciencia de soberanía y con los primeros esfuerzos administrativos. Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y a las riquezas del país. 2.- De La Descripción A La Aritmética Política: Las ideas mercantilistas entrañan una intensificación de este tipo de investigación. Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población. Vauban, quien hace la primera propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Uno de sus principales exponentes Petty es autor de la famosa Aritmética Política. Chaptal, ministro del interior francés, publica, en 1801, el primer censo general de población y desarrolla estudios industriales, de las producciones y de los cambios, los cuales se hicieron sistemáticos durante las dos terceras partes del siglo XIX. 3.- Estadística Y Cálculo De Probabilidades: El cálculo de probabilidades se incorpora, rápidamente, como un instrumento de análisis extremadamente poderoso para el estudio de los fenómenos económicos y sociales y, en general, para el estudio de fenómenos "cuyas causas son demasiado complejas para conocerlas totalmente y hacer posible su análisis". Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó, en 1760, la palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. 11 UNIVERSIDAD PRIVADA TELESUP 12 de dos tipos: n, se mnos D. Población, Elementos Y Caracteres. Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población. Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo: si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. Las personas o cosas que forman parte de la población se denominan elementos. En sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo. Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres. La población puede ser según su tamaño Población Finita: Cuando el número de elementos que lo forma pueden enumerar, por ejemplo el número de alu de un centro de enseñanza, o grupo clase. UNIVERSIDAD PRIVADA TELESUP 13 Población Infinita: Cuando la cantidad de elementos que la forman no es posible numerarlo. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantosy de tantas calidades que esta población podría considerarse infinita. Muestra: Subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo muestra) que se entienda que es suficientemente representativo. UNIVERSIDAD PRIVADA TELESUP 14 Variables Cualitativas y TEMA 2 Cuantitativas Competencia: Describir y aplicar los diferentes tipos de variables en la estadística descriptiva. UNIVERSIDAD PRIVADA TELESUP 15 1 = muy en desacuerdo 2 = en desacuerdo 3 = indiferente 4 = de acuerdo 5 = muy de acuerdo En variables que exploran el grado de acuerdo o desacuerdo frente a una afirmación los atributos podrían ser: Tema 02: Variables Cualitativas y Cuantitativas Las variables pueden ser clasificadas como cuantitativas (intervalares) o cualitativas (categóricas), dependiendo si los valores presentados tienen o no un orden de magnitud natural (cuantitativas), o simplemente un atributo no sometido a cuantificación (cualitativa). Una variable es medida utilizando una escala de medición. La elección de la(s) escala(s) de medición a utilizar depende, en primer lugar, del tipo de variable en estudio, y, además, del manejo estadístico a la que se someterá la información. En términos prácticos, existe una correspondencia directa entre el concepto de variable y escala de medición. Un atributo corresponde a un valor específico de una variable, como es el caso de la variable sexo, la que posee dos atributos: varón o mujer. UNIVERSIDAD PRIVADA TELESUP 16 Dependiendo de los valores que puede tener una variable cualitativa, ésta puede a su vez ser dicotómicas (cuando sólo pueden adoptar un sólo valor sin jerarquía entre sí; hombre - mujer, positivo-negativo, presente-ausente), o bien, poli o multicotómicas, si existe la posibilidad de que adopten múltiples valores (edad, talla, nivel socioeconómico, grupos sanguíneos, calificación previsional de usuarios). 1. Las escalas de medición de una variable cualitativa son: Nominal.- Nominal, En este nivel de medición se establecen categorías distintivas que no implican un orden especifico. Ejemplo: Nombres de personas, de establecimientos, raza, grupos sanguíneos, estado civil. Estas variables no tienen ningún orden inherente a ellas ni un orden de jerarquía. Ordinal.- Cuando se establecen categorías con dos o mas niveles que implican un orden inherente entre sí. Ejemplo: Grados de desnutrición, respuesta a un tratamiento, nivel socioeconómico, intensidad de consumo de alcohol, días de la semana, meses del año. A pesar de este orden jerárquico no es posible obtener valoración numérica lógica entre dos valores. 1. Las variables de tipo cuantitativo pueden a su vez ser clasificadas como continuas o discretas. Las escalas cuantitativas son reconocidas también como escalas intervalares o numéricas. Continua.- Cuando entre dos valores determinados existen infinitas posibilidades de valores. Ejemplo: El peso, la talla, la presión arterial o el nivel de colesterol sérico. UNIVERSIDAD PRIVADA TELESUP 17 Discreta.- Cuando la variable a medir sólo puede adoptar un sólo valor numérico, entero, con valores intermedios que carecen de sentido Ejemplo: El número de hijos, de unidades vecinales del sector, número de exámenes de laboratorio o de pacientes atendidos. En la práctica, salvo contadas excepciones no se dispone de métodos de medición sofisticados como para poder medir exactamente los valores. Tanto las variables discretas como las continuas pueden agruparse construyendo intervalos, entre cuyos valores extremos se ubicarán las diferentes observaciones registradas. Sin embargo, estrictamente hablando, sólo las variables continuas pueden ser objeto de categorización mediante intervalos. Clasificación de Variables Continuas Cuantitativas (intervalares) Discretas Ej. Presión arterial, peso, edad, talla, IMC (Índice de Masa Corporal) Ej. Número de hijos, episodios de infección urinaria Categóricas (cualitativas) Dicotómicas Ej. Sexo masculino y femenino; vivo/muerto. Politómicas Ej. Grupo sanguíneo, raza, estado civil, grado de instrucción UNIVERSIDAD PRIVADA TELESUP 18 (por ción ejemplo: NOTA: Las variables también se pueden clasificar en: Variables unidimensionales: Sólo recogen información sobre una característica ejemplo: edad de los alumnos de una clase). Variables Bidimensionales: Recogen información sobre dos características de la pobla (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: Recogen información sobre tres o más características (por edad, altura y peso de los alumnos de una clase). Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El nivel de estudios, etc. No ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc. UNIVERSIDAD PRIVADA TELESUP 19 Organización de Datos y Distribuciónde TEMA 3 Frecuencias Competencia: Explicar las maneras de cómo organizar datos y distribuir frecuencias. UNIVERSIDAD PRIVADA TELESUP 20 Cuando se han recopilado datos mediante un muestreo o un censo, la primera inquietud que aparece es sobre la manera en la que se puede realizar un análisis descriptivo apropiado con la información recolectada de manera que resulte sencillo entender lo que ocurre en la población de la que se han captado las observaciones. En este tema se proprocionan algunos procedimientos para la tabulación de datos que conducen a la formación de cuadros Tema 03: Organización De Datos Y Distribución De Frecuencias Organización de los Datos Obtenidos de una Muestra o tablas de frecuencias. Organización De Los Datos Cualitativos Antes de iniciar el trabajo de organización de datos cualitativos, es necesario determinar si éstos corresponden a variables cualitativas nominales u ordinales. Si los datos son cualitativos nominales, se formar categorías que pueden ser presentadas en cualquier orden: por ejemplo los colores de preferencia de las personas. Si los datos son ordinales, entonces deben estar asociados a algún orden en su presentación. Una vez definido el tipo de variable, se obtiene mediante un proceso de conteo las frecuencias absolutas (número de veces que se repite cada respuesta), luego las frecuencias relativas (división de cada frecuencia absoluta entre el tamaño de muestra) y/o los porcentajes de cada respuesta (cada frecuencia relativa multiplicada por 100). También se puede encontrar las frecuencias absolutas acumuladas (Fi) UNIVERSIDAD PRIVADA TELESUP 21 a absolutaa re e número l (n). a l f Frecuencia relativa (hi).- Es la proporción del total de observaciones que caen dentro de cada modalidad o valor. Se obtiene dividiendo la frecuenci (fi) de la modalidad ent total de observaciones Frecuencia acumulada (Fi).- Para cada clase, valor o modalidad, la frecuencia acumulada equivale la frecuencia absoluta (fi) de la fila sumada a la frecuencia cumulada de la fila anterior. Para a primera fila, la frecuencia cumulada equivale simplemente a a frecuencia absoluta de la misma ila. Ejemplo 1. Una revista conocida efectuó una encuesta respecto a lo adecuado de la protección policial en la ciudad. Se seleccionó un total de 419 personas. Las respuestas se presentan en la siguiente tabla de frecuencias: Respuesta Frecuencia Frecuencia Porcentaje absoluta relativa Si 293 0.6993 69.93 No 80 0.1909 19.09 No sabe/ 46 0.1098 10.98 no responde 419 1 100 Ejemplo 2. Se ha efectuado una encuesta a 200 madres solteras entre 15 y 25 años de la ciudad de Piura. Los valores se agrupan en: primaria completa, secundaria completa y educación superior completa. El resultado del conteo se presenta en la siguiente tabla: 22 rcentaje 125 0.625 62.5 70 0.35 35 5 0.025 2.5 200 1 100 absoluta relativa 0 2 0.013 1.3 1 15 0.100 10.0 2 40 0.267 26.7 3 55 0.367 36.7 4 38 0.253 25.3 TOTAL 150 1 100 UNIVERSIDAD PRIVADA TELESUP Modalidad Frecuencia absoluta Frecuencia Po relativa Primaria completa Secundaria completa Educac.superior completa Organización De Datos Cuantitativos Discretos Cuando se tienen datos cuantitativos discretos cuyo número de resultados posibles no es grande, la información puede ser clasificada y presentada directamente sin pérdida de la identidad de la misma. En estos casos, primero se ordenan los posibles valores de la variable según su magnitud, y a continuación se obtienen, mediante un proceso de conteo, las frecuencias absolutas asociadas a cada uno de dichos valores; las frecuencias relativas y porcentuales se obtienen de manera similar a lo descrito para las variables cualitativas. Ejemplo. Consideremos la variable número de hijos y tomemos las observaciones de una muestra de 150 familias de zonas marginales de Lima Metropolitana. Los valores obtenidos se pueden agrupar en diferentes valores: 0 hijos, 1 hijo, 2 hijos, 3 hijos o 4 hijos. Para hacer un arreglo de estas observaciones, usaremos una tabla como la siguiente: Número de hijos Frecuencia Frecuencia Porcentaje 23 UNIVERSIDAD PRIVADA TELESUP Organización De Datos Cuantitativos Continuos Cuando se tiene información para una variable cuantitativa continua, las observaciones son usualmente diferentes entre sí, lo cual hace que la evaluación descriptiva a través de los valores individuales sea compleja. Para simplificar el análisis, los datos son clasificados de acuerdo con ciertos rangos llamados intervalos de clase. Ejemplo. Tomamos una muestra de 100 niños de 10 años de edad para estudiar su estatura. Entonces la variable estatura que es cuantitativa continúa se puede presentar en una tabla del siguiente tipo: INTERVALOS DE CLASE FRECUENCIA(fi) [1.0mt.- 1.15mt] [1.15mt. - 1.30mt] [1.30mt.- 1.45mt] [1.45mt.- 1.60mt] 3 39 55 3 TOTAL 100 A la organización de las observaciones de una muestra en una tabla para expresar la frecuencia de cada una de sus modalidades o valores se le conoce como distribución de frecuencias. En las distribuciones de frecuencia de las variables cuantitativas continuas, también se acostumbra colocar otras columnas además de la frecuencia absoluta (fi), estas nos permitirán tener una mayor información sobre los datos y nos facilitarán los cálculos de las medidas descriptivas o estadísticos de la muestra. Estas son la frecuencia relativa (hi), la frecuencia acumulada (Fi y Hi). 24 UNIVERSIDAD PRIVADA TELESUP La organización de los datos para el caso en que la variable estadística usada tenga muchos valores implica e arreglo de las observaciones en intervalos de clases. El proceso para hallar los intervalos de clase es el siguiente: Debemos hallar, en primer lugar, en la muestra, el menor valor observado y el mayor valor observado. El número de intervalos no deberá ser tan pequeño (menor que 5) o tan grande (mayor de 15) que la verdadera naturaleza de la distribución sea imposible de visualizar. La longitud del intervalo de clase deberá ser siempre la misma. Si la longitud de cada intervalo no fuera exacta, se puede tomar por exceso asegurándonos de este modo que la reunión de todos los intervalos cubrirá a todos los valores observados. Para construir los intervalos se usa los intervalos cerrados a la izquierda y abiertos a la derecha: [LIi, LSi[, donde LIi,es el límite inferior del intervalo y LSi, es su límite superior. ¿Cómo decidimos cuántos intervalos de clase tomar? Existen varias reglas que se basan en el tamaño de nuestra población o muestra. Una de las reglas más usadas es la Regla de Sturges, regla empírica que funciona bastante bien para grupos de 30 a 300 observaciones. Esta regla nos dice que el número de intervalos de clase para una muestra de tamaño n será k si este resulta un número entero o el siguiente número entero a k, si k resulta un número decimal. La ecuación para hallar k es: k = 1 + 3.3 * log n, donde n es el tamaño de la muestra. UNIVERSIDAD PRIVADA TELESUP s un La marca de clase (xi), definida como el punto medio del intervalo de clase, deberá tener de preferencia el mismo número de decimales que los valores observados. La marca de clase puede considerarse que e representante de los datos que caen en el intervalo . Xi = 𝑳𝑰𝒊 + 𝑳𝑺𝒊 � Ejemplo 1. Suponga que los datos que se presentan a continuación corresponden a los valores de la inflación anual durante el año 2008 de un total de 20 ciudades de una región del país. Construir la distribución de frecuencias 8.2 12.8 10.5 9.3 12.7 10.2 9.1 10.7 8.2 12.8 8.5 11.6 8.4 10.1 10.2 13.1 9.8 12.1 13.6 11.7 Solución 1. R = 13.6 – 8.2 = 5.4 2. K = 1 + 3.3 log20 = 1 + 3.3 (1.30.10) = 1 + 4.29 = 5.29 = 5 (redondeo por aproximación) 3. C = R/k = 5.4 / 5 = 1.08 = 1.1 (redondeo por exceso; los datos tienen un decimal) 4. Los límites de los intervalos se obtienen del siguiente modo: LI1 = 8.2 LS1 = LI2 = 9.3 LI2 = LI1 + c = 8.2 + 1.1= 9.3 LS2 = LI3 = 10.4 LI3 = LI2 + c = 9.3 + 1.1 = 10.4 LS3 = LI4 = 11.5 LI4 = LI3 + c = 10.4 + 1.1 = 11.5 LS4 = LI5 = 12.6 LI5 = LI4 + c = 11.5 + 1.1 = 12.6 LS5 = LS4 + c = 12.6 + 1.1 = 13.7 5. Las marcas de clase se calculan de la siguiente manera: X1 = �. �+ �. � = �. ��; �� = �. �+ ��. � = �. �� y así sucesivamente � � 6. Para determinar las frecuencias absolutas se procede como sigue: Se toma la primera observación 8.2 y se busca el intervalo de clase que pertenece, es el 8.2 – 9.3, luego se asigna una tarja en la intersección de la columna de conteo y la fila de ese intervalo. Se toma ahora la otra observación 12.8, la cual perteneceal intervalo 12.6 – 13.7, entonces se asigna una tarja en la intersección de la fila de este nuevo intervalo y la columna de conteo. Así sucesivamente hasta agotar la última observación. Sumando las tarjas se obtiene la frecuencia absoluta de cada clase. 7. Para obtener las frecuencias acumuladas se procede de la siguiente forma: F1 = f1 = 5 F2 = F1 + f2 = 5 + 5 = 10 25 UNIVERSIDAD PRIVADA TELESUP ncia 20 20 20 20 20 Con los resultados anteriores se obtiene el siguiente cuadro de distribución de frecuencias Intervalos Marca de Tarjas Frecuencia Frecuencia Frecue de clase clase Xi absoluta acumulada relativa fi Fi hi 8.2 ; 9.3 8.75 ///// 5 5 5/ 9.3 ; 10.4 9.85 ///// 5 10 5/ 10.4 ; 11.5 10.95 // 2 12 2/ 11.5 ; 12.6 12.05 /// 3 15 3/ 12.6 ; 13.7 13.15 ///// 5 20 5/ 20 1 Ejemplo 2. A continuación, se presenta una lista ya ordenada de las observaciones hechas sobre el ingreso de las personas. 53 57 58 61 61 63 64 66 67 68 69 70 71 72 73 74 74 74 74 77 77 77 78 78 79 79 79 81 81 81 82 82 83 83 84 85 85 86 87 87 88 90 90 90 90 92 93 94 96 97 Para estos ingresos, el menor valor de la muestra es 53 dólares y el mayor valor de la muestra es 97 dólares. Luego, el rango de estos valores es: 97 - 53 = 44 dólares Al aplicar la regla de Sturges con n= 50, tendremos: k= 1 + 3.3*(1.69897) = 6.6, lo que equivale a tomar 7 intervalos s) El tamaño o amplitud de cada intervalo de clase se determina así: c=R /K= 44 / 7 = 6.29 = 7. (redondeo por exceso, al entero superior, considerando que los datos son entero. Si los datos tienen decimales el proceso es el mismo). 26 UNIVERSIDAD PRIVADA TELESUP 27 Siguiendo el mismo proceso utilizado para el ejemplo 1, se tiene la tabla de distribución de frecuencias: INTERV ALOS xi fi hi Fi [ 5 3 ; 60 ] 56.5 3 3/ 50 3 [ 6 0 ; 67] 63.5 5 5/ 50 8 [67 ; 74] 70.5 7 7/50 15 [ 7 4 ; 81] 77.5 12 12 / 50 27 [81 ; 88] 84.5 13 13/ 50 40 [88 ; 95] 91.5 10 10 / 50 50 TOTAL 50 1 UNIVERSIDAD PRIVADA TELESUP 28 7 Gráficas TEMA 4 Estadísticas Competencia: Explicar la estructura de cada uno de los gráficos usados en la estadística descriptiva. UNIVERSIDAD PRIVADA TELESUP 29 Tema 04: Gráficas Estadísticas Presentación De Los Datos Obtenidos De Una Muestra Una vez realizada la organización de los datos observados, es necesario presentar estos de forma gráfica forma visual permitirá resaltar algunos hechos que muestran los datos. Se verán diversos tipos de gráficos catalogados según el tipo de variable a presentarse. a)Gráfica De Barras Para Una Variable Cualitativa Para una variable cualitativa, ya sea nominal u ordinal, la presentación de la información obtenida organizada en una distribución de frecuencias puede ser presentada mediante dos gráficos: gráfico de barras y gráfico de sectores. En este tipo de presentación, cada barra rectangular corresponde a una modalidad. Todas las barras tienen base de igual longitud y altura proporcional a la frecuencia (fi) o frecuencia relativa (hi) que presen modalidad. Tomemos la distribución de frecuencias de la variable grado de instrucción, obtenida de una muestra de 150 mujeres. Se considerará que cada mujer pertenece al mayor grado de instrucción que ha concluido. MODALIDAD fi hi Pi Primaria Completa 60 0,40 40% Secundaria Completa 55 0,37 37% Superior Completa 35 0,23 23% 150 UNIVERSIDAD PRIVADA TELESUP 30 N Ú M ER O D E M U JE R ES 60 70 GRÁFICA DE BARRAS 50 40 30 Primaria Completa 20 Secundaria Completa 10 Superior Completa 0 Primaria Completa Secundaria Completa Superior Completa GRADO DE INSTRUCCIÓN También es posible realizar GRÁFICAS DE BARRAS HORIZONTALES, los cuales se parecen mucho a las gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambia y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la población de un país ficticio llamado "Perulandia": A este tipo de gráficos en particular se le llama pirámide de edades por su forma. Incluso, cuando se compara la población masculina y femenina por estratos de edades, se estila utilizar el lado izquierdo para la población de un sexo y el lado derecho para el otro, el resultado es una "pirámide" casi simétrica (dependerá de la población en particular). UNIVERSIDAD PRIVADA TELESUP 31 b)Gráfica De Sectores Otra forma de presentar la información de una variable cualitativa es utilizando una gráfica de sectores (también denominada gráfica tipo "pie" o "pastel"). La gráfica de sectores es un círculo dividido en varios sectores proporcionales en tamaño a las frecuencias relativas (hi) de las diferentes modalidades. En el caso anterior de la distribución de frecuencias, tendremos: Primaria completa 40% de 360 grados = 144 grados Secundaria completa 37% de 360 grados = 133.2 grados Superior completa 23% de 360 grados = 82.8 grados MODALIDAD fi hi Pi Primaria Completa 60 0,40 40% Secundaria Completa 55 0,37 37% Superior Completa 35 0,23 23% 150 23% 40% Primaria Completa Secundaria Completa Superior Completa 37% UNIVERSIDAD PRIVADA TELESUP 32 c) Gráfico De Bastones Para una variable cuantitativa discreta (con pocos valores) es posible usar los gráficos de barras. Pero existe otro gráfico, diseñado para este tipo de variables y es la GRÁFICA DE BASTONES. En esta gráfica, la frecuencia del valor de la variable es representada por un segmento de recta en vez de una barra. Tomemos la variable número de hijos, los posibles valores de esta variable son 0 hijos, 1 hijo, 2 hijos, 3 hijos ó 4 hijos. Luego, para una muestra de 100 datos tendremos la distribución de frecuencias: VALOR fi Hi 0 Hijos 7 7 / 1 0 0 = 0 . 0 7 1 Hijo 15 15 ./ 100 = 0.15 2 Hijos 40 40 / 100 = 0.40 3 Hijos 25 25 / 100 = 0.25 4 Hijos 13 13 / 100 = 0.13 TOTAL 100 1.00 UNIVERSIDAD PRIVADA TELESUP 33 In [ 5 [ 5 [ 6 [ 6 [ 7 [ 7 [ 8 [ 8 d)Histograma Para Una Variable Cuantitativa Discreta (Con Muchos Valores) O Continua existe una gráfica equivalente a la gráfica de barras, se denomina histograma. Esta forma de presentación también consiste en graficar barras, pero, a diferencia de la gráfica de barras, aquí las barras están pegadas unas a otras. Cada barra corresponde a un intervalo de clase y se acostumbra a colocar el valor inicial y final de cada intervalo o la marca de clase para identificar cada barra. La alturade cada barra puede ser proporcional a la frecuencia (fi) o la frecuencia relativa (hi) del intervalo. tervalos Xi fi Fi hi Pi 2,5 ; 57,5 ] 55 2 2 0,04 4% 7,5 ; 62,5 ] 60 3 5 0,06 6% 2,5 ; 67,5 ] 65 4 9 0,08 8% 7,5 ; 72,5 ] 70 5 14 0,10 10% 2,5 ; 77,5 ] 75 8 22 0,16 16% 7,5 ; 82,5 ] 80 10 32 0,20 20% 2,5 ; 87,5 ] 85 8 40 0,16 16% 7,5 ; 92,5 ] 90 6 46 0,12 12% [ 92,5 ; 97,5 ] 95 4 50 0,08 8% Total 50 1,00 100% UNIVERSIDAD PRIVADA TELESUP 34 FR EC U EN C IA S HISTOGRAMA 12 10 8 6 4 2 0 60 65 55 70 75 80 85 90 95 MARCAS DE CLASE e) Polígono De Frecuencias Uniendo los puntos medios de los lados superiores de cada barra rectangular del histograma se obtiene un gráfico llamado polígono de frecuencias. El conocimiento del polígono de frecuencias ayudará más adelante en la búsqueda del modelo teórico que mejor describa a los elementos de la población de acuerdo con la variable que se estudia. Polígono De Frecuencias (Línea Negra) UNIVERSIDAD PRIVADA TELESUP 35 Otro Ejemplo De Polígono De Frecuencias (Línea Negra) f) Ojiva Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayores que y las ojivas menores que. Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por esto la aplicación de la técnica es parcial): Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que, es la frontera menor; para la ojiva menor que, la frontera mayor. La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las 4:00 horas). http://www.uaq.mx/matematicas/estadisticas/xu3.html#poligono_frec http://www.uaq.mx/matematicas/estadisticas/xu3.html#dist_acum UNIVERSIDAD PRIVADA TELESUP 36 De forma análoga, en la ojiva menor que, la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera). Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que se acaba de usar, pero con una distribución porcentual: g)Gráfica De Áreas En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una llamada gráfica de áreas, la cual consiste en rellenas el área que se encuentre debajo de las líneas que resultan de una gráfica de líneas. El ejemplo que se presenta es la comparación del total de las especies de las familias del orden Carnívora y las que están amenazadas, en México, (fuente: Revista "Ciencia y Desarrollo"). http://www.uaq.mx/matematicas/estadisticas/xu3.html#dist_acum_p http://www.uaq.mx/matematicas/estadisticas/xu3.html#series http://www.uaq.mx/matematicas/estadisticas/g_lineas UNIVERSIDAD PRIVADA TELESUP 37 Actualmente, y mucho en los medios masivos de comunicación, se utilizan gráficos para ilustrar los datos o los resultados de alguna investigación. Regularmente se utilizan dibujos para representar dicha información, y el tamaño o el número de estos dibujos dentro de una gráfica queda determinado por la frecuencia correspondiente. A este tipo de gráfica se le llama pictograma y éstos son dos ejemplos: h)Gráfica De Dispersión Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una gráfica de dispersión. http://www.uaq.mx/matematicas/estadisticas/xu7.html#dispersion http://www.uaq.mx/matematicas/estadisticas/xu7.html#correlacion 38 UNIVERSIDAD PRIVADA TELESUP Por ejemplo, el ejemplo de la izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX (114):12): La gráfica de la derecha es resultado de comparar el diámetro (en miles de kilómetros) de los planetas interiores de nuestro sistema solar contra sus densidades (en gramos por centímetro cúbico). Es interesante observar que los puntos parecen "seguir" una línea imaginaria que se asemeja a una recta, con excepción de un caso atípico: Mercurio. Uno de los usos de este tipo de gráficas es precisamente encontrar si las observaciones siguen algún patrón lineal (una línea de tendencia) o si existen valores atípicos. Para el caso del Excel, el programa es capaz de graficar las líneas de tendencias que siguen un conjunto de datos. http://www.uaq.mx/matematicas/estadisticas/???#linea_tendencia http://www.uaq.mx/matematicas/estadisticas/xconst.html#disp_xl http://www.uaq.mx/matematicas/estadisticas/xconst.html#disp_xl http://www.uaq.mx/matematicas/estadisticas/xconst.html#disp_xl http://www.uaq.mx/matematicas/estadisticas/xconst.html#disp_xl http://www.uaq.mx/matematicas/estadisticas/xconst.html#disp_xl 39 UNIVERSIDAD PRIVADA TELESUP i) Gráfica De Burbujas Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas, en las cuales se presenta la dispersión de las observaciones de la misma forma que aquéllas, pero se le añade la posibilidad de visualizar otra variable representada en el tamaño del punto, pues éstos se convierten en círculos (burbujas) con radios proporcionales a las magnitudes que representan. Este ejemplo compara la distancia que existe entre cada uno de los planetas interiores de nuestro sistema solar con respecto al Sol, contra el tiempo que necesitan para recorrer sus órbitas, y el tamaño de las burbujas que indica la masa de cada planeta. Además existen otros tipos de gráficos, cada uno con características particulares que les proporcionan cierta intencionalidad para su uso, como son las gráficas de radar y las gráficas polares. http://www.uaq.mx/matematicas/estadisticas/xu3.html#g_dispersion 40 UNIVERSIDAD PRIVADA TELESUP Lecturas Recomendadas INTRODUCCIÓN, CONCEPTO, ETAPAS DEL DESARROLLO DE LA ESTADÍSTICA. http://www.monografias.com/trabajos15/estadistica/estadistica.shtml ORGANIZACIÓN DE DATOS Y DISTRIBUCIÓN DE FRECUENCIAS http://www.vitutor.net/2/11/distribucion_frecuencias.html Actividades y Ejercicios Ingresa al link presentación de datos, lee atentamente las indicaciones, desarrolla los ejercicios y envíalo por el mismo medio. 1. De los siguientes valores: Ford Toyota Nissan Hyundai Hyundai Ford Nissan Ford Hyundai Nissan Hyundai Toyota Hyundai Nissan Toyota Ford Toyota Hyundai Ford Hyundai a. Hallar la frecuencia absolutay relacional. b. Hallar la frecuencia acumulada absoluta y relacional. c. Realizar un grafico de barras. d. Dibujar un diagrama circular. 2. Suponga que en estudio socioeconómico se observó, entre otras variables, el número de trabajadores eventuales que tienen las empresas comerciales de una región de la ciudad de Trujillo. Mediante una muestra de 30 empresas se encontraron los siguientes resultados. 4 10 5 8 10 6 10 7 8 6 9 7 9 6 8 8 6 7 10 8 7 8 9 7 5 9 4 7 8 6 Construir el cuadro de distribución de frecuencias . 3. Suponga que se ha llevado a cabo una encuesta a 28 personas elegidas al azar para analizar su opinión sobre la calidad de una nueva conserva que se desea introducir en el mercado. Los resultados observados fueron los sigui entes: Bueno Malo Bueno Excelente Regular Bueno Regular Regular Regular Excelente Excelente Bueno Excelente Bueno Bueno Excelente Bueno Malo Bueno Bueno Malo Bueno Excelente Bueno Bueno Excelente Bueno Excelente Construir el cuadro de distribución de frecuencias . http://www.monografias.com/trabajos15/estadistica/estadistica.shtml http://www.vitutor.net/2/11/distribucion_frecuencias.html 41 UNIVERSIDAD PRIVADA TELESUP Autoevaluación 1. Clasifique las variables referidas a la población de electores del Perú. Preferencia electoral. Edad del elector. Estado socio económico del elector. Número de integrantes en la familia del elector. Sexo del elector. Grado de instrucción del elector. Ingresos mensuales del elector. a) 4 Cualitativas y 3 Cuantitativas b) 3 Cualitativas y 4 Cuantitativas c) 2 Cualitativas y 5 Cuantitativas d) 5 Cualitativas y 2 Cuantitativas e) 1 Cualitativas y 6 Cuantitativas 2. El objetivo principal de la estadística descriptiva es: a) Describir una población. b) Hallar las regularidades que se encuentran en los fenómenos de masa. c) Inferir algo acerca de la población. d) Calcular un promedio. e) Hallar el promedio de acuerdo a la cantidad. 3. ¿Cuáles de las siguientes afirmaciones es cierto respecto a una muestra? a) Es parte de una población. b) Debe contener al menos cinco observaciones. c) Se refiere a estadística descriptiva. d) Se refiere a una variable no contable. e) Contiene dentro a la población. 4. Una variable cualitativa. a) Siempre se refiere a una cualidad. b) Es no numérica. 42 UNIVERSIDAD PRIVADA TELESUP c) Siempre tiene sólo dos resultados posibles. d) Todas las anteriores son correctas. e) Es numérica. 5. Una variable en escala nominal. a) Casi siempre es el resultado de contar algo. b) Tiene un punto cero significativo. c) Puede adquirir valores negativos. d) No puede tener más de dos categorías. e) Sólo sirve para nombrar su característica 6. En una empresa, se hizo el estudio sobre las edades de los empleados y se obtuvo la siguiente tabla: EDADES Nº DE EMPLEADOS [20 – 25] 12 [25 – 30] 15 [30 – 35] 23 [35 – 40] 11 [40 - 45] 9 Total: 70 Donde A es el porcentaje de empleados con 30 años ó más. B es el porcentaje de empleados entre 40 y 45 años. Señale A - B (aprox.) a) 65% b) 60% c) 63% d) 64% e) 62% 7. La tabla muestra la distribución del ingreso familiar correspondiente a 80 familias. fi: frecuencia absoluta simple Fi: frecuencia absoluta acumulada 43 UNIVERSIDAD PRIVADA TELESUP Marca de Clase Frecuencias Relativas 45 K/50 55 3k/100 65 2k/25 75 3k/50 85 K/100 hi: frecuencia relativa simple en tanto por uno Intervalo de Ingreso S/. fi Fi hi [160 - 170] 12 12 [170 – 180] 48 60 [180 – 190] 0,125 [190 – 200] 0,075 [200 – 210] Determine el número de familias que ganan menos de 200 nuevos soles. a) 66 b) 70 c) 54 d) 76 e) 50 8. En una prueba de aptitud académica se evaluaron a “n” estudiantes y las notas obtenidas se clasificaron en una tabla de distribución de frecuencias como se muestra a continuación. ¿Qué porcentaje de estudiantes obtuvieron una nota menor que 65 puntos o igual que 85 puntos? a) 30% b) 40% c) 50% d) 60% e) 70% UNIVERSIDAD PRIVADA TELESUP ) 9. ¿Cuál de los siguientes diagramas es un histograma? a) b) c) d) e 10. ¿Cuál de los siguientes diagramas es una ojiva? a) b) c) d) e) 44 45 UNIVERSIDAD PRIVADA TELESUP Resumen UUNNIIDDAADD DDEE AAPPRREENNDDIIZZAAJJEE II:: La estadística es un auxiliar de muchas ciencias con base matemática referente a la recolección, análisis e interpretación de datos, ya sea para ayudar en la resolución de la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno, de ocurrencia en forma aleatoria o condicional. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio. Clasificación de Variables: Cualitativos: Arrojan respuestas categóricas, miden cualidades y se les puede asignar después un valor numérico (codificarlas). Cuantitativos: Producen respuestas numéricas, miden cantidades y podemos tratar un dato cuantitativo como cualitativo (categorizando). Los datos recopilados en la muestra se pueden organizar en Tablas de Frecuencias. Estas tablas muestran: Frecuencia absoluta (fi): Resulta de contar el número de observaciones que "entran" en una clase Frecuencia Relativa (hi): Es la proporción de observaciones que "entran" en una clase Frecuencia Absoluta Acumulada (Fi): Es el número de observaciones acumuladas. Frecuencia Relativa Acumulada (Hi): es la proporción de observaciones acumuladas Las más importantes gráficas: Sector.- Consiste en dividir un círculo en tantos sectores como valores de la variable. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente. Histograma.- Es un caso particular del diagrama anterior en el caso de variables continuas. Si los intervalos son correlativos, los rectángulos aparecen pegados en la representación gráfica. Barras.- Consiste en dos ejes perpendiculares y una barra o rectángulo para cada valor de la variable. Se suele colocar en el eje horizontal los valores de la variable. http://es.wikipedia.org/wiki/Aleatoria http://es.wikipedia.org/wiki/Condicional http://es.wikipedia.org/wiki/Negocios http://es.wikipedia.org/wiki/Gobierno UNIVERSIDAD PRIVADA TELESUP 46 47 UNIVERSIDAD PRIVADA TELESUP Introducción a)aaa a) Presentación y contextualización Los temas que se tratan en la presente unidad, tiene por finalidad que el estudiante comprenda las Medidas De Tendencia Central y Medidas de Dispersión así como formular apreciaciones críticas sobre los diversos conceptos desarrollados. Conocer además las diferentes medidas para datos agrupados y no agrupados; esto se puede utilizar para organizar datos y resolverlas interrogantes. b) Competencia Utiliza las medidas estadísticas adecuadamente para comprender mejor el comportamiento de los datos agrupados y no agrupados. c) Capacidades 1 .Explica y compara los resultados obtenidos en base a las Medidas de Tendencia Central para datos no Agrupados. 2. Describe y analiza las Medidas de Tendencia Central para datos Agrupados. 3. Calcula y grafica la estructura de las Medidas de Dispersión. 4. Define, analiza y grafica las medidas de posición. d) Actitudes Toma iniciativa y lidera al equipo en el cumplimiento de las actividades asignadas a su vez promueve actividades y toma de decisiones pertinentes. Cumple con los horarios establecidos, respeta y cumple las normas de convivencia en el ámbito superior universitario. Planifica y cumple oportunamente sus tareas o actividades diarias y presenta sus trabajos en forma organizada. e) Presentación de Ideas básicas y contenido esenciales de la Unidad: La Unidad de Aprendizaje 2: Medidas De Tendencia Central y Medidas de Dispersión, comprende el desarrollo de los siguientes temas: TEMA 01: Medidas de tendencia central para datos no agrupados. TEMA 02: Medidas de tendencia central para datos agrupados. TEMA 03: Medidas de dispersión. TEMA 04: Medidas de posición. UNIVERSIDAD PRIVADA TELESUP 48 Medidas de Tendencia Central TEMA 1 Para Datos No agrupados Competencia: Explicar y comparar los resultados obtenidos en base a las Medidas de Tendencia Central para datos no Agrupados. 49 UNIVERSIDAD PRIVADA TELESUP Desarrollo de los Temas Tema 01: Medidas de Tendencia Central Para Datos No Agrupados Las medidas de tendencia central: Son indicadores estadísticos que muestran hacia que valor (o valores) se agrupan los datos. Esta primera parte la dedicaremos a analizar tres medidas de tendencia central: La media aritmética La moda La mediana Media aritmética (µ o X): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos. Hay que entender que existen dos formas distintas de Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como muestrales: sin agruparlos o agrupándolos en tablas de frecuencias. Esta apreciación nos sugiere dos formas de representar la media aritmética. 50 UNIVERSIDAD PRIVADA TELESUP Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los alumnos de la clase. El promedio de las 10 notas es de 3,47. Media Aritmética para Datos No Agrupados Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muestrales: Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica el tamaño de la población, mientras que n el de la muestra). Ejemplo El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3,2 3,1 2,4 4,0 3,5 3,0 3,5 3,8 4,2 4,0 ¿Cuál es el promedio de notas de los alumnos de la clase? Solución Aplicando la fórmula tenemos: 51 UNIVERSIDAD PRIVADA TELESUP a. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmétic En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que la media aritmética es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atípica comparada con las demás, que están ubicadas entre 3,0 y 4,2. Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales. La definición de geométrica se refiere al punto que divide en dos partes a un segmento. Por ejemplo, la mediana del segmento AB es el punto C. Ejemplo: (cantidad de datos impar) Encontrar la mediana para los siguientes datos: 4, 1, 2, 3, 4, 2, 2, 1, 5, 5, 3 Solución PASO 1: Ordenar los datos. 1 1 2 2 2 3 3 4 4 5 5 PASO 2: Localizar el valor que divide en dos el número de datos. La mediana es 3, dejando 5 datos a cada lado. Me = 3 52 UNIVERSIDAD PRIVADA TELESUP SOLUCIÓN dato. Encontrar la mediana: de datos. Ejemplo: (cantidad de datos par) Modifiquemos el ejemplo anterior, eliminando el último 4 1 2 3 4 2 2 1 5 5 Solución PASO 1: Ordenar los datos. 1 1 2 2 2 3 4 4 5 5 PASO 2: Localizar el valor que divide en dos el número El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la mediana será Me = �+ � = 2,5. � Moda (Mo): indica el valor que más se repite, o la clase que posee mayor frecuencia. En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal. Ejemplo: Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más consume a la semana: Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3 53 UNIVERSIDAD PRIVADA TELESUP SOLUCIÓN PASO 1: Determinar las frecuencias de cada valor de la variable. La marca 1 se repite 15 veces La marca 2 se repite 6 veces La marca 3 se repite 9 veces PASO 2: La moda representa el valor que más se se repite. Mo = Marca 1 UNIVERSIDAD PRIVADA TELESUP 54 Medidas De Tendencia Central Para Datos TEMA 2 Agrupados Competencia: Describir, analizar y las Medidas de Tendencia Central para datos Agrupados. UNIVERSIDAD PRIVADA TELESUP 55 s Tema 02: Medidas de Tendencia Central para Datos Agrupados Cuando los datos se agrupan en tablas, la media aritmética es igual a la división de la sumatoria del producto de las clases por la frecuencia sobre el número de datos. Media Aritmética para Datos Agrupado La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el último (Nc), siendo Xi la clase del intervalo i. Cuando los datos se agrupan en tablas de frecuencias, el cálculo de la media varía un poco, ya que existe una pérdida de información en el momento en que se trabaja con intervalos de frecuencia y no con los datos directamente (los datos se agrupan por intervalo, desconociendo el valor exacto de cada uno de ellos). Las marcas de clases (Xi) cumple la función de representar los intervalos de clase. UNIVERSIDAD PRIVADA TELESUP 56 Ejemplo en Tablas La siguiente tabla de frecuencia muestra el número de preguntas de 81 encuestados sobre un test que consta de solo seis preguntas.Preguntas buenas/ personas. SOLUCIÓN PASO 1: Realizar la sumatoria del producto resultante de las clases por su frecuencia absoluta. Para efectos del cálculo de la media, deberíamos sumar 15 veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la última clase: PASO 2: Dividir la sumatoria sobre el número total de datos. UNIVERSIDAD PRIVADA TELESUP En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es el de 3,41) preguntas buenas. Ejemplo en Tablas de Frecuencia Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia: Ni Intervalos Marca de clase ( Xi) fi 1 40.1 48.1 44.1 3 2 48.1 56.1 52.1 8 3 56.1 64.1 60.1 11 4 64.1 72.1 68.1 32 5 72.1 80.1 76.1 21 6 80.1 88.1 84.1 18 7 88.1 96.1 92.1 14 8 96.1 104.1 100.1 1 Solución Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores exactos que están dentro de dicho intervalo. Paso 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta. �𝑐 ∑ �𝑖 �𝑖 = 44.1 𝑥 3 + 52.1 𝑥 8 + 60.1 𝑥 11 + 68.1 𝑥 32 + 76.1 𝑥 21 ��=1 + 84.1 𝑥 18 + 92.1 𝑥 14 + 100.1𝑥 1 = 7890.6 57 UNIVERSIDAD PRIVADA TELESUP 58 nales): ��=1 Paso 2: Dividir la sumatoria sobre el número total de datos. 𝑥 = ∑ 8 �𝑖 �𝑖 = � 7890 . 6 108 = 73.1 Ejemplo: Comparativa entre el cálculo de la media aritmética para datos no agrupados y datos agrupados en tablas de frecuencia. Calcular la media aritmética a los siguientes datos sin agrupar y agrupándolos en una tabla de frecuencia (suponga que los datos son poblacio Solución Calculemos la media para los datos sin agrupar: 𝜇 = ∑ � 𝑖 = 47 . 8+ 18 .6+ 18 .6+ 12 .8+ 33 .6+ 23 .1+ ⋯+ 37 .0 = 832 . 1 = 27.74 𝑁 30 30 Luego construyamos la tabla y calculemos su media aritmética con el fin de comparar ambos resultados: Ni Intervalos Marca de clase ( Mc) fi 1 11.0 17.4 14.2 8 2 17.4 23.8 20.6 6 3 23.8 30.2 27.0 2 4 30.2 36.6 33.4 5 5 36.6 43.0 39.8 4 6 43.0 49.4 46.2 5 UNIVERSIDAD PRIVADA TELESUP 59 30 UNIVERSIDAD PRIVADA TELESUP 60 de la e la me Paso 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta. � ∑ ��� �𝑖 = 14.2 𝑥 8 + 20.6 𝑥 6 + 27.0 𝑥 2 + 33.4 𝑥 5 + 39.8 𝑥 4 + 46.2 𝑥 5 ��=1 = 822.4 Paso 2: Dividir La Sumatoria Sobre El Número Total De Datos. Si Se Observa El Resultado, Solo Se Diferencia En Centésimos De La Media Poblacional. 𝑥 = ∑ ��� �𝑖 � 822.4 = 30 = 27.41 Mediana para Datos Agrupados La mediana para datos agrupados en un cuadro de frecuencia se obtiene utilizando las frecuencias absolutas o las frecuencias relativas de la siguiente manera: � �� = ��� + [ 2 − 𝐹� − 1 ] � �� = ��� + [ �� 50% − �� − 1 ] � ℎ� Donde m = Intervalo que contiene a la mediana Fm-1 = Frecuencia acumulada absoluta del intervalo anterior a la clase me (Fm) Hm-1= Frecuencia acumulada relativa del intervalo anterior a la clase d (Hm) fm = Frecuencia absoluta del intervalo de clase m. hm = Frecuencia relativa del intervalo de clase m. LIm = Límite inferior de la clase donde está ubicada la mediana. c = Longitud del intervalo de clase. UNIVERSIDAD PRIVADA TELESUP 61 s Ejemplo: Calcular la mediana a partir de la siguiente tabla de frecuencia: Solución Paso 1: Localizar entre que clases se encuentra la mediana. Observe que la mediana se encuentra en la clase 4 (*) que contiene a los elementos 24 y 25. Como n = 48 (número par), la mediana será la media aritmética de los valores que ocupan las posiciones 24 y 25. Paso 2: La posición 24 corresponde al valor 40. La posición 25 corresponde al valor 40. Luego: Me = 40 + 40 = 40 2 Ejemplo: Mediana Para Datos Agrupados En Tabla Determinar la mediana de la siguiente tabla de frecuencia: UNIVERSIDAD PRIVADA TELESUP 61 Solución Paso 1: Localizar entre que intervalos de clase se encuentra la mediana. Podemos observar que el punto que divide el 50% de los datos esta en el intervalo de clase 4, para ser más preciso, entre los valores 45,21 y 53,21 (hasta 45,21 hay agrupados el 42,50% de los datos, y hasta 53,21 se resume el 60,00% de los datos). Paso 2: �� = ��� + [ ℎ� ] � = 45.21 + [ Me = 48.64 ] 8 17.50 En el mismo ejemplo ahora vamos a encontrar la mediana, utilizando para ello las frecuencias absolutas. Paso 1: Localizar entre que intervalos de clase se encuentra la mediana. Podemos observar que el punto que divide en partes iguales a la distribución esta en el intervalo de clase 4, para ser más preciso, entre los valores 45,21 y 53,21. N° Intervalos de fi Fi clase 1 21.21 29.21 5 5 2 29.21 37.21 2 7 3 37.21 45.21 10 17 4 45.21 53.21 7 24 5 53.21 61.21 12 36 6 61.21 69.21 3 39 7 69.21 77.20 1 40 UNIVERSIDAD PRIVADA TELESUP 61 40 UNIVERSIDAD PRIVADA TELESUP 62 Paso 2: Hallamos m = 45.21 a 53.21 fm = 7 LIm = 45.21 c = 8 Fm-1 = 17 � Luego: Me = ��� + [ 2 ] � = 𝑓� 45.21 + [ 20 − 17 ] 8 = 48.64 7 Ubicando La Mediana En El Gráfico De Ojiva En un gráfico de ojiva, la mediana corresponde a la proyección del punto en eje horizontal que equivale al 50% de los datos. En la el gráfico de ojiva del ejemplo 3.6.1, la mediana estaría ubicada en el sexto intervalo, entre 350 y 400: Moda Para Datos Agrupados Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más consume a la semana: UNIVERSIDAD PRIVADA TELESUP 63 Marca Fi Marca 1 Marca 2 Marca 3 15 6 9 Total 30 Solución Paso 1: Construimos la tabla de frecuencias Paso 2: La moda representa el valor que más se repite. En este caso es la marca 1. Calculo De La Moda Mediante Fórmula Algunos autores suelen aplicar una fórmula para determinar la moda para tablas de frecuencia. �1 �� = ���� + ( ) � �1 + �2 Donde: Limo = Límite inferior del intervalo donde se ubica la moda d1 = Diferencia entre el valor de la frecuencia donde se ubica la moda y el valor del intervalo anterior (fm – fm-1) d2 = Diferencia entre el valor de la frecuencia donde se ubica la moda y el valor del intervalo siguiente (fm – fm+1) c = Longitud del intervalo de clase Ejemplo: Moda Para Datos Agrupados Calcular la moda a partir de la siguiente tabla de frecuencia: N° Intervalos de clase fi 1 21.21 29.21 5 2 29.21 37.21 2 3 37.21 45.21 10 4 45.21 53.21 7 5 53.21 61.21 12 6 61.21 69.21 3 7 69.21 77.20 1 UNIVERSIDAD PRIVADA TELESUP 64 encias )Solución Paso 1: Hemos marcado (*) el intervalo que tiene la frecuencia más alta; allí se encuentra el valor de la moda. Paso 2: Ubicamos el límite inferior del intervalo de clase donde se ubica la moda = 53.21 Así mismo hallamos las diferencias: d1 = 12 – 7 = 5 d2= 12 – 3 = 9 El valor de c = 8 Calculando la moda �� = 53.21 + ( 5 8 = 56.08 5+9 Ejemplo 2 Calcular la moda en la siguiente tabla de frecu N Intervalos Fi 1 4 6 2 2 6 8 4 3 8 10 4 4 10 12 5 5 12 14 5 Solución Paso 1: Los intervalos de clase que mas frecuencias tienen son [10- 12) y [12- 14) por tanto decimos que es un caso donde aparecen dos modas, (bimodal). Paso 2: Como hay dos modas, entonces calculando la primera moda LIm1 = 10; d1 = 5 – 4= 1; d2 = 5 – 5 = 0; c = 2 Mo1 =10 + ( 1 ) 2 = 12 1+0 UNIVERSIDAD PRIVADA TELESUP 65 Ahora, la segunda moda: LIm2 = 12; d1 = 5 – 5 = 0; d2 = 5 – 0= 5 (Como el 5 está en el último intervalo entonces la resta siempre es con 0); c = 2 Mo2=12 + ( 0 ) 2 = 12 0+5 NOTA. Recordar que fuera de la tabla de frecuencias no hay valores por eso se considera como cero. UNIVERSIDAD PRIVADA TELESUP 66 Medidas de Dispersión TEMA 3 Competencia: Calcular y graficar la estructura de las Medidas de Dispersión. UNIVERSIDAD PRIVADA TELESUP 67 ��=1 ��=1 Las Medidas son: Tema 03: Medidas de Dispersión 1. Rango 2. Desviación Media 3. Varianza 4. Desviación Típica 5. Cuasi varianza 6. Cuasi Desviación típica 7. Coeficiente de Variación Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersión. Rango: El rango o amplitud de un conjunto de datos es la diferencia entre la observación de mayor valor y la observación de menor valor. R = Xmax – Xmin Desviación media o desviación promedio: Es la media aritmética de los valores absolutos de las desviaciones de todos los valores en relación con algún punto central, tal como la media o la mediana. a) Para datos no agrupados: �� = ∑ � | �𝑖 − 𝑥 | b) Para datos agrupados: �� = � ∑� |�𝑖 − 𝑥 |𝑓𝑖 � Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Este estadístico tiene el inconveniente de http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html#seccion5 http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html#seccion6 http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html#seccion7 http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html#seccion8 http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html#seccion9 http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html#seccion10 UNIVERSIDAD PRIVADA TELESUP 68 ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. la varianza vendrá en cm2. UNIVERSIDAD PRIVADA TELESUP 69 Ecuaciones de la varianza 𝑁 2 1) Varianza poblacional: a) Datos no agrupados 𝜎 2 = ∑𝑖 = 1( � 𝑖 − 𝜇 ) 𝑁 𝑘 2 2) Varianza muestral: b) Datos agrupados 𝜎 2 = ∑𝑖 =1 𝑓 𝑖 (� 𝑖 − 𝜇 ) 𝑁 � 2 [ ∑ �𝑖 ] � 2 � 2 − ��=1 a) Datos no agrupados �2 = ∑𝑖 = 1( � 𝑖 − 𝑥 ) = ∑𝑖 =1 �𝑖 � �−1 �−1 � 2 𝑘 2 � 2 − [∑𝑖 =1 𝑓 𝑖 �𝑖 ] b) Datos agrupados �2 = ∑𝑖 =1 𝑓 𝑖 (� 𝑖 − 𝑥 ) = ∑𝑖 =1 𝑓 𝑖 �𝑖 � �−1 �−1 A la varianza muestral con en el denominador n-1 se le llama cuasivarianza Desviación estándar o típica: Es la raíz cuadrada de la varianza, se denota por S. Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. A la raíz cuadrada de la Cuasi varianza se le llama Cuasi desviación típica. Coeficiente de Variación: Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V. Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos UNIVERSIDAD PRIVADA TELESUP 70 estadísticos se vean a su vez modificados. Además, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan más dispersión, pues no es posible comparar unidades de distinto tipo. UNIVERSIDAD PRIVADA TELESUP 69 ∑ − Ejemplo 1. Sean los datos siguientes: 32, 54, 21, 33, 45, 49, 36, 42, 57, 28, 52, 61 a) Rango: 61 – 21 = 40 b) Para calcular Varianza muestral, primero se obtiene la suma de las observaciones y la suma de los cuadrados de las observaciones. 12 ��=1 �𝑖 = 32 + 54 + ⋯ + 52 + 61 = 510; 𝑥 = ∑ ���⁄� = 510 12 = 42.5 � 2 2 2 2 2∑��=1 �𝑖 = 32 + 54 + ⋯ + 52 + 61 = 23414 �2 = 23414 (510)2 12 = 158.09 11 c) Desviación típica s = √158.09 = 12.573 d) Coeficiente de variación �𝑉 = 𝑠 ��100 = 12 . 57 3 𝑥100 = 29.58 % Ejemplo 2 𝑥 42.5 Sean los datos presentados en la siguiente tabla x i f i x i · f i x i 2 · f i |�𝒊 − �̅|�𝒊 [ 1 0 , 2 0 ) 15 1 15 225 2 8 . 3 3 [ 2 0 , 3 0 ) 25 8 200 5000 1 4 6 . 6 4 [ 3 0 , 4 0 ) 35 10 350 1 2 2 5 0 8 3 . 3 [ 4 0 , 5 0 ) 45 9 405 1 8 2 2 5 1 5 . 0 3 [ 5 0 , 6 0 55 8 440 2 4 2 0 0 9 3 . 3 6 [ 6 0 , 7 0 ) 65 4 260 1 6 9 0 0 8 6 . 6 8 [ 7 0 , 8 0 ) 75 2 150 1 1 2 5 0 6 3 . 3 4 S u m a 42 1 8 2 0 8 8 0 5 0 5 1 6 . 6 8 UNIVERSIDAD PRIVADA TELESUP 70 Solución En este caso se trata de datos agrupados, y para hacer los cálculos usaremos las ecuaciones de datos agrupados. a) Media aritmética: 𝑥 = 1820 = 43.33 42 88050− (1820)2 b) Varianza: �2 = 42 = 223.98 41 c) Desviación estándar: s = √223.98 = 14.96 d) Coeficiente de variación: CV = 14 . 96 𝑥100 = 34.53 % 43.33 e) Desviación Media: Dm = 516 .68 = 12.30 42 Ejemplo 3. El tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea fue
Compartir