Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 1 ESTADISTICA Introducción En el lenguaje común se emplea la palabra ESTADÍSTICA casi como sinónimo de números o cifras. Por ejemplo: El comentarista deportivo dice “estas son las estadísticas de los partidos”. Según las estadísticas el 99% de la población fue censada. Según las estadísticas el año anterior fue menor el número de accidentes de fin de año. El origen de la Estadística puede advertirse en la necesidad de datos numéricos en los Estados que surgían de la sociedad medieval en Europa Occidental. Al transformarse la sociedad medieval en el estado político, el nuevo gobierno necesitaba información sobre los recursos del país para poder tener éxito. Casi diariamente utilizamos los conceptos estadísticos en todas las facetas de nuestra vida. Ejemplos: Uno va y abre la llave del baño para sentir la temperatura del agua y decidir si añade más agua caliente o agua fría, o que la temperatura sea la correcta y se pone bajo la ducha. Usted se va al supermercado pensando qué tipo de pizza hecha va a comprar, frente a la góndola de pizzas, está sobre el mostrador y ofrecen pequeños pedazos para prueba. Después de probarla, uno decide si la compra o no. En los dos ejemplos anteriores, se toma una decisión y se elige un curso de acción basándose en una muestra. ¿Qué se entiende por Estadística? Es una palabra que la encontramos con frecuencia en nuestro lenguaje diario. El uso más común se refiere a información numérica, como por ejemplo el salario de los empleados que trabajan en una empresa, el número de autos vendidos en el mes anterior, o la oficina de Censo y Estadísticas considera que el número de habitantes en el Paraguay es aproximadamente 6.000.000. Estos ejemplos anteriores se refieren a un valor estadístico. El término ESTADÍSTICA, que deriva del latín status, significa estado en el sentido político, se empleó entonces para referirse a la recolección y descripción de tales datos del estado. La necesidad de acopiar y analizar datos numéricos impulsó a desarrollar métodos para facilitar la labor, que era lo que constituía lo más considerable de la estadística hasta la era moderna. Con el advenimiento de la probabilidad, se puso de manifiesto que la estadística podría emplearse en la extracción de conclusiones válidas y en la toma de decisiones. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 2 La estadística o los métodos estadísticos, como se denomina a veces, está jugando un papel más y más importante en casi todas las facetas del comportamiento humano. Ocupada inicialmente en los asuntos de estado, la influencia de la estadística se ha extendido ahora a la agricultura, biología, negocios, química, comunicaciones, economía, educación, electrónica, medicina, física, ciencias políticas, sicología, sociología y otros muchos campos de la ciencia y de la ingeniería. ¿Por qué hay que estudiar Estadística? La razón estriba, en pocas palabras, en que los conceptos y las técnicas de la estadística se utilizan actualmente en un gran número de ocupaciones. Las ideas estadísticas constituyen una parte integral de las actividades investigativas, de las encuestas para recopilar datos y del análisis de los datos que se originan en las actividades que desarrollan las instituciones y organizaciones. Los conocimientos estadísticos son de gran importancia para las demás asignaturas. Los conceptos y la metodología de la estadística se emplean en muchos campos como los citados anteriormente. Las técnicas estadísticas se utilizan para tomar decisiones que afecten nuestra vida diaria, eso quiere decir que afecta nuestro bienestar personal. Además el conocimiento de la estadística ayudará a entender por qué se toman ciertas decisiones y le aportarán una mejor comprensión sobre la manera que lo afecten. Definiciones Estadística: Es la ciencia que estudia cómo recolectar, ordenar y analizar datos procedentes de observaciones de fenómenos colectivos, permitiendo sacar conclusiones y tomar decisiones. Población: Es el conjunto formado por todos los elementos objeto de estudio. Una población puede ser finita o infinita. Población finita: significa que es posible alcanzar a contar, por tanto incluye un número limitado de medidas y observaciones. Población infinita: no tiene límites, se extiende más allá de la medición. Ejemplo: - El alquiler de todas las familias que vive en Asunción. - Los dividendos anuales de cada uno de los valores negociados en la bolsa. - El costo anual de reparación de todos los autos de un determinado modelo. - Los errores que aparecen en la lista de factura. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 3 Parámetros: Se llama así a las características medibles de una población. A los valores de esta población se los consideras valores verdaderos. Muestra: En muchos casos, es imposible reunir la información de todos los individuos de una población; entonces se toma una muestra de ella. La muestra es un subconjunto de la población y se puede elegir por distintos procedimientos debiendo tener en cuenta que todos los elementos de la población tengan la misma probabilidad de ser elegidos. División de la estadística: Si una muestra es representativa de una población, es posible sacar, inferir importantes conclusiones sobre la población a partir del análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal inferencia es válida se llama estadística inductiva o inferencia estadística. La parte de la Estadística que sólo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadística descriptiva o deductiva. Fenómeno aleatorio: son aquellos fenómenos que ocurren al azar, que no siguen una regla conocida o determinada y cuyos resultados finales, en consecuencia, no se pueden predecir con exactitud. Ejemplo: la salida de un número de la lotería como ganador, la obtención del número 2 en una tirada del dado, la ocurrencia de una mutación en un cruce genético, la adquisición de un resfriado en una determinada estación del año. Fenómeno determinístico: son aquellos fenómenos que siguen reglas fijas y conocidas y cuyos resultados son predecibles de acuerdo a tales reglas. Ejemplo: todos los fenómenos químicos y físicos, la mayoría de los fenómenos biológicos. Dato: es una característica cualitativa o cuantitativa de una persona, animal o cosa y que no tiene utilidad por sí misma. Información: es un dato con mayores descripciones o un conjunto de datos procesados que tiene aplicabilidad Variables: Es cada una de las características de los elementos de la población que estudiamos. Pueden ser cualitativas y cuantitativas. Son cualitativas cuando indica una cualidad o característica de la población; no se expresan mediante números. Ejemplos: color de ojos, el sexo, el estado civil, etc. Son cuantitativas cuando se expresan mediante una cantidad, toman valores numéricos. Ejemplos: el peso, cantidad de personas por vivienda, notas, etc. Las variables cuantitativas pueden ser: Discretas: cuando se expresan con números enteros y generalmente se obtienen por conteo. Ej.: número de habitantes, de hijos, etc. Continuas: generalmente se obtienen por medición y pueden tomar cualquier valor entero o decimal. Ej.: el peso de una persona puede ser 50Kg o 50,3Kg dependiendo de la exactitud de la medición. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 4 Niveles de medición Los datos pueden clasificarse de acuerdo con los niveles de medición. Generalmente, el nivel de medición de un dato marca los cálculos que pueden realizarse para resumir y presentar la información, las pruebas estadísticas que pueden desarrollarse: Nivel nominal: losdatos son clasificados en categorías sin algún orden específico de las mismas. Las diferentes categorías de la escala se distinguen por el nombre que se asigna. No existe jerarquía entre las diferentes clases y su ordenación es arbitraria. Ejemplo: las causas de las defunciones, el estado civil de las personas, etc. Nivel ordinal: esta escala lleva implícita la idea de jerarquización o un orden que permite indicar la posición de los distintos elementos clasificados, supone que una categoría está clasificada como más alta que la otra, y constituye una etapa de transición hacia la cuantificación de un fenómeno. Ejemplo: la gravedad de una enfermedad, el nivel socioeconómico, etc. Nivel de intervalo: cuenta con la característica de clasificación del nivel ordinal de medición, más la característica de que la distancia entre los valores es importante. Además, el cero indica ausencia. Nivel de razón: las escalas de razón se caracterizan por los números asignados a las diferentes categorías tienen un significado cuantitativo claro respecto a la distancia que existe entre dos observaciones diferentes. Además el cero no indica ausencia. Ejemplo: temperatura. Distribuciones de frecuencia Tablas de distribución de frecuencias: los datos estadísticos se organizan en tablas de frecuencias con la finalidad de sintetizar la información que ellos contengan, permitiendo una primera interpretación de los hechos en estudio. En ellas se consignan las variables y las frecuencias. Frecuencia absoluta: es el número de veces que se repite un dato. Frecuencia relativa: es el cociente entre la frecuencia absoluta de cada dato y el número total de datos. Frecuencia porcentual: es la frecuencia expresada en porcentajes. Se obtiene multiplicando por 100 la frecuencia relativa. Frecuencias acumuladas: se puede acumular las tres frecuencias anteriores. Ej.: producción ganadera del departamento de Concepción en el año 1999 Variable (tipo de ganado) Frecuencia absoluta (en miles de cabeza) Frecuencia relativa Frecuencia porcentual (%) f.ac %.ac Vacunos 706 706/843=0,84 84 706 84 Porcinos 77 77/843=0,09 9 783 93 Ovinos 30 30/843=0,04 4 813 97 Equinos 20 20/843=0,02 2 833 99 Caprinos 10 10/843=0,01 1 843 100 Total 843 1 100 Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 5 Construcción de la serie de frecuencias Intervalo de clase (clase): se denomina así a cada uno de los grupos en que se divide el conjunto de datos. Limite inferior y limite superior de clase: es el menor y mayor valor que delimita un nuevo intervalo de clase. Marca de clase (x): es el representante de un intervalo. Se calcula por la semisuma de los extremos del intervalo. Amplitud (ancho) de clase (h): es la diferencia de los límites reales de clase. También se puede calcular por la diferencia entre dos límites inferiores o superiores de clases contiguas. Ejemplo de elaboración de una tabla de distribución de frecuencias En la siguiente tabla se dan los promedios expresados en porcentajes, de 40 alumnos de un curso determinado: 70 82 70 74 87 69 22 49 73 52 86 45 19 15 2 51 3 23 42 50 69 58 89 71 59 70 47 41 51 71 67 69 60 38 74 56 67 56 46 70 Construir una distribución de frecuencias. Rango: R = 89 – 2 = 87 Número de intervalos: K = 1 + 3,3.log40 = 6 (Fórmula de Sturges) Amplitud: h = 87/6 ; h = 15 Interv. de clase Frec. Absoluta Frec. acumulad Marca de clase 2 - 16 3 3 9 17 - 31 3 6 24 32 - 46 5 11 39 47 - 61 11 22 54 62 - 76 14 36 69 77 -91 4 40 84 Representaciones gráficas Gráficos: el gráfico es la representación de datos numéricos en el plano con el fin de obtener una impresión visual de conjunto, del material presentado que facilite su rápida comprensión. Los objetivos de la mayoría de los gráficos son representar distribuciones de frecuencias o mostrar la asociación entre dos o más variables investigadas en las unidades de observación Todo trabajo de análisis estadísticos debe venir precedido de una o más representaciones gráficas. La importancia de las representaciones gráficas para el estadístico, reside en la posibilidad de apreciar mediante un gráfico el conjunto de variaciones de un golpe de vista, permitiendo formar juicio sobre el desarrollo y las 2 LsLi x Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 6 relaciones de las variables que intervienen en la investigación. Un gráfico proporciona la apreciación integral del fenómeno que se estudia, lo que difícilmente se obtiene cuando solamente disponemos de cuadros estadísticos, lo que en general, son colecciones complejas y largas de cifras. Requisitos generales de un gráfico 1. Debe ser sencillo y auto-explicativo. No debe tener más elementos que los que puedan captarse cómodamente con la vista, ni menos que lo que permiten la identificación del material presentado: títulos, escalas numéricas y leyendas. 2. Debe presentar fielmente los hechos. Se evitarán distorsiones por escalas exageradas. 3. Debe ser agradable a la vista. Para categoría de una misma variable representada por barras se usará un solo color o un solo tipo de rayado. Tipos de gráficos En Estadística se utiliza muchos tipos de gráficos dependiendo de la naturaleza de los datos y el propósito para el que la curva ha sido proyectada. La mayoría de ellos se basan en un sistema de ejes perpendiculares orientados, en lo que se inscriben las escalas de clasificación o las frecuencias. Los tipos de gráficos más utilizados son: a) Gráfico de barras. Pueden ser: barras simples, compuestas (agrupadas o apiladas), bidireccionales. b) Gráfico lineal c) Gráfico circular, de sectores o postal. d) Histogramas y polígonos de frecuencias. e) Ojivas o polígonos de frecuencias acumuladas. Barras simples: comparan totales de ciertas variables de un periodo a otro. Puede expresar los datos en cantidades absolutas e incluso en porcentajes. Tiene la ventaja de presentar en forma vertical u horizontal. Barras compuestas: se utilizan para mostrar más de una variable a la vez, no se recomienda utilizar más de tres variables ya que dificulta su lectura. Barras apiladas: muestra el tamaño del valor relativo de los componentes dentro de un total. Barras bidireccionales: sirven para indicar cambios porcentuales que son útiles para ilustrar ganancias y pérdidas de la producción o ventas de un periodo a otro. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 7 Gráficos circulares: sirven para mostrar la participación de una variable en un total. Histograma: consiste en una serie de rectángulos contiguos, cuyo ancho es proporcional al tamaño del intervalo y cuya altura es proporcional a la frecuencia de dicho intervalo. Para representarlo deben colocarse en el eje de las abscisas los puntos medios o marcas de clases y en el eje de ordenadas las frecuencias. Polígono de frecuencia: es otro método de presentar de presentar gráficamente datos con intervalos de clases, para construirlo se colocan los puntos medios o marcas de clases en el eje x y las frecuencias en eje de ordenadas. Luego se presenta la frecuencia de cada clase dibujando un punto sobre la proyección del punto medio y se unen dichos puntos en forma continua, hasta formar un polígono. Ojiva o frecuencia acumulada: representa las frecuencias ya sean absolutas o relativas que se van acumulando sucesivamente entre una clase y otra. En el eje de las x se coloca los valores de los límites reales inferiores de cada clase y en el eje de las ordenadas la frecuencia acumulada correspondiente a cada intervalo. Para ilustrar, se presenta algunos ejemplos de gráficos estadísticos: 0 10 20 30 40 P o rc e n ta je Nivel de formación Comparación de niveles de formación por zonas UrbanaRural 0 2 4 6 8 10 12 1 2 3 4 5 N ú m e ro d e a lu m n o s Calificación Calificación final en Estadística Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 8 0 10 20 30 40 50 60 N ú m e ro d e e m p le ad o s Años Número de empleados de dos empresas en los últimos 8 años Empresa A Empresa B Ejercicios propuestos. 1. ¿En que reside la importancia de la representación grafica de un fenómeno? 2. Definir y dar ejemplos de Población y Muestra. 3. ¿De que depende la selección del tipo de grafico a utilizar? 4. ¿Cuales son los tipos de gráfico a utilizar? 5. ¿Cuáles son los tipos de variables? 6. ¿Cuál es la diferencia entre variable cuantitativa y cualitativa? Dar ejemplos. 7. ¿Cuándo se utiliza un Histograma? 8. ¿Qué representa la frecuencia relativa de una clase dado en una tabla de distribución de frecuencias? 9. Indicar si las siguientes variables son discretas o continuas: (…….) Número de hijos en una familia. (…….) Edad de los egresados de esta Facultad de la promoción 2014. (…….) Población a nivel distrital en el Dpto. de Guaira. (…….) Distancia recorrida por un móvil. (…….) Número de páginas de un libro. (…….) Volumen de agua de un reservorio de ESSAP. (…….) Número de billetes de 50.000 circulando en el país. (…….) Sueldos en una Empresa comercial en $ 16% 12% 38% 25% 9% Preferencia de color de autos Azul Negro Blanco Rojo Otros Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 9 (…….) Estudiantes matriculados en esta carrera – Año 2010. (…….) Tiempo de espera en una parada de ómnibus. (…….) Estudiantes inscriptos en la asignatura de Estadística. (…….) Altura en cm. de los integrantes del grupo. (…….) Peso corporal de vacas lecheras medido en kilogramos. (…….) Número de artículos vendidos en una tienda. (…….) Registro del número de días soleados en Asunción del mes de Julio. 10. En una muestra de EMPRESAS del ramo de la confección, se clasifican en tres categorías: pequeñas(P), medianas (M) y grandes (G) Representar gráficamente la distribución. Comentar el resultado. Categoría. Frecuencia. P 15 M 25 G 10 11. Los siguientes datos corresponden al número de postulantes por semestre en los últimos cinco años para iniciar la Carrera de Psicología de esta Facultad Año 2.006 2.007 2.008 2.009 2.010 I Semestre 45 38 48 51 50 II Semestre 25 20 20 35 30 Graficar la tendencia del número de postulantes, utilizando un gráfico lineal y otro de barras compuestas. 12. Las calificaciones obtenidas en estadística por un grupo de 45 alumnos son: 1 2 4 5 3 1 4 5 3 1 5 2 3 2 4 3 2 2 3 3 2 4 4 1 5 3 3 2 4 5 3 3 2 2 1 4 1 3 1 4 4 5 1 2 1 a) Construir la tabla de frecuencia (f., fr, %, fac.) b) Trazar los gráficos de barras verticales y horizontales c) Hacer un comentario sobre el rendimiento de los alumnos 13. Los siguientes observaciones son los tiempos en minutos que tardaran 30 estudiantes en terminar su primer examen de Estadística: 40 67 53 63 70 70 52 51 41 39 37 63 45 38 68 69 39 42 52 52 41 58 69 68 64 39 45 55 61 69 a) Determinar el número de clases adecuado b) Construir una distribución de frecuencias relativas graficando el Histograma y Polígono de frecuencias relativas correspondientes. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 10 Medidas de tendencia central o de centralización Son valores numéricos que nos informan del nivel general medio de los datos que se están ordenando o procesando. En otras palabras, nos dan una idea del valor alrededor del cual se concentran los mismos. Se definen varios tipos, siendo los más comunes la media aritmética, la mediana y la moda. Cada una tiene sus ventajas y desventajas, según los datos y el objetivo perseguido. La media aritmética: la media aritmética o simplemente media es el promedio o resultado de la suma de todos los datos dividido por la cantidad total de datos. Su valor es representativo de la muestra o población. La media aritmética posee ciertas propiedades, algunas deseables y otras no tan deseables. Estas propiedades son las siguientes: 1) Unicidad: para un conjunto determinado de datos, existe una y solo una media aritmética. 2) Simplicidad: la media es fácil de comprender y de calcular. 3) Como todos y cada uno de los valores en un conjunto de datos intervienen en el cálculo de la media, ésta es afectada por cada valor; por tanto, los valores extremos influyen en la media y en algunos casos, pueden distorsionarla tanto que resulte inconveniente como una medida de tendencia central. 4) La media de la población es una cantidad fija, mientras que la media de la muestra es variable, puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. n x x i para datos de frecuencia simple. n fx x ii . para datos de frecuencia agrupados. Algunas veces es apropiado ponderar las observaciones que entran en una media. Si se deben promediar diferentes medias que provienen de muestras con diferentes números de observaciones, entonces es conveniente usar ponderaciones que dependen del número de observaciones de cada promedio. i ii w wx x . para media ponderada Para números positivos, la media geométrica y la media armónica pueden ser útiles. Sus usos principales son, respectivamente, el cálculo de valores tales como números índices y el cálculo de tasas y razones. La mediana: la mediana de un conjunto finito de observaciones es el valor que divide al conjunto en dos partes iguales, tales que, cuando todas las observaciones se ordenan de manera creciente, la mitad de estas es menor que la mediana y la otra mitad mayor. Si el número de observaciones en el conjunto es impar, la mediana es el valor central del conjunto de datos ordenados. Si el número es par, la mediana es el promedio de los dos valores centrales. Puesto que la mediana es un valor que se basa en la secuencia ordenada de las observaciones en un conjunto de datos no se encuentra afectado por los valores Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 11 extremos, por esta razón la mediana puede ser una medida de tendencia central mucho deseable que la media. La mediana puede determinarse a partir de la distribución acumulativa, es decir, es el percentil 50. h f aafn LiMed med . .2/ Donde: Li es el límite inferior de la clase mediana f.acant es la frecuencia acumulada hasta el intervalo anterior fmed es la frecuencia del intervalo que contiene a la mediana. n es el total de observaciones (sumatoria de la frecuencia) h es la amplitud del intervalo de clase La moda: la moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir, e incluso no ser única en caso de existir. Las distribuciones bimodales sugieren dos fuentes de datos, por que se trata de dos poblaciones o por que algún factor en la acumulación de los datos da dos conjuntos de resultados. h dd d LiMo . 21 1 Donde: 1d es el exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior. 2d es el exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior Ejercicios a resolver 1. Los datos corresponden al número de consultas prenatales atendidas diariamente en un puesto de salud durante 20 días: 6, 7, 9, 11, 13, 15, 16, 18, 19, 19, 19, 22, 22, 22, 25, 28, 30, 31, 31, 32. Calcular la media aritmética, la moda y la mediana del número de consultas prenatales. 2. Las estaturas de 13 estudiantesde una clase son: 151, 155, 159, 160, 160, 161, 161, 162, 163, 164, 165, 168, 170 cm. Hallar la media aritmética, la moda, la mediana de las estaturas. 3. Los salarios mensuales de 11 trabajadores estudiantes (en $) son: 970, 1000, 1100, 1120, 1120, 1120, 1120, 1150, 1200, 1200 y 1300. Hallar la media aritmética, la moda, la mediana de los salarios. 4. Las temperaturas tomadas en una ciudad el mismo día de cada mes a la misma hora durante un año fueron: 1ºC, 4ºC, 6ºC, 10ºC, 11ºC, 14ºC, 18ºC, 19ºC, 25ºC, 26ºC, 30ºC y 34ºC. Hallar la media aritmética, la moda, la mediana de las temperaturas. 5. Los tiempos empleados por 8 atletas en recorrer 100metros fueron: 9,99; 10,00; 10,02; 10,08; 10,11; 10,13; 10,15 y 10,18segundos. Hallar la media aritmética, la moda, la mediana de los tiempos. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 12 6. En examen de bioestadística, 6 alumnos obtuvieron 3, 8 obtuvieron un 4, 13 un 5, 8 un 6, 5 un 7, 3 un 8 y 1 un 9. Hallar la media aritmética, la moda y la mediana de las calificaciones. 7. Al finalizar sus estudios de licenciatura en educación, 60 alumnos tenían 22 años, 50 tenían 23 años, 17 tenían 24 años y 8 tenían 25 años. Hallar la media aritmética, la moda, la mediana de las edades. 8. De un total de 100 números, 15 eran 4, 45 eran 5, 25 eran 6 y 15 eran 7. Hallar la media aritmética, la moda y la mediana de los números. 9. En una empresa hay 50 empleados, 30 de los cuales son casados y 20 solteros. Si el salario mensual de un empleado casado es de $1200 y el de un soltero $1000. ¿Cuál es el salario medio, la moda, la mediana de los empleados? 10. Seis estudiantes obtienen las siguientes calificaciones en un examen Estudiantes: A B C D E F Calificación: 10 6 3 8 9 6 Calcular la media aritmética, la moda, la mediana de las calificaciones. 11. Con base a un estudio en el que se preguntó a 200 personas cuántas veces habían visitado a parientes enfermos en los hospitales durante los 12 meses anteriores, se obtuvieron los siguientes datos de la tabla: Número de visitas 0 1 2 3 4 5 Número de personas 90 72 26 8 3 1 Calcular la media aritmética, la moda, la mediana de las visitas. 12. El contador de una empresa privada desea estimar el balance promedio en dólares, de las 10000 cuentas de crédito que maneja. La distribución de frecuencia se presenta en la tabla y fue construida a partir de una muestra de 200 cuentas seleccionadas al azar de los archivos de la empresa. Balance de cuentas Frecuencia 0 – 20 10 20 – 40 14 40 – 60 24 60 – 80 54 80 – 100 48 100 – 120 26 120 – 140 16 140 – 160 8 Total 200 Con referencia a esta tabla, calcular: a) qué porcentaje de los balances de cuentas tienen menos de 60$; b) qué porcentaje de los balances de cuentas tienen al menos 20$ pero menos de 120$, c) media, mediana y moda 13. La tabla de distribución de frecuencia siguiente corresponde a las estaturas de un grupo de 200 estudiantes de una clase Estatura (mt) F 1,20 – 1,40 20 1,40 – 1,60 68 1,60 – 1,80 56 1,80 – 2,00 48 2,00 – 2,20 8 Con referencia a esta tabla, calcular: la media y la moda, la mediana. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 13 Medidas de posición Si un conjunto de datos está ordenado por magnitud, el valor central (o la media de los dos valores centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto en 4 partes iguales. Esos valores, denotados Q1, Q2 y Q3, se llaman primer, segundo y tercer cuartiles, respectivamente. El Q2 coincide con la mediana. Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles y se denotan D1, D2,…, D9, mientras que los valores que los dividen en 100 partes iguales se llaman percentiles, denotados por P1, P2,…., P99. El 5º decil y el 50º percentil coinciden con la mediana Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles. Cuartiles h f aaf nk LiQk . . 4 . Deciles h f aaf nk LiDk . . 10 . Percentiles h f aaf nk LiPk . . 100 . Ejemplo: La tabla muestra una distribución de frecuencias de las calificaciones del examen final de Estadística de un colegio: Calificación Nº de estudiantes (F) 30 – 39 1 40 – 49 3 50 – 59 11 60 – 69 21 70 – 79 43 80 – 89 32 90 – 99 9 Total 120 a) Halla los cuartiles de la distribución e interpreta el resultado de cada uno. b) Calcula los deciles: D2 y D9 e interpreta los resultados. c) Determina los percentiles: P70 y P90 e interpreta los resultados. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 14 Medidas de dispersión o variabilidad La dispersión o variación de los datos intenta dar una idea de cuán esparcidos se encuentran éstos. Las medidas de dispersión son valores numéricos que describen las variaciones que presentan los datos ya que éstas pueden ser muy pequeñas o muy grandes, por lo tanto requieren de medición y ayudan a las medidas de tendencia central a dar una mejor descripción de la globalidad de los datos, midiendo de qué forma se alejan o se acercan al valor central. Hay varias medidas de dispersión, siendo las más comunes el rango, la desviación media, la desviación típica o estándar, varianza, el coeficiente de variación entre otros. El rango: el rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos. R = VMáx - Vmin Desviación: la desviación es el valor absoluto de las diferencias entre los valores individuales observados y la media. ii xxD Desviación media: la desviación media de un conjunto de valores es la media aritmética de las desviaciones. n xx DM ii para datos de frecuencia simple. n xxf DM iii . para datos de frecuencia agrupado. Varianza: la varianza de un conjunto de valores es la media del cuadrado de las desviaciones. La varianza siempre será mayor que cero, cuanto más se aproxima a cero, más concentrados están los datos de la serie alrededor de la media, mientras que cuanto mayor sea la varianza, más dispersos están. n xx Var ii 2 para datos de frecuencia simple. n xxf Var iii 2 . para datos de frecuencia agrupado. O también se puede utilizar en forma práctica la fórmula 2 2 x n fx Var ii Desviación típica o estándar: la desviación típica o estándar es la raíz cuadrada de la varianza. Esta medida se utiliza debido a que la varianza se expresa en unidades cuadradas de las originales. Es la medida de dispersión más utilizada e importante, porque se emplea para comprobar la confianza que merecen algunas medidas estadísticas. varS Coeficiente de variación: indica la relación entre la desviación estándar y la media. Puede expresarse porcentualmente. Es una medida objetiva de la dispersión de un conjunto de datos. Se utiliza generalmente para comparar dos poblaciones o muestras. 100 x s CV Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 15 Ejercicios a resolver 1. Ordena los siguientes datos y halla: la media, la desviación media, la varianza y el coeficiente de variación: 12, 10, 30, 45, 50, 40, 18, 16, 8, 12, 15, 10, 40, 10, 12, 20. 2. Utiliza la siguiente tabla con la muestra de la estatura (expresada en metros) de un colegio, para calcular: Estatura 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70 total Nº de alumnos 1 4 4 2 5 6 5 4 4 3 2 40 a) La media, la mediana, el rango, la desviación media, la varianza y la desviaciónestándar. 3. Los datos agrupados de la siguiente tabla provienen de la distribución de frecuencias de los salarios diarios de 100 trabajadores. Salarios diarios Nº de trabajadores 24.000 – 26.000 7 26.000 – 28.000 20 28.000 – 30.000 33 30.000 – 32.000 25 32.000 – 34.000 11 34.000 – 36.000 4 Total 100 a) Determinar: el salario medio, la mediana de los salarios, el salario modal. b) ¿Cuántos guaraníes ganan como máximo el 25% de los trabajadores? c) ¿Y el 85% de los trabajadores? 4. En una fábrica de alimentos, donde la conservación de los mismos depende de la temperatura en la cámara frigorífica, se han hecho 30 mediciones a lo largo de un día. Los resultados, expresados en ºC, son como sigue: 3,0 3,5 3,4 3,7 3,2 3,9 4,0 3,1 3,6 3,4 3,8 3,5 3,2 3,4 3,6 3,1 3,8 3,2 3,5 3,3 3,1 3,6 3,9 3,1 3,5 3,4 3,7 3,3 3,1 3,8 - Distribuye las temperaturas en una tabla de 5 intervalos de clase y verifica: la media, la desviación media y el coeficiente de variación 5. La siguiente tabla de distribución de frecuencia suministra datos sobre sueldos (en diez mil de guaraníes) de 80 directores ejecutivos de las empresas más importantes de la nación incluido en la publicación de una revista: Salario en diez mil Gs. Frecuencia 90 – 340 8 340 – 590 10 590 – 840 14 840 – 1090 20 1090 – 1340 18 1340 – 1590 6 1590 – 1840 4 Con referencia a la tabla anterior, calcular: a) la media, la moda y la mediana; b) la desviación media, la varianza y la desviación típica; c) el tercer decil, el primer cuartil y el percentil 78. Universidad Nacional de Asunción Facultad de Filosofía Carrera: Psicología 16 6. En experiencias realizadas para determinar una distribución de frecuencias de los perímetros toráxicos, se han obtenido los siguientes datos: Perímetros toráxicos Frecuencia 70 – 75 3 75 – 80 30 80 – 85 312 85 – 90 365 90 – 95 482 95 – 100 218 100 – 105 46 105 – 110 9 Calcular la media, la moda, la mediana, varianza, desviación típica, desviación media, el coeficiente de variación, el tercer decil, el primer cuartil y el percentil 68. 7. En una escuela experimental de Asunción se llevó a cabo un estudio para obtener el nivel de glucosa en la sangre. Los siguientes son datos obtenido en 40 niños: Glucosa Frecuencia 55 – 58 10 58 – 61 12 61 – 64 15 64 – 67 17 67 –70 14 70 – 73 12 73 – 76 9 76 – 79 7 79 – 82 4 Calcular: a) la media, la moda y la mediana; b) la desviación media, la varianza y la desviación típica; c) el sexto decil, el segundo cuartil y el percentil 22. 8. Los siguientes son los salarios de 80 médicos de un hospital regional: Salarios Frecuencia 445 – 477 19 477 – 509 12 509 – 541 5 541 – 573 7 573 – 605 8 605 – 637 9 637 – 669 6 669 – 701 14 Calcular: a) la media, la moda y la mediana; b) la desviación media, la varianza, la desviación típica y el coeficiente de variación; c) el octavo decil, el tercer cuartil y el percentil 63.
Compartir