Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
FUNDAMENTOS DE ESTADÍSTICA DESCRIPTIVA (Conceptos estadísticos, Tablas de frecuencia y Gráficos estadísticos) GENERACIÓN DE PRODUCTO: Manuales o productos publicables DOCUMENTO DE DOCENCIA Rojas Vega Homero Abraham UNIVERSIDAD COOPERATIVA DE COLOMBIA FACULTAD DE INGENIERÍAS PROGRMA DE INGENIERÍA CIVIL NEIVA 2022 Fundamentos de Estadística descriptiva. 1. Conceptos estadísticos Importancia y Utilidad. Definición de Estadística. Tipos de Estadística. Terminología Estadística. 2. Tablas de frecuencia. Tabla de frecuencias para Datos Agrupados en Forma Discreta. Tabla de frecuencias para Datos Agrupados en Clases o Intervalos. 3. Gráficos estadísticos. Gráficas de frecuencias para representar Datos Agrupados en Forma Discreta (Diagrama de Barras, Diagrama de Pastel). Gráficas de frecuencias para representar datos Agrupados en Clases o Intervalos (Histograma de frecuencias, Polígono de frecuencias, Ojiva). APLICACIÓN N° 1. APLICACIÓN N° 2. APLICACIÓN N° 3. APLICACIÓN N° 4. APLICACIÓN N° 6. APLICACIÓN N° 5. Fundamentos de Estadística descriptiva. 1. Conceptos estadísticos Importancia y Utilidad. La Estadística es tan antigua como la escritura misma, se puede decir, ha existido siempre. La Estadística es más que un conjunto de datos observados o medidos, los cuales, sometidos a conteo o tabulación se resumen en tablas y gráficas de frecuencias, así mismo, calculadas en ellos las medidas numéricas de resumen o estadísticas proporciona información, y una vez analizada la información genera alternativas de solución a situaciones problema enmarcadas preferiblemente en un contexto real. La estadística es por sí misma una ciencia, pero a su vez es auxiliar de las otras ciencias que utilizan sus técnicas y métodos para atender situaciones que en ellas se presentan. La estadística proporciona información para ser utilizada por investigadores, administradores, directores, gerentes, asesores, entre otros, quienes son las personas responsables de la toma de decisiones, una vez encuentran o les presentan diferentes alternativas como mejor opción de solución al problema y así elegir las más favorable. Definición de Estadística. Estadística. - Ciencia que estudia el comportamiento de los datos, las variables y elementos a través de la aplicación de sus métodos y técnicas de descripción, interpretación e inferencia. La anterior definición involucra aspectos relacionados con tipos de Estadística al mencionar la aplicación de sus métodos y técnicas de descripción, y el estudio del comportamiento de los datos, variables y elementos. Además de estudiar los tipos de estadística se hace necesario en esta parte de fundamentos, desarrollar terminología estadística pertinente. Tipos de Estadística. La Estadística es estudiada bajo dos grandes campos de acción, áreas o ramas, a saber: La Estadística Descriptiva hace referencia a la utilización de técnicas descriptivas, aplicadas a una muestra tomada de una población. Incluye: recolección, tabulación y representación de datos, medidas numéricas de resumen llamadas estadísticas, que proporcionan información y resultados para ser analizados, los cuales son atribuibles únicamente a la Muestra. La Estadística inferencial hace referencia a la utilización de técnicas interpretativas, aplicadas a resultados arrojados por la muestra, para la obtención de conclusiones y toma de decisiones, las cuales se generalizan a la población, basados en la muestra que debe tener como requisito indispensable ser aleatoria y representativa. La Estadística estudiada bajo el número de variables trabajadas, es: Estadística Uni-Variada, estudia una variable; Estadística Bi-Variada, compara, relaciona o asocia dos características o variables; y Estadística Multi-Variada, información de tres o más variables. Terminología Estadística. Algunos términos, son: Población, Tipo de Población, Elemento, Muestra, Tipo de Muestreo, Variable, Tipo de Variable, Dato, Tipo de Dato, Fuente, Tipo de Fuente e Instrumento. Población, Conjunto finito o infinito de elementos. Finita. - Se puede conocer o contar el total de los elementos que la componen. Infinita. - El número total de elementos que la componen es ilimitado o difícil de establecer. Elemento, Individuo, persona, animal, sujeto, objeto, suceso, acontecimiento, hecho, caso o evento, que conforma la población, en quien se desea observar o medir una o más variables o características para ser estudiadas. Muestra, Subconjunto de elementos que conforman la población, seleccionados de ella, para ser observados y analizados. Muestreo No-Probabilístico. - Produce muestras subjetivas, de intención o a juicio del investigador, elige elementos al azar y no en forma aleatoria, opta por elementos de la población que estén más cerca o que sean fácilmente asequibles o que sean voluntarios. Muestreo Probabilístico. - La selección es aleatoria, los elementos de la población tienen la misma probabilidad de hacer parte de la muestra, el conjunto de muestras posibles que pueden seleccionarse de la población y la probabilidad de selección de cada una de ellas deben definirse aplicando la teoría de muestreo. Variable, Característica a ser analizada en elementos de una población o muestra. Pueden corresponder a una cualidad o cantidad. Cualitativa. - Corresponde a un atributo, susceptible de ser expresado en palabras o nombres y no en forma numérica. Cuantitativa. - Concierne a característica susceptible de ser expresada numéricamente. La variable cuantitativa puede ser: Discreta, asume valores numéricos enteros, entre valores consecutivos no hay valores intermedios, no puede asumir un número racional que no sea entero, y Continua, la resultante de una medición, entre valor y valor consecutivo si hay valores intermedios, puede asumir un número racional que no sea entero. Dato, Valor asignado a una variable o característica examinada en elementos de la población o muestra. Nominal. Asigna como valor, atributo o nombre susceptible de ser organizado en categorías. Ordinal. Asigna como valor, atributo o nombre susceptible de ser organizado en categorías ordenadas jerárquicamente. Numérico. Asigna como valor, número que representa una magnitud comparable. Numérico de Intervalo; presenta valores en intervalos de igual amplitud ordenados según su magnitud, la diferencia de valores tiene interpretación, incluye cero (0) como valor relativo o arbitrario el cual no implica ausencia de medición o magnitud de la variable. Numérico de Razón; la diferencia con el numérico de intervalo radica en que no solo tiene interpretación la diferencia de valores, sino que también tiene interpretación la diferencia de cocientes, y que incluye el cero (0) como valor absoluto, implicando valor nulo o ausencia de magnitud en la variable. Datos. - Colección o conjunto de valores asignados a una característica o variable examinada en los elementos de la población o muestra, por medio de la observación o medición. Fuente, Cuando se requiere de información para satisfacer una necesidad de conocimiento, cuando se pretende recolectar una serie de datos para solucionar situaciones problema del contexto realidad o para adelantar procesos de investigación, se recurre a una fuente de información. Fuente primaria. - información o dato observado o recogido por contacto directo con el elemento primario. Fuente secundaria. - información o dato recogido por otra persona, quien fue la que tuvo el contacto directo con el elemento primario. Instrumento, Cuando se hace referencia al instrumento de recolección dedato o información en el elemento de investigación o estudio, se habla del recurso utilizado para ese propósito, entre los que se encuentran: Observación, Encuesta, Entrevista, Cuestionario, Prueba, Test, Censo, entre otros. Ahora bien, hay que tener en cuenta que una cosa es el instrumento de recolección y otra bien distinta es el medio por el cual se aplica dicho instrumento. Es el caso, por ejemplo, la encuesta puede aplicarse de manera personal, virtual o cualquier otro medio de comunicación como forma de aplicación. Así mismo pasa con otros instrumentos, pueden ser aplicados por medios diferentes. A continuación, se plantea una situación problema del contexto real con base en la inclusión, en él, de la terminología estadística. Situación problema.- La línea de proyecto preferida por los estudiantes de VIII semestre del programa Ingeniería Industrial de la Universidad, en un determinado año, para desarrollar su trabajo de aula se revisa con la docente del curso diseño de producto y del registro total de noventa (90) trabajos se seleccionan aleatoriamente veinte (20) de ellos, observándose: Elaboración, Impacto ambiental, Elaboración, Impacto ambiental, Automatización, Rediseño, Elaboración, Impacto ambiental, Automatización, Impacto ambiental, Rediseño, Rediseño, Elaboración, Impacto ambiental, Impacto ambiental, Rediseño, Impacto ambiental, Impacto ambiental, Rediseño y Automatización,. Revisando el planteamiento anterior para descubrir en él y hacer la descripción de términos estadísticos que involucra, podemos deducir los siguientes: 1.- Población. Noventa (90) trabajos de aula desarrollados por estudiantes de VIII semestre del programa de Ingeniería Industrial de la Universidad, en un determinado año. 2.- Tipo de población. Finita, noventa (90) trabajos de aula. 3.- Muestra. Veinte (20) trabajos de aula seleccionados aleatoriamente. 4.- Tipo de muestreo. Probabilístico, selección aleatoria. 5.- Elemento. Trabajo de aula. 6.- Variable. Línea de proyecto. 7.- Tipo de variable. Cualitativa. 8.- Dato. Elaboración. 9.- Tipo de dato. Nominal, se expresa como nombre. 10.- Datos. Elaboración, Impacto ambiental, Automatización, Rediseño. 11.- Fuente. Secundaria, los datos fueron recolectados de los registros de la docente. 12.- Instrumento. Observación, hecha a los registros de la docente. APLICACIÓN N° 1. Fundamentos de Estadística descriptiva. 2. Tablas de frecuencia. Tabla de frecuencias para Datos Agrupados en Forma Discreta. A partir de los aspectos desarrollados en fundamentos de la Estadística, la construcción de la tabla de distribución de frecuencias para datos agrupados en forma discreta debe concebirse como el resumen, en ella, de datos no agrupados de variables cualitativas o cuantitativas. Toda tabla de distribución de frecuencias debe contener como identificación un número y un título. Su configuración en matriz o marco, conformada por columnas y filas, presenta en la primera columna la variable, en las columnas siguientes las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas. Su proceso de elaboración es el siguiente: Variable (xi): x1, x2, . . ., x k. Corresponden a los valores diferentes que puede tomar la variable, bien sea cualitativa o cuantitativa. Frecuencia absoluta (ni): n1, n2, . . ., n k. Resultante de contar el número de veces que la variable toma determinado valor. Su sumatoria es igual al número total de datos o elementos o al tamaño de la muestra (n). Sumatoria (∑) indica sumar. Sumatoria de frecuencias absolutas (∑ n i) implica, ∑ n i = n1 + n2 +. . . + n k = n. Frecuencia relativa (h i): h 1, h 2, . . ., h k. Resultan de dividir las frecuencias absolutas n 1, n 2, . . ., n k, anotadas en cada valor de la variable x 1, x 2, . . ., x k, con la ∑ n i o número total de datos o elementos o tamaño de muestra (n), así: h 1 = n 1 / n; h 2 = n 2 / n; . . .; h k = n k / n. ∑ h i = h 1 + h 2 +. . . + h k = 1.00, y los valores de las frecuencias relativas deben estar entre 0.00 ≤ h i ≤ 1.00. Frecuencia absoluta acumulada (N i): N 1, N 2, . . ., N k. Corresponden a sumar las frecuencias absolutas, así: N 1 = n 1; N 2 = n 1 + n 2 o N 2 = N 1 + n 2; . . .; N k = n 1 + n 2 + . . . + n k. Frecuencia relativa acumulada (H i): H 1, H 2, . . ., H k. Corresponden a sumar las frecuencias relativas, así: H 1 = h 1; H 2 = h 1 + h 2 o H 2 = H 1 + h 2; . . .; H k = h 1 + h 2 + . . . + h k = ∑ h i = 1.00. Variable x i Frecuencia absoluta n i Frecuencia relativa h i Frec. Absol. Acumulada N i Frec. Relat. Acumulada H i x 1 n 1 h 1 N 1 H 1 x 2 n 2 h 2 N 2 H 2 * * * * * * * * * * * * * * * x k n k h k N k H k Total ∑n i = n ∑h i = 1.00 La tendencia en una muestra de 20 trabajos de aula desarrollados por estudiantes del curso diseño de producto, en VIII semestre del programa Ingeniería Industrial de una Universidad, está enmarcada en las siguientes líneas de proyectos: Rediseño, Impacto ambiental, Automatización, Impacto ambiental, Elaboración, Rediseño, Automatización, Impacto ambiental, Impacto ambiental, Elaboración, Rediseño, Impacto ambiental, Rediseño, Impacto ambiental, Elaboración, Impacto ambiental, Automatización, Elaboración, Impacto ambiental, Rediseño. En el anterior planteamiento se observa la variable de tipo cualitativa Línea de Proyecto que toma como valores diferentes los siguientes datos de tipo nominal; Rediseño (de productos ergonómicos), Impacto ambiental (en energía solar y tratamiento de aguas), Automatización (de estructuras y maquetas) y Elaboración (de productos a partir de materiales naturales y material reciclado). Se encuentran veinte (20) trabajos de aula. Usando conteo se determina que cinco (5) de ellos son desarrollados prefiriendo la línea de proyecto Rediseño, ocho (8) son desarrollados en la línea de proyecto Impacto ambiental, tres (3) en la línea de proyecto Automatización y cuatro (4) en la línea de proyecto Elaboración. La tabla de frecuencias que resume esta situación, es la siguiente: Tabla N° 1.- Distribución de frecuencias. Línea de proyecto preferida en trabajos de aula, en el curso diseño de producto. Línea de Proyecto N° trabajos de aula Frecuencia Relativa Frecuencia Absoluta Acumulada Frecuencia Relativa Acumulada Rediseño 5 0.25 5 0.25 Impacto ambiental 8 0.40 13 0.65 Automatización 3 0.15 16 0.80 Elaboración 4 0.20 20 1.00 Total 20 1.00 APLICACIÓN N° 2. Tabla de frecuencias para Datos Agrupados en Clases o Intervalos. La tabla resume, en ella, datos no agrupados de variables cuantitativas. Se identifica con un número y un título, en la matriz o marco, formada por columnas y filas, la primera columna presenta la variable en grupos de datos, es decir en clases o intervalos, y en las columnas siguientes, las marcas de clases, frecuencias absolutas, frecuencias relativas, las absolutas acumuladas y las relativas acumuladas. Su proceso de elaboración es el siguiente: Variable (x i - 1 - x i + 1): (x i - 1 - x i + 1) ; (x i + 1 - x i + 2) ; . . . ; (x k - 1 - x k + 1). Corresponden a las clases o intervalos conformados por grupos de datos numéricos que toma la variable cuantitativa. Se expresan con un límite inferior x i – 1 y con un límite superior x i + 1. Variable (x i): x 1, x 2, . . ., x k. Corresponden a las marcas de clase o valor medio o valor de la mitad en cada una de las clases o intervalos. Se obtienen al dividir por dos el resultado de la suma del límite inferior más el límite superior. Frecuencia absoluta (n i): n 1, n 2, . . ., n k. Resultante de contar el número de valores o datos de la variable en cada una de las clases o intervalos.Se debe entender que en cada clase o intervalo se cuentan los valores o datos que estén entre el límite inferior incluyéndolo y el límite superior excluyéndolo. La suma del número de datos o frecuencia en cada clase o intervalo es igual al número total de datos o elementos del problema o tamaño de la muestra (n). Sumatoria (∑) indica sumar. La suma de las frecuencias absolutas ∑ n i implica, ∑ n i = n 1 + n 2 +. . . + n k = n. Frecuencia relativa (h i): h 1, h 2, . . ., h k. Resulta de dividir las frecuencias absolutas n 1, n 2, . . ., n k, anotadas en las clases o intervalos y la ∑ n i o número total de datos o elementos o tamaño de muestra, así: h 1 = n 1 / n; h 2 = n 2 / n; h k = n k / n. Las frecuencias relativas deben estar entre 0.00 ≤ h i ≤ 1.00. Sumatoria (∑) indica sumar. La suma de las frecuencias relativas ∑ hi implica: ∑ h i = h 1 + h 2 +. . . + h k = 1.00. Frecuencia absoluta acumulada (N i): N 1, N 2, . . ., N k. Corresponden a ir sumando una a una las frecuencias absolutas, así: N 1 = n1; N2 = n 1 + n 2 o N 2 = N 1 + n 2; . . .; N k = n1 Variable (x i - 1 - x i + 1) Variable x i Frecuencia absoluta n i Frecuencia relativa h i Frec. Absol. Acumulada N i Frec. Relat. Acumulada H i (x i - 1 - x i + 1) x 1 n 1 h 1 N 1 H 1 (x i + 1 - x i + 2) x 2 n 2 h 2 N 2 H 2 * * * * * * * * * * * * * * * * * * (x k - 1 - x k + 1) x k n k h k N k H k Total ∑n i = n ∑h i = 1.00 + n 2 + . . . + n k = ∑ n i = n, así, la última frecuencia absoluta acumulada N k es igual a la sumatoria de las frecuencias absolutas ∑ n i o al número total de datos o elementos o tamaño de la muestra n. Frecuencia relativa acumulada (H i): H 1, H 2, ..., H k. Corresponden a ir sumando una a una las frecuencias relativas, así: H 1 = h 1; H 2 = h 1 + h 2 o H 2 = H 1 + h 2; ...; H k = h 1 + h 2 + . . . + h k = ∑ h i = 1.00, así, la última frecuencia relativa acumulada H k es igual a la suma de las frecuencias relativas ∑ h i o igual a 1.00. Surge ahora preguntas como: ¿Cuántas clases o intervalos debe contener la tabla?; ¿Cuál es el ancho o la amplitud de las clases o intervalos?; ¿Cómo conformar las clases o intervalos en cuanto a sus límites inferiores y superiores?; ¿Cómo calcular marcas de clase?; ¿Cómo tabular o ubicar los datos de la variable en las clases o intervalos?; entre otras. Para responder estos interrogantes, se presenta a continuación el método de clasificación a ser utilizado en la aplicación del tema datos agrupados en clases o intervalos y ser tenido en cuenta por los estudiantes en la actividad propuesta sobre el mismo tema. Número de clases o intervalos. C = 1 + 3.3 Log (n). Siendo n = número total de datos o elementos o tamaño de la muestra. El resultado siempre será aproximado al número entero siguiente. Rango inicial o de la serie de datos de la variable X. R = X Máx. – X Mín. Se obtiene restando del valor máximo de la variable X el valor mínimo. Amplitud o ancho de clase o intervalo. A = R / C Es el resultado de dividir el rango obtenido entre el número de clases o intervalos. El resultado siempre se aproxima al entero, 1er decimal, 2° decimal, etc., siguiente. Rango nuevo. R’ = C * A Consiste en multiplicar las clases o intervalos por la amplitud. Los resultados del número de clases y de la amplitud deben ser los aproximados. Diferencia de rangos. D = R’ – R Se obtiene una vez reste del rango nuevo el rango inicial de la serie. Se debe tener presente que el rango nuevo siempre será mayor que el rango inicial de la serie, siempre habrá diferencia, ésta nunca será cero (0), mucho menos negativa. Configuración de las clases o intervalos. Primera Clase o Intervalo. Límite inferior = X Mín. – D / 2 Al dato menor restarle la mitad de la diferencia. Límite superior = Límite inferior de la clase o intervalo + Amplitud o ancho de clase. Segunda Clase o Intervalo. Límite inferior = Límite superior de la 1ª. Clase o Intervalo. Límite superior = Límite inferior de la 2ª. Clase o Intervalo + Amplitud o ancho de clase. A partir de la Tercera Clase o Intervalo. Límite inferior = Límite superior de la Clase o Intervalo anterior. Límite superior = Límite inferior de la Clase o Intervalo + Amplitud o ancho de clase. Para la construcción de la tabla de distribución de frecuencias de datos agrupados en clases o intervalos se tiene en cuenta, para ser utilizado en esta aplicación, el método de clasificación propuesto en la temática. Para esta aplicación, se parte de las calificaciones o notas definitivas del semestre, antes de habilitación, de cuarenta (40) estudiantes de dos (2) de los cursos de Estadística Descriptiva uno de la jornada diurna y el otro de la jornada nocturna, cuyos datos resultantes fueron: 2.6 3.0 3.4 3.5 3.4 3.0 3.2 2.8 3.1 3.7 4.0 3.9 3.3 2.0 3.8 3.9 3.4 3.3 2.6 3.6 3.1 3.5 2.2 3.3 2.5 2.9 2.5 2.7 3.0 3.0 3.2 2.8 3.0 3.1 2.3 2.4 3.0 3.6 2.7 2.2 C = 1 + 3.3 Log (40) = 1 + 3.3 (1.60205999) = 1 + 5.286797967 = 6.286797967 Resultado de aproximar clases al número entero siguiente. Siempre será entero. R = X Máx. – X Mín. = 4.0 – 2.0 = 2.0 Resultado de restar de la calificación máxima definitiva, la calificación mínima. A = R / C = 2.0 / 7 = 0.285714286 La amplitud se deja en un decimal, aproximada al decimal siguiente es decir 0.3, por estar las calificaciones dadas en este estilo de datos. R’ = C ٭ A = 7 2.1 = 0.3 ٭ Por efecto de las aproximaciones, el rango inicial 2.0 pasa a 2.1 rango nuevo. D = R’ – R = 2.1 – 2.0 = 0.1 Resultado de restar del rango nuevo, el rango inicial. Primera Clase o Intervalo = X Mín. – D / 2 = 2.0 – 0.1 / 2 = 2.0 – 0.05 = 2.0 – 0.0 = Obsérvese que a la calificación o nota mínima que está dada con un decimal 2.0 cuando se le va a restar la mitad de la diferencia D / 2, por ser esta impar, 0.1 el resultado da con dos decimales 0.05, el cual para restarse debe aproximarse bien dejándolo con un decimal, 0.0. = Límite INF + A = 2.0 + 0.3 = Segunda Clase o Intervalo Límite INF = Límite SUP de la primera clase o Intervalo = 2.3 Límite SUP = Límite INF de la segunda Clase o Intervalo + A = 2.3 + 0.3 = 2.6 Tercera Clase o Intervalo y siguientes Límite INF = Límite SUP de la segunda clase o Intervalo = 2.6 Límite SUP = Límite INF de la tercera Clase o Intervalo + A = 2.6 + 0.3 = 2.9 APLICACIÓN N° 3. C ≈ 7 R = 2.0 A ≈ 0.3 R’ = 2.1 D = 0.1 Límite INF Límite SUP 2.0 2.3 Para las Clases o Intervalos siguientes se hace el mismo procedimiento que se ha explicado, por lo tanto, el Límite INF = Límite SUP de la Clase o Intervalo anterior y el Límite SUP = Límite INF de la Clase o Intervalo que se está estableciendo sumándole la Amplitud. Así los datos estén dados en enteros, con un decimal, con dos decimales o más, las Clases o Intervalos siempre será aproximada a número entero siguiente al resultante de su cálculo. Observe como para las calificaciones o notas trabajadas, dadas con un decimal, a excepción de las Clases o Intervalos que se dan en entero, todas las demás medidas incluyendo límites inferiores y superiores de las Clases o intervalos se dan en valores con un decimal. Si la información a trabajar está dada en enteros, todos los valores calculados deben estar en enteros. Si son con 1 decimal todos los valores deben quedar con 1 decimal, excepto las Clases o Intervalos que siempre será aproximado a entero, y así sucesivamente. Debe tener bien en cuenta al determinar cuál de los valores de los datos es el mayor o X Máx. y cuál es el menor o X Mín. porque desde ahí pueden empezar los problemasde clasificación. Así como el número de Clases o Intervalos se aproxima a número entero siguiente, la Amplitud de Clase o Intervalo también debe aproximarse, pero teniendo en cuenta de dejarla en número entero si los datos o información a trabajar son enteros, en número con un decimal si la información o datos a trabajar está presentada en este estilo, en número con dos decimales si es este el caso y así sucesivamente. El Rango nuevo R’ siempre será mayor que el Rango inicial R, por consiguiente, siempre habrá una diferencia, la diferencia no podrá ser cero (0), mucho menos negativa (–) Para el cálculo del límite INF de la primera Clase o Intervalo en lo que refiere a la mitad de la diferencia D / 2 que se debe restar del dato menor X MÍN., en datos enteros si la diferencia es impar su mitad se transforma en resultado con un decimal, si los datos son con un decimal y la diferencia es impar igual su mitad se convierte en resultado con dos decimales, y así si los datos son con dos decimales y la diferencia es impar su mitad se vuelve con tres decimales. En consecuencia, para cada uno de estos casos se debe aproximar bien dejándolo en entero, en un decimal o dos decimales según el caso, para restar de X MÍN. entero una D / 2 entero, de X MÍN. con un decimal restar una D / 2 con un decimal y de X MÍN. con dos decimales restar una D / 2 con dos decimales. Recuerde que para aproximar bien el criterio de aproximación a utilizar debe ser el de compensación, es decir, si el número anterior o número que se debe aproximar es par no se aproxima, se deja así, pero en cambio si el número anterior o número a aproximar es impar si se aproxima, al número siguiente, sea para dejarlo en entero, con un decimal, dos decimales, etc. La tabla de frecuencia que refleja el método de clasificación utilizado para resumir los datos numéricos expresados con un decimal de la variable cuantitativa calificaciones definitivas del semestre, antes de habilitación, de cuarenta (40) estudiantes de dos (2) de los cursos de Estadística Descriptiva, unos de jornada diurna y otros de jornada nocturna, es: Para recordar: Tabla N° 2.- Distribución de frecuencias. Calificaciones definitivas del semestre, antes de habilitación, de 40 estudiantes, diurnos y nocturnos, de Estadística Descriptiva. La tabla de distribución de frecuencias se construye teniendo en cuenta los resultados de la clasificación propuesta y utilizada. Ella presenta: 7 clases o intervalos de amplitud constante de 0.3, cada una, entre el límite inferior y superior; el nuevo rango de 2.1 que va desde 2.0 hasta 4.1 donde se incluyen todas las calificaciones o notas definitivas del semestre teniendo en cuenta que la mínima fue de 2.0 y la máxima de 4.0; y la diferencia de rangos que fue de 0.1 comprobada al observar en que calificación o nota menos que la menor inicia la 1ª Clase o Intervalo y en que más que la mayor termina la última clase (inicia en la mínima 2.0 pero termina en 4.1, es decir 0.1 más que la máxima que fue de 4.0). La segunda columna de la tabla corresponde a la marca de clase. Se debe recordar que ésta se calcula sumando el límite inferior más el límite superior y esta suma dividirla por dos. Este procedimiento se repite en todas las clases o intervalos de la tabla, pero si se quiere obviar, también se pueden obtener si a la primera marca de clase se le suma la amplitud para hallar la segunda, a la segunda se le suma la amplitud para obtener la tercera y así sucesivamente, hasta obtener la última. Para establecer el N° de estudiantes en cada Clase o Intervalo debe entenderse como incluir en él las calificaciones o notas que van desde la representada en el límite inferior hasta una menos de la expresada en el límite superior, esto es lo que se conoce como límite inferior incluyente, límite superior excluyente. Así las cosas, para obtener cuantos estudiantes tienen calificaciones o notas entre (2.0 - 2.3) revisamos los datos para ver el número de ellos que quedaron con definitiva de 2.0, 2.1 o 2.2. 2.6 3.0 3.4 3.5 3.4 3.0 3.2 2.8 3.1 3.7 4.0 3.9 3.3 2.0 3.8 3.9 3.4 3.3 2.6 3.6 3.1 3.5 2.2 3.3 2.5 2.9 2.5 2.7 3.0 3.0 3.2 2.8 3.0 3.1 2.3 2.4 3.0 3.6 2.7 2.2 Se observa son tres los estudiantes que obtienen calificación o nota definitiva del semestre, antes de habilitación, que cumplen con la condición de estar entre 2.0 y menos de 2.3. Calificaciones definitivas Calificaciones definitivas N° de Estudiantes Frecuencia Relativa Frecuencia Absoluta Acumulada Frecuencia Relativa Acumulada (2.0 – 2.3) 2.15 3 0.08 3 0.08 (2.3 – 2.6) 2.45 4 0.10 7 0.18 (2.6 – 2.9) 2.75 6 0.15 13 0.33 (2.9 – 3.2) 3.05 10 0.25 23 0.58 (3.2 – 3.5) 3.35 8 0.20 31 0.78 (3.5 – 3.8) 3.65 5 0.12 36 0.90 (3.8 – 4.1) 3.95 4 0.10 40 1.00 Total Total 40 1.00 Para saber cuántos estudiantes tienen calificaciones o notas entre (2.3 - 2.6) revisamos los datos para ver el número de ellos que quedaron con definitiva de 2.3, 2.4 o 2.5. 2.6 3.0 3.4 3.5 3.4 3.0 3.2 2.8 3.1 3.7 4.0 3.9 3.3 2.0 3.8 3.9 3.4 3.3 2.6 3.6 3.1 3.5 2.2 3.3 2.5 2.9 2.5 2.7 3.0 3.0 3.2 2.8 3.0 3.1 2.3 2.4 3.0 3.6 2.7 2.2 Se observa son cuatro estudiantes que obtienen calificación o nota definitiva del semestre, antes de habilitación, que cumplen con la condición de estar entre 2.3 y menos de 2.6. Siguiendo este mismo procedimiento se obtiene que para la Clase o Intervalo (2.6 - 2.9), es decir calificaciones definitivas de 2.6, 2.7 o 2.8, se encuentran seis estudiantes; (2.9 - 3.2), notas de 2.9, 3.0 o 3.1, se obtienen diez estudiantes; (3.2 - 3.5), notas de 3.2, 3.3 o 3.4, se hallan ocho estudiantes; (3.5 - 3.8), notas de 3.5, 3.6 o 3.7, se localizan cinco estudiantes y de (3.8 - 4.1), notas de 3.8, 3.9 o 4.0, se cuentan cuatro estudiantes. Para la obtención de frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada, se deben seguir los lineamientos planteados en el desarrollo de la temática tabla de frecuencias para datos agrupados en Clases o Intervalos, expresados anteriormente. Fundamentos de Estadística descriptiva. 3. Gráficos estadísticos. Gráficas de frecuencias para representar Datos Agrupados en Forma Discreta (Diagrama de Barras, Diagrama de Pastel). La construcción de gráficas de frecuencias, diagrama de barras y diagrama de pastel, para representar información contenida en tablas de frecuencias para datos agrupados en forma discreta, debe entenderse como la forma de resumir en ella datos no agrupados de variables cualitativas o cuantitativas. Toda gráfica de frecuencias debe identificarse con un número y con un título. Diagrama de Barras. - Utiliza el primer cuadrante del plano cartesiano, representa en el eje equis (x) o abscisa la variable y en el eje ye (y) u ordenada la frecuencia bien sea absoluta o relativa manejando escala. Se traza una línea a la altura de la frecuencia a representar y se une con perpendiculares al eje formando una barra. Las barras se representan de manera vertical u horizontalmente. De ser necesario utiliza convenciones para dar claridad al gráfico. Retomando el ejercicio planteado en la aplicación anterior sobre línea de proyecto preferida en los trabajos de aula en el curso diseño de producto y con base en la tabla de frecuencias para él elaborada, se construye diagrama de barras representando las frecuencias absolutas y las frecuencias relativas en forma de barras verticales. Gráfica N° 1. - Diagrama de barras. Línea de proyecto preferida en trabajos de aula, en el curso de diseño de producto. 0 2 4 6 8 Rediseño Impacto ambiental Automatización Elaboración N ° tr a b a jo s d e a u la Línea de proyecto Línea de Proyecto N° trabajos de aula FrecuenciaRelativa Rediseño 5 0.25 Impacto ambiental 8 0.40 Automatización 3 0.15 Elaboración 4 0.20 Total 20 1.00 APLICACIÓN N° 4. Gráfica N° 2.- Diagrama de barras. Línea de proyecto preferida en trabajos de aula, en el curso de diseño de producto. Diagrama de pastel. - Llamado también de Torta o Circular. Utiliza la circunferencia, presenta los datos en sectores circulares de manera proporcional una vez convertidas las frecuencias absolutas o relativas en porcentajes, de forma tal que a mayor porcentaje mayor sector o porción de pastel. Requiere de expresar en el título del gráfico el total de elementos. De ser necesario utiliza convenciones para dar claridad al gráfico. Se retoma el ejercicio planteado en la aplicación anterior sobre línea de proyecto preferida en los trabajos de aula en el curso diseño de producto y con base en la tabla de frecuencias, convirtiendo las frecuencias relativas en valores porcentuales, multiplicando éstas por 100, se construye diagrama de pastel representando porcentajes. Gráfica N° 3. - Diagrama de Pastel. – Línea de proyecto preferida en 20 trabajos de aula en el curso diseño de producto. Gráficas de frecuencias para representar datos Agrupados en Clases o Intervalos (Histograma de frecuencias, Polígono de frecuencias, Ojiva). La elaboración de las gráficas de frecuencias, Histograma, Polígono y Ojiva, diseñadas para representar información contenida en tablas de frecuencias para datos agrupados en forma de Clases o intervalos debe ser entendida como el resumen, en ella, de datos no agrupados de variables cuantitativas que presentan alta variabilidad en sus datos. Todas las gráficas de frecuencias deben identificarse con un número y un título. 0,00 0,10 0,20 0,30 0,40 Rediseño Impacto ambiental Automatización Elaboración N ° tr a b a jo s d e a u la Línea de proyecto Línea de Proyecto N° trabajos de aula Porcentaje (%) Rediseño 5 25% Impacto ambiental 8 40% Automatización 3 15% Elaboración 4 20% Total 20 100% APLICACIÓN N° 5. 25% 40% 15% 20% Rediseño Impacto ambiental Automatización Elaboración Histograma de frecuencias. - Utiliza el primer cuadrante del plano cartesiano, representa en el eje equis (x) o abscisa la variable cuantitativa expresada en Clases o Intervalos y en el eje ye (y) u ordenada la frecuencia bien sea absoluta o relativa, manejando escala. Se traza una línea a lo largo de cada Clase o Intervalo y a la altura de la frecuencia a representar. Las líneas así trazadas se unen con perpendiculares al eje formando una barra. Las barras se representan de manera vertical, pero a diferencia del diagrama de barras, en el Histograma las barras quedan unidas, contiguas o pegadas, formando así esta gráfica. De ser necesario se utiliza convenciones para hacer claridad. Polígono de frecuencias. - Igual que la gráfica anterior, utiliza el primer cuadrante del plano cartesiano, representa en el eje equis (x) o abscisa la variable cuantitativa expresada en Clases o Intervalos y en el eje ye (y) u ordenada la frecuencia bien sea absoluta o relativa, manejando escala. Se coloca un punto en la mitad de cada Clase o Intervalo y a la altura de su correspondiente frecuencia. Los puntos así colocados a lo largo de la gráfica se unen con una línea recta, formando el Polígono. También, de ser necesario, utiliza convenciones. Ojiva. - Igual que las dos gráficas anteriores, Histograma y Polígono de frecuencias, la Ojiva utiliza también el primer cuadrante del plano cartesiano, pero a diferencia del Histograma de frecuencias y el Polígono de frecuencias que representan las frecuencias absolutas o relativas, la Ojiva representa las frecuencias absolutas acumuladas o relativas acumuladas, manejando una escala según los datos. Se coloca un punto al finalizar de cada Clase o Intervalo y a la altura de su correspondiente frecuencia acumulada a representar. Los puntos así colocados se unen con una línea curva, formando la Ojiva. La ilustración de cada una de las gráficas, Histograma, Polígono y Ojiva, que representa de manera resumida información procesada de datos no agrupados de variable cuantitativa en datos agrupados en Clases o Intervalos, utilizando datos de la tabla sobre calificaciones o notas definitivas del semestre, antes de habilitación, de cuarenta (40) estudiantes de dos (2) de los cursos de Estadística Descriptiva uno de la jornada diurna y el otro de la jornada nocturna, se observa a continuación: Gráfica N° 4.- Histograma de frecuencias.- Calificaciones definitivas de semestre, estudiantes Estadística Descriptiva. Calificaciones definitivas N° de Estudiantes (2.0 – 2.3) 3 (2.3 – 2.6) 4 (2.6 – 2.9) 6 (2.9 – 3.2) 10 (3.2 – 3.5) 8 (3.5 – 3.8) 5 (3.8 – 4.1) 4 Total 40 APLICACIÓN N° 6. Gráfica N° 5.- Polígono de frecuencias.- Calificaciones definitivas de semestre, estudiantes Estadística Descriptiva. Gráfica N° 6.- Ojiva. - Calificaciones definitivas de semestre, estudiantes Estadística Descriptiva. Las gráficas que se presentan en esta aplicación N° 6, Histograma de frecuencias, Polígono de frecuencias y Ojiva, están construidas en Excel. Las gráficas así construidas representan datos numéricos de variables cuantitativas, que una vez resumidos en tablas de frecuencias para datos agrupados en Clases o Intervalos, revelan información pertinente a una situación problema de un contexto real. El Histograma de Frecuencias y el Polígono de Frecuencias representan frecuencias absolutas simples o relativas simples. La Ojiva representa frecuencias absolutas acumuladas o relativas acumuladas. En la construcción del Polígono de Frecuencias el punto se ubica en la mitad del intervalo. En la Ojiva el punto se ubica al finalizar el intervalo. Calificaciones definitivas N° de Estudiantes (2.0 – 2.3) 3 (2.3 – 2.6) 4 (2.6 – 2.9) 6 (2.9 – 3.2) 10 (3.2 – 3.5) 8 (3.5 – 3.8) 5 (3.8 – 4.1) 4 Total 40 Calificaciones definitivas Frecuencia Absoluta Acumulada (2.0 – 2.3) 3 (2.3 – 2.6) 7 (2.6 – 2.9) 13 (2.9 – 3.2) 23 (3.2 – 3.5) 31 (3.5 – 3.8) 36 (3.8 – 4.1) 40 Total 0 5 10 15 20 25 30 35 40 2,0 2,3 2,6 2,9 3,2 3,5 3,8 4,1 N ú m e ro d e e s tu d ia n te s Calificaciones definitivas Para recordar:
Compartir