Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ARITMÉTICA ADMISIÓN 2020 - II 1 ESTADÍSTICA 1. DEFINICION Es aquella que nos proporciona un conjunto de métodos, procedimientos o técnicas para recopilar, clasificar, analizar y presentar datos con el fin de describirlos o de realizar generalizaciones válidas. El estudio de la estadística puede dividirse en dos áreas principales: Estadística Descriptiva. - que comprenden las técnicas que se emplean para la recopilación, organización, resumen y presentación de los datos (o información). Estadística Inferencial. - comprende técnicas que con base únicamente en una muestra o subconjunto de la población sometida a observación o experimentación, se toma decisiones sobre toda la población. La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que estas sean dadas con una medida de confiabilidad que es la probabilidad. 2. POBLACION Y MUESTRA Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población. Las personas o cosas que forman parte de la población se denominan unidad elemental o unidad estadística. La población puede ser según su tamaño de dos tipos finita o infinita. Normalmente en un estudio estadístico, no se puede trabajar con todos los elementos de la población, sino que se realiza sobre un subconjunto de la misma al que se le llama muestra, es decir un determinado número de elementos de la población. La muestra debe ser seleccionada adecuadamente de manera que el tamaño de muestra sea representativo de la población para posibles inferencias a realizar. 3. VARIABLES ESTADISTICAS Al estudiar una población o muestra nos concentramos en una característica de los individuos u objetos que le conforman; si esta característica tiene variabilidad o variación se denomina variable estadística y el resultado de las observaciones o mediciones de la característica se llama dato estadístico. Cuando la característica o variable en estudio es no numérica o numérica no operable se le denomina variable cualitativa o atributo. Así, por ejemplo: el estado civil de una persona, su nacionalidad, tipo de automóvil que posee, ciclo en el que se encuentra un alumno, etc. son variables cualitativas. Cuando la variable de estudio se puede expresar numéricamente y se puede hacer operaciones con ella, entonces se denomina variable cuantitativa. Así, por ejemplo: el saldo de una cuenta bancaria; la estatura de una persona, el número de hijos en una familia, son variables cuantitativas, estas variables cuantitativas pueden ser: a. discretas: Aquellas a las que se les puede asociar un número entero, es decir, aquellas que por su naturaleza no admiten fraccionamiento de la unidad, por ejemplo, número de hijos, número de empleados de una empresa, número de ruedas de un vehículo, etc. ARITMÉTICA ADMISIÓN 2020 - II 2 Cuadro de Clasificación de Variables Cualitativas Discretas Continuas Cuantitativas Variables b. continuas, Aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo, pesos, tiempo de duración de en proceso y estaturas de personas, etc.). 4. ORGANIZACIÓN Y PRESENTACION DE DATOS I. DATOS NO AGRUPADOS. La información que se ha recopilado pero que aún no se organiza se debe ordenar. Si los datos incluyen valores repetidos se puede organizar una distribución de frecuencias que es una tabla o lista de los distintos valores de la variable (x). Sean x1,x2, x3,…., xk los distintos valores que puede tomar la variable x. La Frecuencia absoluta (fi), designa el número de veces que el valor correspondiente aparece en el conjunto de datos. Por ejemplo, f1,f2, f3,…., fk indican las respectivas frecuencias absolutas de los valores x1,x2, x3,…., xk La Frecuencia relativa (hi), de cada valor, indica la frecuencia expresada como fracción o porcentaje del total. Si n es el número de datos, la frecuencia relativa del valor xi sera: , i=1,2,....,k i i f h n La Frecuencia Absoluta Acumulada (Fi) es la suma de todas las frecuencias absolutas f1, f2,……., fi : i21i f...ffF La Frecuencia Relativa Acumulada (Hi) Es el cociente entre la frecuencia acumulada absoluta correspondiente al dato xi , y el número total de datos. n F H ii ; h h h i 1 2 iH ... Ejemplo 1: Se realizó una encuesta entre los 50 empleados de una empresa, consultando sobre el número de hijos en edad escolar que tenía cada empleado, a fin de estimar el pago de una bonificación por gastos escolares que proyecta hacer la empresa. Estos fueron los resultados: 0 2 1 0 3 2 0 1 1 0 0 1 1 2 4 1 0 1 1 0 2 1 0 0 3 0 0 1 2 1 0 0 2 4 1 1 0 1 2 0 1 1 0 3 5 1 2 1 3 2 ARITMÉTICA ADMISIÓN 2020 - II 3 Organizar los datos en una distribución de frecuencias, enlistando cada valor diferente (x) en una columna, luego empleamos marcas para contar el número de veces que aparece cada valor de x y al acabar, anotamos la frecuencia absoluta (f) y luego calculamos la frecuencia relativa (h). Tabla 1. Nro de hijos por empleados de una empresa. No. de hijos X Conteo Frecuencia absoluta (f) Frecuencia relativa (h) Frecuencia Absoluta Acumulada Frecuencia Relativa Acumulada 0 \\\\ \\\\ \\\\ \ 16 16/50 = 0.32 = 32% 16 32% 1 \\\\ \\\\ \\\\ \\\ 18 18/50 = 0.36 = 36% 34 68% 2 \\\\ \\\\ 9 9/50 = 0.18 = 18% 43 86% 3 \\\\ 4 4/50 = 0.08 = 8% 47 94% 4 \\ 2 2/50 = 0.04 = 4% 49 98% 5 \ 1 1/50 = 0.02 = 2% 50 100% n = 50 Total = 1 = 100% El total de frecuencias absolutas debe ser el total de datos y el total de frecuencias relativas debe ser el 100%. Ambos totales permiten verificar los cálculos realizados. II.- DATOS AGRUPADOS Cuando los datos consisten en solo unos cuantos valores distintos (es el caso de los datos del ejemplo anterior que tomaba solo los valores 0, 1, 2, 3, 4 y 5), podemos organizarlos fácilmente y determinar cualquier tendencia, sin embargo cuando los datos consisten en muchos valores en su mayoría no repetidos es conveniente agrupar los datos y determinar las frecuencias absolutas y relativas de cada grupo que llamaremos clase. Necesitamos estas definiciones: ARITMÉTICA ADMISIÓN 2020 - II 4 a) Rango Recorrido (R). Es la diferencia entre el mayor de los datos xmáx y el menor de los datos xmin. R = xmax – xmin b) Intervalo de Clase b, a ii Son cada una de las categorías excluyentes (o clases) en los que se pueden clasificar los datos. Los extremos de un intervalo [ai, bi son ai y bi, donde ai = límite inferior del intervalo de clase bi = límite superior del intervalo de clase Cada intervalo es cerrado por la derecha y abierto por la izquierda. c) Marca de Clase (x’i) Son los puntos medios de cada clase, así en el intervalo b, a ii la marca de clase x’i será: 2 ba x iii d) Número de Intervalos (k) No existen reglas fijas para establecer el valor de k. Una regla sugiere que sea un número próximo a N y otra dice que el número ideal es 1 + 3,3 log(N) (Regla de Sturges), siendo N el total de datos. En muchos casos, desde 5 hasta 20 intervalos puede ser el número adecuado. e) Amplitud del Intervalo (A) Es la diferencia entre sus extremos. Por lo general todos los intervalos tienen la misma longitud A por lo que se cumplirá para estos casos que:k R A f) Frecuencia absoluta (fi) Es el número de datos que corresponden al i-ésimo intervalo de clase. g) Frecuencia absoluta Acumulada (Fi) Se define para cada i-ésimo intervalo de clase, como la suma de todas las frecuencias absolutas fi desde el primero hasta el i-ésimo intervalo: i21i f...ffF h) Frecuencia relativa (hi) Es el cociente entre la frecuencia absoluta del i-ésimo intervalo y el número total de datos. Es preferible redondear el valor de “A” por exceso para no perder datos. ARITMÉTICA ADMISIÓN 2020 - II 5 n f h ii i) Frecuencia relativa Acumulada (Hi) Es el cociente entre la frecuencia acumulada absoluta correspondiente al i-ésimo intervalo y el número total de datos. n F H ii Organización y presentación de datos para una variable cuantitativa continúa Ejemplo. Se pesaron a 40 estudiantes y sus pesos en kilogramos fueron: 60 69 50 79 65 71 48 60 86 42 86 64 90 81 78 73 69 64 72 80 65 52 70 47 54 74 53 77 45 66 75 60 63 55 62 72 59 61 67 55 Construir la tabla de distribución de frecuencias SOLUCION: La variable (x) es el peso de los estudiantes. 1. Determinación del rango Como mayor dato es: 90 ; Menor dato es: 42 Rango = 90 - 42 = 48 Kg. 2. Número de intervalos : 6 40 k 3. Ancho de clase 8 6 48 Tabla 2 Ii xi fi Fi hi Hi 42 - 50 46 4 4 0.10 0.100 50 - 58 54 6 10 0.15 0.250 58 - 66 62 11 21 0.275 0.525 66 -74 70 9 30 0.225 0.750 74 -82 78 7 37 0.175 0.925 82 -90 86 3 40 0.075 1.00 ARITMÉTICA ADMISIÓN 2020 - II 6 Histograma de la frecuencia absoluta con el polígono de frecuencias Histograma de la frecuencia absoluta acumulada y la OJIVA (Menor que) OBSERVACIÓN Histogramas Son gráficos específicos para datos agrupados por intervalos. Los histogramas asocian a cada intervalo un rectángulo de superficie proporcional a la frecuencia. Los límites de clase se marcan en el eje horizontal y determinan las bases de los rectángulos y las frecuencias se anotan en el eje vertical y determinan sus alturas. Polígono de frecuencias Es la línea que une los puntos correspondientes a las frecuencias de cada elemento. Si los datos están agrupados por intervalos, se construye de modo similar al histograma, pero los puntos que se unen son los correspondientes a las marcas de clase. Ojivas Son gráficos de frecuencias acumuladas. En el eje vertical se anotan la frecuencias acumuladas asociadas a cada límite superior de clase (acumula frecuencias “menores que” un valor dado). En algunos casos se grafican las frecuencias acumuladas de todos los valores mayores o iguales al límite inferior de cada intervalo (ojivas “mayor que”). Siempre que se mencione una ojiva sin especificar su tipo, se entenderá que es de tipo “menor que”. F 50 40 30 20 10 0 42 50 58 66 74 82 90 X
Compartir