Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Para comenzar vamos a hacer una breve introducción acerca de la estadística descriptiva: La estadística descriptiva es una parte de la estadística y por lo tanto de las matemáticas, que estudia fenómenos mediante: recolección de datos organización de estos datos. Pero ¿Cómo vamos a organizar estos datos? Los organizamos en tablas para que toda esa información que nos dan, en ocasiones, un número muy grande de datos, esa cumbre de datos, quede bien ordenada y también mediante la interpretación de estos datos, que vamos a realizar mediante gráficos denominados GRÁFICOS ESTADÍSTICOS o cálculos de parámetros a los cuales llamamos PARÁMETROS ESTADÍSTICOS que no son más que valores que resumen todos esos datos que hemos recolectado Cuando realizamos un estudio estadístico lo hacemos para obtener conclusiones sobre una población ¿qué sería esta población? Bueno, la población constituye un conjunto de datos en los cuales se está interesado, la población puede ser un país, las personas de 65 años de una determinada región, animales de una determinada especie y así puedo seguir dando varios ejemplos Y es importante aclarar que una población es relativa respecto al conjunto de datos que deseemos analizar En este caso realizamos un estudio estadístico en el cual la población fueron todos los alumnos que cursan la materia “Probabilidad y Estadística”, pero también podríamos haber elegido como población a los alumnos de la facultad de ingeniería, alumnos que cursan en la facultad de ingeniería y son mayores de 20, y así sucesivamente En ocasiones la población es muy grande y es muy laborioso tener datos de todos estos elementos, entonces, lo que se hace es seleccionar un subconjunto de esta población, seleccionar de forma inteligente, porque este subconjunto tiene que representar a toda la población, este concepto es el de muestra En nuestro estudio estadístico la muestra son todos los alumnos que llenaron la encuesta de la materia Probabilidad y Estadística Luego hablamos acerca del estudiante que respondió la encuesta de la materia Probabilidad y Estadística, el cual es considerado como “unidad experimental” y es aquella sobre la cual efectuamos mediciones o intentamos clasificarla en categorías Las variables que se ven en pantalla representan una variedad, entre ellas algunas son cualitativas o cuantitativas que a su vez pueden ser continuas o discretas, de razón o de intervalo La altura es una variable cuantitativa – continua – de razón, cuantitativa por tomar valores numéricos, continua por tomar valores en intervalo de la recta real y corresponder a una medida de magnitud continua, de razón por tener un punto de cero absoluto donde el cero indica la ausencia de esta característica En la tabla de distribución de frecuencias de alturas de los 216 alumnos de la cátedra que llenaron la encuesta de Probabilidad y Estadística, podemos observar la marca de clase que es el valor intermedio entre los dos límites de la clase, la frecuencia absoluta que es una medida estadística que nos da información acerca de la cantidad de veces que se repite un suceso, la frecuencia absoluta acumulada es el resultado de ir sumando las frecuencias absolutas de las observaciones, la frecuencia relativa que se calcula como el cociente de la frecuencia absoluta de algún valor de la muestra (fi) entre el total de valores que componen la muestra (N) donde N, en este caso, es 216 (la cantidad de alumnos de la cátedra que completaron la encuesta de Probabilidad y Estadística), la frecuencia relativa porcentual que es resultado del producto entre 100 y la frecuencia relativa y por último la frecuencia relativa porcentual acumulada que es resultado de ir sumando las frecuencias relativas porcentual Observamos el polígono frecuencia y sabemos que podemos hacer referencia a la simetría cuando una mitad (vista desde un valor “central” respecto a la cantidad de datos que tenemos) es aproximadamente una imagen de espejo de la otra mitad, entonces, observando el histograma de las alturas de estudiantes universitarios que cursan probabilidad y estadística, podemos decir que existe una asimetría, por lo tanto, los valores de la media, mediana, moda, no van a ser exactamente los mismos Respecto el sesgo, a simple vista podemos determinar que la distribución de los datos en el histograma corresponde a una distribución asimétrica sesgada a la izquierda porque la distribución está más extendida hacia los valores menores o también podemos decir que es sesgada hacia la izquierda porque tiene una cola más larga a la izquierda que a la derecha. Lo podemos verificar mediante el índice de simetría de Pearson, en el cual si realizamos el cálculo nos da un valor negativo, al ser este valor < 0 entonces la distribución es sesgada a la izquierda A su vez en las distribuciones con sesgo a la izquierda, las pocas observaciones, extremadamente pequeñas distorsionan el rango medio y la media hacia la izquierda. Por ello la moda es el valor más alto y el rango fuera el menor, una vez que obtuvimos todos estos valores verificamos que se cumple en este sentido el orden de las medidas Rango medio < media< eje medio< mediana < moda Y por lo tanto consideramos que la distribución de los datos respecto a la altura de los alumnos de probabilidad y estadística corresponde a una distribución asimétrica sesgada a la izquierda CURTOSIS Para conocer la curtosis empleamos la relación Cr=∑ i=1 n ¿¿¿ Luego del cálculo de Cr observamos que Cr>>0 por lo tanto la curtosis de los datos respecto a la altura de los alumnos de probabilidad y estadística es leptocúrtica MEDIA MEDIANA Entre la media y la mediana la medida central más descriptiva de un conjunto de datos, si bien en este caso no difieren mucho, la mediana toma un valor más preciso, mientras que si existe la presencia de datos atípicos la media aritmética cambia su valor y se ve muy afectada debido a estos datos X=166,40 cm ~ X=168,00cm DESVIACIÓN ESTANDAR La desviación estándar indica qué tan dispersos están los valores respecto a la altura promedio (altura media). Mientras mayor sea la desviación estándar mayor será la dispersión de los datos por lo tanto es útil para buscar probabilidades de que un alumno mida una altura determinada s=√s2 s=9,33 cm
Compartir