Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Cátedra: MATEMÁTICA 1 ESTADÍSTICA Estadística Es la ciencia formal que estudia los métodos y procedimientos para recolectar datos, clasificarlos, organizarlos, representarlos, analizarlos e inferir conclusiones. Los datos pueden referirse a personas, animales, objetos, hechos, etc. La Estadística descriptiva realiza la recolección, organización, clasificación, representación y análisis de los datos. En cambio, la Estadística inferencial toma decisiones y realiza inferencias sobre los mismos. Población Es el conjunto de todos los elementos o datos que se someten a un estudio estadístico. Ejemplos: La población de alumnos que estudian diseño. La población de animales que viven en la montaña. La población de autos que circulan en una ciudad. La población de computadoras de una institución, etc. Individuo o unidad estadística Corresponde a cada uno de los elementos que componen la población. Ejemplos: En la población de alumnos que estudian diseño, los individuos son los alumnos. En la población de animales que viven en la montaña, cada individuo es un animal. En la población de autos que circulan en una ciudad, cada individuo es un auto. Muestra Es un subconjunto representativo de la población de referencia. El número de individuos de una muestra es menor que el de la población y se considera mayor a 800 y menor a 2000. Ejemplo: En la población de alumnos que estudian diseño, una muestra estaría formada por 10 alumnos que cursan primer año, 10 de segundo, 10 de tercero, etc. ¿Cómo elegir una muestra? El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población. Se puede realizar en forma: - Aleatoria (azarosa o estratificada) - No aleatoria (sistemática o deliberada) Cátedra: MATEMÁTICA 2 En el muestreo no aleatorio y sistemático se busca el mismo perfil del encuestado; en el muestreo no aleatorio y deliberado se busca a quien encuestar. Carácter estadístico Es el atributo que se desea estudiar sobre los individuos de la población o de la muestra. Puede ser de tipo cualitativo o cuantitativo; a su vez el cuantitativo puede ser continuo o discreto, según recolecte información utilizando números reales o números enteros respectivamente. Ejemplos: Carácter cualitativo: Se desea estudiar el color de ojos de una población. Carácter cuantitativo discreto: Se desea estudiar la edad en años de los alumnos de primer año. Carácter cuantitativo continuo: Se desean estudiar las longitudes en cm de tornillos. Todo carácter estadístico tiene asociado una variable estadística. Variable estadística Es el conjunto de valores que toma el carácter estadístico al cual está asociado. Pueden ser de tipo cualitativas o cuantitativas, según el carácter estadístico respectivo. Ejemplos: Variable cualitativa: En el ejemplo del estudio del color de ojos de una población, la variable cualitativa puede tomar los valores: negro, marrón, verde, gris, azul. Variable cuantitativa discreta: En el ejemplo del estudio de la edad en años de los alumnos, la variable cuantitativa discreta puede tomar los valores: 17, 18, 19, 20, 21, etc. (recuerda que los valores que puede tomar son números enteros). Variable cuantitativa continua: En el ejemplo del estudio de las longitudes en cm de tornillos, la variable cuantitativa continua puede tomar los valores: 1,34; 1,32; 1,234; 1,452, etc. (recuerda que los valores que puede tomar son números reales). También se pueden clasificar en dicotómicas (toman dos valores) o policotómicas (varios valores). Cátedra: MATEMÁTICA 3 Ejemplos: Variable cualitativa dicotómica: Si se desea estudiar la filiación de un grupo de personas, la variable cualitativa dicotómica asociada puede tomar los valores: si tiene hijos, no tiene hijos. Variable cualitativa policotómica: Si se desea estudiar el color de autos, la variable cualitativa policotómica asociada puede tomar los valores: verde, azul, rojo, amarillo, gris, blanco, etc. Para su estudio, se las considera agrupadas en intervalos o no agrupadas. Ejemplos: Variable no agrupada: Se ha considerado el peso en kilogramos de un grupo de jóvenes que practican natación. Se presentan a continuación: 60- 62- 70- 75- 71- 70- 70- 65- 67- 62 Variable agrupada en intervalos: En la siguiente tabla se presentan los pesos al nacer de un grupo de bebes: Pesos(en kilogramos) Cantidad de bebes [2,0;2,3[ 5 [2,3;2,6[ 4 [2,6;2,9[ 8 [2,9;3,2[ 35 [3,2;3,5[ 20 [3,5;3,8[ 18 [3,8;4,1[ 10 [4,1;4,4[ 6 Frecuencias Las frecuencias pueden ser de diferentes tipos: frecuencia absoluta, acumulada, relativa o porcentual. Frecuencia absoluta (f): es el número de veces que se registra cada valor de la variable. Frecuencia acumulada (fa): es la suma de todas las frecuencias absolutas correspondientes a los valores que preceden o son iguales al considerado. Frecuencia relativa (fr): es el cociente entre su frecuencia absoluta y el número total de datos de una colección (N). Cátedra: MATEMÁTICA 4 fr = f/N Frecuencia porcentual (f%): es el producto entre su frecuencia relativa y 100. f% = fr .100 Organización de los valores de la variable y sus frecuencias Si se realiza un determinado estudio estadístico, los valores obtenidos de la variable en cuestión y de sus frecuencias, suelen organizarse en cuadros o tablas denominadas tablas de distribución de frecuencias. Ejemplos: Para una variable cualitativa Se realiza un estudio estadístico sobre los grupos sanguíneos de 40 personas, en la siguiente tabla de distribución de frecuencias se presentan los valores obtenidos y las frecuencias asociadas: Estatura (en cm) Cantidad de personas ( f) Frecuencia acumulada (fa) Frecuencia relativa (fr) Frecuencia porcentual (f%) A 15 15 15/40 40% B 12 27 12/40 30% O 8 35 8/40 20% AB 5 40 5/40 10% Total ( N) 40 1 100 Para una variable cuantitativa continua Se realiza un estudio estadístico sobre las estaturas (en cm) de 70 personas, en la siguiente tabla de distribución de frecuencias se presentan los valores obtenidos y las frecuencias asociadas: Estatura (en cm) Cantidad de personas ( f) Frecuencia acumulada (fa) Frecuencia relativa (fr) Frecuencia porcentual (f%) [170,0;170,3[ 5 5 5/70 7% [170,3;170,6[ 4 9 4/70 5% [170,6;170,9[ 8 17 8/70 11% [170,9;171,2[ 35 52 35/70 50% [171,2;171,5[ 18 70 18/70 25% Total ( N) 70 1 100 En todos los casos, sean datos agrupados o no agrupados, se cumple que: - la suma de las frecuencias absolutas debe ser igual al número total de datos (N). - la suma de las frecuencias relativas debe ser igual a 1. - la suma de las frecuencias porcentuales debe ser igual a 100. Cátedra: MATEMÁTICA 5 La construcción de las tablas de distribución de frecuencias esta explicada en videos que se encuentran en la catedra virtual. Organización de los valores de la variable y sus frecuencias en diferentes tipos de gráficos Existen diferentes tipos de gráficos que permiten visualizar de otra forma la información obtenida al realizar un estudio estadístico, es decir, permiten mostrar de manera gráfica los valores obtenidos y sus frecuenciasasociadas. Entre ellos podemos destacar los gráficos de bastones, de barras, de sectores o pastel, histograma, pictograma, cartograma, poligonal estadística, polígono de frecuencias, etc. Para utilizarlos de forma adecuada hay que tener en cuenta que deben: - ajustarse a la realidad de los datos que representan, - ser claros, fáciles de leer y entender, - llevar todas las indicaciones necesarias para su fiel interpretación, - ser los adecuados para el carácter estadístico que visualizan. Ejemplos: Diagrama de bastones: Es una gráfica que asocia a cada valor de la variable un bastón o segmento, cuya altura es proporcional a la frecuencia absoluta correspondiente. Generalmente se utiliza para variable cualitativa o también para variable cuantitativa discreta. Diagrama de barras: Es una gráfica que asocia a cada valor de la variable una barra, cuya altura es proporcional a la frecuencia absoluta correspondiente. Generalmente se utiliza para variable cualitativa o también para variable cuantitativa discreta. Cátedra: MATEMÁTICA 6 Diagrama de sectores: Es un diagrama de sectores, en el cual cada sector circular tiene una amplitud que es proporcional a la frecuencia que representa, generalmente se utiliza la frecuencia porcentual, en cuyo caso el disco entero representa al 100%. Se los utiliza para variable cualitativa o también para variable cuantitativa discreta, en estudios en donde intervengan poca cantidad de datos. Histograma: Dada una variable cuantitativa discreta o continua que este agrupada en intervalo. Un histograma es una gráfica que asocia a cada intervalo de dicha variable un recinto rectangular, siendo el valor de la frecuencia absoluta coincidente con la altura de dicho rectángulo. Poligonal estadística: Es la línea poligonal obtenida al unir las extremidades de los puntos medios de las bases superiores de los rectángulos en un histograma. Cátedra: MATEMÁTICA 7 Polígono estadístico: Es el polígono determinado por una poligonal asociada a un histograma y una porción de la recta de abscisas, agregando en los dos extremos de la distribución de datos, dos intervalos ficticios con frecuencia cero. Parámetros estadísticos Corresponden a los valores numéricos obtenidos al realizar un estudio estadístico y que reflejan el comportamiento de los datos, es decir, son números que describen, de manera concisa, el comportamiento y las características generales de un conjunto de datos. Pueden ser de diversos tipos: de centralización, de dispersión y de posición, entre otros. Parámetros de centralización Los parámetros de centralización o medidas de tendencia central dan un valor típico o representativo de un conjunto de datos, es la disposición de éstos para agruparse alrededor del centro o de ciertos valores numéricos. Corresponden a la moda (Mo), la media ( X ) y la mediana (Me). Para datos no agrupados en intervalos MEDIA ARITMÉTICA: X Se obtiene calculando el cociente entre la sumatoria de los productos de los valores numéricos de la variable y sus respectivas frecuencias, y el número total de esos valores, es decir: X = N fx n i ii 1 Es un concepto intuitivamente claro, cada conjunto de datos tiene media y es única, además es útil para llevar a cabo procedimientos estadísticos como la comparación de datos. Si bien es confiable porque toma en cuenta todos los valores del conjunto, puede Cátedra: MATEMÁTICA 8 verse afectada por los valores extremos que no son representativos del resto de los datos. MEDIANA: Me Es el valor de la variable que ocupa el lugar central en el conjunto ordenado de datos: si N (número de datos) es par, se encuentra calculando el promedio de los dos valores centrales si N es impar, es el valor central obtenido Los valores extremos no afectan a la mediana tan intensamente como a la media. MODA: Mo Corresponde al valor de la variable que tiene mayor frecuencia. Si el valor modal se repite dos veces corresponde a una distribución bimodal, si se repite más de dos veces, es multimodal. También puede ocurrir que todos los valores de la variable presenten la misma frecuencia, en ese caso no hay moda. La moda no se modifica por los valores extremos. Para datos agrupados en intervalos MEDIA ARITMÉTICA: X Se obtiene calculando el cociente entre la sumatoria de los productos de las marcas de clase y sus respectivas frecuencias, y el número total de datos, es decir: X = N fx n i iim 1 Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del intervalo i-ésimo. MEDIANA: Me Para calcular la mediana se determina primero el intervalo en donde se encuentra, y luego se aplica la siguiente fórmula: Me = h f fa N e i i ). 2( 1 En donde: ei es el extremo inferior del intervalo donde está la mediana fai-1 es el valor de la frecuencia acumulada del intervalo anterior f es el valor que toma la frecuencia donde está la mediana h es la amplitud del intervalo Cátedra: MATEMÁTICA 9 MODA: Mo Para calcular la moda se determina primero el intervalo modal (corresponde al de mayor frecuencia), y luego se aplica la siguiente fórmula: Mo = hei ).( 21 1 En donde: ei es el extremo inferior del intervalo de mayor frecuencia (intervalo modal) 1 es la diferencia entre la mayor frecuencia y la anterior 2 es la diferencia entre la mayor frecuencia y la siguiente h es la amplitud del intervalo Parámetros de dispersión Los parámetros de dispersión son medidas que representan el alejamiento o diseminación de los datos a lo largo del rango de distribución; es decir la variación de valores alrededor del punto central, o la tendencia de valores individuales a desviarse de los parámetros de centralización. Las más frecuentemente utilizadas son el rango, la desviación estándar o típica, la desviación media y la varianza. Para datos no agrupados en intervalos RANGO: R Es el valor que se obtiene de la diferencia entre el mayor y el menor valor de la variable. Indica la variabilidad existente entre los valores que toma la variable, sin embargo, debe usarse con precaución ya que su valor depende únicamente de los valores extremos. R = Xmax – X min DESVIACIÓN MEDIA: dm Indica el promedio de las desviaciones con respecto a la media. dm = N fXx n i ii 1 xi - X es la distancia entre X y xi Cátedra: MATEMÁTICA 10 VARIANZA: 2 La varianza de las observaciones x1, x2,…, xn es el promedio de los cuadrados de las distancias entre cada valor de la variable y la media aritmética del conjunto de datos. El valor de la varianza puede sufrir un cambio muy desproporcionado por la existencia de valores extremos en el conjunto de datos.2 = N fXx n i ii 1 2)( DESVIACION ESTÁNDAR O TIPICA: La raíz cuadrada de la varianza, es la desviación estándar o típica. A menudo, esta se prefiere en lugar de la varianza, porque se expresa en las mismas unidades que la de los datos. Permite calcular con un buen grado de precisión, dónde están localizados los valores de la variable con respecto a la media. = N fXx n i ii 1 2)( COEFICIENTE DE VARIACIÓN: CV Es una medida de dispersión relativa, indica que proporción de la media representa la desviación estándar, suele expresarse en forma porcentual. CV= x Para datos agrupados en intervalos RANGO: R R = Xmax – X min DESVIACIÓN MEDIA: dm dm = N fXx n i iim 1 Cátedra: MATEMÁTICA 11 Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del intervalo i-ésimo. VARIANZA: 2 2 = N fXx n i iim 1 2)( Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del intervalo i-ésimo. DESVIACIÓN ESTÁNDAR O TIPICA: = N fXx n i iim 1 2)( Siendo imx la marca de clase del intervalo i-ésimo, es decir el punto medio del intervalo i-ésimo. Parámetros de posición Para datos agrupados en intervalos Los parámetros de posición representan el lugar que ocupa un individuo con respecto a los demás en el conjunto ordenado de datos. Estos valores solo sirven para realizar comparaciones, corresponden entre otros, a los cuartiles y percentiles. PERCENTILES: Pk Se divide a la población en 100 partes iguales. Para hallar cada percentil se calcula primero la frecuencia acumulada, que permite determinar el intervalo donde se encuentra el mismo. Para esto se utiliza la fórmula: fa = 100 kN . Luego se aplica la siguiente fórmula para calcular el percentil k: Pk = h f fa kN e i i ). 100( 1 En donde: ei es el extremo inferior del intervalo donde está el percentil fai-1 es el valor de la frecuencia acumulada del intervalo anterior f es la frecuencia del intervalo donde está el percentil h es la amplitud del intervalo Cátedra: MATEMÁTICA 12 CUARTILES: Qk Se divide a la población en 4 partes iguales. Para hallar cada cuartil, se calcula primero la frecuencia acumulada que permite determinar el intervalo donde se encuentra el mismo, utilizando la fórmula: fa = 4 kN . Luego se aplica la siguiente fórmula para calcular el cuartil k: Qk = h f fa kN e i i ). 4( 1 En donde: ei es el extremo inferior del intervalo donde está el cuartil fai-1 es el valor de la frecuencia acumulada del intervalo anterior f es el valor que toma la frecuencia donde está el cuartil h es la amplitud del intervalo
Compartir