Vista previa del material en texto
ESTADISTICA • DEFINICION: Es una ciencia que “recoge, ordena, y analiza datos de una muestra extraída de cierta población, y que a partir de esa muestra, valiéndose del cálculo de probabilidades se encarga de hacer inferencias acerca de la población”. Amón, Jesús Por estadística entendemos los métodos científicos por medio de los cuales podemos recolectar, organizar, resumir, presentar, y analizar datos numéricos relativos a un conjunto de individuos u observaciones y que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en dichos análisis. La aplicación de la estadística tiene lugar porque los fenómenos de algunas ciencias no se dan siempre iguales entre si exactamente, sino que presenta variaciones. Yule: estadística: son los datos cuantitativos fuertemente influidos por una multitud de causas. Gini: estadística: técnica adecuada al estudio cuantitativo de los fenómenos de masa o colectivo. POBLACION Y MUESTRA: (P), estudiar una característica de un grupo, este grupo en total se llama población; generalmente si la población es muy grande se puede estudiar a todos los individuos y se toma un subgrupo que se llama muestra. ESTADISTICA DESCRIPTIVA E INFERENCIAL: • Función descriptiva: recolectar, sintetizar y organizar la información. Función exclusiva de describir sin sacar conclusión. • Función inferencial: sacar conclusiones a partir de resultados obtenidos. Como no pueden ser exactos aplica el lenguaje PROBABILISTICO. La variable: característica de los fenómenos u objetos que podemos observar, estas no son constantes sino que varían constantemente. Las distintas variaciones, valores, modalidades que asume una variable se denominan categorías de la variable. Se dividen en: Variable cualitativa: exclusivas para la clasificación. Cuando las categorías son cualidades Variable cuantitativa: cuando las variables se pueden cuantificar, es decir, separar por números; se dividen en: • Continuas: permiten valor intermedio, es decir, decimales, ej.: 37,5 kg. Se miden, y se establecen subdivisiones. • Discretas: no permiten valor intermedio, es decir, números enteros, ej.: partido sale 3-0. Se cuentan, no se establece subdivisiones. Medición: asignación de números a objetos o hechos de acuerdo a reglas. Implica una relación de ISOMORFISMO. Isomorfismo: equivalencia de forma, es decir, que se mantenga relación entre sí. Escala de Medición: conjunto de números cuya escala son representaciones numéricas de la variable, clasifica t cumple funciones de identidad. Nivel de medición: (las variables se incluyen entre sí, y van al nivel + alto al que pueden acceder) - Escala Nominal: dada 2 o más modalidades, solo puede decir si son iguales o distintas, aquí el numero cumple la función de nombrar o designar. No matemática, tipo de variable cualitativa. - Escala Ordinal: además de designar si son iguales o distintas, también establece orden jerárquico, pero no determina cuan mayor es la jerarquía de uno sobre otro. Tipo de variable cualitativa. Este archivo fue descargado de https://filadd.com � FI LA DD .CO M - Escala Intervalar: determina si son iguales o distintas, establece orden jerárquico también orden empírico y cuan más o menos es en referencia al otro. El cero es relativo. Operación de más y de menos. Variable cuantitativa. -Escala Racional: el 0 es absoluto, indica ausencia de atributos que es igual en todos lados y para todas las maneras. Involucra operaciones de más, menos, por y dividido. (Si se cuenta el cero) -Clasifique la variable (medición). Identifique la variable (características)- Presentación Tabular Los datos se presentan como: • DATOS NO AGRUPADOS: presentación común cuando las unidades de análisis son pocas. una serie de datos sin orden preestablecido. Se presentan en modo de serie por ejemplo: 1,2,5,3,3,7,8,4,2,2,6,9. • DATOS AGRUPADOS: presentación tabular o en tablas, como mínimo 2 columnas una con categoría de la variable y otra con las frecuencias. ordenados en base a las categorías de la variable de estudio y donde ya aparecen las frecuencias. • DATOS AGRUPADOS EN INTERVALOS DE CLASES: los datos se organizan en intervalos (en una Tabla) que se construyen considerando los valores que presenta la variable. Frecuencia Absolutas: frecuencia con la que se repite la variable. (Frecuencia de menor variable se le suma la siguiente y asi sucesivamente hasta llegar al total de frecuencias, para saber si está bien calculado la última frecuencia que saquemos tiene que dar como resultado el mismo número que n) Frecuencia Relativa: medidas proporcionales a las frecuencias absolutas. Entre ellas utilizaremos: proporción, porcentaje y razón. • Proporción (P): F/N Es el cociente entre la frecuencia de una categoría y el número total de observaciones o de casos. Expresa la comparación de una parte con respecto de la unidad. para asegurar el resultado tengo que sumar todas las proporciones y me tiene que dar 1 en aprox a 1. • Porcentaje (%): F/N.100 Es la proporción multiplicada por cien. Es decir la relación de una parte con respecto a una base de 100. Para asegurar el resultado debo sumar tengo que sumar todos los % y me tiene que dar 100 o un aprox. a 100. • Razón: Es un cociente que simboliza la relación de tamaño de una frecuencia respecto a otra. R=f1/f2. Tipo de gráfica ➢ Variable Cualitativa: Nivel de Medición: ▪ Nominal: gráfico de torta o circular o barras. El grafico siempre debe tener título, fuente y referencias. Grafico circular o pastel: xf-%: se saca porcentaje y esos valores son los que se colocan en el gráfico. Este archivo fue descargado de https://filadd.com � FI LA DD .CO M ▪ Ordinal: gráfico de barras (intersección de ejes cartesianos). Ejes de abscisas (X) horizontal: las categorias y de ordenadas (Y) vertical: frecuencia. También se cruzan porcentajes, proporciones o frecuencias. X F p % Primario 10 0,1 10 Secundario 20 O,2 20 Terciario 30 0,3 30 Universitario 40 0,4 40 N: 100 ➢ Variable cuantitativa: datos por lo general muy numerosos, se organizan en frecuencias agrupados o distribución de frecuencia agrupados en intervalos. Variable Cuantitativa Continua: para la presentación de datos agrupados en intervalos: es necesario determinar la amplitud total (A.T.) y la amplitud del intervalo. Construcción de la Amplitud Total: valor máximo - valor mínimo X máximo – x mínimo= a. t. Construcción de la Amplitud de Intervalos: como regla general se usan amplitudes de 2, 3, 5, 10 y sus múltiplos. - Para determinar la cantidad de intervalos que no debe ser menor de 5 ni más de 15. AT/f= N° de intervalo + 1: X max (valor max) – x min (valor min) % i (amplitud de intervalo) = resultado + 1: número de intervalo de clases (i puede ser cualquier número mayor a 2 y en lo posible menor a 15. desde el número menor hay que contar con los dedos para elegir el número intervalar por ejemplo i de 3, número menor 27: 27-29 30-32, etc. Puede comenzar con un número menor al presentado y terminar con un número mayor, pero ninguno de los dos tiene que ser 0 sino está mal elaborada) Resultado es = al número de categoría. 0 5 Chart Title Serie 1 Serie 2 Serie 3 Este archivo fue descargado de https://filadd.com � FI LA DD .CO M x L. ex X’ 31-32 30,5 - 32,5 31,5 29-30 28,5 - 30,5 29,5 27-28 26,5 - 28,5 27,5 Limites Exactos (L. Ex): se resta 0,5 al límite exacto inferior (LEI) y suma 0,5 intervalo superior (LES) -Histograma de Pearson: se trata de columnas pegadas que se construyen con los límites exactos de los intervalos. Para realizarlo se debe calcular los límites exactos de los intervalos. Punto medio de un intervalo: se suma el L. ex inferior (LEI) y superior (LES) y se lo divide en 2. Y (frecuencia)vertical X (limites exactos) horizontal -Polígono de Frecuencia: se coloca la frecuencia en la (Y) y los puntos medios en la (X). • Punto medio: (x1): sumar ambos intervalos y dividirlos en 2, por ejemplo.: 10-19: 14,5 Para cerrar el grafico hay que restar el menor punto medio menos el valor del intervalo: ej.: 14,5-10: 4,5 (con esto cierra una punta) y la otra punta seria sumando el intervalo con el número mayor de punto medio ej.: 74,5 +10: 84,5 (con esto cierra la otra punta) ambos tiene frecuencia 0 por eso se puede cerrar el grafico ➢ Variables cuantitativas discretas: intervalar o racional. (no admiten valores intermedio) -Grafico de Bastones: para variables cuantitativas discretas: eje horizontal (X) categoría de la variable, eje vertical (Y) frecuencia. Este archivo fue descargado de https://filadd.com � FI LA DD .CO M Medida de Tendencia Central (MTC) y Posición: Se refiere a los valores de la variable, puede estar en el centro de la distribución, como los promedios, y que caracterizan la posición de un grupo respecto de la variable. Modo, mediana y media. Modo (Mo): valor que se presenta con mayor frecuencia. Es la mtc específica para el nivel de medición (NM) NOMINAL. (Pero puede usarse para todas). • Datos no agrupados: más se repite x ej.: 2-7-7-4-4-6-5-3-6-4 MODO ES: 4 • Datos agrupados: frecuencia más grande. Ej.: x F A 15 B 36 C 130 Modo: 130 • Datos agrupados en intervalos: se requiere sacar el valor de punto medio (x1) del intervalo de la categoría con mayor frecuencia. Ej: x: 76-85 f: 45 modo: 80,5 Mediana (Md): valor que por encima y por debajo de la variable, hay la misma cantidad de observaciones. Divide en dos partes iguales la distribución. Es la MTC específica para el NM ORDINAL. (También puede ser calculado en intervalar y de razón). • Datos no agrupados: valor que cae en el centro de los datos una vez ordenados los mismos de menor a mayor. Fórmula para datos pares Md: n/2 formula para datos no pares Md: n+ 1 /2 EL RESULTADO DE ESTAS FORMULAS DA EL ORDEN EN EL QUE SE ENCUENTRA LA MEDIANA • Datos agrupados: es necesario sacar frecuencia acumulada (FA) Md: n/2 (el resultado de este, hay que fijarse que numero de la fa contiene el resultado y ese es el valor de la mediana) PARA SACAR FRECUENCIA ACUMULADA (FA) HAY QUE EMPEZAR POR EL VALOR DE FRECUENCIA DE MENOR VALOR E IR SUMANDO, EN EL FINAL PUEDE ENCONTRARSE ARRIBA. • Datos agrupados en intervalos: formula abajo y el resultado que da ES la mediana Media (x con un palito acostado arriba): suma de un conjunto de medidas dividido por la cantidad total de medidas. Valor que suele calcularse para obtener el promedio de algo. Es la sumatoria de todos los valores divididos en el total de los casos. Esta MTC solo se puede calcular en NM INTERVALAR y RACIONAL. • Datos no agrupados: media: sumatoria de x/ n ej.: 6-6-6-7-7-7-7-7-7-8-9-10-11 media es: 98/13 media es: 7,53 Siempre lleva conclusión: conclusión: la media de edad de la sala de parálisis cerebral del centro educativo terapéutico es de 7,5 años. • Datos agrupados: formula: sumatoria de f.x /n (en una columna particular de la tabla se tiene que poner f.x y desarrollar cada categoría. La sumatoria de los mismos es lo que se tiene que poner en el resultado y dividirlo en n) • Datos agrupados en intervalos: sumatoria de f. x1 /N (en una columna particular de la tabla se tiene que poner f. x1 y desarrollar cada categoría. La sumatoria de los mismos es lo que se tiene que poner en el resultado y dividirlo en n) Nivel de medición modo mediana media cualitativa Nominal si No no cualitativa Ordinal Si si no cuantitativa Intervalar si si Si cuantitativa De razón si si si Este archivo fue descargado de https://filadd.com � FI LA DD .CO M Simétrica y asimétrica: Usar la media cuando es Simétrica (cuando el valor central de la frecuencia es el mayor, y desciende para ambas esquinas,) y cuando es asimétrica (cuando esto varia), más conveniente la mediana. Medidas de Variabilidad o Dispersión: Son medidas que acompañan otras medidas descriptivas y que nos informan acerca de qué características tiene un conjunto de datos. Nos indica si un conjunto de datos es muy disperso (heterogéneo) o menos disperso (homogéneo). Es importante que cuando ya conocemos su tendencia central estudiemos su variabilidad. Solo se utiliza con variables cuantitativas. Modo: amplitud total o rango: es el intervalo entre el valor máximo y el valor mínimo. Solo se usa en muestras pequeñas. Mediana: amplitud intercuartil C (AQ): diferencia entre el 1° cuartil y el 3° cuartil.AQ= Q3-Q1 Media: -desviación estándar (S) es la medida de dispersión más común, que indica que tan dispersos están los datos con respecto a la media. + Desviación estándar + dispersión de datos. Es el promedio de desvíos de cada valor con respecto a la media. FORMULA EN EL LIBRO -Variancia (S2 elevado a 2) emplea los desvíos respecto a la moda, pero elevado al cuadrado. Este archivo fue descargado de https://filadd.com � FI LA DD .CO M