Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
RESUMEN DE FÓRMULAS DE ESTADÍSTICA I Estadística descriptiva y tratamiento de datos: Caso de elementos discretos Tabla de frecuencias: a. Frecuencia absoluta: es el número de veces que se repite un elemento, se representa como 𝑓𝑖. b. Frecuencia acumulada: es el número de elementos que se encuentran por detrás y en él, se representa como 𝐹𝑖. c. Frecuencia absoluta relativa: es el número de veces que se repite un elemento, dividido en el número total de datos. Se representa como 𝑓𝑟 . d. Frecuencia acumulada relativa: es el número de elementos que se encuentran por detrás y en él, dividido en el número total de datos. Se representa como 𝐹𝑟 . Gráficos: Grafico de barras: en él se grafican líneas o columnas, en las cuales el eje horizontal contiene a los elementos (𝑥𝑖) y el eje vertical a la frecuencia absoluta o la frecuencia absoluta relativa. Medidas de posición central Media: �̅� = ∑ 𝑥𝑖 ∙ 𝑓𝑖 𝑛 Mediana: - Cuando haya un número impar de valores, la mediana será justo el valor central. 𝑀𝑒 = 𝑥𝑛 2 - Cuando haya un número par de valores, la mediana será la media de los dos valores centrales de la variable. Del mismo modo que en el caso anterior: 𝑀𝑒 = 𝑥𝑛 2 + 𝑥 ( 𝑛 2 +1) 2 Moda Es el valor de la variable que más veces se repite, es decir, el valor que tiene mayor frecuencia absoluta. En las distribuciones sin agrupar, la obtención de la moda es inmediata, solo debemos encontrar el elemento x con mayor frecuencia absoluta. Medidas de dispersión Varianza 𝑆2 = (𝑥𝑖 − �̅�)2 ∙ 𝑓𝑖 𝑛 Desviación estándar 𝑆 = √ (𝑥𝑖 − �̅�)2 ∙ 𝑓𝑖 𝑛 Coeficiente de variación 𝐶𝑉 = 𝑆 �̅� Caso de agrupación por intervalos Armado de intervalos: a. Rango: el recorrido comprendido entre el valor mínimo y el valor máximo se denominada rango, se representa con una 𝑅. b. Número de intervalos: se representa como 𝑘 y se debe calcular conociendo 𝑛, luego de ello si nos da como resultado un número decimal, siempre se redondea a un número impar. 𝑘 = 1 + 3,3 ∙ log(𝑛) c. Amplitud de intervalo: La amplitud de intervalo nos indica el ancho de un intervalo, esta se representa con 𝑤, y se calcula como: 𝑤 = 𝑅/𝑘 d. Amplitud ampliada: la amplitud nos da un número decimal, para corregir eso se elige un numero entre el valor de la amplitud y entre la amplitud aumentada un 10%, que seria 1,1𝑤. La amplitud ampliada se representa como 𝑤𝑎. 𝑤 ≤ 𝑤𝑎 ≤ 1,1𝑤 e. Rango ampliado: el rango ampliado (𝑅𝑎) es nuestro nuevo rango, a lo cual este se calcula como: 𝑅𝑎 = 𝑘 ∙ 𝑤𝑎 f. Modificación del rango y selección de nuevo valor mínimo: como el rango ampliado muchas veces es mayor que el rango de origen, se procede a calcular la diferencia de rangos “𝑑”, que se calcula como: 𝑑 = 𝑅𝑎 − 𝑅 Con ello ahora el nuevo valor mínimo donde van a comenzar nuestros intervalos se calcula como: 𝑉𝑚í𝑛,𝑁𝑢𝑒𝑣𝑜 = 𝑉𝑚í𝑛 − 𝑑/2 g. Construcción de intervalos: Ahora a este nuevo valor mínimo vamos a comenzar a sumarle la amplitud ampliada, y así obtenemos los valores limites de cada intervalo. Tabla de frecuencias: a. Intervalos: los intervalos están formados por un límite inferior y un límite superior, a lo cual dentro de estos límites se encuentran múltiples números. b. Frecuencia absoluta: es el número de veces que se repite un elemento o el número de elementos que están dentro de un intervalo, se representa como 𝑓𝑖 . c. Frecuencia acumulada: es el número de elementos que se encuentran por detrás del límite superior de un intervalo, se representa como 𝐹𝑖. d. Frecuencia absoluta relativa: es el número de veces que se repite un elemento o el número de elementos que están dentro de un intervalo, dividido en el número total de datos. Se representa como 𝑓𝑟 . e. Frecuencia acumulada relativa: es el número de elementos que se encuentran por detrás del límite superior de un intervalo, dividido en el número total de datos. Se representa como 𝐹𝑟 . f. Marca de clase: es un valor que representa cada intervalo, se calcula como límite superior más límite inferior, todo esto dividido en dos, se representa como 𝑚𝑖 o 𝑚𝑐𝑖. 𝑚𝑖 = 𝐿𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + 𝐿𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 2 g. Gráficos: Histograma: en él se grafican columnas unidas unas a otras, en las cuales el eje horizontal contiene a las marcas de clase (𝑚𝑖) en el medio de las columnas y el eje vertical a la frecuencia absoluta o la frecuencia absoluta relativa de cada intervalo. Ojiva: en él se grafican líneas que se unen unas a otras, en las cuales el eje horizontal contiene a los limites de los intervalos y el eje vertical a la frecuencia acumulada o la frecuencia acumulada relativa, donde la grafica de cada intervalo comienza en el valor acumulado anterior, y termina en el valor acumulado que le corresponde. Medidas de posición central Media: �̅� = ∑ 𝑚𝑖 ∙ 𝑓𝑖 𝑛 Mediana: Se busca el intervalo que acumule el 50% de los datos (esto se observa en la frecuencia acumulada relativa), a lo cual la marca de clase de ese intervalo será nuestra mediana. Moda En los supuestos que la distribución venga dada en intervalos, se busca el intervalo con la mayor frecuencia absoluta, y por ende como no podemos elegir un intervalo como moda, vamos a utilizar su marca de clase (𝑚𝑖) correspondiente como moda. Medidas de dispersión Varianza 𝑆2 = (𝑚𝑖 − �̅�)2 ∙ 𝑓𝑖 𝑛 Desviación estándar 𝑆 = √ (𝑚𝑖 − �̅�)2 ∙ 𝑓𝑖 𝑛 Coeficiente de variación 𝐶𝑉 = 𝑆 �̅� Probabilidad Probabilidad simple: 𝑝(𝑠𝑢𝑐𝑒𝑠𝑜) = 𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 Probabilidades marginales, conjuntas y condicionales Probabilidad marginal: probabilidad de que un evento característico suceda: 𝑃(𝐴) Probabilidad conjunta: probabilidad que sucedan dos elementos en simultáneo: 𝑃(𝐴𝑦𝐵) Probabilidad condicional: probabilidad que aparezca un suceso, dado que otro ya sucedió: 𝑃(𝐴/𝐵) Tipos de eventos Eventos mutuamentes excluyentes: son aquellos que no tienen elementos en común, por lo tanto 𝑃(𝐴𝑦𝐵) = 0 Eventos independientes: son aquellos que dependen de la ocurrencia de uno u otro, la prueba de independencia es la siguiente: 𝑃(𝐴𝑦𝐵) = 𝑃(𝐴) ∙ 𝑃(𝐵) Si no se cumple son elementos dependientes. Operaciones con probabilidades: Unión: cuando decimos que suceda un evento o que también suceda otro, hablamos de una unión: 𝑃(𝐴𝑜𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴𝑦𝐵) Condicionalidad: si calculamos una probabilidad condicional esta depende si son dependientes o independientes, a lo cual: Si son dependientes: 𝑃(𝐴/𝐵) = 𝑃(𝐴𝑦𝐵) 𝑃(𝐵) Si son independientes: 𝑃(𝐴/𝐵) = 𝑃(𝐴) Complemento: se dice que el complemento es buscar lo que tiene relación con un evento, por ejemplo, el evento A, su complemento es todo lo que no es A, se representa como 𝐴𝐶 . 𝑃(𝐴𝐶) = 1 − 𝑃(𝐴)
Compartir