Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
[Escribir el nombre de la compañía] 15 Estadísticas Maestría en Finanzas Jose Pablo Agis Reyes arjp2447@gmail.com Matricula: 137152 E s t a d í s t i c a s Página 2 Contenido Recopilación de la información ........................................................................................................... 4 Conceptos de estadísticas y su clasificación ................................................................................... 4 a) Medidas de tendencia central ..................................................................................................... 4 Organización, presentación y medición de la información ................................................................. 7 Distribución de frecuencias ............................................................................................................. 7 Intervalos de clase ........................................................................................................................... 7 Histogramas, polígono de frecuencias y ojiva ................................................................................. 7 Curvas de frecuencia ....................................................................................................................... 7 Distribución de frecuencias relativas .............................................................................................. 7 Control no. 2 .............................................................................................................................. 10 Control no. 3 .............................................................................................................................. 11 Probabilidad ...................................................................................................................................... 15 Conceptualización básica de probabilidad .................................................................................... 15 Expresión de la probabilidad ......................................................................................................... 15 Control 4 .................................................................................................................................... 17 Variables aleatorias discretas ............................................................................................................ 18 Variable aleatoria de Bernoulli ...................................................................................................... 18 Distribución binomial .................................................................................................................... 18 Variables aleatorias continuas .......................................................................................................... 19 Formulas ........................................................................................................................................ 19 Variables uniformes ...................................................................................................................... 22 Formulas ........................................................................................................................................ 22 Distribución normal ........................................................................................................................... 24 Distribución normal estándar ....................................................................................................... 25 Intervalos de confianza ................................................................................................................. 25 Elementos de una prueba o contraste de Hipótesis ..................................................................... 26 Procedimiento para realizar una prueba de hipótesis .............................................................. 28 E s t a d í s t i c a s Página 3 Proporción. Prueba de hipótesis ................................................................................................... 30 Prueba de diferencia de medias .................................................................................................... 30 Regresión lineal simple ................................................................................................................. 31 Funicones racionales ..................................................................................................................... 32 E s t a d í s t i c a s Página 4 Recopilación de la información Conceptos de estadísticas y su clasificación Descriptiva: Describe al grupo o población objetivo. Es un conjunto de herramientas matemáticas que se utilizan para obtener información numérica y grafica. (N) Población. Es el conjunto de observaciones datos y resultados de un experimento objetivo. (n) Muestra. Es un subconjunto de la población. Análisis numérico a) Medidas de tendencia central b) Medidas de dispersión c) Medidas de localización a) Medidas de tendencia central Media, también se le llama promedio. Es la medida que representa la población o la muestra y es la suma de las observaciones entre el número total de datos. Población Muestra ᴍ = ∑ 𝑿𝒊 𝑵 X̅ = ∑ 𝑋𝑖 𝑛 Ejemplo: Xi X1 3 X2 5 X3 5 X4 10 X5 10 X6 12 X7 15 Mediana, es el valor central de los datos. Se obtiene ordenando los datos en forma ascendente y es la observación que está a la mitad. X̅ = ∑ 𝑋𝑖 𝑛 = 3+5+5+10+10+12+15 7 = 60 7 = 8.571 E s t a d í s t i c a s Página 5 Población Muestra �̃� Ejemplo: Xi X1 3 X2 5 X3 5 X4 10 X5 10 X6 12 X7 15 Cuando la suma de la muestra forma un número impar: �̃� = 𝑛+1 2 = 7+1 2 = 8 2 = 4 �̃� = 10 Cuando la suma de la muestra es par, la formula es la siguiente: 𝑛 2 , 𝑛 + 1 2 Despues se realizara un promedio Moda, es una medida central de la muestra. Es la observación que más se repite en la muestra o población- Ejemplo: De la tabla anterior, los valores que más se repiten son: Mo = 5 y 10 Rango, es la diferencia del valor mayor y el valor menor de una muestra o población. Ejemplo: De la tabla anterior: Rango= 15 - 3 = 12 n, puede ser: "n" par , "n" impar E s t a d í s t i c a s Página 6 b) Medidas de dispersión Varianza, es el promedio de las desviaciones cuadradas de cada uno de las observaciones con respecto a la media Población Muestra 𝜶𝟐 = ∑(𝑿𝒊 −ᴍ)𝟐 𝑵 𝑆𝟐 = ∑ 𝑋𝑖 −X̅ 𝟐 𝑛−1 Ejemplo Xi X (Xi - Media) (Xi - Media)2 x1 3 8.571 -5.571 31.04 x2 5 8.571 -3.571 12.76 x3 5 8.571 -3.571 12.76 x4 10 8.571 1.429 2.04 x5 10 8.571 1.429 2.04 x6 12 8.571 3.429 11.76 x7 15 8.571 6.429 41.33 S 2 = 18.95 Desviación estándar Población Muestra 𝜶= √𝜶𝟐 𝑆= √𝑺𝟐 Ejemplo S = 4.35 El precio promedio de la acción es de 8.57 (estimación puntual) y la estimación por intervalo será (8.57 - 4.35 , 8.57 + 4.35) 4.22 , 12.92 Ejercicio 1 Xi Media (Xi - Media) (Xi - Media)^2 x1 1 7.600 -6.600 43.56 x2 4 7.600 -3.600 12.96 x3 5 7.600 -2.600 6.76 x4 5 7.600 -2.600 6.76 E s t a d í s t i c a s Página 7 x5 6 7.600 -1.600 2.56 x6 7 7.600 -0.600 0.36 x7 10 7.600 2.400 5.76 x8 11 7.600 3.400 11.56 x9 12 7.600 4.400 19.36 x10 15 7.600 7.400 54.76 X̅ = ∑ 𝑋𝑖 𝑛 = 1+4+5+5+6+7+10+11+12+1510 = 76 10 = 7.6 �̃� = 10 2 = 5 , �̃� = 11 2 = 5.5 = (5 + 5.5) /2 = 5.25 �̃� = 6 Mo = 5 Rango = 15 - 1 = 14 S 2 = 18.27 S = 4.27 El precio promedio de la acción es de 7.6 (estimación puntual) y la estimación por intervalo será (7.6 - 4.27 , 7.6 + 4.27) 3.33, 11.87 Organización, presentación y medición de la información Distribución de frecuencias Intervalos de clase Histogramas, polígono de frecuencias y ojiva Curvas de frecuencia Distribución de frecuencias relativas Es una tabla que utiliza los conceptos de frecuencia absoluta y relativa para organizar y agrupar los datos provenientes de un experimento. Utilizaremos el ejemplo de tasa de inflación para determinar la construcción de la distribución de frecuencias. Paso 1. Determinar el número de clases. Se calcula de la raíz cuadrada de n. Se deben de redondear los datos E s t a d í s t i c a s Página 8 Paso 2. Determinar los límites de clase. Determinar los rangos de los datos. Se calcula del dato mayor menos el dato menor. Pero antes se debe ordenar los datos de menor a mayor. Se deben de redondear los datos 1) Calcular rango (dato mayor menos dato menor) 2) Calcular longitud de clases (rango/número de clases) 3) Sacar límites para cada clase, empezando con el dato menor de la serie sumando la longitud de clase; para la clase 2, se comienza con el límite de la clase 1 y a su vez se suma la longitud de clase. Se repite este procedimiento hasta que no queden más clases. Paso 3. Calcular la frecuencia absoluta, consiste en contar el número de observaciones en cada clase. Paso 4. Calcular la frecuencia relativa, es el cociente de la frecuencia absoluta entre el número total de observaciones. Paso 5. Calcular la frecuencia absoluta y relativa acumulada. Consiste en sumar la frecuencia actual a la suma de las frecuencias anteriores. Al terminar los pasos anteriores se deben realizar unas graficas. • Histograma, es un grafico de barra que contiene en el eje x a los limites de clases y en el eje y las frecuencia relativas • Ojiva, es un grafico de líneas, que contiene en el eje x a los limites de clases y en el eje y a la frecuencia relativa o absoluta acumulada Ejemplo: Inflación mensual 3.00% 3.40% 4.00% 5.00% 5.00% 6.00% 7.50% 7.80% 8.00% 9.00% 10.00% E s t a d í s t i c a s Página 9 0.000 0.500 1.000 3.00 - 5.50 5.50 - 8.00 8.00 - 10.50 Ojiva 0.000 0.100 0.200 0.300 0.400 0.500 3.00 - 5.50 5.50 - 8.00 8.00 - 10.50 Histograma Clase Limite de clase Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada 1 [ 3.00 , 5.50) 5 0.455 5 0.455 2 [ 5.50 , 8.00) 3 0.273 8 0.727 3 [ 8.00 , 10.50) 3 0.273 11 1.000 11 Resultados Numero de clases 3 Rango 7.00% Longitud de la clase 2.5% Media (Xi) 6.29% Varianza (S2) 4.77% Desviación estándar (S) 2.18% Conclusiones La tasa de inflación en México se encuentra entre 3 y 5.5% con probabilidad 0.45 La tasa de inflación en México es cuando mucho 8% con probabilidad 0.727 La tasa promedio de inflación anual es de 6.3%, con una desviación estándar de 2.18% Por lo tanto, el intervalo de confianza de la inflación se ubicara entre 4.11% y 8.48% Intervalo de confianza 4.11% 8.48% E s t a d í s t i c a s Página 10 0.000 0.200 0.400 0.600 0.800 12 - 33 33 - 54 54 - 75 Histograma 0.000 0.500 1.000 12 - 33 33 - 54 54 - 75 Ojiva Control no. 2 Precio de la acción A 12.00 12.00 18.00 22.00 23.00 24.00 28.00 34.00 35.00 75.00 Clase Limite de clase Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada 1 [ 12.00 , 33.00) 7 0.700 7 0.700 2 [ 33.00 , 54.00) 2 0.200 9 0.900 3 [ 54.00 , 75.00) 1 0.100 10 1.000 10 Resultados Numero de clases 3 Rango 63 Longitud de la clase 21 Media (Xi) 30.90 Varianza (S2) 215.60 Desviación estándar (S) 14.68 Intervalo de confianza 16.22 45.58 E s t a d í s t i c a s Página 11 Conclusiones El precio de la acción A se encuentra entre 12 Y 33 con probabilidad 0.700 El precio de la acción A es cuando mucho 54 con probabilidad 0.900 El precio promedio de la acción A es 30.90 con una desviación estándar de 14.68 Por lo tanto, el intervalo de confianza de la acción A es de $16.22 a $45.58 Control no. 3 Precio del petróleo crudo, promedio general del Brent, Texas Oeste y Dubái Dólares por barril Fecha Precio 30/09/2014 $ 95.89 31/10/2014 $ 86.13 30/11/2014 $ 76.96 31/12/2014 $ 60.55 31/01/2015 $ 47.45 28/02/2015 $ 54.93 31/03/2015 $ 52.83 30/04/2015 $ 57.42 31/05/2015 $ 62.50 30/06/2015 $ 61.30 31/07/2015 $ 54.43 31/08/2015 $ 45.72 Fuente de los datos: Indexmundi Clase Limite de clase Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada 1 [ 45.72 , 62.44) 8 0.667 8 0.667 2 [ 62.44 , 79.17) 2 0.167 10 0.833 3 [ 79.17 , 95.89) 2 0.167 12 1.000 12 0.000 0.200 0.400 0.600 0.800 46 - 63 63 - 80 80 - 97 Histograma 0.000 0.500 1.000 46 - 63 63 - 80 80 - 97 Ojiva E s t a d í s t i c a s Página 12 Resultados Numero de clases 3 Rango 50 Longitud de la clase 16.72 Media (Xi) 62.44 Mediana X ̃ 52.13 Moda Ninguno Varianza (S2) 177.97 Desviación estándar (S) 13 Conclusiones El precio del petróleo crudo durante septiembre del 2014 y agosto del 2015 se ubico entre $46 y $63 dólares por barril. La probabilidad de que se sitúe en estos rangos es del 0.667 El precio promedio del petróleo crudo durante dicho periodo es de $62.72, con una desviación estándar de $13.34 dólares por barril Por lo tanto, el intervalo de confianza para el petróleo crudo se ubicara entre $49.10 y $75.78 dólares por barril. Ejercicio 2 Precio promedio futuro semanal del ganado bovino en pie para engorda (Feeder Cattle) en Estados Unidos Dólares por libra Semana (2015) Precio Semana 1 2.240 Semana 2 2.248 Semana 3 2.190 Semana 4 2.150 Semana 5 2.105 Semana 6 1.984 Semana 7 2.017 Semana 8 2.016 Semana 9 1.986 Semana 10 2.061 Semana 11 2.129 Semana 12 2.134 Intervalo de confianza 49.10 75.78 E s t a d í s t i c a s Página 13 Semana 13 2.173 Semana 14 2.189 Semana 15 2.165 Semana 16 2.139 Semana 17 2.132 Semana 18 2.157 Semana 19 2.152 Semana 20 2.183 Semana 21 2.194 Semana 22 2.222 Semana 23 2.227 Semana 24 2.247 Semana 25 2.238 Semana 26 2.222 Semana 27 2.174 Semana 28 2.142 Semana 29 2.141 Semana 30 2.123 Semana 31 2.107 Semana 32 2.142 Semana 33 2.140 Semana 34 2.136 Semana 35 2.089 Semana 36 2.010 Fuente de los datos: CME Clase Limite de clase Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada 1 [ 1.98 , 2.03) 5 0.139 5 0.139 2 [ 2.03 , 2.07) 1 0.028 6 0.167 3 [ 2.07 , 2.12) 3 0.083 9 0.250 4 [ 2.12 , 2.16) 12 0.333 21 0.583 5 [ 2.16 , 2.20) 8 0.222 39 0.806 6 [ 2.20 , 2.25) 7 0.194 36 1.000 36 E s t a d í s t i c a s Página 14 Resultados Numero de clases 6 Rango 0.26 Longitud de la clase 0.04 Media (Xi) 2.14 Mediana X ̃ 2.14 Moda 2.14 Varianza (S2) 0.00 Desviación estándar (S) 0.07 Conclusiones El precio futuro del ganado bovino en pie en los Estados Unidos durante la semana 1 a la semana 36 del 2015, se ubico entre $2.12 y $2.16 dólares por libra. La probabilidad de que se sitúe en estos rangos es del 0.333 El precio del ganado bovino en pie es cuando mucho de $2.20 dólarespor libra, con una probabilidad del 0.806 El precio promedio del ganado en pie durante dicho periodo es de $2.14, con una desviación estándar de $0.07 dólares por libra Por lo tanto, el intervalo de confianza para el ganado bovino en pie se ubicara entre $2.07 y $2.21 dólares por libra Intervalo de confianza 2.07 2.21 0.000 0.100 0.200 0.300 0.400 1.98 - 2.03 2.03 - 2.072.07 - 2.122.12 - 2.162.16 - 2.202.20 - 2.25 Histograma 0.000 0.500 1.000 1.98 - 2.03 2.03 - 2.07 2.07 - 2.12 2.12 - 2.16 2.16 - 2.20 2.20 - 2.25 Ojiva E s t a d í s t i c a s Página 15 Probabilidad Conceptualización básica de probabilidad Probabilidad clásica; está definida como el cociente de casos favorables y casos totales. 𝑃 (𝐴) = 𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝐶𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 A: Eventos, es un espacio de muestra, se expresa como Ω Experimento uno: Es como lanzar un dado Ω = {1, 2, 3, 4, 5, 6} Experimento dos: Lanzar una moneda Ω = {águila, sol} A: Observar un numero par al lanzar un dado 𝑃 (𝐴) = 3 6 = 1 2 B: Observar un sol 𝑃 (𝐴) = 1 2 Expresión de la probabilidad a) Probabilidad frecuentista; Se entiende por probabilidad frecuentista que por cuantas más veces se repita el experimento, al final las posibilidades de que ocurra cada uno de los sucesos será regular. Aunque cualquier comportamiento sea aleatorio, por proceso empírico llegaremos a una regularidad. Es cuando se lanza un dado y suponiendo cuantas veces cae el número que se seleccionó. 𝑃 (𝐴) = lim ∞ 𝑥 𝑛 ≈ ← 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑐𝑒𝑟𝑐𝑎𝑛𝑎 b) Probabilidad subjetiva; medida numérica de oportunidad que expresa un grado puramente personal de creencia en la verosimilitud de un acontecimiento específico de un experimento aleatorio único. A= {Que ocurra un terremoto de 8.2} 𝑃 (𝐴) = 0.9 B= {Que el cliente consuma una Coca Cola Zero} 𝑃 (𝐵) = 04 Axiomas de Kolmogorov; Los axiomas de probabilidad son las condiciones mínimas que deben verificarse para que una función definida sobre un conjunto de sucesos determine consistentemente sus probabilidades. i. 𝑃 (Ω) = 1 E s t a d í s t i c a s Página 16 ii. 0 ≤ 𝑃 (A) ≤ 1 iii. 𝑃 (A ∪ B)) = 𝑃 (𝐴) + 𝑃 (𝐵) − 𝑃(𝐴 ∩ 𝐵) Ejemplo: Tabla de contingencia • Bebidas con azúcar • Bebidas bajo en azúcar • Bebidas sin azúcar A B C Menores de 12 Menores de 24 Mayores o igual de 24 Total D Con azúcar 300 120 100 520 E Bajo azúcar 200 200 200 600 F Sin azúcar 100 250 300 650 Total 600 570 600 1770 Probabilidad conjunta P(A ∩ 𝐵) = 300 1770 = 0.16 P(B ∩ E) = 200 1770 = 0.11 Probabilidad marginal P(A) = 600 1770 = 0.34 P(B) = 570 1770 = 0.32 Probabilidad unión 𝑃 (C ∪ F) = 𝑃 (𝐶) + 𝑃 (𝐹) − 𝑃(𝐶 ∩ 𝐹) = 𝑃 ( 600 1770 ) + 𝑃 ( 650 1770 ) − 𝑃 ( 300 1770 ) = 0.537 𝑃 (E ∪ F) = 𝑃 (𝐸) + 𝑃 (𝐹) − 𝑃(𝐸 ∩ 𝐹) = 𝑃 ( 600 1770 ) + 𝑃 ( 650 1770 ) = 0.706 Probabilidad condicional (Dado) 𝑃 (A l D) = 𝑃 (𝐴 ∩D) 𝑃 (𝐷) = 300 1770 520 1770 = 0.576 E s t a d í s t i c a s Página 17 La probabilidad de que un cliente consuma una bebida bajo en azúcar, dado que sea menor de 24 años. Control 4 Acción HOY ALZA (A) BAJA (B) SIN MOVIMIENTO (C) SUMA AYER ALZA (D) 120 80 50 250 BAJA (E) 100 90 100 290 SIN MOVIMIENTO(F) 50 100 125 275 270 270 275 815 E s t a d í s t i c a s Página 18 Variables aleatorias discretas X es una variable aleatoria Alea: azar Variable aleatoria de Bernoulli 𝑥 ~<Be (P) X toma los valores de 0 a 1 El éxito observado por ejemplo, es un envase defectuoso X = 0 P ( X = 0) = 1 – P P (X = 0) = P X ~ Be (0.3) P = 0.3 P = 0.0.1 Distribución binomial X = cuenta el numero de éxitos observados X ~ Bi (n , p) Para determinar la probabilidad de que en lo envases sean defectuosos, utilizamos la distribución binomial. n = 10 P = 0.01 P = (X = 2) 𝑃 [𝑋 = 𝑋] = ( 𝑛 𝑥 ) 𝑝𝑥(1 − 𝑝) En Excel, utilizaremos la formula de =Distr.Binom (núm_exito, ensayos, prob-éxito, acumulado) X = Numero de éxitos Ensayos = 10 E s t a d í s t i c a s Página 19 Prob_exito = 0.01 Acumulado = Falso X 0 1 2 3 4 5 6 7 8 9 10 P (X=X) 0.904 0.091 0.004 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Variables aleatorias continuas Sea X una VA Con una función de densidad de la acción f(x) = Kx2 0 ≤ x ≤ 1 Una VA continua tiene función de densidad de probabilidad f(x) que posee las siguientes propiedades: • f (x) ≥ 0 • f (x) dx = 1 Formulas Pasos 1) ∫ 𝐾𝑥 𝑑𝑥 = 1 1 0 k∫ 𝑥𝑛 𝑑𝑥 1 0 𝑥𝑛+1 𝑛+1 𝑥𝑛 𝑛 = ∫ [ 1𝑛 𝑛 − 0𝑛 𝑛 ] 1 0 = 1 𝑛 = 𝑛 x 1 0 y E s t a d í s t i c a s Página 20 2) Probabilidad La probabilidad va de 1 a 0. Que dependerá de acuerdo a lo que se busque ∫ 𝐾𝑥 𝑑𝑥 = 1 1 0 k∫ 𝑥𝑛 𝑑𝑥 1 0 𝑥𝑛+1 𝑛+1 k∫ 𝑥𝑛 𝑛 = 𝑥𝑛 − 𝑥𝑛 = 3)Esperanza E (x) = ∫ 𝑥 𝑓(𝑥) 𝑑𝑥 1 0 𝑥𝑛+1 𝑛+1 𝑥𝑛 𝑛 = ∫ [ 𝑥(1)𝑛 𝑛 − 𝑥()0𝑛 𝑛 ] 1 0 = 𝑥 𝑛 E (𝑥2) =∫ 𝑥2 𝑓(𝑥) 𝑑𝑥 1 0 𝑥𝑛+1 𝑛+1 𝑥𝑛 𝑛 = ∫ [ 𝑥(1)𝑛 𝑛 − 𝑥()0𝑛 𝑛 ] 1 0 = 𝑥 𝑛 5) Varianza 𝜎2 = 𝐸 (𝑥2) − (𝐸(𝑥)2) 6) Desviación estándar 𝜎 = √𝑉𝑎𝑟 (𝑥) E s t a d í s t i c a s Página 21 Control 5: f (x) = K𝑥4 0≤ 𝑥 ≥ 1 ∫ 𝐾𝑑𝑥 = 1 1 0 k∫ 𝑥4 𝑑𝑥 = 1 1 0 𝑥𝑛+1 𝑛+1 𝑥5 5 = ∫ [ 15 5 − 05 5 ] 1 0 = 1 5 = 5 E (x) = ∫ 𝑥 𝑓(𝑥) 𝑑𝑥 1 0 E (x) = ∫ 𝑥 5 𝑥4 𝑑𝑥 1 0 5 ∫ 𝑥5 𝑑𝑥 1 0 𝑥𝑛+1 𝑛+1 56 6 ∫ [ 5(1)6 6 − 5(0)6 6 ] 1 0 = 5 6 𝜎2 = 𝐸 (𝑥2) − (𝐸(𝑥)2) 5 7 − ( 5 6 2 ) = 0.714 - 0.693 = 0.021 E (𝑥2) =∫ 𝑥2 𝑓(𝑥) 𝑑𝑥 1 0 ∫ 𝑥2 5𝑥4 𝑑𝑥 1 0 5 ∫ 𝑥6 𝑑𝑥 1 0 𝑥𝑛+1 𝑛+1 57 7 ∫ [ 5(1)7 7 − 5(0)7 7 ] 1 0 = 5 7 𝜎 = √𝑉𝑎𝑟 (𝑥) 𝜎 = √0.021 = 𝟎. 𝟏𝟒𝟒 E s t a d í s t i c a s Página 22 Variables uniformes Distribución uniforme con parámetros de a y b X ≈ U [a, b] Formulas 1) f (x) = 1 𝑎−𝑏 2) E (x) ∫ 𝑥 𝑓(𝑥) 𝑑𝑥 𝑎 𝑏 f (x) ∫ 𝑥 𝑑𝑥 𝑎 𝑏 𝑥𝑛+1 𝑛+1 1 𝑎−𝑏 𝑥𝑛 𝑛 𝑎 𝑏 = [𝑎𝑛 − 𝑏𝑛] 3) E (x) ∫ 𝑥2𝑓(𝑥) 𝑑𝑥 𝑎 𝑏 f (x) ∫ 𝑥2 𝑑𝑥 𝑎 𝑏 𝑥𝑛+1 𝑛+1 1 𝑎−𝑏 𝑥𝑛 𝑛 𝑎 𝑏 = [𝑎𝑛 − 𝑏𝑛] 4) 𝜎2 = 𝐸 (𝑥2) − (𝐸(𝑥)2) 5) 𝜎 = √𝑉𝑎𝑟 (𝑥) Ejemplo: Distribución uniforme x: precio de una acción x~u [0, 50] E s t a d í s t i c a s Página 23 Calcular el parámetro de x E (x) x~u [0, 50] f (x) = 1 50−0 = 1 50 E (x) ∫ 𝑥 𝑓(𝑥) 𝑑𝑥 50 0 f (x) ∫ 𝑥 𝑑𝑥 50 0 1 50 ∫ 𝑥 𝑑𝑥 50 0 𝑥𝑛+1 𝑛+1 1 50 𝑥2 2 50 0 = 1 100 [502 − 02] = 2500 100 = 25 E (x) ∫ 𝑥2 𝑓(𝑥) 𝑑𝑥 50 0 E (x) ∫ 𝑥2 1 50 𝑑𝑥 50 0 1 50 ∫ 𝑥2 𝑑𝑥 50 0 𝑥𝑛+1 𝑛+1 1 50 𝑥3 3 50 0 = 1 150 [503 − 03] = 125,000 150 = 833.33 𝜎2 = 𝐸 (𝑥2) − (𝐸(𝑥)2) x 50 0 y 1 25 E s t a d í s t i c a s Página 24 833.33 - 252 = 208.33 𝜎 = √𝑉𝑎𝑟 (𝑥) 𝜎 = √208.33 = 14.4336 µ [ 25 - 2 ( 14.43) ; 25 + 2 ( 14.43) ] -3 ; 53 Distribución normal Z ~ N ( µ, σ2 ) Ejemplo: ¿Cuál es la probabilidad de que la utilidad obtenida se encuentre 45 y 70? Z ~ N ( 50 , 100) (Resolver en Excel) Media = 50 Desviación estándar = 10 P (45 < X < 70) P (x < 70) - P(x < 45) 0.9772 - 0.3085 = 0.6687 P (x > 65) x y E s t a d í s t i c a s Página 25 P (x > 65) = 1 - P (x > 65) 1 - 0.9331 = 0.06680 P (X < 70) = 0.067 Distribución normal estándar Z ~ N ( 50 , 100) Media = 50 Desviación estándar = 10 𝑍 = 𝑋− µ 𝜎 P (45 < Z < 70) P (45 < Z < 70) P ( 45−50 10 < 𝑍−50 10 < 70−50 10 ) P = (0.5 < Z < 2) P (Z < 2) - P (Z < 0.5) 0.9772 - 0.3085 = 0.6687 Intervalos de confianza Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en particular generen intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población desconocido. En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea E s t a d í s t i c a s Página 26 horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que está completamente por debajo de la línea horizontal no lo contiene. Un intervalo de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población generarán intervalos de confianza que contendrán el parámetro de población. En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada. El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error. Toma de decisiones Nivel de confianza del 90% al 99% 1 – α (Alfa) = 0.90 α : Nivel de significancia, equivalente al error En estadísticas existen dos tipos de estimaciones: • Puntuales • Por intervalo Elementos de una prueba o contraste de Hipótesis Planteamientos de hipótesis: Ho: µ = Ho Vs H1: µ ≠ Ho Ho: µ = Ho Vs H1: µ < Ho Ho: µ = Ho Vs H1: µ > Ho Determinar el valor de significancia, decidir el valor de ά (alfa). ά = 0.5 E s t a d í s t i c a s Página 27 Seleccionar el estadístico de prueba (EP), el cual es un valor que resume la evidencia que ofrece la muestra para rechazar o no a Ho. • Parámetros sobre cual se lleva la prueba µ • Distribución muestra de probabilidad adecuada (Z, t) Regla de decisión es un criterio, si se rechaza o no Ho Para muestra grande: 𝝁 [𝑿 ± 𝒁𝜶/𝟐 𝝈 √𝒏 ] Muestras pequeñas: 𝝁 [𝑿 ± 𝒕𝜶/𝟐 𝒔 √𝒏 ] Contrastar una Hipótesis Estadísticamente es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella. Hipótesis Nula: (H0) es la hipótesis que se contrasta. Esta hipótesis se mantendrá a no ser que los datos indiquen lo contrario. Esta hipótesis nunca se considera probada aunque puede ser rechazada por los datos. Hipótesis Alternativa: (H1) es la hipótesis contrapuesta a H0. Definiciones: Prueba (Contraste) de Hipótesis Estadística: es una regla (Procedimiento) para decidir si rechazamos una hipótesis H0. Estadística de Prueba: Es una función de la muestra. Interesa que contenga el máximo de información sobre H0. Es en base a la información contenida en esta función que decidiremos respecto de la aceptación o rechazo de H0. Región Crítica: Define los valores del estadístico de Prueba para los cuales se contradice H0. Regla de Decisión: Procedimiento que acepta o rechaza H0, dependiendo del valor del estadístico de Prueba. Nivel de Significación: Este valor ά determina un valor crítico c : P ( d > c / H0 ) = . El procedimiento de selección de “c” a partir de ά tiene varias críticas: i. El resultado del Test depende mucho de ά ii. Dar sólo el resultado del Test no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H0. E s t a d í s t i c a s Página 28 Procedimiento para realizar una prueba de hipótesis Ejemplo: 25,000 usd precio por lote o menos 32 propiedades 26,000 Xbarra por lote 2,500 σ 25,000 μ0 (Media bajo hipótesis nula) Paso 1. Definir las hipótesis El ejercicio deberá definir qué lado de la cola utilizar, en este caso se utilizara la cola inferior, como lo indica la imagen de abajo. Hipótesis nula Hipótesis alternativa H0 μ ≤ 25,000 H1 μ ≥ 25,000 Se define un nivel de confianza; Se pueden usar los siguientes niveles de confianza (90%; 95%; 99%) Paso 2. Se define un nivel de significancia (ά). Se obtiene de la diferencia de tu nivel de confianza, dividido entre dos para cada cola. ά = 0.05 Definir la distribución de muestreo. Normal estándar Z = (Xbarra - μ0) / (σ/√n) Paso 3. Evaluar el estadístico de prueba, con la formula anterior. Con ayuda de Excel, utilizar la formula =DISTR.NORM.ESTAND.INV( ) y seleccionar la celda con tu nivel de confianza utilizado. Paso 4. Definirla regla de rechazo E s t a d í s t i c a s Página 29 Si P es menor a ά la hipótesis se rechaza Si P es mayor a ά la hipótesis se acepta Ejercicio: Un corral de engorda lleva un registro del precio del ganado en pie para engorda durante las últimas semanas. El dueño de la empresa desea saber si el precio del ganado se mantendrá menor o igual a 2.12 dólares/libra, de lo contrario compraría un contrato a futuro para cubrirse de las fluctuaciones de los próximos meses. Con una muestra de 36 datos, un precio promedio de 2.14 dólares/libra y una desviación estándar de 0.0725. Utilice el valor del estadístico de prueba para sacar una conclusión con ά = 0.01 Resultado: Definir hipótesis H0 μ = 2.12 H1 μ ≠ 2.12 Intervalo de confianza = 0.99 ά = 0.010 Z de una muestra Prueba de μ = 2.12 vs. ≠ 2.12 La desviación estándar supuesta = 0.0725 Error estándar de la N Media media IC de 99% Z P 36 2.1400 0.0121 (2.1089, 2.1711) 1.66 0.098 1 – α (Alfa) = Limite inferior L,imite superior E s t a d í s t i c a s Página 30 Con un 99% de confianza, el dueño de la empresa puede estar tranquilo ya que el precio del ganado se mantendrá en el promedio esperado por él. Por tal motivo no es necesario recurrir a un contrato a futuro para cubrirse de las fluctuaciones. Proporción. Prueba de hipótesis 𝑃 (𝑋) ( 𝑛 𝑥 ) 𝑝𝑥(1 − 𝑝)𝑛−𝑥 𝑍 = 𝑃1 − 𝑃0 √𝑃0 (1 − 𝑃𝑂) 𝑛 Planteamientos de hipótesis: Ho: p = Ho Vs H1: p ≠ Ho Ho: p = Ho Vs H1: p < Ho Ho: p = Ho Vs H1: p > Ho Prueba de diferencia de medias Ho: μ1= μ2 Vs H1: μ1≠ μ2 Ho: μ1 ≤ μ2 Vs H1: μ1 > μ2 Ho: μ1 ≥ μ2 Vs H1: μ1 < μ2 E s t a d í s t i c a s Página 31 n1 , n2 ≥ 30 σ1 , σ2 ; Conocidas 𝑍 = (𝑋1 − 𝑋2) − (μ1 − μ2) √ σ1 2 𝑛1 + σ2 2 𝑛2 n1 , n2 ≥ 30 σ1 , σ2 ; 𝐷𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠 𝑍 = (𝑋1 − 𝑋2) − (μ1 − μ2) √ s1 2 𝑛1 + 𝑠2 2 𝑛2 n1 , n2 < 30 σ1 , σ2 ; 𝐷𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠 𝑡 = (𝑋1 − 𝑋2) − (μ1 − μ2) √𝑆𝑝 2 1 𝑛1 + 1 𝑛2 Varianza ponderada 𝑆𝑝 2 = (𝑛1 − 1)𝑆1 2 + (𝑛2 − 1)𝑆2 2 𝑛1 + 𝑛2 − 2 Regresión lineal simple El análisis de regresión es una técnica estadística para investigar la relación funcional entre dos o más variables, ajustando algún modelo matemático. Laregresión lineal simple utiliza una sola variable de regresión y el caso más sencillo es el modelo de línea recta. • Investigar si existe una asociación entre las dos variables testeando la hipótesis de independencia estadística • Estudiar la fuerza de la asociación, a través de una medida de asociación denominada coeficiente de correlación • Estudiar la forma de la relación. Usando los datos propondremos un modelo para la relación y a partir de ella será posible predecir el valor de una variable a partir de la otra Para ello proponemos un MODELO que relaciona una variable dependiente (Y) con una variable independiente (X). E s t a d í s t i c a s Página 32 Llamaremos MODELO MATEMÁTICO a la función matemática que proponemos como forma de relación entre la variable dependiente (Y) y la o las variables independientes. La función más simple para la relación entre dos variables es la FUNCIÓN LINEAL 𝑦 = 𝑏 + 𝑚 ∗ 𝑥 b = Ordenada al origen m = pendiente • Esta expresión es una aproximación de la verdadera relación entre X e Y • Para un dado valor de X el modelo predice un cierto valor para Y • Mientras mejor sea la predicción, mejor es el modelo para explicar el fenómeno Se considera que la variable X es la variable independiente o regresiva y se mide sin error, mientras que Y es la variable respuesta para cada valor específico xi de X; y además Y es una variable aleatoria con alguna función de densidad para cada nivel de X. Si la recta de regresión es: Y = β0 + β1X Cada valor yi observado para un xi puede considerarse como el valor esperado de Y dado xi más un error: Modelo lineal simple: 𝑦𝑖 = β0 + β1𝑥𝑖 + 𝜖𝑖 Los 𝜖𝑖 se suponen errores aleatorios con distribución normal, media cero y varianza σ2σ ; β0 y β1 son constantes desconocidas (parámetros del modelo de regresión). Funciones racionales Definición cociente de los polimonios 𝑟 (𝑥) = 𝑝 (𝑥) 𝑞 (𝑥) Un polimonio tiene la forma: 𝑝(𝑥) = 𝑎𝑥𝑛 + 𝑎𝑛−1𝑥 𝑛−1 + ⋯ 𝑎𝑛𝑥 + 𝑎𝑛 𝑝 (𝑥) = 2𝑥3 + 3𝑥2 − 6𝑥 + 1 Polimonio de grado 2 𝑦 = 4𝑥2 + 8𝑥 − 1 La ecuación anterior se puede simplicar de la siguiente forma mediante el “Metodo de completar cuadrados”, la ecuacion quedara de la siguiente forma: 𝑦 = 𝑎(𝑥 − ℎ)2 + 𝑘 E s t a d í s t i c a s Página 33 Paso 1 Agrupar terminos en x 𝑦 = 4𝑥2 + 8𝑥 − 1 Agrupados: 𝑦 = (4𝑥2 + 8𝑥) − 1 Paso 2 El coeficiente de la variable al cuadrado debe ser: 𝑦 = 4(𝑥2 + 2𝑥) -1 Paso 3 Completar el cuadrado 𝑦 = 4 (𝑥2 + 2𝑥 + 1) − 1 − 4 El valor 𝑎𝑥 se divide entre 2 y se eleva al cuadrado para obtener el valor de 𝑎. Posteriormente se multilica por el valor fuera del parantesis y se coloca el signo contrario. Paso 5 Se escribe el binomio. Se elimina el valor de 𝑎𝑥. Todo lo que esta dentro del parentesisi se le saca la raiz cuadrada, para simplifar el binomio de la siguiente forma: 4 (𝑥 + 1)2 − 5 Que es lo mismo que: 𝑦 = 𝑎 ( 𝑥 − ℎ)2 + 𝑘 Para sacar los vectores de nuestra parabola, se toman los siguientes datos: • El valor h, con el signo contrario al de la formula original • El valor de k, se pasa con el mismo signo En este caso: V (-1 , -5) E s t a d í s t i c a s Página 34 Ejercicio Precio de la habitación. Actualmente al precio de $1,000 pesos se rentan 100 habitaciones. Se desea incrementar en $500 cada habitación. Se sabe que por cada incremento del mismo valor se dejan de rentar 10 habitaciones. Ingreso minimo Y = (Precio)*(Cantidad de habitaciones) Y = (1000 + 500 x) (100 – 10x) 𝑌 = (100000 − 10000𝑥 + 50000𝑥 − 50002) Se agrupan −5000𝑥2 + 40000𝑥 + 100000 𝑦 = (−5000𝑥2 + 40000𝑥) + 100000 𝑦 = −5000(𝑥2 − 8𝑥) + 100000 𝑦 = −5000(𝑥2 − 8𝑥 + 16) + 100000 + 80000 𝑦 = −5000(𝑥 − 4)2 + 180000 v (4, 180000) -6 -5 -4 -3 -2 -1 0 0 0.5 1 1.5 2 2.5 E s t a d í s t i c a s Página 35 Ejercicios 1) 𝑌 = −4𝑥2 + 8𝑥 − 2 𝑦 = −4 (𝑥2 + 8𝑥) − 2 𝑦 = −4 (𝑥2 − 2𝑥 + 1) − 2 + 4 𝑦 = −4(𝑥 − 1)2 + 2 v (1 , 2) -6 -5 -4 -3 -2 -1 0 0 0.5 1 1.5 2 2.5 E s t a d í s t i c a s Página 36 Despejar x −4(𝑥 − 1)2 − 2 (𝑥 − 1)2 = √ 1 2 𝑥 − 1 = ±√ 1 2 𝑥 = ± 1 √2 + 1 𝑥1 = 1 √2 + 1 =1.7 𝑥2 = 1 √2 + 1 =1.3 Ejercicio 2 𝑌 = 6𝑥2 + 12𝑥 − 3 𝑦 = 6 (𝑥2 + 2𝑥) − 3 𝑦 = 6(𝑥2 − 2𝑥 + 1) − 3 − 6 𝑦 = 6(𝑥 + 1)2 − 9 v (-1 , -9) -6 -5 -4 -3 -2 -1 0 0 0.5 1 1.5 2 2.5 E s t a d í s t i c a s Página 37 Despejar x 6(𝑥 + 1)2 − 2 (𝑥 + 1)2 = √ 9 6 𝑥 + 1 = ±√ 9 6 𝑥 = ± 9 √6 − 1 𝑥1 = 9 √6 − 1 =0.22 𝑥2 = 9 √6 + 1 =-2-22 Ejercicio 4) Si se disminuye el precio en 20 pesos, se incrementa la venta de acciones en 50. Cual es el precio de la acción que maximiza el ingreso. I = (100 – 20x) (800 + 50x) Precio * Cantidad I = 80000 + 5000X -16000x – 1000x2 -6 -5 -4 -3 -2 -1 0 0 0.5 1 1.5 2 2.5 E s t a d í s t i c a s Página 38 =-1000 x2 – 11000x + 80000 =-1000 (x2 + 5.5 + 30.25) + 80000+30250 = −1000(𝑥 + 5.5)2 + 110250 V ( -5.5 , 110250) (100 – (20 (-5.5))) (800 + (50 (-5.5))) = 210 1075 Ejercicio 5) Si se siembran 20 arboles. Cada uno produce 1000 naranjas y por cada arbol adicional se dejan de cosechar 20 naranjas. Definir el numero de arboles I = (1000 – 20x) (20 + x) Naranjas * arboles I = 20000 – 400x + 1000x – 20x2 =-20x2 +1600x + 20000 =-20 (x2 - 15x + 225) + 20000 + 4500 = −20(𝑥 − 15)2 +24500 V ( 15 , 24500) -6 -5 -4 -3 -2 -1 0 0 0.5 1 1.5 2 2.5 E s t a d í s t i c a s Página 39 (100 – (20 (15))) (20 + 15) = 700 35 Cadenas de Markov Matriz de probabilidad: Es un arreglo cuadrado donde los elementos toman valores entre 0 y 1. La suma deberá ser siempre 1 0.5 0.5 0.3 0.0 El producto de dos matrices de probabilidad es una matriz de probabilidad. ( 0.5 0.5 0.3 0.7 ) ( 1 0 0.8 0.2 ) Matriz regular, algunas de las potencias T1, T2, T3 no contiene ceros como elementos. -6 -5 -4 -3 -2 -1 0 0 0.5 1 1.5 2 2.5
Compartir