Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
de la cola de la curva de acerca tanto pero nunca lo toca, lo que en la vida real no sucede, porque eso nos daría la chance de encontrar a alguien que mida 63 metros. Que un evento tenga la probabilidad de ocurrir no quiere decir que ocurra: si la curva es asintótica podría ocurrir. Pero la probabilidad de ese evento es infinitesimal. ¿Hay alguna probabilidad de que hay una muestra que se equivoque por mucho? Si, pero no existe. Algo que podría ocurrir pero que en los hechos no ocurre. Damos por descontado que ciertos eventos que podrían ocurrir no ocurren. Entre M y una desviación estándar, entre la media de la curva normal y una desviación estándar por arriba esta abarcado el 34% del área debajo de la curva. El área es un 34%. La primera vez que uno escucha esto suena raro, pero siempre es un 34%. Si tuviésemos una curva normal con un desvío estándar mayor, también se aplastaría la curva, entonces siempre seria del 34%. Para el caso de la altura, si el desvío estándar es de 5, entonces el 68% de la población se encuentra entre 165 y 175 cm. Una vez que vos sabes la desviación estándar, también sabes que proporción de los casos se ubican entre 165 y 175. La regla empírica dice que a dos desviaciones estándar: a M - 2 sigma y a M + 2sigma va a estar el 47,5% de los casos. Al 34% le agrego un pedazo. Entre M - 2sigma y M + 2sigma voy a tener el 95% de los reclutas: entre 160 y 180 voy a tener el 95% de los reclutas. A M + 3sigmas cae el 49,7% de los casos. De la media hacia la derecha hay 50% del área, lo que implica decir es que a 49,7 de los casos se encuentran casi todos los casos. El 99,5% de los reclutas tienen entre 165 y 185. Si tengo 1000 reclutas, y del lado derecho me queda 0,3% de probabilidad y del otro lado 0,3% de probabilidad, un 0,6 por ciento de probabilidad serian 6, por lo que yo esperaría que haya 3 reclutas que midan más de 185 y tres que midan menos de 165. Versión generalizada de la regla empírica: pone una curva normal estándar: curva normal con media en 0 y desvío estándar de 1. Curva normal teórica que tiene una media con 0 y un desvío estándar de 1. A la cantidad de desviaciones estándar que se aleja algo de la media vamos a llamarlo Z: representa la cantidad de alejamientos en desvíos estándar de un caso respecto de la media. Cantidad de desviaciones estándar que un caso se aleja de la media. Si Santiago mide 180, su valor Z es de 2, porque tiene 2 desviase standard por arriba de la media. Un recluta que mide 165, su valor Z o puntaje Z es -1. Un desvió estándar por debajo de la media, por lo que tiene un puntaje Z: cuantas desviaciones estándar se está con respecto a la media del curso. Si Z es cero es que estas exactamente en la media. ¿Que área debajo de la curva está involucrada entre la media y 1,83 desviaciones estándar? Vamos por Z hacia 1,80, y podemos decir que el 46,64% de los casos caen los casos desde la media. Si quiero saber qué porcentaje de los reclutas miden entre 1,68 y 1,75: quizás la forma más fácil sea dibujar la curva normal, recordar que tiene 170 de media y 5 desviaciones estándar. ¿Qué porcentaje mide entre 1,68 y 1,75? La mejor forma es dividirlo en 2: de 170 a 175 es fácil: coincide con la regla empírica: ahí va a estar el 34% de los reclutas. En cambio, de 168 a 170 es un poco más difícil: buscas en la tabla que seria 2 cm en termino de desviación estándar. Si una desviación estándar es 5 cm, 2 cm es 0,4 desviaciones estándar. Z es igual al valor de X menos la media dividido sigma: 168 - 170 / 5 = -2/5 = -0,4. Qué área debajo de la curva está involucrada en 0,4: 15,54%. Averigüe que entre 168 cm y 170 cm hay 15,54% de los casos. Entre 168 cm y 175 cm hay 49,54% de los reclutas. Error: aplicar la regla de los tres simples al área. Como va bajando, cada cantidad de desvíos estándar adicional no abarca la misma cantidad de desvíos. El valor Z es expresar algo en termino de sus desvíos respecto de la media medido en sus desvíos. Si yo digo que tiene un puntaje Z de uno, estoy diciendo que tiene una desviación estándar por arriba de la media: 6,8 como promedio final. No quiere decir nada si no sabes cómo le fue a los demás: si esta alumna se sacó 6,8 y el promedio fue 5, va a tener una curva mucho más alta. Si se sacó 6,8 y el promedio fue 8, la nota no fue tan buena. Imagínate en variables que sabes todavía menos: hemoglobina h tenés 64. Si me dice “tenés un puntaje Z de 0,2”, por lo que estás muy cerca de la media. Hay veces que resulta más sencillo expresar magnitud en termines de cuantas deviaciones estándar se está respecto a la media. Altura promedio de la gente es de 170. Persona que mide 180: ¿Cuánto más alto que el promedio es eso? Si estamos en una situación con una curva normal, que es normal de 1,70 de media y 10 cm de desvíos estándar, esa persona tiene un puntaje Z de 1. Entonces, hay un 16% de gente que es más alta que 180, porque el 34% de gente va a caer entre 170 y 180. En términos relativos, si la curva se angosta, y el desvío estándar se hace de 3, entonces él se encuentra a más de 3 desvíos estándar por sobre la media, lo que quiere decir que hay muy poca gente más alta que él. Los dos miden 180, pero en el segundo caso es un caso extremo, pero en el primero hay un 16% más alto que él. Clase 5/9. Hasta que el evento no ocurre hay una idea de incertidumbre. Si tengo certeza de ocurrencia la probabilidad de ocurrencia es 1, que sé que ocurrió o va a ocurrir. Tanto en cero probabilidades como en una probabilidad tengo certeza absoluta. Cuanto más te acercas a cero mayor certidumbre tenés. Tener una expresión de probabilidad te ayuda a tomar decisiones en la estadística y en la vida cotidiana. Las regularidades en grandes números se consolidan en cifras que me permiten tomar decisiones con menos riesgo. El negocio del casino es que la mayoría de la gente no entiende la lógica, o si pero entienden la voluntad de retirarse cuando ganan ya que las probabilidades son menores. El casino siempre gana. Uno puede tomar decisiones sobre una base más firme cuando piensa las probabilidades en eventos repetidos, a largo plazo. La probabilidad cuando se trata de eventos de igual probabilidad como tirar los dedos, un experimento o evento que tiene igual probabilidad la definición de la probabilidad de un evento X es igual al número de formas en que X puede ocurrir, sobre el número total de posibles resultados. La probabilidad de tirar un dado y que salga el numero dos es 1/6. Aplicando la formula P (x=2) = 1 (formas en que dos pueda salir) / 6 (posibles resultados). La probabilidad del evento puede ser comparada para ver que me es conveniente usando esta fórmula. Las probabilidades estrictamente hablando me dan algo entre 0 y 1. Es una cuestión de notación. Es lo mismo que pasarlo a porcentaje. Cuando el evento no tiene iguales probabilidades esta fórmula no aplica. En estos casos tengo que hacer una estimación empírica, tengo que hacer investigación, generar datos, hacer un experimento. Y en ese caso vamos a definir a la probabilidad del evento como la razón entre la cantidad de éxitos sobre el total de investigados. Si hay datos recurrís directamente a esta fórmula sin necesidad de generar datos mediante una investigación. Cuantas más unidades de análisis observes y tengas una muestra más amplia menor error tendrá tu probabilidad estimada. Un concepto importante: probabilidad condicional, la idea de cuando yo tengo alguna otra información sobre algo puedo estimar mi probabilidad mejor, dado que sabes un dato cambia la probabilidad. Podemos calcular la probabilidad dado un factor que conocemos. Por ejemplo: la probabilidad de lluvia dado que esta nublado. P (X|R). Ej: ¿cuál es la probabilidad que un votante de clase baja sea votante del PJ? Esto lo podemos ver en una tabla de doble entrada (La probabilidad de alguno de los valores de la variable dado que en la otra variableadopta cierto valor). La probabilidad condicional puede ser bastante diferente, tanto más alta como más baja, que una probabilidad normal. Asociación entre dos variables es cuando cambian juntas. ¿qué implicaría que las variables sean independientes entre sí, que no tengan asociación? La independencia estadística consiste en que la probabilidad de un evento y la probabilidad condicional de un evento sea la misma. El valor esperado es central en rational choice, porque cuando yo tomo decisiones algo cambia si va a ser una sola vez o si va a ser a largo plazo. El valor esperado es algo así como el resultado esperado del resultado de un experimento en intentos repetidos en el largo plazo. Es equivalente a la media. E (X) = a la sumatoria de la probabilidad de Xi por Xi. Siendo Xi un valor que toma X. Lo que necesitamos determinar del valor esperado cuales son los eventos posibles, la probabilidad de cada evento que tiene que estar dada y el valor/nro. Asociado a cada evento. Esto es muy útil para cuestiones de PPPP. Por ejemplo, para ver el retorno económico de un control automovilístico, tiene en cuenta el costo y beneficio según probabilidades. Si tuviéramos que estimar un parámetro como la edad promedio de los argentinos, eso es el parámetro, la edad exacta de los 40 millones de argentinos promediados. Si no tenemos el dato y tomamos una muestra X con barra arriba es la muestra poblacional te puede dar una sobreestimación o subestimación del parámetro, cada nuestra a
Compartir