Logo Studenta

1 Clases Estadística (1 (9)

¡Estudia con miles de materiales!

Vista previa del material en texto

de la cola de la curva de acerca tanto pero nunca lo toca, lo que en la vida real no sucede, porque eso nos 
daría la chance de encontrar a alguien que mida 63 metros. Que un evento tenga la probabilidad de ocurrir 
no quiere decir que ocurra: si la curva es asintótica podría ocurrir. Pero la probabilidad de ese evento es 
infinitesimal. ¿Hay alguna probabilidad de que hay una muestra que se equivoque por mucho? Si, pero no 
existe. Algo que podría ocurrir pero que en los hechos no ocurre. Damos por descontado que ciertos eventos 
que podrían ocurrir no ocurren. 
 
Entre M y una desviación estándar, entre la media de la curva normal y una desviación estándar por arriba esta 
abarcado el 34% del área debajo de la curva. El área es un 34%. La primera vez que uno escucha esto suena raro, 
pero siempre es un 34%. Si tuviésemos una curva normal con un desvío estándar mayor, también se aplastaría la 
curva, entonces siempre seria del 34%. Para el caso de la altura, si el desvío estándar es de 5, entonces el 68% de la 
población se encuentra entre 165 y 175 cm. Una vez que vos sabes la desviación estándar, también sabes que 
proporción de los casos se ubican entre 165 y 175. La regla empírica dice que a dos desviaciones estándar: a M - 2 
sigma y a M + 2sigma va a estar el 47,5% de los casos. Al 34% le agrego un pedazo. Entre M - 2sigma y M + 2sigma 
voy a tener el 95% de los reclutas: entre 160 y 180 voy a tener el 95% de los reclutas. A M + 3sigmas cae el 49,7% de 
los casos. De la media hacia la derecha hay 50% del área, lo que implica decir es que a 49,7 de los casos se 
encuentran casi todos los casos. El 99,5% de los reclutas tienen entre 165 y 185. Si tengo 1000 reclutas, y del lado 
derecho me queda 0,3% de probabilidad y del otro lado 0,3% de probabilidad, un 0,6 por ciento de probabilidad 
serian 6, por lo que yo esperaría que haya 3 reclutas que midan más de 185 y tres que midan menos de 165. 
Versión generalizada de la regla empírica: pone una curva normal estándar: curva normal con media en 0 y desvío 
estándar de 1. Curva normal teórica que tiene una media con 0 y un desvío estándar de 1. A la cantidad de 
desviaciones estándar que se aleja algo de la media vamos a llamarlo Z: representa la cantidad de alejamientos en 
desvíos estándar de un caso respecto de la media. Cantidad de desviaciones estándar que un caso se aleja de la 
media. Si Santiago mide 180, su valor Z es de 2, porque tiene 2 desviase standard por arriba de la media. Un recluta 
que mide 165, su valor Z o puntaje Z es -1. Un desvió estándar por debajo de la media, por lo que tiene un puntaje Z: 
cuantas desviaciones estándar se está con respecto a la media del curso. Si Z es cero es que estas exactamente en la 
media. 
¿Que área debajo de la curva está involucrada entre la media y 1,83 desviaciones estándar? Vamos por Z hacia 1,80, 
y podemos decir que el 46,64% de los casos caen los casos desde la media. Si quiero saber qué porcentaje de los 
reclutas miden entre 1,68 y 1,75: quizás la forma más fácil sea dibujar la curva normal, recordar que tiene 170 de 
media y 5 desviaciones estándar. ¿Qué porcentaje mide entre 1,68 y 1,75? La mejor forma es dividirlo en 2: de 170 a 
175 es fácil: coincide con la regla empírica: ahí va a estar el 34% de los reclutas. En cambio, de 168 a 170 es un poco 
más difícil: buscas en la tabla que seria 2 cm en termino de desviación estándar. Si una desviación estándar es 5 cm, 
2 cm es 0,4 desviaciones estándar. Z es igual al valor de X menos la media dividido sigma: 168 - 170 / 5 = -2/5 = -0,4. 
Qué área debajo de la curva está involucrada en 0,4: 15,54%. Averigüe que entre 168 cm y 170 cm hay 15,54% de los 
casos. Entre 168 cm y 175 cm hay 49,54% de los reclutas. 
Error: aplicar la regla de los tres simples al área. Como va bajando, cada cantidad de desvíos estándar adicional no 
abarca la misma cantidad de desvíos. El valor Z es expresar algo en termino de sus desvíos respecto de la media 
medido en sus desvíos. Si yo digo que tiene un puntaje Z de uno, estoy diciendo que tiene una desviación estándar 
por arriba de la media: 6,8 como promedio final. No quiere decir nada si no sabes cómo le fue a los demás: si esta 
alumna se sacó 6,8 y el promedio fue 5, va a tener una curva mucho más alta. Si se sacó 6,8 y el promedio fue 8, la 
nota no fue tan buena. Imagínate en variables que sabes todavía menos: hemoglobina h tenés 64. Si me dice “tenés 
un puntaje Z de 0,2”, por lo que estás muy cerca de la media. Hay veces que resulta más sencillo expresar magnitud 
en termines de cuantas deviaciones estándar se está respecto a la media. Altura promedio de la gente es de 170. 
Persona que mide 180: ¿Cuánto más alto que el promedio es eso? Si estamos en una situación con una curva normal, 
que es normal de 1,70 de media y 10 cm de desvíos estándar, esa persona tiene un puntaje Z de 1. Entonces, hay un 
16% de gente que es más alta que 180, porque el 34% de gente va a caer entre 170 y 180. En términos relativos, si la 
curva se angosta, y el desvío estándar se hace de 3, entonces él se encuentra a más de 3 desvíos estándar por sobre 
la media, lo que quiere decir que hay muy poca gente más alta que él. Los dos miden 180, pero en el segundo caso 
es un caso extremo, pero en el primero hay un 16% más alto que él. 
Clase 5/9. 
Hasta que el evento no ocurre hay una idea de incertidumbre. Si tengo certeza de ocurrencia la probabilidad de 
ocurrencia es 1, que sé que ocurrió o va a ocurrir. Tanto en cero probabilidades como en una probabilidad tengo 
certeza absoluta. Cuanto más te acercas a cero mayor certidumbre tenés. Tener una expresión de probabilidad te 
ayuda a tomar decisiones en la estadística y en la vida cotidiana. 
Las regularidades en grandes números se consolidan en cifras que me permiten tomar decisiones con menos riesgo. 
El negocio del casino es que la mayoría de la gente no entiende la lógica, o si pero entienden la voluntad de retirarse 
cuando ganan ya que las probabilidades son menores. El casino siempre gana. 
Uno puede tomar decisiones sobre una base más firme cuando piensa las probabilidades en eventos repetidos, a 
largo plazo. 
La probabilidad cuando se trata de eventos de igual probabilidad como tirar los dedos, un experimento o evento que 
tiene igual probabilidad la definición de la probabilidad de un evento X es igual al número de formas en que X puede 
ocurrir, sobre el número total de posibles resultados. 
La probabilidad de tirar un dado y que salga el numero dos es 1/6. Aplicando la formula P (x=2) = 1 (formas en que 
dos pueda salir) / 6 (posibles resultados). 
La probabilidad del evento puede ser comparada para ver que me es conveniente usando esta fórmula. Las 
probabilidades estrictamente hablando me dan algo entre 0 y 1. Es una cuestión de notación. Es lo mismo que 
pasarlo a porcentaje. 
Cuando el evento no tiene iguales probabilidades esta fórmula no aplica. En estos casos tengo que hacer una 
estimación empírica, tengo que hacer investigación, generar datos, hacer un experimento. Y en ese caso vamos a 
definir a la probabilidad del evento como la razón entre la cantidad de éxitos sobre el total de investigados. Si hay 
datos recurrís directamente a esta fórmula sin necesidad de generar datos mediante una investigación. 
Cuantas más unidades de análisis observes y tengas una muestra más amplia menor error tendrá tu probabilidad 
estimada. 
Un concepto importante: probabilidad condicional, la idea de cuando yo tengo alguna otra información sobre algo 
puedo estimar mi probabilidad mejor, dado que sabes un dato cambia la probabilidad. Podemos calcular la 
probabilidad dado un factor que conocemos. Por ejemplo: la probabilidad de lluvia dado que esta nublado. P (X|R). 
Ej: ¿cuál es la probabilidad que un votante de clase baja sea votante del PJ? Esto lo podemos ver en una tabla de 
doble entrada (La probabilidad de alguno de los valores de la variable dado que en la otra variableadopta cierto 
valor). La probabilidad condicional puede ser bastante diferente, tanto más alta como más baja, que una 
probabilidad normal. 
Asociación entre dos variables es cuando cambian juntas. ¿qué implicaría que las variables sean independientes 
entre sí, que no tengan asociación? 
La independencia estadística consiste en que la probabilidad de un evento y la probabilidad condicional de un 
evento sea la misma. 
El valor esperado es central en rational choice, porque cuando yo tomo decisiones algo cambia si va a ser una sola 
vez o si va a ser a largo plazo. El valor esperado es algo así como el resultado esperado del resultado de un 
experimento en intentos repetidos en el largo plazo. Es equivalente a la media. E (X) = a la sumatoria de la 
probabilidad de Xi por Xi. Siendo Xi un valor que toma X. 
Lo que necesitamos determinar del valor esperado cuales son los eventos posibles, la probabilidad de cada evento 
que tiene que estar dada y el valor/nro. Asociado a cada evento. 
Esto es muy útil para cuestiones de PPPP. Por ejemplo, para ver el retorno económico de un control automovilístico, 
tiene en cuenta el costo y beneficio según probabilidades. 
Si tuviéramos que estimar un parámetro como la edad promedio de los argentinos, eso es el parámetro, la edad 
exacta de los 40 millones de argentinos promediados. Si no tenemos el dato y tomamos una muestra X con barra 
arriba es la muestra poblacional te puede dar una sobreestimación o subestimación del parámetro, cada nuestra a

Otros materiales