1 Clases Estadística (1 (9)

Estadística

•

SIN SIGLA

0

aidensz27

8/7/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Estadística

5354 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

de la cola de la curva de acerca tanto pero nunca lo toca, lo que en la vida real no sucede, porque eso nos
daría la chance de encontrar a alguien que mida 63 metros. Que un evento tenga la probabilidad de ocurrir
no quiere decir que ocurra: si la curva es asintótica podría ocurrir. Pero la probabilidad de ese evento es
infinitesimal. ¿Hay alguna probabilidad de que hay una muestra que se equivoque por mucho? Si, pero no
existe. Algo que podría ocurrir pero que en los hechos no ocurre. Damos por descontado que ciertos eventos
que podrían ocurrir no ocurren.

Entre M y una desviación estándar, entre la media de la curva normal y una desviación estándar por arriba esta
abarcado el 34% del área debajo de la curva. El área es un 34%. La primera vez que uno escucha esto suena raro,
pero siempre es un 34%. Si tuviésemos una curva normal con un desvío estándar mayor, también se aplastaría la
curva, entonces siempre seria del 34%. Para el caso de la altura, si el desvío estándar es de 5, entonces el 68% de la
población se encuentra entre 165 y 175 cm. Una vez que vos sabes la desviación estándar, también sabes que
proporción de los casos se ubican entre 165 y 175. La regla empírica dice que a dos desviaciones estándar: a M - 2
sigma y a M + 2sigma va a estar el 47,5% de los casos. Al 34% le agrego un pedazo. Entre M - 2sigma y M + 2sigma
voy a tener el 95% de los reclutas: entre 160 y 180 voy a tener el 95% de los reclutas. A M + 3sigmas cae el 49,7% de
los casos. De la media hacia la derecha hay 50% del área, lo que implica decir es que a 49,7 de los casos se
encuentran casi todos los casos. El 99,5% de los reclutas tienen entre 165 y 185. Si tengo 1000 reclutas, y del lado
derecho me queda 0,3% de probabilidad y del otro lado 0,3% de probabilidad, un 0,6 por ciento de probabilidad
serian 6, por lo que yo esperaría que haya 3 reclutas que midan más de 185 y tres que midan menos de 165.
Versión generalizada de la regla empírica: pone una curva normal estándar: curva normal con media en 0 y desvío
estándar de 1. Curva normal teórica que tiene una media con 0 y un desvío estándar de 1. A la cantidad de
desviaciones estándar que se aleja algo de la media vamos a llamarlo Z: representa la cantidad de alejamientos en
desvíos estándar de un caso respecto de la media. Cantidad de desviaciones estándar que un caso se aleja de la
media. Si Santiago mide 180, su valor Z es de 2, porque tiene 2 desviase standard por arriba de la media. Un recluta
que mide 165, su valor Z o puntaje Z es -1. Un desvió estándar por debajo de la media, por lo que tiene un puntaje Z:
cuantas desviaciones estándar se está con respecto a la media del curso. Si Z es cero es que estas exactamente en la
media.
¿Que área debajo de la curva está involucrada entre la media y 1,83 desviaciones estándar? Vamos por Z hacia 1,80,
y podemos decir que el 46,64% de los casos caen los casos desde la media. Si quiero saber qué porcentaje de los
reclutas miden entre 1,68 y 1,75: quizás la forma más fácil sea dibujar la curva normal, recordar que tiene 170 de
media y 5 desviaciones estándar. ¿Qué porcentaje mide entre 1,68 y 1,75? La mejor forma es dividirlo en 2: de 170 a
175 es fácil: coincide con la regla empírica: ahí va a estar el 34% de los reclutas. En cambio, de 168 a 170 es un poco
más difícil: buscas en la tabla que seria 2 cm en termino de desviación estándar. Si una desviación estándar es 5 cm,
2 cm es 0,4 desviaciones estándar. Z es igual al valor de X menos la media dividido sigma: 168 - 170 / 5 = -2/5 = -0,4.
Qué área debajo de la curva está involucrada en 0,4: 15,54%. Averigüe que entre 168 cm y 170 cm hay 15,54% de los
casos. Entre 168 cm y 175 cm hay 49,54% de los reclutas.
Error: aplicar la regla de los tres simples al área. Como va bajando, cada cantidad de desvíos estándar adicional no
abarca la misma cantidad de desvíos. El valor Z es expresar algo en termino de sus desvíos respecto de la media
medido en sus desvíos. Si yo digo que tiene un puntaje Z de uno, estoy diciendo que tiene una desviación estándar
por arriba de la media: 6,8 como promedio final. No quiere decir nada si no sabes cómo le fue a los demás: si esta
alumna se sacó 6,8 y el promedio fue 5, va a tener una curva mucho más alta. Si se sacó 6,8 y el promedio fue 8, la
nota no fue tan buena. Imagínate en variables que sabes todavía menos: hemoglobina h tenés 64. Si me dice “tenés
un puntaje Z de 0,2”, por lo que estás muy cerca de la media. Hay veces que resulta más sencillo expresar magnitud
en termines de cuantas deviaciones estándar se está respecto a la media. Altura promedio de la gente es de 170.
Persona que mide 180: ¿Cuánto más alto que el promedio es eso? Si estamos en una situación con una curva normal,
que es normal de 1,70 de media y 10 cm de desvíos estándar, esa persona tiene un puntaje Z de 1. Entonces, hay un
16% de gente que es más alta que 180, porque el 34% de gente va a caer entre 170 y 180. En términos relativos, si la
curva se angosta, y el desvío estándar se hace de 3, entonces él se encuentra a más de 3 desvíos estándar por sobre
la media, lo que quiere decir que hay muy poca gente más alta que él. Los dos miden 180, pero en el segundo caso
es un caso extremo, pero en el primero hay un 16% más alto que él.
Clase 5/9.
Hasta que el evento no ocurre hay una idea de incertidumbre. Si tengo certeza de ocurrencia la probabilidad de
ocurrencia es 1, que sé que ocurrió o va a ocurrir. Tanto en cero probabilidades como en una probabilidad tengo
certeza absoluta. Cuanto más te acercas a cero mayor certidumbre tenés. Tener una expresión de probabilidad te
ayuda a tomar decisiones en la estadística y en la vida cotidiana.
Las regularidades en grandes números se consolidan en cifras que me permiten tomar decisiones con menos riesgo.
El negocio del casino es que la mayoría de la gente no entiende la lógica, o si pero entienden la voluntad de retirarse
cuando ganan ya que las probabilidades son menores. El casino siempre gana.
Uno puede tomar decisiones sobre una base más firme cuando piensa las probabilidades en eventos repetidos, a
largo plazo.
La probabilidad cuando se trata de eventos de igual probabilidad como tirar los dedos, un experimento o evento que
tiene igual probabilidad la definición de la probabilidad de un evento X es igual al número de formas en que X puede
ocurrir, sobre el número total de posibles resultados.
La probabilidad de tirar un dado y que salga el numero dos es 1/6. Aplicando la formula P (x=2) = 1 (formas en que
dos pueda salir) / 6 (posibles resultados).
La probabilidad del evento puede ser comparada para ver que me es conveniente usando esta fórmula. Las
probabilidades estrictamente hablando me dan algo entre 0 y 1. Es una cuestión de notación. Es lo mismo que
pasarlo a porcentaje.
Cuando el evento no tiene iguales probabilidades esta fórmula no aplica. En estos casos tengo que hacer una
estimación empírica, tengo que hacer investigación, generar datos, hacer un experimento. Y en ese caso vamos a
definir a la probabilidad del evento como la razón entre la cantidad de éxitos sobre el total de investigados. Si hay
datos recurrís directamente a esta fórmula sin necesidad de generar datos mediante una investigación.
Cuantas más unidades de análisis observes y tengas una muestra más amplia menor error tendrá tu probabilidad
estimada.
Un concepto importante: probabilidad condicional, la idea de cuando yo tengo alguna otra información sobre algo
puedo estimar mi probabilidad mejor, dado que sabes un dato cambia la probabilidad. Podemos calcular la
probabilidad dado un factor que conocemos. Por ejemplo: la probabilidad de lluvia dado que esta nublado. P (X|R).
Ej: ¿cuál es la probabilidad que un votante de clase baja sea votante del PJ? Esto lo podemos ver en una tabla de
doble entrada (La probabilidad de alguno de los valores de la variable dado que en la otra variableadopta cierto
valor). La probabilidad condicional puede ser bastante diferente, tanto más alta como más baja, que una
probabilidad normal.
Asociación entre dos variables es cuando cambian juntas. ¿qué implicaría que las variables sean independientes
entre sí, que no tengan asociación?
La independencia estadística consiste en que la probabilidad de un evento y la probabilidad condicional de un
evento sea la misma.
El valor esperado es central en rational choice, porque cuando yo tomo decisiones algo cambia si va a ser una sola
vez o si va a ser a largo plazo. El valor esperado es algo así como el resultado esperado del resultado de un
experimento en intentos repetidos en el largo plazo. Es equivalente a la media. E (X) = a la sumatoria de la
probabilidad de Xi por Xi. Siendo Xi un valor que toma X.
Lo que necesitamos determinar del valor esperado cuales son los eventos posibles, la probabilidad de cada evento
que tiene que estar dada y el valor/nro. Asociado a cada evento.
Esto es muy útil para cuestiones de PPPP. Por ejemplo, para ver el retorno económico de un control automovilístico,
tiene en cuenta el costo y beneficio según probabilidades.
Si tuviéramos que estimar un parámetro como la edad promedio de los argentinos, eso es el parámetro, la edad
exacta de los 40 millones de argentinos promediados. Si no tenemos el dato y tomamos una muestra X con barra
arriba es la muestra poblacional te puede dar una sobreestimación o subestimación del parámetro, cada nuestra a