1 Clases Estadística (1 (14)

Estadística

•

SIN SIGLA

0

aidensz27

8/7/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Estadística

5385 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

aleatorio, se eligió por criterio en el estudio del 99 quien eran las voces más representativas de
cada sector.
- Muestreo “bola de nieve”: Es un muestreo que se usa en situaciones donde tengo que muestrear
poblaciones pequeñas y difíciles de encontrar –no hay marco muestral-. La primera unidad de
análisis me funciona como contacto para conseguir más unidades de análisis. Y así sucesivamente.
Un buen muestreo por bola de nieve no empieza con una unidad de análisis para evitar el sesgo de
no tener diversidad y estar representando un mismo grupo. Los puntos de inicio deberían ser
muchos y diversos. No es aleatoria porque solo tienen probabilidad de ser parte de la muestra
aquellos que pertenezcan a las redes de mis primeras unidades análisis.
- Muestreo por cuotas: lógica similar al estratificado pero no aleatorio. Yo necesito conocer el
tamaño relativo de la población pero al interior de esos segmentos hago muestreo no aleatorio.
Ejemplo: si tuviéramos que hacer una encuesta a los alumnos, estratificando por carrera, y le doy a
cada segmento el tamaño que corresponde, es decir, si los alumnos de Ciencia Política y Estudios
internacionales representan el 18% de la población le asignaré ese mismo porcentaje en mi
muestra –habrá en el total de la muestra un 18% de este grupo-. Si a los de CP y EI los selecciono
aleatoriamente estoy haciendo muestreo estratificado proporcional. Pero si agarro cualquiera, me
paro en la puerta de la universidad y agarro los primeros treinta (suponiendo que son el 18% de la
muestra). Garantizo que la muestra este balanceado de forma que corrige un poco los sesgos, pero
como no le das a cada persona la misma probabilidad de ser entrevistado no es aleatorio. Usamos
el sistema de cuotas porque es una metodología más barata y menos costosa (lo ideal es que sea
aleatoria). Típicamente se combina con el método de conglomerado. El sistema de cuotas ayuda a
que las distorsiones no sean tan pronunciadas. Es una pauta que tiene que cumplir mi muestra pero
que al interior de cada cuota la selección no es aleatoria (si no sería un estrato).
EN ESTOS CASOS NO ALEATORIOS EL TEOREMA DEL LIMITE CENTRAL NO APLICA, SON MUESTREOS IMPERFECTOS
QUE PREFERIMOS TENER ANTES QUE NADA.
- Muestreo de expertos: es un muestreo bastante usado, cuando lo que a vos te interesa o es
encuestar gente por sus opiniones sino por lo que sabe. Ejemplo expertos en política subnacional.
Podes hacer un muestreo de expertos de cualquier tipo de los q ue vimos. En general lo que se
termina haciendo es un muestreo de criterio o por bola de nieve. El estudio de Carlos de encuesta
de expertos en política subnacional mezcla ambos. No es una técnica diferente de muestreo, es un
tipo de universo diferente al que típicamente le aplicas muestreo de criterio o por bola de nieve.
- Muestras sistemáticas y paneles: muchas veces interesa estudiar la variación temporal de una
variable por eso se repite cada tanto el estudio. Cuando hago eso tengo dos alternativas. Una
muestra sistemática es una que se repite con la misma metodología y típicamente con el mismo
tamaño pero no con los mismos individuos –se sortea una nueva muestra, de forma que las
variaciones se pueden explicar un poco tambien por el error de medición-. Si yo vuelvo a entrevistar
a los mismos es una muestra de panel, el problema de esto es que la mortalidad del panel es muy
alta –que alguien no quiera participar más, que se haya mudado, muerto, etc. Que alguien no esté
más en el panel-. En este casos se pueden hacer nuevas olas con refrescos para estos casos que se
perdieron como en la APES. La ventaja del panel es que me permite observar cambios en el tiempo.
Mientras que el muestreo sistemático solo me permite estudiar el nivel agregado del cambio. Una
desventaja del panel es que una vez que yo entreviste a alguien yo lo cambie, de alguna forma
cuando lo vuelvo a investigar cambio = el instrumento de medición cambia al objeto de medición.
En estos casos la muestra puede dejar de ser representativa cuando se genera este impacto,
cuando le dirigís la atención a un área que antes no tenía puesta su atención, así el panel se vuelve
menos representativo con el tiempo.
5. Estadística descriptiva bivariada.
5.1. Asociación entre dos variables I ¿qué relación hay entre dos variables?: en el fondo quiero saber si varían
juntas. Si dos variables tienden a variar juntas, yo a eso lo puedo llamar covariación, la forma más técnica de
llamar a esto es correlación. (Hay una medida estadística que se llama coeficiente de correlación, el coeficiente
R de Pierson). Estas dos cosas se pueden entender como una asociación entre variables. Yo puedo decir como
sinónimos, dos variables están asociados, cavarían o están correlacionadas.
Acá hay que hacer una gran diferencia con la idea de causalidad. En general vamos usar el hecho de que dos
variables estén correlacionadas como una forma de ver si hay relación de causalidad. La idea central acá es que
la causalidad implica correlación, pero la correlación no implica causalidad.
¿Por qué podrían estar X e Y asociadas?: ejemplo: hay correlación entre democracia y desarrollo, pero nadie
sabe bien cuál es la causa.
1) causalidad de X a Y, si X es la causa de Y yo esperaría que estuviesen correlacionadas. A mayor desarrollo más
democracia.
2) causalidad de Y a X, la causalidad podría ser al revés, que lo que yo creo que es la causa en realidad sea el
efecto y viceversa. Pero tambien observaría correlación. A más democracia, más desarrollo
3) causalidad bidireccional, podrían ocurrir ambas cosas: que Y sea causa de X y viceversa. Ambas, tanto la
democracia causa más desarrollo, como el desarrollo lleva a más democracia.
4) espuriedad, X no es la causa de Y, ni Y es la causa de X pero ambas variables covarían. En este caso hay una
tercer variable (Z) que es causa de X e Y; el paquete institucional donde surgió el país como Z. instituciones
extractivas países autoritarios y pobres, instituciones productivas países democráticos y ricos.
5) variabilidad muestral o error muestral. Esencialmente es que en el universo no hay correlación pero en tu
muestra hay correlación por error muestral. Podría ocurrir que realmente no haya correlación en la realidad
que vos queres estudiar.
El R de Pierson varía entre 1 y -1. 0 significa que no hay correlación, 1 es que hay perfecta correlación y -1
Las correlaciones pueden no estar demostrándome ninguna causalidad.
Clase 17/10.
Asociación transversal: habría covariación si en el grupo tratado con la droga mejoraran y los que tuvieron
el placebo no mejoren, mejoren menos o empeoren. Si tengo covariación tengo herramientas para
emplear juicios de causalidad.
La asociación puede ser longitudinal: cuando la vi varia en el tiempo en una sola unidad de análisis la vd
tambien varia hay correlación a través del tiempo. Como el artículo del Crackdown, hay correlación
seguramente.
Ejemplo de asociación transversal: dos variables dicotómicas nominales, sexo y una variable Y cuyas
categorías son sí y no.
Femenino Masculino Total
Sí 40% 40% 40%
No 60% 60% 60%
100% 100% 100%