Logo Studenta

1 Clases Estadística (1 (14)

¡Estudia con miles de materiales!

Vista previa del material en texto

aleatorio, se eligió por criterio en el estudio del 99 quien eran las voces más representativas de 
cada sector. 
- Muestreo “bola de nieve”: Es un muestreo que se usa en situaciones donde tengo que muestrear 
poblaciones pequeñas y difíciles de encontrar –no hay marco muestral-. La primera unidad de 
análisis me funciona como contacto para conseguir más unidades de análisis. Y así sucesivamente. 
Un buen muestreo por bola de nieve no empieza con una unidad de análisis para evitar el sesgo de 
no tener diversidad y estar representando un mismo grupo. Los puntos de inicio deberían ser 
muchos y diversos. No es aleatoria porque solo tienen probabilidad de ser parte de la muestra 
aquellos que pertenezcan a las redes de mis primeras unidades análisis. 
- Muestreo por cuotas: lógica similar al estratificado pero no aleatorio. Yo necesito conocer el 
tamaño relativo de la población pero al interior de esos segmentos hago muestreo no aleatorio. 
Ejemplo: si tuviéramos que hacer una encuesta a los alumnos, estratificando por carrera, y le doy a 
cada segmento el tamaño que corresponde, es decir, si los alumnos de Ciencia Política y Estudios 
internacionales representan el 18% de la población le asignaré ese mismo porcentaje en mi 
muestra –habrá en el total de la muestra un 18% de este grupo-. Si a los de CP y EI los selecciono 
aleatoriamente estoy haciendo muestreo estratificado proporcional. Pero si agarro cualquiera, me 
paro en la puerta de la universidad y agarro los primeros treinta (suponiendo que son el 18% de la 
muestra). Garantizo que la muestra este balanceado de forma que corrige un poco los sesgos, pero 
como no le das a cada persona la misma probabilidad de ser entrevistado no es aleatorio. Usamos 
el sistema de cuotas porque es una metodología más barata y menos costosa (lo ideal es que sea 
aleatoria). Típicamente se combina con el método de conglomerado. El sistema de cuotas ayuda a 
que las distorsiones no sean tan pronunciadas. Es una pauta que tiene que cumplir mi muestra pero 
que al interior de cada cuota la selección no es aleatoria (si no sería un estrato). 
EN ESTOS CASOS NO ALEATORIOS EL TEOREMA DEL LIMITE CENTRAL NO APLICA, SON MUESTREOS IMPERFECTOS 
QUE PREFERIMOS TENER ANTES QUE NADA. 
- Muestreo de expertos: es un muestreo bastante usado, cuando lo que a vos te interesa o es 
encuestar gente por sus opiniones sino por lo que sabe. Ejemplo expertos en política subnacional. 
Podes hacer un muestreo de expertos de cualquier tipo de los q ue vimos. En general lo que se 
termina haciendo es un muestreo de criterio o por bola de nieve. El estudio de Carlos de encuesta 
de expertos en política subnacional mezcla ambos. No es una técnica diferente de muestreo, es un 
tipo de universo diferente al que típicamente le aplicas muestreo de criterio o por bola de nieve. 
- Muestras sistemáticas y paneles: muchas veces interesa estudiar la variación temporal de una 
variable por eso se repite cada tanto el estudio. Cuando hago eso tengo dos alternativas. Una 
muestra sistemática es una que se repite con la misma metodología y típicamente con el mismo 
tamaño pero no con los mismos individuos –se sortea una nueva muestra, de forma que las 
variaciones se pueden explicar un poco tambien por el error de medición-. Si yo vuelvo a entrevistar 
a los mismos es una muestra de panel, el problema de esto es que la mortalidad del panel es muy 
alta –que alguien no quiera participar más, que se haya mudado, muerto, etc. Que alguien no esté 
más en el panel-. En este casos se pueden hacer nuevas olas con refrescos para estos casos que se 
perdieron como en la APES. La ventaja del panel es que me permite observar cambios en el tiempo. 
Mientras que el muestreo sistemático solo me permite estudiar el nivel agregado del cambio. Una 
desventaja del panel es que una vez que yo entreviste a alguien yo lo cambie, de alguna forma 
cuando lo vuelvo a investigar cambio = el instrumento de medición cambia al objeto de medición. 
En estos casos la muestra puede dejar de ser representativa cuando se genera este impacto, 
cuando le dirigís la atención a un área que antes no tenía puesta su atención, así el panel se vuelve 
menos representativo con el tiempo. 
5. Estadística descriptiva bivariada. 
5.1. Asociación entre dos variables I ¿qué relación hay entre dos variables?: en el fondo quiero saber si varían 
juntas. Si dos variables tienden a variar juntas, yo a eso lo puedo llamar covariación, la forma más técnica de 
llamar a esto es correlación. (Hay una medida estadística que se llama coeficiente de correlación, el coeficiente 
R de Pierson). Estas dos cosas se pueden entender como una asociación entre variables. Yo puedo decir como 
sinónimos, dos variables están asociados, cavarían o están correlacionadas. 
Acá hay que hacer una gran diferencia con la idea de causalidad. En general vamos usar el hecho de que dos 
variables estén correlacionadas como una forma de ver si hay relación de causalidad. La idea central acá es que 
la causalidad implica correlación, pero la correlación no implica causalidad. 
¿Por qué podrían estar X e Y asociadas?: ejemplo: hay correlación entre democracia y desarrollo, pero nadie 
sabe bien cuál es la causa. 
1) causalidad de X a Y, si X es la causa de Y yo esperaría que estuviesen correlacionadas. A mayor desarrollo más 
democracia. 
2) causalidad de Y a X, la causalidad podría ser al revés, que lo que yo creo que es la causa en realidad sea el 
efecto y viceversa. Pero tambien observaría correlación. A más democracia, más desarrollo 
3) causalidad bidireccional, podrían ocurrir ambas cosas: que Y sea causa de X y viceversa. Ambas, tanto la 
democracia causa más desarrollo, como el desarrollo lleva a más democracia. 
4) espuriedad, X no es la causa de Y, ni Y es la causa de X pero ambas variables covarían. En este caso hay una 
tercer variable (Z) que es causa de X e Y; el paquete institucional donde surgió el país como Z. instituciones 
extractivas países autoritarios y pobres, instituciones productivas países democráticos y ricos. 
5) variabilidad muestral o error muestral. Esencialmente es que en el universo no hay correlación pero en tu 
muestra hay correlación por error muestral. Podría ocurrir que realmente no haya correlación en la realidad 
que vos queres estudiar. 
El R de Pierson varía entre 1 y -1. 0 significa que no hay correlación, 1 es que hay perfecta correlación y -1 
Las correlaciones pueden no estar demostrándome ninguna causalidad. 
Clase 17/10. 
Asociación transversal: habría covariación si en el grupo tratado con la droga mejoraran y los que tuvieron 
el placebo no mejoren, mejoren menos o empeoren. Si tengo covariación tengo herramientas para 
emplear juicios de causalidad. 
La asociación puede ser longitudinal: cuando la vi varia en el tiempo en una sola unidad de análisis la vd 
tambien varia hay correlación a través del tiempo. Como el artículo del Crackdown, hay correlación 
seguramente. 
Ejemplo de asociación transversal: dos variables dicotómicas nominales, sexo y una variable Y cuyas 
categorías son sí y no. 
 Femenino Masculino Total 
Sí 40% 40% 40% 
No 60% 60% 60% 
 100% 100% 100%

Otros materiales