Logo Studenta

1 Clases Estadística (1 (1)

¡Estudia con miles de materiales!

Vista previa del material en texto

Estadística para las Ciencias Sociales 
En las inferencias hicimos hincapié en como producir datos para la investigación social. énfasis en como generar 
datos de buena calidad, operacionalización de variables (como bajo un concepto abstracto y complejo a formas 
concretas de medirlo, buscarle indicadores con precisión, con validez y confiabilidad, de buena calidad). 
Esta materia es a partir de ya tener datos, vamos a ver en gran parte análisis de datos. 
Cuando tenemos una afirmación del tipo X tiene impacto causal sobre Y, una causa que varía causa otra cosa que 
varía. Una variación en un X aparentemente causa una variación en Y. Una causalidad no es observable, vemos 
correlación a partir de la cual inferir causalidad que no se puede comprobar con absoluta certeza. La causalidad 
consiste en ver el mundo con la VI de una forma y la VD de otra, ver el contrafáctico. Pero esto es imposible. La 
flecha de causalidad es muy difícil observar. 
Cada vez que alguien hace una afirmación causal hay que ver cuál es la prueba. 
Si no nos ponemos de acuerda con la definición de la variable aun más difícil será encontrarle indicadores. Los datos 
son de los indicadores no de las variables. Entonces no correlacionas las variables sino los indicadores de cada 
variable. 
En las filas tenemos las unidades de análisis. En las columnas tenemos las variables, lo que sea que le pregunto a las 
unidades de análisis. 
La desviación estándar mide la heterogeneidad del promedio. Es una medida de cuan heterogéneo o disperso es el 
promedio. 
La estadística llama inferencial a la parte de inferir de muestras a poblaciones. 
Clase 3/8. 
- Herramientas estadísticas muy concretas. 
- Predominio cuantitativo. Para investigación 🡪 metodologías cuantitativas como dominantes en cs pol y 
rrii. Investigación de opinión pública con herramientas cuanti; consultoría estadística. Evaluación de PP. 
- Estadísticos 🡪 dividir la disciplina en: 
1. Estadística descriptiva: análisis de datos. Tengo datos y los voy a usar para describir la realidad. Puede 
ser: 
a) Univariada 
b) Bivariada 
c) Multivariada 
2. Estadística inferencial: tipo particular de inferencia 🡪 de las muestras a las poblaciones. Muestreo. 
Como hago para diseñar buenas muestras que me permitan inferir bien de muestras a población. Ej. 
1: % de desempleo: encuesta permanente de hogares – acá 20 mil hogares. Decimos algo de 10M de 
hogares a partir de los 20 mil hogares 🡪 inferimos algo a partir de la muestra. Problema: quien 
responde (hogares que no quieren participar que salieron de forma aleatoria 🡪 entonces la muestra 
no es aleatoria, no todos viven en hogares, se realiza en grandes conglomerados urbanos – grandes 
ciudades 🡪 argentina como uno de los países urbanizados del mundo 🡪 tendrías la mayoría, pero él % 
rural no sabemos el desempleo). Sesgos muestrales: poblaciones que tienen baja o cero 
probabilidades de ser incluida: lo que no están en zona urbana, los que no quieren contestar, los que 
no viven en hogares, etc. Con el censo tendría mejores valores. Pero ventajas de muestra porque me 
permite medir con mayor rapidez. Ej. 2: canasta de bienes y servicios para medir la inflación 🡪 canasta 
como muestra 🡪 selecciona ciertos bienes y servicios 🡪 no pueden hacer de todos 🡪 muestra que sea 
representativa del total. Si después el relevador del indec se confunde en anotar un dato, es error de 
medición, o si el valor del cartel está mal. Cual es el mejor indicador para el precio del producto 🡪 
parece una pavada la pregunta, pero imaginemos que la góndola dice $40 pesos y después en la caja 
dice $50. O si después tengo descuento por cierta tarjeta 🡪 para un segmento aumenta el $ y para 
otros no. Todo es muy complejo de medir 🡪 y estamos hablando de algo concreto, no de ideología, 
etc. 
Diferencia entre error de medición y error muestral 🡪 aun cuando tenga un censo que abarca a todo el mundo 
tengo el problema de por ejemplo decir que están desempleadas para recibir AUH 🡪 mentir como 
posible error de medición. Dos grandes fuentes de error: 
a) Muestra no es totalmente representativa de la población 🡪 error muestral. Muestra tiene algún 
tipo de distorsión respecto al universo. Si error se soluciona entrevistando a toda la población. 
b) Indicadores no reflejan lo que quiero medir 🡪 error de medición. El indicador que uso para medir 
la variable conceptual no es perfecto. 
🡺 En las dos hay inferencia. Pero la segunda es un tipo particular de inferencia. 
- Hay error también en el censo (ej. que no respondan por desconfianza a que usen su información por 
ejemplo la agencia migratoria). Termina siendo una muestra muy grande. Pero no es error de medición. 
Es muestral. Ej. que un grupo social no participe en el censo entonces se sobreestime el nivel de ingresos, 
etc. 
Error aleatorio muestral y sesgo muestral Asumimos que tenemos datos. Textos: Araujo 
- Articulo donde él habla el rol de la estadística en la investigación social. 
- Típicamente tenemos hipótesis de forma X es la causa de Y. pero como X es Y no son directamente 
observables tenemos indicadores. Lo que vamos a ver directamente es si el indicador de X es causa o no 
del indicador de Y. no si desarrollo eco causa democracia sino si PBI per cápita usa mayor nivel de polity. 
Esto implica, además de hipótesis sustantiva (X 🡪 Y), implica una hipótesis auxiliar de validez (que los 
indicadores son válidos de tales conceptos o variables). Cada flecha implica una hipótesis. La principal es 
la horizontal (X 🡪 Y). pero como conceptos no las puedo ver directamente, la veo a través de indicadores, 
que pueden ser mejores o peores de lo que quiero medir. Tengo una hipótesis más que tengo que mostrar 
que un indicador es bueno de lo que quiero medir: hipótesis auxiliar de validez. 
- También habla de: la estadística inferencial generalizando de muestras a poblaciones. Error muestral o 
sesgo muestral aleatorio. 
- Ej. edad de población argentina 🡪 conocer el promedio de la edad: ej. que el promedio real de edad es 38. 
No sabemos edad promedio de la población. Hacemos una muestra y encuesta para saberlo. Para que una 
muestra sea de buena calidad, necesito 2 cosas: grande y aleatoria. Tomo 2 mil argentinos (es grande) y 
aleatorio (cada uno de los 44M de argentinos tiene la misma probabilidad de ser elegido). Muestra de 2 
mil argentinos al azar y estimar la media muestral 🡪 entrevistado va y pregunta y asumo que cada persona 
sabe su edad y que no miente (asumo que no tengo error de medición, lo cual no ocurre). Nadie se puede 
resistir al estudio con lo cual muestra no tiene error de medición ni sesgo de que alguien no pueda 
participar. Ni tengo sesgo urbano. Finalizar esto y sacar el promedio. El resultado no va a dar exactamente 
38, pero va a estar cerca: ej. puede dar 38,7. Otra persona hace una muestra de 2mil argentinos (otros), 
aleatoria también. No va a dar 38 ni tampoco 38,7. Cada muestra va a tener un pequeño error con 
respecto a la realidad (parámetro), que va a ser diferente respecto de cada muestra. Cada uno hace la 
muestra y calcula el promedio, que va a estar cerca de 38. Todas las muestras son buenas porque están 
cerca de 38, pero todas tienen error, ya sea para arriba o para abajo. A este patrón de error lo vamos a

Otros materiales