1 Clases Estadística (1 (1)

Estadística

•

SIN SIGLA

0

aidensz27

8/7/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Estadística

5385 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Estadística para las Ciencias Sociales
En las inferencias hicimos hincapié en como producir datos para la investigación social. énfasis en como generar
datos de buena calidad, operacionalización de variables (como bajo un concepto abstracto y complejo a formas
concretas de medirlo, buscarle indicadores con precisión, con validez y confiabilidad, de buena calidad).
Esta materia es a partir de ya tener datos, vamos a ver en gran parte análisis de datos.
Cuando tenemos una afirmación del tipo X tiene impacto causal sobre Y, una causa que varía causa otra cosa que
varía. Una variación en un X aparentemente causa una variación en Y. Una causalidad no es observable, vemos
correlación a partir de la cual inferir causalidad que no se puede comprobar con absoluta certeza. La causalidad
consiste en ver el mundo con la VI de una forma y la VD de otra, ver el contrafáctico. Pero esto es imposible. La
flecha de causalidad es muy difícil observar.
Cada vez que alguien hace una afirmación causal hay que ver cuál es la prueba.
Si no nos ponemos de acuerda con la definición de la variable aun más difícil será encontrarle indicadores. Los datos
son de los indicadores no de las variables. Entonces no correlacionas las variables sino los indicadores de cada
variable.
En las filas tenemos las unidades de análisis. En las columnas tenemos las variables, lo que sea que le pregunto a las
unidades de análisis.
La desviación estándar mide la heterogeneidad del promedio. Es una medida de cuan heterogéneo o disperso es el
promedio.
La estadística llama inferencial a la parte de inferir de muestras a poblaciones.
Clase 3/8.
- Herramientas estadísticas muy concretas.
- Predominio cuantitativo. Para investigación 🡪 metodologías cuantitativas como dominantes en cs pol y
rrii. Investigación de opinión pública con herramientas cuanti; consultoría estadística. Evaluación de PP.
- Estadísticos 🡪 dividir la disciplina en:
1. Estadística descriptiva: análisis de datos. Tengo datos y los voy a usar para describir la realidad. Puede
ser:
a) Univariada
b) Bivariada
c) Multivariada
2. Estadística inferencial: tipo particular de inferencia 🡪 de las muestras a las poblaciones. Muestreo.
Como hago para diseñar buenas muestras que me permitan inferir bien de muestras a población. Ej.
1: % de desempleo: encuesta permanente de hogares – acá 20 mil hogares. Decimos algo de 10M de
hogares a partir de los 20 mil hogares 🡪 inferimos algo a partir de la muestra. Problema: quien
responde (hogares que no quieren participar que salieron de forma aleatoria 🡪 entonces la muestra
no es aleatoria, no todos viven en hogares, se realiza en grandes conglomerados urbanos – grandes
ciudades 🡪 argentina como uno de los países urbanizados del mundo 🡪 tendrías la mayoría, pero él %
rural no sabemos el desempleo). Sesgos muestrales: poblaciones que tienen baja o cero
probabilidades de ser incluida: lo que no están en zona urbana, los que no quieren contestar, los que
no viven en hogares, etc. Con el censo tendría mejores valores. Pero ventajas de muestra porque me
permite medir con mayor rapidez. Ej. 2: canasta de bienes y servicios para medir la inflación 🡪 canasta
como muestra 🡪 selecciona ciertos bienes y servicios 🡪 no pueden hacer de todos 🡪 muestra que sea
representativa del total. Si después el relevador del indec se confunde en anotar un dato, es error de
medición, o si el valor del cartel está mal. Cual es el mejor indicador para el precio del producto 🡪
parece una pavada la pregunta, pero imaginemos que la góndola dice $40 pesos y después en la caja
dice $50. O si después tengo descuento por cierta tarjeta 🡪 para un segmento aumenta el $ y para
otros no. Todo es muy complejo de medir 🡪 y estamos hablando de algo concreto, no de ideología,
etc.
Diferencia entre error de medición y error muestral 🡪 aun cuando tenga un censo que abarca a todo el mundo
tengo el problema de por ejemplo decir que están desempleadas para recibir AUH 🡪 mentir como
posible error de medición. Dos grandes fuentes de error:
a) Muestra no es totalmente representativa de la población 🡪 error muestral. Muestra tiene algún
tipo de distorsión respecto al universo. Si error se soluciona entrevistando a toda la población.
b) Indicadores no reflejan lo que quiero medir 🡪 error de medición. El indicador que uso para medir
la variable conceptual no es perfecto.
🡺 En las dos hay inferencia. Pero la segunda es un tipo particular de inferencia.
- Hay error también en el censo (ej. que no respondan por desconfianza a que usen su información por
ejemplo la agencia migratoria). Termina siendo una muestra muy grande. Pero no es error de medición.
Es muestral. Ej. que un grupo social no participe en el censo entonces se sobreestime el nivel de ingresos,
etc.
Error aleatorio muestral y sesgo muestral Asumimos que tenemos datos. Textos: Araujo
- Articulo donde él habla el rol de la estadística en la investigación social.
- Típicamente tenemos hipótesis de forma X es la causa de Y. pero como X es Y no son directamente
observables tenemos indicadores. Lo que vamos a ver directamente es si el indicador de X es causa o no
del indicador de Y. no si desarrollo eco causa democracia sino si PBI per cápita usa mayor nivel de polity.
Esto implica, además de hipótesis sustantiva (X 🡪 Y), implica una hipótesis auxiliar de validez (que los
indicadores son válidos de tales conceptos o variables). Cada flecha implica una hipótesis. La principal es
la horizontal (X 🡪 Y). pero como conceptos no las puedo ver directamente, la veo a través de indicadores,
que pueden ser mejores o peores de lo que quiero medir. Tengo una hipótesis más que tengo que mostrar
que un indicador es bueno de lo que quiero medir: hipótesis auxiliar de validez.
- También habla de: la estadística inferencial generalizando de muestras a poblaciones. Error muestral o
sesgo muestral aleatorio.
- Ej. edad de población argentina 🡪 conocer el promedio de la edad: ej. que el promedio real de edad es 38.
No sabemos edad promedio de la población. Hacemos una muestra y encuesta para saberlo. Para que una
muestra sea de buena calidad, necesito 2 cosas: grande y aleatoria. Tomo 2 mil argentinos (es grande) y
aleatorio (cada uno de los 44M de argentinos tiene la misma probabilidad de ser elegido). Muestra de 2
mil argentinos al azar y estimar la media muestral 🡪 entrevistado va y pregunta y asumo que cada persona
sabe su edad y que no miente (asumo que no tengo error de medición, lo cual no ocurre). Nadie se puede
resistir al estudio con lo cual muestra no tiene error de medición ni sesgo de que alguien no pueda
participar. Ni tengo sesgo urbano. Finalizar esto y sacar el promedio. El resultado no va a dar exactamente
38, pero va a estar cerca: ej. puede dar 38,7. Otra persona hace una muestra de 2mil argentinos (otros),
aleatoria también. No va a dar 38 ni tampoco 38,7. Cada muestra va a tener un pequeño error con
respecto a la realidad (parámetro), que va a ser diferente respecto de cada muestra. Cada uno hace la
muestra y calcula el promedio, que va a estar cerca de 38. Todas las muestras son buenas porque están
cerca de 38, pero todas tienen error, ya sea para arriba o para abajo. A este patrón de error lo vamos a