Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística para las Ciencias Sociales En las inferencias hicimos hincapié en como producir datos para la investigación social. énfasis en como generar datos de buena calidad, operacionalización de variables (como bajo un concepto abstracto y complejo a formas concretas de medirlo, buscarle indicadores con precisión, con validez y confiabilidad, de buena calidad). Esta materia es a partir de ya tener datos, vamos a ver en gran parte análisis de datos. Cuando tenemos una afirmación del tipo X tiene impacto causal sobre Y, una causa que varía causa otra cosa que varía. Una variación en un X aparentemente causa una variación en Y. Una causalidad no es observable, vemos correlación a partir de la cual inferir causalidad que no se puede comprobar con absoluta certeza. La causalidad consiste en ver el mundo con la VI de una forma y la VD de otra, ver el contrafáctico. Pero esto es imposible. La flecha de causalidad es muy difícil observar. Cada vez que alguien hace una afirmación causal hay que ver cuál es la prueba. Si no nos ponemos de acuerda con la definición de la variable aun más difícil será encontrarle indicadores. Los datos son de los indicadores no de las variables. Entonces no correlacionas las variables sino los indicadores de cada variable. En las filas tenemos las unidades de análisis. En las columnas tenemos las variables, lo que sea que le pregunto a las unidades de análisis. La desviación estándar mide la heterogeneidad del promedio. Es una medida de cuan heterogéneo o disperso es el promedio. La estadística llama inferencial a la parte de inferir de muestras a poblaciones. Clase 3/8. - Herramientas estadísticas muy concretas. - Predominio cuantitativo. Para investigación 🡪 metodologías cuantitativas como dominantes en cs pol y rrii. Investigación de opinión pública con herramientas cuanti; consultoría estadística. Evaluación de PP. - Estadísticos 🡪 dividir la disciplina en: 1. Estadística descriptiva: análisis de datos. Tengo datos y los voy a usar para describir la realidad. Puede ser: a) Univariada b) Bivariada c) Multivariada 2. Estadística inferencial: tipo particular de inferencia 🡪 de las muestras a las poblaciones. Muestreo. Como hago para diseñar buenas muestras que me permitan inferir bien de muestras a población. Ej. 1: % de desempleo: encuesta permanente de hogares – acá 20 mil hogares. Decimos algo de 10M de hogares a partir de los 20 mil hogares 🡪 inferimos algo a partir de la muestra. Problema: quien responde (hogares que no quieren participar que salieron de forma aleatoria 🡪 entonces la muestra no es aleatoria, no todos viven en hogares, se realiza en grandes conglomerados urbanos – grandes ciudades 🡪 argentina como uno de los países urbanizados del mundo 🡪 tendrías la mayoría, pero él % rural no sabemos el desempleo). Sesgos muestrales: poblaciones que tienen baja o cero probabilidades de ser incluida: lo que no están en zona urbana, los que no quieren contestar, los que no viven en hogares, etc. Con el censo tendría mejores valores. Pero ventajas de muestra porque me permite medir con mayor rapidez. Ej. 2: canasta de bienes y servicios para medir la inflación 🡪 canasta como muestra 🡪 selecciona ciertos bienes y servicios 🡪 no pueden hacer de todos 🡪 muestra que sea representativa del total. Si después el relevador del indec se confunde en anotar un dato, es error de medición, o si el valor del cartel está mal. Cual es el mejor indicador para el precio del producto 🡪 parece una pavada la pregunta, pero imaginemos que la góndola dice $40 pesos y después en la caja dice $50. O si después tengo descuento por cierta tarjeta 🡪 para un segmento aumenta el $ y para otros no. Todo es muy complejo de medir 🡪 y estamos hablando de algo concreto, no de ideología, etc. Diferencia entre error de medición y error muestral 🡪 aun cuando tenga un censo que abarca a todo el mundo tengo el problema de por ejemplo decir que están desempleadas para recibir AUH 🡪 mentir como posible error de medición. Dos grandes fuentes de error: a) Muestra no es totalmente representativa de la población 🡪 error muestral. Muestra tiene algún tipo de distorsión respecto al universo. Si error se soluciona entrevistando a toda la población. b) Indicadores no reflejan lo que quiero medir 🡪 error de medición. El indicador que uso para medir la variable conceptual no es perfecto. 🡺 En las dos hay inferencia. Pero la segunda es un tipo particular de inferencia. - Hay error también en el censo (ej. que no respondan por desconfianza a que usen su información por ejemplo la agencia migratoria). Termina siendo una muestra muy grande. Pero no es error de medición. Es muestral. Ej. que un grupo social no participe en el censo entonces se sobreestime el nivel de ingresos, etc. Error aleatorio muestral y sesgo muestral Asumimos que tenemos datos. Textos: Araujo - Articulo donde él habla el rol de la estadística en la investigación social. - Típicamente tenemos hipótesis de forma X es la causa de Y. pero como X es Y no son directamente observables tenemos indicadores. Lo que vamos a ver directamente es si el indicador de X es causa o no del indicador de Y. no si desarrollo eco causa democracia sino si PBI per cápita usa mayor nivel de polity. Esto implica, además de hipótesis sustantiva (X 🡪 Y), implica una hipótesis auxiliar de validez (que los indicadores son válidos de tales conceptos o variables). Cada flecha implica una hipótesis. La principal es la horizontal (X 🡪 Y). pero como conceptos no las puedo ver directamente, la veo a través de indicadores, que pueden ser mejores o peores de lo que quiero medir. Tengo una hipótesis más que tengo que mostrar que un indicador es bueno de lo que quiero medir: hipótesis auxiliar de validez. - También habla de: la estadística inferencial generalizando de muestras a poblaciones. Error muestral o sesgo muestral aleatorio. - Ej. edad de población argentina 🡪 conocer el promedio de la edad: ej. que el promedio real de edad es 38. No sabemos edad promedio de la población. Hacemos una muestra y encuesta para saberlo. Para que una muestra sea de buena calidad, necesito 2 cosas: grande y aleatoria. Tomo 2 mil argentinos (es grande) y aleatorio (cada uno de los 44M de argentinos tiene la misma probabilidad de ser elegido). Muestra de 2 mil argentinos al azar y estimar la media muestral 🡪 entrevistado va y pregunta y asumo que cada persona sabe su edad y que no miente (asumo que no tengo error de medición, lo cual no ocurre). Nadie se puede resistir al estudio con lo cual muestra no tiene error de medición ni sesgo de que alguien no pueda participar. Ni tengo sesgo urbano. Finalizar esto y sacar el promedio. El resultado no va a dar exactamente 38, pero va a estar cerca: ej. puede dar 38,7. Otra persona hace una muestra de 2mil argentinos (otros), aleatoria también. No va a dar 38 ni tampoco 38,7. Cada muestra va a tener un pequeño error con respecto a la realidad (parámetro), que va a ser diferente respecto de cada muestra. Cada uno hace la muestra y calcula el promedio, que va a estar cerca de 38. Todas las muestras son buenas porque están cerca de 38, pero todas tienen error, ya sea para arriba o para abajo. A este patrón de error lo vamos a
Compartir