Logo Studenta

Resumen Gerring Cap 4

¡Estudia con miles de materiales!

Vista previa del material en texto

Resumen Gerring Cap 4 
 
El capítulo aborda en profundidad dos términos: Precisión y Validez. Las ciencias sociales, 
en sus estudios, busca cumplir con ciertos parámetros que hacen a estos dos valores. 
 
Precisión: refiere a cuán cercanos son los valores arrojados (entre sí) tras aplicar el mismo 
instrumento de medición o modelo causal a un fenómeno de interés repetidas veces. También 
se refiere al nivel de error, o “ruido”, encontrado en la medición. La manera de determinar 
cuán precisa es una medición es a través de una prueba de fiabilidad (“reliability”). Una 
prueba de fiabilidad consiste en aplicar la misma técnica de recopilación de datos múltiples 
veces, de manera que se puedan comparar los datos obtenidos en cada resultado y así medir 
la precisión de la técnica. Si múltiples aplicaciones del instrumento de medición reflejan un 
elevado nivel de consistencia, uno puede concluir que el instrumento es fiable, y por ende 
preciso. Lo opuesto a una alta fiabilidad es una alta tasa de variación (“variance”). A mayor 
tasa de variación, menor fiabilidad y menor precisión. Si no se presenta la oportunidad de 
repetir la medición de un indicador, entonces la fiabilidad no es medible. 
 
Validez: refiere a cuán cercanos son los valores arrojados a la verdad, la cual suele 
desconocerse. En contraste a la precisión, la validez se refiere a la medición de errores 
sistemáticos, los cuales introducen sesgos a los análisis. Es importante encontrar estos 
errores porque no porque no podemos estimar su efecto, ni corregirlos fácilmente. Por esta 
razón, la validez no es tan fácil de medir como la fiabilidad. 
 
Validez interna y externa: 
 
Una pregunta fundamental en las ciencias sociales es cómo realizar inducciones sobre una 
población de interés relativamente grande, a partir de los hallazgos realizados en una muestra 
reducida. Este problema nos introduce a un juego de doble nivel: por un lado, hay que extraer 
conclusiones de los resultados sobre la muestra, y por el otro hay que extrapolar esos 
resultados a la población más grande. Para distinguir estas esferas, los cientistas sociales 
distinguen entre validez interna y externa. 
 
Validez interna: refiere a la validez de la hipótesis de investigación en relación a la muestra 
estudiada. Esto es, qué tan bien seleccionada está la muestra considerando lo que se busca 
investigar. 
 
Validez externa: se refiere a características que permiten realizar una mejor extrapolación e 
inducción de la muestra estudiada a la población. Las dos principales son la 
representatividad de la muestra y el tamaño de la muestra 
 
Representatividad de la muestra: se refiere a si la muestra es similar a la población con 
respecto a la hipótesis que está siendo estudiada, y por ende, si podemos inferir los resultados 
de los estudios sobre la muestra a un universo mayor. Cabe destacar que la representatividad 
también implica observar cómo se define la población, y requiere especificidad acerca del 
alcance de la inferencia. 
 
Tamaño de la muestra: más observaciones es mejor para el estudio, porque provee un 
estimado más certero acerca de la cuestión en estudio. Muestras pequeñas hacen más 
probable (y significativo estadísticamente) un error, y poblaciones grandes hace que las 
inferencias sean más riesgosas, ya que hay muchas posibilidades de error. La incertidumbre 
generada por la variabilidad en la selección de la muestra es representada en un valor 
conocido como intervalo de confianza (“En estadística, se llama intervalo de confianza a un 
par o varios pares de números entre los cuales se estima que estará cierto valor desconocido 
respecto de un parámetro poblacional con un determinado nivel de confianza.” Wikipedia). Se 
recomienda tener muestras grandes, siempre que todo el resto de las variables no se vean 
alteradas (por ejemplo, la representatividad de la muestra). Los requisitos del tamaño de la 
muestra dependen, en general, de la fortaleza de la variable de interés teórico en 
comparación al “ruido” (factores que pueden interferir en la observación de la variable de 
interés). Los errores de muestreo suelen relacionarse al tamaño de la muestra, y no a su 
tamaño en relación a la población. Una manera de calcular un tamaño adecuado para una 
muestra es estipular los objetivos del análisis y un intervalo de confianza aceptable para la 
variable de interés. Sin embargo, esto solo funciona si hay una única hipótesis y si es posible 
identificar un intervalo de confianza de un estudio similar (“benchmark”). 
 
Probability sampling 
 
La manera predilecta de elegir las muestras es elegir los casos de manera aleatoria de entre 
la población. Esto es conocido como probabilidad de muestreo. Se llama así porque en un 
muestreo aleatorio simple, cada caso de la población tiene la misma probabilidad de ser 
seleccionado para la muestra. Hay varios tipos de método que utilizan este tipo de muestreo. 
 
En un muestreo sistemático los miembros de una población son elegidos de a intervalos 
iguales. Esto asegura igual probabilidad de muestreo SI los intervalos elegidos no están 
asociados con alguna característica de población (*el ejemplo que pensé es elegir gente de 
la guía telefónica: si se eligen los primeros 100 de cada 10 personas es un muestreo 
sistemático, pero si el teléfono se relaciona con el barrio en el que viven, esto puede generar 
sesgos en las muestras si estas características son relevantes a la hipótesis). 
 
El muestreo por conglomerados divide la población en grupos de los cuales se elige un 
conglomerado aleatoriamente. Por ejemplo, se divide la población por barrios (conglomerado) 
y se eligen todos lo habitantes de uno de ellos como muestra. Este método suele elegirse por 
cuestiones logísticas. 
 
En el muestreo estratificado se asigna la población a un estrato y los casos se eligen 
aleatoriamente de cada uno de los niveles del estrato. Si el número elegido de cada nivel del 
estrato no refleja de manera proporcional dicho nivel del estrato en la población general, la 
muestra no será representativa. 
 
Más de un método de muestreo puede ser combinado para generar un muestreo de etapas 
múltiples. 
 
La ventaja principal del muestreo de probabilidad es que uno puede estimar la variabilidad, 
lo cual permite proveer estimados de precisión para acompañar las inferencias que se 
realicen. 
 
Muestreo no probabilístico: 
 
Selecciona los casos de manera no aleatoria de una población general. Una manera de hacer 
esto es usando el método bola de nieve, en el cual cada entrevistado sugiere otros posibles 
casos. Los casos también peuden ser elegidos por razones logísticas, a lo que se llama 
muestreo por conveniencia. 
 
Al usar estos métodos, el investigador no cuenta con una forma de calcular la probabilidad 
que cada individuo de la población tiene de ser seleccionado para la muestra. De mismo 
modo, no hay manera de definir cuán representativa es la muestra. De todas formas, cuando 
los métodos de muestreo probabilístico son inaplicables, los investigadores deben usar este 
tipo de métodos, enfrentando dificultades para definir la representatividad de la muestra, y 
por ende cuán generalizables son los resultados obtenidos de la misma. 
 
Ausencia de datos: 
Hasta aquí se asumió que todos los casos de la población pueden ser seleccionados para la 
muestra. Sin embargo, esto puede no ser así, presentando un descalce entre la población y 
el marco de muestreo (la población que puede ser seleccionada a través del método 
probabilístico). Un ejemplo es: si se llama por teléfono aleatoriamente para realizar una 
encuesta, aquellos que no tengan teléfono no formarán parte del marco de muestreo. Otro 
sesgo puede devenir de cuando un caso no puede ser estudiado, o solo parcialmente. Esto 
se da cuando un entrevistado se rehúsa a contestar algunas de las preguntas, o no presenta 
ninguna respuesta. 
 
Laausencia de datos refiere a que la muestra no tiene observaciones sobre algunas 
unidades que deberían estar incluidas. 
- Si el patrón de falta de datos es aleatorio, causa poco daño. 
- Si el patrón de falta de datos es sistemático, la muestra estará sesgada. 
 
Las soluciones a la falta de datos propuestas en el capítulo son 2: 
- Rellenar los datos faltantes, creando una muestra completa que es más grande y 
representativa que la anterior. También se pueden llenar los datos si se tiene 
confianza en fuentes que proveen la información necesaria. 
- Utilizar un método estadístico para estimar los valrores faltantes en base a patrones 
en los datos que se juntaron. 
 
Conclusión: 
Toda observación empírica es incierta, gracias a que las inferencias realizadas se encuentran 
sujetas a la contrastación de la validez de una muestra, la cual depende del valor verdad. A 
su vez, se reconoce que aún cuando se presuma validez, la precisión no siempre puede ser 
garantizada.

Continuar navegando