Resumen Gerring Cap 4

•

SIN SIGLA

elkun

25/6/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Desarrollo

2354 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Resumen Gerring Cap 4

El capítulo aborda en profundidad dos términos: Precisión y Validez. Las ciencias sociales,
en sus estudios, busca cumplir con ciertos parámetros que hacen a estos dos valores.

Precisión: refiere a cuán cercanos son los valores arrojados (entre sí) tras aplicar el mismo
instrumento de medición o modelo causal a un fenómeno de interés repetidas veces. También
se refiere al nivel de error, o “ruido”, encontrado en la medición. La manera de determinar
cuán precisa es una medición es a través de una prueba de fiabilidad (“reliability”). Una
prueba de fiabilidad consiste en aplicar la misma técnica de recopilación de datos múltiples
veces, de manera que se puedan comparar los datos obtenidos en cada resultado y así medir
la precisión de la técnica. Si múltiples aplicaciones del instrumento de medición reflejan un
elevado nivel de consistencia, uno puede concluir que el instrumento es fiable, y por ende
preciso. Lo opuesto a una alta fiabilidad es una alta tasa de variación (“variance”). A mayor
tasa de variación, menor fiabilidad y menor precisión. Si no se presenta la oportunidad de
repetir la medición de un indicador, entonces la fiabilidad no es medible.

Validez: refiere a cuán cercanos son los valores arrojados a la verdad, la cual suele
desconocerse. En contraste a la precisión, la validez se refiere a la medición de errores
sistemáticos, los cuales introducen sesgos a los análisis. Es importante encontrar estos
errores porque no porque no podemos estimar su efecto, ni corregirlos fácilmente. Por esta
razón, la validez no es tan fácil de medir como la fiabilidad.

Validez interna y externa:

Una pregunta fundamental en las ciencias sociales es cómo realizar inducciones sobre una
población de interés relativamente grande, a partir de los hallazgos realizados en una muestra
reducida. Este problema nos introduce a un juego de doble nivel: por un lado, hay que extraer
conclusiones de los resultados sobre la muestra, y por el otro hay que extrapolar esos
resultados a la población más grande. Para distinguir estas esferas, los cientistas sociales
distinguen entre validez interna y externa.

Validez interna: refiere a la validez de la hipótesis de investigación en relación a la muestra
estudiada. Esto es, qué tan bien seleccionada está la muestra considerando lo que se busca
investigar.

Validez externa: se refiere a características que permiten realizar una mejor extrapolación e
inducción de la muestra estudiada a la población. Las dos principales son la
representatividad de la muestra y el tamaño de la muestra

Representatividad de la muestra: se refiere a si la muestra es similar a la población con
respecto a la hipótesis que está siendo estudiada, y por ende, si podemos inferir los resultados
de los estudios sobre la muestra a un universo mayor. Cabe destacar que la representatividad
también implica observar cómo se define la población, y requiere especificidad acerca del
alcance de la inferencia.

Tamaño de la muestra: más observaciones es mejor para el estudio, porque provee un
estimado más certero acerca de la cuestión en estudio. Muestras pequeñas hacen más
probable (y significativo estadísticamente) un error, y poblaciones grandes hace que las
inferencias sean más riesgosas, ya que hay muchas posibilidades de error. La incertidumbre
generada por la variabilidad en la selección de la muestra es representada en un valor
conocido como intervalo de confianza (“En estadística, se llama intervalo de confianza a un
par o varios pares de números entre los cuales se estima que estará cierto valor desconocido
respecto de un parámetro poblacional con un determinado nivel de confianza.” Wikipedia). Se
recomienda tener muestras grandes, siempre que todo el resto de las variables no se vean
alteradas (por ejemplo, la representatividad de la muestra). Los requisitos del tamaño de la
muestra dependen, en general, de la fortaleza de la variable de interés teórico en
comparación al “ruido” (factores que pueden interferir en la observación de la variable de
interés). Los errores de muestreo suelen relacionarse al tamaño de la muestra, y no a su
tamaño en relación a la población. Una manera de calcular un tamaño adecuado para una
muestra es estipular los objetivos del análisis y un intervalo de confianza aceptable para la
variable de interés. Sin embargo, esto solo funciona si hay una única hipótesis y si es posible
identificar un intervalo de confianza de un estudio similar (“benchmark”).

Probability sampling

La manera predilecta de elegir las muestras es elegir los casos de manera aleatoria de entre
la población. Esto es conocido como probabilidad de muestreo. Se llama así porque en un
muestreo aleatorio simple, cada caso de la población tiene la misma probabilidad de ser
seleccionado para la muestra. Hay varios tipos de método que utilizan este tipo de muestreo.

En un muestreo sistemático los miembros de una población son elegidos de a intervalos
iguales. Esto asegura igual probabilidad de muestreo SI los intervalos elegidos no están
asociados con alguna característica de población (*el ejemplo que pensé es elegir gente de
la guía telefónica: si se eligen los primeros 100 de cada 10 personas es un muestreo
sistemático, pero si el teléfono se relaciona con el barrio en el que viven, esto puede generar
sesgos en las muestras si estas características son relevantes a la hipótesis).

El muestreo por conglomerados divide la población en grupos de los cuales se elige un
conglomerado aleatoriamente. Por ejemplo, se divide la población por barrios (conglomerado)
y se eligen todos lo habitantes de uno de ellos como muestra. Este método suele elegirse por
cuestiones logísticas.

En el muestreo estratificado se asigna la población a un estrato y los casos se eligen
aleatoriamente de cada uno de los niveles del estrato. Si el número elegido de cada nivel del
estrato no refleja de manera proporcional dicho nivel del estrato en la población general, la
muestra no será representativa.

Más de un método de muestreo puede ser combinado para generar un muestreo de etapas
múltiples.

La ventaja principal del muestreo de probabilidad es que uno puede estimar la variabilidad,
lo cual permite proveer estimados de precisión para acompañar las inferencias que se
realicen.

Muestreo no probabilístico:

Selecciona los casos de manera no aleatoria de una población general. Una manera de hacer
esto es usando el método bola de nieve, en el cual cada entrevistado sugiere otros posibles
casos. Los casos también peuden ser elegidos por razones logísticas, a lo que se llama
muestreo por conveniencia.

Al usar estos métodos, el investigador no cuenta con una forma de calcular la probabilidad
que cada individuo de la población tiene de ser seleccionado para la muestra. De mismo
modo, no hay manera de definir cuán representativa es la muestra. De todas formas, cuando
los métodos de muestreo probabilístico son inaplicables, los investigadores deben usar este
tipo de métodos, enfrentando dificultades para definir la representatividad de la muestra, y
por ende cuán generalizables son los resultados obtenidos de la misma.

Ausencia de datos:
Hasta aquí se asumió que todos los casos de la población pueden ser seleccionados para la
muestra. Sin embargo, esto puede no ser así, presentando un descalce entre la población y
el marco de muestreo (la población que puede ser seleccionada a través del método
probabilístico). Un ejemplo es: si se llama por teléfono aleatoriamente para realizar una
encuesta, aquellos que no tengan teléfono no formarán parte del marco de muestreo. Otro
sesgo puede devenir de cuando un caso no puede ser estudiado, o solo parcialmente. Esto
se da cuando un entrevistado se rehúsa a contestar algunas de las preguntas, o no presenta
ninguna respuesta.

Laausencia de datos refiere a que la muestra no tiene observaciones sobre algunas
unidades que deberían estar incluidas.
- Si el patrón de falta de datos es aleatorio, causa poco daño.
- Si el patrón de falta de datos es sistemático, la muestra estará sesgada.

Las soluciones a la falta de datos propuestas en el capítulo son 2:
- Rellenar los datos faltantes, creando una muestra completa que es más grande y
representativa que la anterior. También se pueden llenar los datos si se tiene
confianza en fuentes que proveen la información necesaria.
- Utilizar un método estadístico para estimar los valrores faltantes en base a patrones
en los datos que se juntaron.

Conclusión:
Toda observación empírica es incierta, gracias a que las inferencias realizadas se encuentran
sujetas a la contrastación de la validez de una muestra, la cual depende del valor verdad. A
su vez, se reconoce que aún cuando se presuma validez, la precisión no siempre puede ser
garantizada.