Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Resumen Gerring Cap 4 El capítulo aborda en profundidad dos términos: Precisión y Validez. Las ciencias sociales, en sus estudios, busca cumplir con ciertos parámetros que hacen a estos dos valores. Precisión: refiere a cuán cercanos son los valores arrojados (entre sí) tras aplicar el mismo instrumento de medición o modelo causal a un fenómeno de interés repetidas veces. También se refiere al nivel de error, o “ruido”, encontrado en la medición. La manera de determinar cuán precisa es una medición es a través de una prueba de fiabilidad (“reliability”). Una prueba de fiabilidad consiste en aplicar la misma técnica de recopilación de datos múltiples veces, de manera que se puedan comparar los datos obtenidos en cada resultado y así medir la precisión de la técnica. Si múltiples aplicaciones del instrumento de medición reflejan un elevado nivel de consistencia, uno puede concluir que el instrumento es fiable, y por ende preciso. Lo opuesto a una alta fiabilidad es una alta tasa de variación (“variance”). A mayor tasa de variación, menor fiabilidad y menor precisión. Si no se presenta la oportunidad de repetir la medición de un indicador, entonces la fiabilidad no es medible. Validez: refiere a cuán cercanos son los valores arrojados a la verdad, la cual suele desconocerse. En contraste a la precisión, la validez se refiere a la medición de errores sistemáticos, los cuales introducen sesgos a los análisis. Es importante encontrar estos errores porque no porque no podemos estimar su efecto, ni corregirlos fácilmente. Por esta razón, la validez no es tan fácil de medir como la fiabilidad. Validez interna y externa: Una pregunta fundamental en las ciencias sociales es cómo realizar inducciones sobre una población de interés relativamente grande, a partir de los hallazgos realizados en una muestra reducida. Este problema nos introduce a un juego de doble nivel: por un lado, hay que extraer conclusiones de los resultados sobre la muestra, y por el otro hay que extrapolar esos resultados a la población más grande. Para distinguir estas esferas, los cientistas sociales distinguen entre validez interna y externa. Validez interna: refiere a la validez de la hipótesis de investigación en relación a la muestra estudiada. Esto es, qué tan bien seleccionada está la muestra considerando lo que se busca investigar. Validez externa: se refiere a características que permiten realizar una mejor extrapolación e inducción de la muestra estudiada a la población. Las dos principales son la representatividad de la muestra y el tamaño de la muestra Representatividad de la muestra: se refiere a si la muestra es similar a la población con respecto a la hipótesis que está siendo estudiada, y por ende, si podemos inferir los resultados de los estudios sobre la muestra a un universo mayor. Cabe destacar que la representatividad también implica observar cómo se define la población, y requiere especificidad acerca del alcance de la inferencia. Tamaño de la muestra: más observaciones es mejor para el estudio, porque provee un estimado más certero acerca de la cuestión en estudio. Muestras pequeñas hacen más probable (y significativo estadísticamente) un error, y poblaciones grandes hace que las inferencias sean más riesgosas, ya que hay muchas posibilidades de error. La incertidumbre generada por la variabilidad en la selección de la muestra es representada en un valor conocido como intervalo de confianza (“En estadística, se llama intervalo de confianza a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido respecto de un parámetro poblacional con un determinado nivel de confianza.” Wikipedia). Se recomienda tener muestras grandes, siempre que todo el resto de las variables no se vean alteradas (por ejemplo, la representatividad de la muestra). Los requisitos del tamaño de la muestra dependen, en general, de la fortaleza de la variable de interés teórico en comparación al “ruido” (factores que pueden interferir en la observación de la variable de interés). Los errores de muestreo suelen relacionarse al tamaño de la muestra, y no a su tamaño en relación a la población. Una manera de calcular un tamaño adecuado para una muestra es estipular los objetivos del análisis y un intervalo de confianza aceptable para la variable de interés. Sin embargo, esto solo funciona si hay una única hipótesis y si es posible identificar un intervalo de confianza de un estudio similar (“benchmark”). Probability sampling La manera predilecta de elegir las muestras es elegir los casos de manera aleatoria de entre la población. Esto es conocido como probabilidad de muestreo. Se llama así porque en un muestreo aleatorio simple, cada caso de la población tiene la misma probabilidad de ser seleccionado para la muestra. Hay varios tipos de método que utilizan este tipo de muestreo. En un muestreo sistemático los miembros de una población son elegidos de a intervalos iguales. Esto asegura igual probabilidad de muestreo SI los intervalos elegidos no están asociados con alguna característica de población (*el ejemplo que pensé es elegir gente de la guía telefónica: si se eligen los primeros 100 de cada 10 personas es un muestreo sistemático, pero si el teléfono se relaciona con el barrio en el que viven, esto puede generar sesgos en las muestras si estas características son relevantes a la hipótesis). El muestreo por conglomerados divide la población en grupos de los cuales se elige un conglomerado aleatoriamente. Por ejemplo, se divide la población por barrios (conglomerado) y se eligen todos lo habitantes de uno de ellos como muestra. Este método suele elegirse por cuestiones logísticas. En el muestreo estratificado se asigna la población a un estrato y los casos se eligen aleatoriamente de cada uno de los niveles del estrato. Si el número elegido de cada nivel del estrato no refleja de manera proporcional dicho nivel del estrato en la población general, la muestra no será representativa. Más de un método de muestreo puede ser combinado para generar un muestreo de etapas múltiples. La ventaja principal del muestreo de probabilidad es que uno puede estimar la variabilidad, lo cual permite proveer estimados de precisión para acompañar las inferencias que se realicen. Muestreo no probabilístico: Selecciona los casos de manera no aleatoria de una población general. Una manera de hacer esto es usando el método bola de nieve, en el cual cada entrevistado sugiere otros posibles casos. Los casos también peuden ser elegidos por razones logísticas, a lo que se llama muestreo por conveniencia. Al usar estos métodos, el investigador no cuenta con una forma de calcular la probabilidad que cada individuo de la población tiene de ser seleccionado para la muestra. De mismo modo, no hay manera de definir cuán representativa es la muestra. De todas formas, cuando los métodos de muestreo probabilístico son inaplicables, los investigadores deben usar este tipo de métodos, enfrentando dificultades para definir la representatividad de la muestra, y por ende cuán generalizables son los resultados obtenidos de la misma. Ausencia de datos: Hasta aquí se asumió que todos los casos de la población pueden ser seleccionados para la muestra. Sin embargo, esto puede no ser así, presentando un descalce entre la población y el marco de muestreo (la población que puede ser seleccionada a través del método probabilístico). Un ejemplo es: si se llama por teléfono aleatoriamente para realizar una encuesta, aquellos que no tengan teléfono no formarán parte del marco de muestreo. Otro sesgo puede devenir de cuando un caso no puede ser estudiado, o solo parcialmente. Esto se da cuando un entrevistado se rehúsa a contestar algunas de las preguntas, o no presenta ninguna respuesta. Laausencia de datos refiere a que la muestra no tiene observaciones sobre algunas unidades que deberían estar incluidas. - Si el patrón de falta de datos es aleatorio, causa poco daño. - Si el patrón de falta de datos es sistemático, la muestra estará sesgada. Las soluciones a la falta de datos propuestas en el capítulo son 2: - Rellenar los datos faltantes, creando una muestra completa que es más grande y representativa que la anterior. También se pueden llenar los datos si se tiene confianza en fuentes que proveen la información necesaria. - Utilizar un método estadístico para estimar los valrores faltantes en base a patrones en los datos que se juntaron. Conclusión: Toda observación empírica es incierta, gracias a que las inferencias realizadas se encuentran sujetas a la contrastación de la validez de una muestra, la cual depende del valor verdad. A su vez, se reconoce que aún cuando se presuma validez, la precisión no siempre puede ser garantizada.
Compartir