Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIDAD 8 Teoría clásica de los Tests. Las mediciones a través de Tests psicológicos se realizan sobre individuos en un momento determinado e sus vidas, en circunstancias particulares y usando una muestra específica de comportamiento que se supone representativa de un dominio generalmente inobservable. Estas limitaciones implican que el resultado de la medición es solo una estimación aproximada de la puntuación verdadera del individuo en el constructo de interés. Además de esas características debe considerarse que toda medición conlleva errores. La Psicometría hace uso de modelos formales que le permiten lograr una estimación de la puntuación verdadera de un individuo en el rasgo con el menor error posible. La TCT surge del modelo lineal de medición formulado por Spearman y fue consolidada mediante los desarrollos teóricos y metodológicos de Thurstone y Gulliksen, entre otros. Se considera que los errores de medición varían en torno a algún valor verdadero. Gauss y otros matemáticos del siglo XVIII derivaron la función de distribución normal con media cero, que permitió describir la distribución de los errores de medida. Éste es uno de los antecedentes históricos más importantes de la TCT. El modelo lineal de medición sobre el que se asienta la TCT es sencillo, robusto y satisface la mayor parte de las necesidades de los profesionales de la medición psicológica, tanto en lo relativo a la confiabilidad como a la validez. Esta teoría se basa en supuestos débiles pero generales, adaptables a distintas situaciones. Hipótesis fundamental: la puntuación observada de una persona en un test es una función lineal de dos componentes: su puntaje verdadero (inobservable) y el error de medición implícito en la prueba. La TCT es un modelo de puntuación verdadera como valor esperado (matemático, probabilístico). La puntuación verdadera es constante, pero las puntuaciones observadas y los errores son aleatorios. Para cada individuo, su puntuación observada es igual a la puntuación verdadera más el error. (Oi=Vi+Ei). El error es igual a la puntuación observada menos la verdadera. (Ei=Oi-Vi). Los corolarios que se desprenden de estos supuestos son: La media de los errores tiende a cero cuando el número de mediciones tiende al infinito. La media de las puntuaciones verdaderas es igual a la media de las puntuaciones observadas cuando el número de mediciones tiende al infinito. Los dos corolarios anteriores parten del supuesto de que los errores aleatorios y las puntuaciones observadas se distribuyen de manera normal. Si extraemos una muestra aleatoria de una población y le administramos un test: las puntuaciones observadas tendrán una distribución normal ; y los límites que encierran a la media poblacional con una media del 95% estarán dados por: La media de puntuaciones en el test de la población se ubicará con una probabilidad del 95% dentro del intervalo comprendido entre 1,96 desviacion estándar a la izquierda y a la derecha de la media de las puntuaciones de la media. Este archivo fue descargado de https://filadd.com � FI LA DD .CO M La varianza de las puntuaciones observadas es igual a la varianza de las puntuaciones verdaderas (la varianza del atributo que se está midiendo) más la varianza del error de medición. La correlación entre las puntuaciones observadas de dos formas paralelas de un mismo test es igual a la razón entre la varianza de las puntuaciones verdaderas sobre la varianza de las puntuaciones observadas. La varianza de las puntuaciones verdaderas es igual al producto de la varianza de las puntuaciones observadas por la correlación de las medidas paralelas. Esta deducción es importante porque la correlación entre dos formas paralelas de un test (un dato inobservable) nos permite estimar la varianza de las puntuaciones verdaderas, que es inobservable. Derivando la fórmula anterior obtenemos el corolario que sigue. El error estándar de la medición (desviación estándar del error) es igual a: La desviación estándar (raíz cuadrada de la varianza) de las puntuaciones observadas en repetidas mediciones a un individuo es en sí misma un índice de error. Si la desviación estándar de esas repetidas mediciones fuera igual a cero no habría error de medición. Nunca tenemos un número suficiente de observaciones para calcular el error estándar de medición de la distribución de los puntajes observados. Sin embargo, como la correlación test-retest se obtiene de dos administraciones del test a una misma muestra, cuanto más alta es la correlación menor debería ser el error de medición. Este supuesto de la igualdad de las varianzas de error a lo largo de todo el continuo de puntuaciones se denomina homoscedasticidad y es uno de los supuestos más cuestionables de la TCT. De estos supuestos, corolarios y deducciones puede concluirse que: 1. La puntuación verdadera de un individuo es una puntuación “límite”, un punto en un intervalo de la distribución de puntajes observados. 2. Cuanto más alta sea la confiabilidad de un test, menor será ese intervalo, y la puntuación observada se ubicará más próxima a la puntuación verdadera. 3. Como la desviación estándar no puede modificarse, deben disminuirse los errores de medida. La aplicación de este modelo presenta algunos problemas de medición: a. La TCT suministra un coeficiente de confiabilidad para todo el test, pero los datos de investigaciones empíricas demuestran que la precisión de los test también depende del nivel de desempeño del individuo en el constructo medido. Los test no miden con la misma precisión a todos los individuos. b. Las puntuaciones no son invariantes respecto del instrumento usado. c. En el marco de la TCT, las propiedades métricas (confiabilidad y validez) de los instrumentos de medida no son invariantes respecto de los individuos evaluados para estimarlas. Por consiguiente, las propiedades de los ítems de un test también dependen de las muestras de investigación. Cronbach y Gleser expusieron la teoría de la generabilidad (TG), que puede considerarse una extensión de la TCT para superar algunas de sus limitaciones. La TG postula que el concepto de confiabilidad en el contexto de la TCT es muy limitado, pues no tiene en cuenta todas las posibles fuentes de error. Los diseños de la TCT son limitados para alcanzar un control simultáneo de varias fuentes de error. La TG suministra herramientas más sólidas de control. Los diseños de análisis de varianza usados por la TG permiten discriminar varios componentes de varianza de error en un único análisis. Este archivo fue descargado de https://filadd.com � FI LA DD .CO M Cuando se administra un test, en el puntaje observado de un individuo operan diversas influencias además de las variaciones de su aptitud o rasgo verdadero. Pueden mencionarse el ambiente de administración del test, las instrucciones de respuesta dadas por el psicólogo, etc. Cada una de estas variaciones es una fuente de varianza de error y el puntaje observado de las personas puede cambiar en función de las mismas. En la TG el coeficiente de confiabilidad se denomina coeficiente de generalizabilidad. Al igual que en la TCT, refleja la proporción de variabilidad de las puntuaciones observadas que puede atribuirse a la variación sistemática de las puntuaciones verdaderas. El concepto de generalizabilidad se refiere a cuán precisamente podemos generalizar el puntaje observado al puntaje promedio que la persona debería recibir considerando todas las posibles condiciones de administración de un test. Las diferentes fuentes de variación aleatoria en las puntuaciones del test se denominan facetas en la terminología de la TG. Éste término fue introducido para designar cada una de las características de la situación de medición que pueden cambiar de un momento a otro y hacer variar los resultados obtenidos. El análisis de varianza (ANOVA) proporciona lasherramientas estadísticas para realizar un estudio de generalizabilidad. El ANOVA permite estudiar de manera simultánea el efecto de varias variables independientes sobre una variable dependiente. En el lenguaje del ANOVA, las facetas serían los factores, y sus efectos combinados con otras facetas constituirían las interacciones. En los diseños de una faceta habría 4 fuentes de variación, que en un test de rendimiento en matemática podrían ser: Diferencias individuales de los estudiantes en ese dominio Diferencias de dificultad de los ítems Interacciones de las personas con los ítems Errores aleatorios y fuentes de error no identificadas Este archivo fue descargado de https://filadd.com � FI LA DD .CO M
Compartir