Logo Studenta

Teoria clasica de los test Psicologicos

¡Estudia con miles de materiales!

Vista previa del material en texto

UNIDAD 8 
Teoría clásica de los Tests. 
 
Las mediciones a través de Tests psicológicos se realizan sobre individuos en un momento determinado e 
sus vidas, en circunstancias particulares y usando una muestra específica de comportamiento que se supone 
representativa de un dominio generalmente inobservable. Estas limitaciones implican que el resultado de la 
medición es solo una estimación aproximada de la puntuación verdadera del individuo en el constructo de 
interés. 
 
Además de esas características debe considerarse que toda medición conlleva errores. 
La Psicometría hace uso de modelos formales que le permiten lograr una estimación de la puntuación 
verdadera de un individuo en el rasgo con el menor error posible. 
 
La TCT surge del modelo lineal de medición formulado por Spearman y fue consolidada mediante los 
desarrollos teóricos y metodológicos de Thurstone y Gulliksen, entre otros. Se considera que los errores de 
medición varían en torno a algún valor verdadero. 
Gauss y otros matemáticos del siglo XVIII derivaron la función de distribución normal con media cero, que 
permitió describir la distribución de los errores de medida. Éste es uno de los antecedentes históricos más 
importantes de la TCT. 
 
El modelo lineal de medición sobre el que se asienta la TCT es sencillo, robusto y satisface la mayor parte de 
las necesidades de los profesionales de la medición psicológica, tanto en lo relativo a la confiabilidad como a 
la validez. 
Esta teoría se basa en supuestos débiles pero generales, adaptables a distintas situaciones. 
Hipótesis fundamental: la puntuación observada de una persona en un test es una función lineal de dos 
componentes: su puntaje verdadero (inobservable) y el error de medición implícito en la prueba. La TCT es 
un modelo de puntuación verdadera como valor esperado (matemático, probabilístico). 
La puntuación verdadera es constante, pero las puntuaciones observadas y los errores son aleatorios. 
 
 Para cada individuo, su puntuación observada es igual a la puntuación verdadera más el error. 
(Oi=Vi+Ei). 
 El error es igual a la puntuación observada menos la verdadera. (Ei=Oi-Vi). 
 
Los corolarios que se desprenden de estos supuestos son: 
 La media de los errores tiende a cero cuando el número de mediciones tiende al infinito. 
 La media de las puntuaciones verdaderas es igual a la media de las puntuaciones observadas cuando 
el número de mediciones tiende al infinito. 
 
Los dos corolarios anteriores parten del supuesto de que los errores aleatorios y las puntuaciones 
observadas se distribuyen de manera normal. 
 
 Si extraemos una muestra aleatoria de una población y le administramos un test: las puntuaciones 
observadas tendrán una distribución normal ; y los límites que encierran a la media poblacional con 
una media del 95% estarán dados por: 
 
 
 
La media de puntuaciones en el test de la población se ubicará con una probabilidad del 95% dentro del 
intervalo comprendido entre 1,96 desviacion estándar a la izquierda y a la derecha de la media de las 
puntuaciones de la media. 
 
Este archivo fue descargado de https://filadd.com
�
 FI
LA
DD
.CO
M
 La varianza de las puntuaciones observadas es igual a la varianza de las puntuaciones verdaderas (la 
varianza del atributo que se está midiendo) más la varianza del error de medición. 
 La correlación entre las puntuaciones observadas de dos formas paralelas de un mismo test es igual a 
la razón entre la varianza de las puntuaciones verdaderas sobre la varianza de las puntuaciones 
observadas. 
 
 
 
 
La varianza de las puntuaciones verdaderas es igual al producto de la varianza de las puntuaciones 
observadas por la correlación de las medidas paralelas. Esta deducción es importante porque la correlación 
entre dos formas paralelas de un test (un dato inobservable) nos permite estimar la varianza de las 
puntuaciones verdaderas, que es inobservable. Derivando la fórmula anterior obtenemos el corolario que 
sigue. 
 
 El error estándar de la medición (desviación estándar del error) es igual a: 
 
 
 
 
 
La desviación estándar (raíz cuadrada de la varianza) de las puntuaciones observadas en repetidas 
mediciones a un individuo es en sí misma un índice de error. Si la desviación estándar de esas repetidas 
mediciones fuera igual a cero no habría error de medición. Nunca tenemos un número suficiente de 
observaciones para calcular el error estándar de medición de la distribución de los puntajes observados. Sin 
embargo, como la correlación test-retest se obtiene de dos administraciones del test a una misma muestra, 
cuanto más alta es la correlación menor debería ser el error de medición. Este supuesto de la igualdad de las 
varianzas de error a lo largo de todo el continuo de puntuaciones se denomina homoscedasticidad y es uno 
de los supuestos más cuestionables de la TCT. 
 
De estos supuestos, corolarios y deducciones puede concluirse que: 
1. La puntuación verdadera de un individuo es una puntuación “límite”, un punto en un intervalo de la 
distribución de puntajes observados. 
2. Cuanto más alta sea la confiabilidad de un test, menor será ese intervalo, y la puntuación observada 
se ubicará más próxima a la puntuación verdadera. 
3. Como la desviación estándar no puede modificarse, deben disminuirse los errores de medida. 
 
La aplicación de este modelo presenta algunos problemas de medición: 
a. La TCT suministra un coeficiente de confiabilidad para todo el test, pero los datos de investigaciones 
empíricas demuestran que la precisión de los test también depende del nivel de desempeño del 
individuo en el constructo medido. Los test no miden con la misma precisión a todos los individuos. 
b. Las puntuaciones no son invariantes respecto del instrumento usado. 
c. En el marco de la TCT, las propiedades métricas (confiabilidad y validez) de los instrumentos de 
medida no son invariantes respecto de los individuos evaluados para estimarlas. Por consiguiente, las 
propiedades de los ítems de un test también dependen de las muestras de investigación. 
 
Cronbach y Gleser expusieron la teoría de la generabilidad (TG), que puede considerarse una extensión de la 
TCT para superar algunas de sus limitaciones. La TG postula que el concepto de confiabilidad en el contexto 
de la TCT es muy limitado, pues no tiene en cuenta todas las posibles fuentes de error. Los diseños de la TCT 
son limitados para alcanzar un control simultáneo de varias fuentes de error. 
La TG suministra herramientas más sólidas de control. Los diseños de análisis de varianza usados por la TG 
permiten discriminar varios componentes de varianza de error en un único análisis. 
Este archivo fue descargado de https://filadd.com
�
 FI
LA
DD
.CO
M
Cuando se administra un test, en el puntaje observado de un individuo operan diversas influencias además 
de las variaciones de su aptitud o rasgo verdadero. Pueden mencionarse el ambiente de administración del 
test, las instrucciones de respuesta dadas por el psicólogo, etc. Cada una de estas variaciones es una fuente 
de varianza de error y el puntaje observado de las personas puede cambiar en función de las mismas. 
 
En la TG el coeficiente de confiabilidad se denomina coeficiente de generalizabilidad. Al igual que en la TCT, 
refleja la proporción de variabilidad de las puntuaciones observadas que puede atribuirse a la variación 
sistemática de las puntuaciones verdaderas. 
El concepto de generalizabilidad se refiere a cuán precisamente podemos generalizar el puntaje observado 
al puntaje promedio que la persona debería recibir considerando todas las posibles condiciones de 
administración de un test. 
 
Las diferentes fuentes de variación aleatoria en las puntuaciones del test se denominan facetas en la 
terminología de la TG. Éste término fue introducido para designar cada una de las características de la 
situación de medición que pueden cambiar de un momento a otro y hacer variar los resultados obtenidos. 
 
El análisis de varianza (ANOVA) proporciona lasherramientas estadísticas para realizar un estudio de 
generalizabilidad. El ANOVA permite estudiar de manera simultánea el efecto de varias variables 
independientes sobre una variable dependiente. 
En el lenguaje del ANOVA, las facetas serían los factores, y sus efectos combinados con otras facetas 
constituirían las interacciones. 
En los diseños de una faceta habría 4 fuentes de variación, que en un test de rendimiento en matemática 
podrían ser: 
 Diferencias individuales de los estudiantes en ese dominio 
 Diferencias de dificultad de los ítems 
 Interacciones de las personas con los ítems 
 Errores aleatorios y fuentes de error no identificadas 
 
Este archivo fue descargado de https://filadd.com
�
 FI
LA
DD
.CO
M

Continuar navegando