Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
PRINCIPIOS DE PSICOMETRÍA Consulte nuestra página web: wwwwww..ssiinntteessiiss..ccoomm En ella encontrará el catálogo completo y comentado PRINCIPIOS DE PSICOMETRÍA CARMEN SANTISTEBAN REQUENA EDITORIAL SINTESIS Vallehermoso, 34 28015 MADRID Telf: (91) 593 20 98 Fax: (91) 445 86 96 Diseño y óleo de cubierta: Verónica Rubio Reservados todos los derechos. Está prohibido, bajo las sanciones penales y el resarcimiento civil previstos en las leyes, reproducir, registrar o transmitir esta publicación, íntegra o parcialmente, por cualquier sistema de recuperación y por cualquier medio, sea mecánico, electrónico, magnético, electroóptico, por fotocopia o por cualquier otro, sin la autorización previa por escrito de Editorial Síntesis, S. A. © Carmen Santisteban Requena © EDITORIAL SÍNTESIS, S. A. Vallehermoso, 34. 28015 Madrid Teléfono 91 593 20 98 http://www.sintesis.com ISBN: 978-84-975663-0-8 Depósito Legal: M. 11.211-2009 Impreso en España - Printed in Spain Prólogo 13 1. Psicometría y teoría de tests: Introducción 19 La medición de los atributos psicológicos y los instrumentos que la hacen posible 1.1. Cuantificación y experimentación: Los inicios de la psicología como ciencia cuantitativa 19 1.2. Los fundamentos de la psicometría 21 1.3. La medición de las aptitudes mentales 22 Algunos antecedentes 24 1.4. Tipos de tests 27 1.5. Variabilidad de las puntuaciones 28 Distribución de las puntuaciones 30 1.6. La interpretación de las puntuaciones 35 Las puntuaciones tipificadas (puntuaciones z) 36 Las escalas y las normas 38 1.7. Teorías y modelos 39 1.8. La construcción del test 46 La redacción de los ítems 48 La administración de los tests 48 Puntos clave 50 Actividades 51 2. Teoría clásica de los tests 53 El modelo lineal de Spearman 2.1. Formalización del modelo de Spearman 54 Hipótesis 54 Índice 2.2. Relaciones e índices que se deducen de las hipótesis 55 2.3. Condiciones de paralelismo entre medidas: Consecuencias 60 Medidas paralelas 60 Medidas tau-equivalentes 64 Comprobación del paralelismo 65 Consecuencias prácticas 66 Puntos clave 73 Actividades 73 3. Fiabilidad 75 Precisión de las medidas 3.1. El concepto de fiabilidad 76 3.2. Ecuaciones para definir y calcular la fiabilidad 78 Definiciones 78 Ecuación para un test compuesto por subtests 80 Valores e interpretación 81 3.3. Formas usuales de generar medidas repetidas 83 Test-retest 84 Formas paralelas 84 División en dos partes 85 3.4. Cálculo práctico de los coeficientes e índices de fiabilidad 86 3.5. Otras ecuaciones para el cálculo de la fiabilidad 90 Ecuación de Rulon 91 Ecuación de Flanagan y Guttman 94 Puntos clave 95 Actividades 96 4. Fiabilidad 99 Variabilidad y longitud de las pruebas 4.1. Fiabilidad y variabilidad de las puntuaciones 99 4.2. Fiabilidad y longitud de las pruebas 103 Ecuación de Spearman-Brown 104 Los valores de k 108 Variaciones de la fiabilidad con la longitud 108 Cambios en la longitud para valores prefijados de la fiabilidad 111 4.3. Relaciones entre fiabilidad, longitud y varianza 116 Puntos clave 119 Actividades 119 6 Principios de Psicometría 5. Fiabilidad 121 Consistencia interna: El coeficiente α 5.1. El coeficiente αα y las ecuaciones de Kuder-Richardson 122 Coeficiente α 123 Ecuaciones de Kuder-Richardson 123 5.2. El coeficiente αα: Cota inferior de la fiabilidad en tests compuestos 125 5.3. Casos particulares del coeficiente αα 130 Ecuaciones de Rulon y de Flanagan y Guttman 130 Ecuación de Hoyt 131 5.4. El coeficiente ββ 136 5.5. Cálculo de αα con técnicas de análisis de varianza 138 5.6. Coeficientes derivados del análisis factorial 141 El coeficiente Ω 141 El coeficiente θ 143 5.7. Variaciones de la fiabilidad 144 Cuantía 144 La fórmula de cálculo 145 Aplicación de la ecuación de Spearman-Brown 146 Puntos clave 149 Actividades 150 6. Inferencias 153 Estimación y contrastes de significación 6.1. Predicciones de la puntuación verdadera 153 6.2. Errores de medida, de estimación y de predicción 156 Tipos de errores 157 Relación entre los errores 159 6.3. Intervalos de confianza para la puntuación verdadera 159 6.4. Contrastes de medias 164 Diferencias entre la media de una muestra y la de la población 165 Diferencia de medias en muestras independientes 167 Diferencia de medias en muestras relacionadas 168 6.5. Significación e inferencias de los coeficientes de fiabilidad 173 Contrastes de coeficientes de correlación 174 Contrastes para coeficientes α 176 Puntos clave 179 Actividades 180 7Índice 7. Teoría de la generalizabilidad 183 ¿Cómo afectan a las medidas distintas facetas y fuentes de error? 7.1. Conceptos básicos y terminología 184 7.2. Estudios G 189 Diseño de una faceta 189 Diseño de dos facetas 193 7.3. Estudios D 196 Coeficientes de generalizabilidad y toma de decisiones 197 Diseño de una faceta 198 Diseño de dos facetas 201 7.4. Diseños anidados versus diseños cruzados 204 Puntos clave 205 Actividades 206 8. La validez 209 ¿Qué es la validez? 8.1. El concepto de validez 209 8.2. Tipos de validez 211 8.3. Validez en relación con el contenido 216 Validez de contenido versus validez aparente 218 8.4. Asociaciones con otras variables: Evidencias de validez convergente y discriminante 218 8.5. Validez en los procesos de respuesta 221 8.6. Validez en relación con el criterio 222 8.7. Validez de la estructura interna del test 223 8.8. Validez de constructo 224 Puntos clave 227 Actividades 227 9. La validez 229 Evaluación de las evidencias de validez 9.1. Validación del contenido 230 9.2. El coeficiente de validez 231 Validez y fiabilidad 232 Validez y longitud 236 Acotación del valor del coeficiente de validez 239 Coeficientes derivados del coeficiente de validez 240 Validez y representación muestral 243 8 Principios de Psicometría 9.3. Validez relativa al criterio 247 Pronóstico mediante regresión lineal simple 247 Pronósticos mediante una batería de predictores 250 Selección de las variables predictoras 252 9.4. Evaluación de la validez convergente y discriminante 253 Red nomológica y correlaciones 255 El método de Westen y Rosenthal 256 Matrices multirrasgo-multimétodo 257 9.5. Validez de la estructura interna del test 260 Puntos clave 264 Actividades 265 10. La validez 267 Coeficiente de validez y toma de decisiones 10.1. Detección, clasificación y diagnóstico 267 Sensibilidad y especificidad 270 Curvas ROC 273 10.2. Interpretaciones y uso práctico del coeficiente de validez 276 BESD 276 Tablas de Taylor-Russell 279 10.3. Análisis de la utilidad 284 Puntos clave 290 Actividades 291 11. Teoría de la respuesta al ítem 293 Aspectos generales 11.1. Orígenes y objetivos de la teoría de la respuesta al ítem 294 11.2. Aspectos generales 297 Dimensionalidad del espacio del rasgo 297 Independencia local 299 La curva característica del ítem (CCI) 306 Regresión y curvas características 307 11.3. La puntuación verdadera y la escala de aptitud 310 Puntos clave 312 Actividades 313 9Índice 12. Teoría de la respuesta al ítem 315 Modelos 12.1. Modelos ojiva normal 316 Tipos de modelos ojiva normal 317 12.2. Significado de los parámetros ai y bi 319 12.3. Modelos logísticos 325 Modelo logístico de dos parámetros 327 Modelo logístico de tres parámetros 331 Modelo logístico de cuatro parámetros 333 12.4. El modelo de Rasch 335 12.5. Otros modelos 339 12.6. Estimación de los parámetros de los modelos 341 El método de máxima verosimilitud 343 Métodos condicionales y no condicionales 346 Puntos clave 350 Actividades 351 13. Teoría de la respuesta al ítem 353 Funciones de información y aplicaciones 13.1. Funciones de información 354 Función de información del ítem 354 Función de información del test 357 13.2. Las funciones de información en diferentes modelos 358 13.3. Curvas de información 361 Ponderaciones 363 Aplicabilidad 367 Bancos de ítems 368 Tests adaptativos computarizados 368 13.4. Eficiencia relativa 369 13.5. La métrica y los valores de las funciones de información 372 13.6.Resumen de los procedimientos 373 Puntos clave 374 Actividades 375 14. El sesgo en los tests 377 Sesgos y comportamiento diferencial de los ítems 14.1. El sesgo en los tests 378 14.2. Detección y estimación de sesgo en la evaluación del constructo 379 10 Principios de Psicometría Consistencia interna 380 Índices de discriminación 380 Rango de dificultad 380 Análisis factorial 381 Funcionamiento diferencial de los ítems 382 14.2. El método Mantel-Haenszel para estimar el DIF 384 Significación estadística de los valores αMH 386 14.3. Estimación del DIF haciendo uso de las CCI 392 Puntos clave 398 Actividades 399 15. Medición y psicometría 401 Medición, escalas e interpretación de las puntuaciones 15.1. Psicología, psicometría y medición 402 15.2. Métrica y espacios métricos 404 15.3. Medición, estructuras, representación y escalas 405 El problema de la representación 406 El problema de la unicidad 407 El problema del significado 408 15.4. Medición directa e indirecta 409 15.5. Tipos de escalas 411 Escalas ordinales 413 Escalas de intervalo y de razón 413 Transformaciones admisibles 415 15.6. Interpretación de las puntuaciones: Escalas y normas 417 Escalas estandarizadas 419 Normas centiles 419 Escalas de puntuaciones normalizadas 421 Equiparación de puntuaciones 423 La escala de aptitud θ en la TRI 426 Puntos clave 427 Actividades 428 Bibliografía 431 Índice de contenidos 445 11Índice Prólogo Los avances científicos y tecnológicos están cimentados en la cuantificación y en la experimentación, estableciendo la diferenciación entre ciencia y creencia. Esta dife- renciación no es específica de las ciencias sociales y de la conducta, al enfrentarse con el reto de hacer ciencia en su intento de comprender y predecir la conducta humana, sino que abarca todos los campos del saber. La contraposición entre Astro- nomía y Astrología o entre Química y Alquimia son sólo dos ejemplos clásicos del divorcio entre ciencias y creencias, aunque estas últimas puedan incluir un gran baga- je de conocimientos acumulados durante siglos y se aborden con el mayor rigor filo- sófico, con la máxima seriedad y buenas intenciones. La aportación indiscutible del experimento, debidamente cuantificado, para la comprobación de teorías y de hipó- tesis generadas por el desarrollo científico, es la que ha convertido a la Psicología en una de las Ciencias con un desarrollo más espectacular durante el siglo XX, siendo la Psicometría la parte de la Psicología que sirve de soporte a esta cuantificación. Los conceptos métricos se introducen en ciencia para que, aprehendiendo el significado de algunas propiedades de los elementos, sujetos y objetos, poder estu- diarlos de forma sistematizada y, a ser posible, de una forma generalizada. La medición es el núcleo de la ciencia y de sus aplicaciones, incluyendo a las ciencias del comportamiento. Los estudios que se abordan desde la psicología, la educa- ción u otras ciencias sociales y políticas se basan en la posibilidad de obtener mediciones adecuadas de los atributos psicológicos y conductuales de los sujetos. Este libro trata de cómo obtener mediciones utilizando tests psicológicos como instrumentos de medida, evaluar la calidad de esas medidas y su aplicabili- dad, que es el objetivo de la Psicometría. La exposición de estos temas se hace desde el supuesto de que el lector pueda no tener conocimientos previos de esta materia, por lo que los contenidos van fluyendo, desde el concepto a la técnica, de forma monótona hasta alcanzar un nivel en el que, si se quiere ir más allá, no se requieran nuevos conceptos, sino el uso de métodos y técnicas más avanzadas que permitan abordar muchos de los temas que ya se apuntan en el texto. El libro está dirigido a universitarios, tanto de grado como de posgrado, y a los profe- sionales de las ciencias de la conducta (psicología, educación, medicina, sociolo- gía, etc.), quienes pueden encontrar en este texto los fundamentos y la lógica de muchos de los procedimientos que utilizan en la práctica. Este libro no sustitu- ye, ni es su objetivo, a aquellos textos que se centran en aspectos puramente téc- nicos en la construcción de tests, sin embargo, puede servir de ayuda y ser un buen complemento de esos otros. Para hacer su lectura comprensiva al mayor número de lectores posible, a veces se ponen ejemplos y se clarifican conceptos o expresiones provenientes de otros contextos. También se aclara el significado de algunos términos que son propios del ámbito de la estadística. Al ser un libro de fundamentos, se ha puesto el acento en los aspectos más básicos y conceptuales, aunque tratando en lo posible de dar una visión aplicada de cada uno de ellos, vinculando esos conceptos con aspectos técnicos y aplica- ciones. Con esta finalidad en este libro se incluyen ejercicios, tablas, gráficos y ejem- plos tomados de la literatura, que ilustran los métodos y los procedimientos. Para conseguir una mejor y más inmediata comprensión de dichos fundamentos, todos los ejercicios y ejemplos se han simplificado de tal manera que el lector pueda repli- carlos con ayuda de una simple calculadora manual, sin que tenga necesariamen- te que acudir (aunque lógicamente puede hacerlo) a ninguno de los múltiples pro- gramas informáticos que hay disponibles. Por otra parte, un texto de fundamentos debe incluir deducciones formales que justifiquen el porqué de muchas de las afir- maciones y ecuaciones que se proponen. Este libro incluye deducciones cuyo gra- do de complejidad no exceda en exceso el propio de esta obra. Aun así, esos con- tenidos se insertan en el texto generalmente en forma de cuadros cuya lectura puede omitir el lector, al menos en una primera fase, sin que ello sea óbice para seguir adecuadamente el desarrollo del tema que se esté tratando, procurando en todo momento hacerlo asequible al tipo de lector al que va destinado. La organización de los contenidos de los capítulos se hace procurando que el lector vaya adentrándose en ellos de forma paulatina y que cada uno de los cono- cimientos que adquiere demande alguno o algunos de los que se exponen a con- tinuación. Por ello, al finalizar cada capítulo se hace una breve recopilación de aquellos puntos o conceptos (Puntos clave) que el lector debe revisar antes de pasar al siguiente capítulo. El primer capítulo se dedica a introducir al lector 14 Principios de Psicometría en el significado de la medición psicológica, de sus orígenes y desarrollo, inci- diendo en la importancia y el significado de las puntuaciones que se obtienen uti- lizando los tests, haciendo mención expresa a los modelos psicométricos. Se tra- ta pues de una visión general que de alguna manera anticipa cuáles son los temas que se van a tratar posteriormente. Se recomienda, especialmente a aquellos lec- tores con un conocimiento previo de algunos aspectos de la Psicometría, que tras este capítulo primero aborden la lectura del capítulo 15. Probablemente habrá partes de dicho capítulo 15 que les resulten demasiado complejas o difíciles de entender, pero pueden pasar muy ligeramente por todo el capítulo y seguir con el normal ordenamiento del libro para reemprender su lectura cuando hayan asi- milado los contenidos del resto de capítulos. En el capítulo 2 se presenta el modelo lineal que ha dado origen a la teoría clá- sica de los tests, dedicándose los capítulos 3 al 5 a tratar el concepto de fiabilidad, que es un concepto central en la teoría clásica, su estimación y su importancia en la construcción, desarrollo y aplicaciones de los tests. En esos capítulos se insis- te en la diferenciación entre diversos tipos de fiabilidad, en los conceptos y en los procedimientos, dedicando en exclusiva el capítulo 5 al tratamiento de la consis- tencia interna. La comprobación de la significación de los indicadores de la fia- bilidad, así como la de las estimaciones de las puntuaciones, se pone a prueba mediante los procedimientos de inferencia estadística, y es a lo que se dedica el capítulo 6. Una extensión delmodelo clásico que intenta superar las limitaciones que el contexto clásico impone a la fiabilidad, aunque manteniéndose en el seno de los modelos lineales, se presenta en el capítulo 7, donde se exponen los con- ceptos básicos de la teoría de la generalizabilidad. Se incluyen en este capítulo explicaciones y ejemplos de los métodos y de las técnicas más básicas que se uti- lizan en esta teoría para realizar estudios de generalización y de decisión. Los capítulos 8, 9 y 10 se dedican al tratamiento de la validez. Se examina el concepto de validez, sus diferentes acepciones y clasificaciones en psicometría, posicionándonos en la visión más actualizada que reflejan las Normas de 1999 (AERA, APA & NCME, 1999, las últimas publicadas cuando este libro se impri- me). Se examinan los diferentes métodos para evaluar la validez y su utilidad en el pronóstico y en el diagnóstico cuando para ello se utilizan tests. A lo largo de esos capítulos se ha tratado de poner el énfasis en el significado de la validez en cuanto a que es crucial que la posean los tests, desde su gestación hasta la inter- pretación de las puntuaciones que con ellos se obtienen, puesto que la validez es una condición imprescindible para poder establecer conclusiones. 15Prólogo En los capítulos 11 al 13 se presenta la teoría de la respuesta al ítem. Los con- ceptos básicos se abordan en el capítulo 11, dedicando el 12 al tratamiento de los modelos concretos (ojiva normal, logísticos y el modelo de Rasch). Se explicita la forma y el significado de los modelos y de sus parámetros y cómo realizar la esti- mación, tanto de esos parámetros como del rasgo, esto es, del nivel de aptitud del sujeto que realiza la prueba. El capítulo 13 trata de la evaluación de la informa- ción que cada ítem aporta al test y la cantidad de información que proporcionan cada ítem y el test en los diferentes niveles del rasgo. Se introducen las expresio- nes de las funciones de información para los diferentes modelos, presentando algunas de sus aplicaciones. En el capítulo 14 se abordan los problemas de sesgo en los tests y sus cone- xiones con la validez, ya que la validez de un test implica ausencia de sesgos. Se presentan algunos métodos para detectar las fuentes y evaluar el sesgo, en los que se incluyen el estudio del comportamiento diferencial de los ítems. Especial énfa- sis se pone en advertir que diferentes fuentes de sesgo pueden llevar a la no equi- dad en la valoración de los sujetos y en las repercusiones personales y sociales que el uso de tests sesgados puede tener en diversos ámbitos (educativos, empresa- riales, jurídicos, clínicos, etc.). Finalmente, el capítulo 15 se dedica a exponer el significado de la medición en general y de la medición psicológica en particular, y las propiedades que deben poseer las representaciones numéricas para que legítimamente estén representando las magnitudes de aquello que se desea evaluar. Se explicitan esas propiedades y cómo dan origen a las diferentes escalas. Por último, se presen- tan algunos tipos de escalas, cómo se puede operar con ellas, las transforma- ciones que admiten conservando sus propiedades y cómo se interpretan sus puntuaciones. Muchos lectores se pueden preguntar por qué este capítulo se ha situado al final, cuando debería ser el primero, pues las bases de la psico- metría están en la medición. Las razones son que el tema de la medición no es un tema fácil que se pueda abordar en un primer capítulo, sin más conocimientos de sus implicaciones. Sin embargo, es más fácilmente comprensible si se pre- senta después de haber tratado con modelos, con puntuaciones, con transfor- maciones de las puntuaciones y haber percibido los problemas estructurales que conlleva la medición. Por ello, se ha recomendado que se aborde la lectu- ra, aunque sea superficial, de este capítulo antes de empezar con el segundo, para volver a él cuando el lector lo considere conveniente y retomándolo como capítulo final. 16 Principios de Psicometría Hay que añadir que, además de los ejercicios y de las aclaraciones y deduccio- nes que se dan en los cuadros que se insertan en los capítulos, se ha considerado que el conocimiento de los orígenes y de la evolución de aspectos cruciales en psi- cometría pueden ayudar a comprender mejor los conceptos y ser un incentivo sobre todo para aquellos lectores para los que ésta es su primera aproximación a la psicometría, además de que les permite situar en el marco adecuado los cono- cimientos actuales y contemplar con perspectiva una prospectiva hacia donde con- ducen los nuevos desarrollos. Para no interrumpir la lectura del tema, esta infor- mación se da en cuadros a los que el lector puede prestar atención en ese u otro momento. Con la convicción de que la información no es formación y que el conoci- miento se adquiere con el trabajo personal, se proponen al final de cada capítu- lo, además del examen de los puntos más importantes tratados en el mismo, un conjunto de actividades que es recomendable que el lector realice, unas porque son una aplicación directa de lo expuesto en el capítulo, y otras porque suponen que el lector dé un paso más con su elaboración personal. Este libro está dedicado a Ángel Santisteban y Angustias Requena, mis padres, y a mi esposo Manuel Cortijo. 17Prólogo Psicometría y teoría de tests: Introducción La medición de los atributos psicológicos y los instrumentos que la hacen posible 1 El término psicometría indica medición en psicología. La psicometría actual trata de las teorías, modelos, métodos, procedimientos y herramientas que se utilizan en la medición psicológica, en sentido amplio. En este texto se exponen las teorías y los modelos para el estudio de las diferencias indivi- duales. Es conveniente conocer los orígenes de los tests e interpretar el sig- nificado de las puntuaciones que con ellos se obtienen para entender los principios básicos de la psicometría. Todo ello sin perder la perspectiva de que otras materias, entre las que se incluyen la medición psicofísica, son temas psicométricos que también estudian las diferencias individuales. En este capítulo se va a tratar: ãLos inicios de la psicología como ciencia cuantitativa. ãLa psicometría y la medición de las aptitudes mentales. ãLos tipos de tests. ãLa variabilidad e interpretación de las puntuaciones. ãQué es un test y una breve reseña de las teorías y de los modelos que dan soporte a la construcción de los tests psicométricos. m1.1. Cuantificación y experimentación: Los iniciosm de la psicología como ciencia cuantitativam La psicología cuantitativa y experimental se puede decir que empieza con la publi- cación en 1860 de Elemente der psychophysick por el científico alemán Fechner, un físico preocupado por estudiar cuestiones psicológicas desde la medición y la experimentación. La medición y la experimentación son los procedimientos que comúnmente se consideran válidos en Ciencia, y son los que Fechner adopta para abordar la investigación de las relaciones entre estímulos y sensaciones, naciendo entonces la psicofísica como una nueva área científica de estudio. Tras la publicación de esta obra, y durante varias décadas, la psicofísica fue la princi- pal rama de la psicología en la que se intentó la cuantificación y el establecimiento de relaciones entre las magnitudes, hasta que surgió el interés por la medición de las aptitudes mentales. A principios del siglo XX, la medición de aptitudes y el desarrollo de técnicas que la hicieran posible, fue cobrando tanta importancia que colocó a la psicofísica en un segundo plano, dejando de ser el ámbito único y preponderante de la psicología científica. Hacia mediados del siglo XX se avan- za en la formalización y aparecen modelos para el estudio de algunos procesos psicológicos, así como el desarrollo de métodos para su medición. Se puede decir que la psicometría ha sido una de las mayores contribuciones que la psicología moderna ha hecho a la sociedad a lo largo del siglo XX. Es usual que muchos autores clasifiquenlas tareas de cuantificación de las que se ocupa la psicometría en dos grandes grupos: a) la de las diferencias indi- viduales, utilizando tests psicológicos como instrumentos de medición, que es lo que comúnmente se suele identificar con la psicometría y b) la cuantificación de los estímulos y de los efectos percibidos, o más precisamente, la de las carac- terísticas de las señales y la de los comportamientos de los sujetos que las reci- ben, que se suele identificar con la psicofísica, como materia independiente de la psicometría. No obstante, tanto si se utiliza una cuestión (ítem) planteada en el contexto de los clásicamente denominados tests (psicometría), como si se uti- liza un estímulo físico (psicofísica), ambos se podrían considerar como señales o como estímulos. A esos estímulos son a los que el sujeto debe dar una res- puesta, que es la que se evalúa en relación con las condiciones experimentales, entre las que deben destacarse las propias características del estímulo. Además, consideramos que tampoco está justificado llamar estudios de las diferencias individuales sólo a aquellos que se derivan de la aplicación de tests psicológicos, pues también existe un comportamiento diferencial de los sujetos cuando se apli- can otros métodos como los psicofísicos. Lo que se puede afirmar es que una y otra rama, unas veces juntas y aliadas, otras veces independientes y aparente- mente contrapuestas, se han enfrentado al reto de la medición y de la experi- mentación en el ámbito de la psicología, utilizando para su estudio y para la cons- trucción de sus modelos métodos estadísticos y matemáticos, casi siempre de naturaleza probabilística. Ambas disciplinas han generado sus propios procedi- 20 Principios de Psicometría mientos de medición y han dado normas para la interpretación de las medidas con la determinación de umbrales, la construcción de escalas de puntuaciones, el escalamiento de los estímulos, etc. En la actualidad están emergiendo nuevas teorías y, sobre todo, nuevas técnicas para el estudio del comportamiento huma- no, abordándolo a través de la medida de la activación cerebral, son las llamadas técnicas de imagen o de neuroimagen. Las más relevates son la magnetoencefa- lografía (MEG), la resonancia magnética funcional (fMRI) y la tomografia de emisión de positrones (PET). Utilizando estas técnicas se están abriendo nue- vos horizontes en el conocimiento de las actitudes, procesos atencionales, ras- gos de personalidad, etc., cuyo estudio hasta ahora se había abordado con téc- nicas tradicionales. Las relaciones estímulo/s-respuesta/s se habían evaluado fundamentalmente mediante puntuaciones, número de errores, tiempos de reac- ción y tiempos de respuesta. Estos datos ahora se ven implementados con los que se obtienen a través de la medición de la activación cerebral. m1.2. Los fundamentos de la psicometríam La psicometría es un campo de conocimiento cuyo nombre, compuesto por psi- co y metría, la define como la medición de lo psicológico, o la medición en psi- cología. Esta definición es aparentemente tan amplia e inespecífica que hay auto- res que mencionan las dos ramas principales cuyo desarrollo se ha impulsado desde la psicometría, los métodos psicofísicos y los de construcción de tests. Algu- nos autores también definen la psicometría por sus objetivos, diciendo que sirve para obtener estimaciones de las características de los sujetos, y otros la conside- ran sólo en su acepción de herramienta para distintos fines, con lo que en casi todos los casos se está tomando la parte por el todo. Revisando la definición que se da en los manuales de diferentes países y en diferentes épocas, lo más frecuente es que todos los autores mantengan en sus definiciones ese carácter general de que la psicometría es medición en psicología, pero también muchas veces, bajo esa amplia generalización hay alguna palabra que la restringe, como llamarla méto- do, o técnica, aunque la extiendan a todos los aspectos de la psicología. El alto grado en que la psicometría está al servicio de la medición psicológica y de los instrumentos adecuados para efectuarla hace olvidar que tiene un bagaje teórico propio y bien estructurado, que constituye un campo de conocimiento de donde se nutren sus modelos y se inspiran muchas de sus técnicas. 21Capítulo 1. Psicometría y teoría de tests: Introducción En la literatura también se dan definiciones de la psicometría por extensión, enumerando y describiendo los aspectos que la integran, tanto los teóricos como sus aplicaciones. Por ello, al relacionar sus contenidos, hay autores que los redu- cen a la teoría de tests y otros que incluyen no sólo las teorías, sino los métodos estadísticos que se van desarrollado para contrastar y validar los modelos forma- les que se ajustan a esas teorías, dándoles soporte, permitiendo la experimenta- ción y, por ende, avances tanto en la teoría como en la práctica psicométrica. m1.3. La medición de las aptitudes mentalesm Es una creencia común, y de hecho es de fácil comprobación, que las personas difieren en sus capacidades o aptitudes mentales. Basta con proponer un pro- blema que implique algún tipo de razonamiento y muy probablemente, se pre- sentarán distintas aproximaciones al problema y diferentes formas de solucio- narlo, aun cuando los sujetos que responden tengan la misma edad, el mismo nivel cultural, vivan en la misma ciudad, etc. Se supone que las aptitudes men- tales son características propias de las personas y también se asume que esas aptitudes son las principales responsables de las diferencias individuales que se observan en la resolución de diferentes tareas intelectivas, aunque hay que admi- tir la posible influencia de otras muchas variables, como por ejemplo, la moti- vación, los diferentes rasgos de personalidad, así como la de algunos factores ambientales o de contexto. Las teorías que se han desarrollado bajo la hipótesis de la existencia de dife- rencias individuales en las aptitudes mentales son muchas y variadas. Los pri- meros intentos formales de medición de las aptitudes mentales aparecen en la literatura con los trabajos de Binet (1903) y de Spearman (1904a, 1904b), inten- tándose su medición a través de determinadas pruebas. Estas pruebas, que se conocen universalmente bajo la denominación de tests psicométricos, y que se aplican bajo condiciones relativamente estandarizadas, suelen estar compues- tas por un conjunto de cuestiones o de problemas que se presentan a las per- sonas para que den su respuesta, a veces eligiendo entre diferentes alternativas o llegando a una determinada solución u otro tipo de respuesta, de acuerdo con unos criterios previamente establecidos. Las formas de plantear las cuestiones, así como los formatos de respuesta, son muy variados. Los tests son de diver- sa complejidad y las cuestiones que se plantean pueden ir desde una simple ase- 22 Principios de Psicometría veración con la que se pide consignar si se está o no de acuerdo, o el grado en que se está de acuerdo, o marcar o descubrir el elemento que sigue en una deter- minada secuencia lógica, hasta responder a algo más complejo, como puede ser dar la resolución de un problema del que se pide que se especifiquen los pasos para llegar a esa solución. A cada una de las cuestiones o problemas que se plantean en la prueba (test) es a lo que se le llama elemento, o más universalmente, ítem del test. El uso de las denominaciones test, en lugar de prueba, e ítem, en lugar de elemento, se han generalizado en la literatura, aun en los textos en español. En esta obra, salvo que se indique lo contrario de forma expresa, se utilizan indistintamente los términos prueba y test, como términos indiferenciables e intercambiables dentro de su con- texto. Igualmente se hace con los términos elemento e ítem del test aunque, en algunos casos, se verá que está justificado el que se consideren elementos que son un compuesto, o sea, elementos que a su vez pueden estar compuestos por un conjunto de otros elementos o de ítems.Las respuestas a los ítems del test proporcionan una puntuación, que es la que se pone en relación con los niveles de la aptitud u otro rasgo que se preten- de medir en los sujetos a los que se aplica la prueba. Otra cuestión relevante es saber si la prueba es aplicable a toda la población o solamente a algunos grupos específicos, así como las condiciones que se han de dar para poder extrapolar y/o generalizar los resultados. Por lo tanto, un test es un instrumento diseñado para inferir una medida de capacidades o ciertas características de los sujetos a través de las respuestas que dan a los ítems de ese test. Se puede decir también que es un instrumento para obtener una muestra de un comportamiento individual. Cada aptitud, actitud o característica que se quiera medir necesitará la construcción de una prueba o test diferente que contenga al menos un elemento que dé cuenta de ello. Los tests, los cuestionarios y otras medidas estandarizadas han sido las herra- mientas más utilizadas en psicología, extensiva e intensivamente, tanto en los ámbitos aplicados de la psicología clínica, del trabajo, educativa, etc., como en investigación. Su aplicación se demanda desde las empresas, generalmente en los procesos de selección de personal, o desde los ámbitos educativos, o por los ser- vicios de salud, los gobiernos, etc. El uso de los tests está tan extendido que es difícil imaginar que cualquier persona a lo largo de su vida no haya cumplimen- tado algunas decenas de tests. Desafortunadamente en algunos casos se encuen- tran tests y cuestionarios que están escritos, administrados y/o interpretados por 23Capítulo 1. Psicometría y teoría de tests: Introducción personas que no tienen un entrenamiento adecuado. Esta obra pretende ayudar a comprender los principios, los métodos y las destrezas técnicas necesarias para generar y usar los tests responsablemente. Algunos antecedentes Desde que Galton (1822-1911) tuvo la idea de medir las diferencias individua- les de las aptitudes mentales por métodos puramente objetivos, son muchos los trabajos y procedimientos que se han desarrollado con el fin de construir instrumentos que sean adecuados para realizar tales mediciones. Entre los pio- neros más destacados se encuentran Catell, quien acuñó en 1890 la expresión de test mental, y Binet (1857-1911), quien generó el primer test de inteligencia que resultó ser útil en la práctica y en el que, en su tiempo y posteriormente, se han inspirado un amplio grupo de tests muy conocidos y utilizados. En 1895 Binet y Henri publican un artículo en el que se alejan de la medición simple de aspectos sensoriales y motores, defendiendo el uso de tareas de carácter más complejo y, en consecuencia, la construcción de pruebas para medir memoria, atención, comprensión, etc. Mientras tanto, Ebbinghaus también trabaja con escolares aplicando tests de este tipo, proponiendo tareas como completar fra- ses, hacer cálculos aritméticos, recordar palabras, etc. En 1904 el Ministerio de Instrucción Pública de Francia crea una comisión para tratar el problema de la instrucción a niños con bajos niveles de inteligencia, e implica a Binet en la bús- queda de una solución a este problema, quien, dada su experiencia, propone un test de inteligencia que se comienza a utilizar para la selección de estudian- tes en las escuelas de París (Binet y Simon, 1905). También se debe a Binet la introducción del concepto de edad mental. Este concepto fue utilizado por Stern (1912) para establecer el denominado cociente de inteligencia (CI), definido como el cociente entre la edad mental y la edad cronológica y que ha tenido una gran trascendencia a lo largo de la primera mitad del siglo XX, al menos por su influen- cia en los numerosos estudios dirigidos a la determinación de las diferencias individuales en el campo de los procesos intelectivos. Con la definición del CI se estableció en el marco de la teoría psicométrica la primera escala de puntua- ciones referida a las aptitudes mentales, o bien, se puede decir que se realizó la primera normalización de las puntuaciones, si la consideramos bajo ciertas condi- ciones de estandarización. 24 Principios de Psicometría 25Capítulo 1. Psicometría y teoría de tests: Introducción Alfred Binet (Niza, 1857-1911) estudiaba derecho en París, cuando tenien- do veinte años se interesó por los estudios de hipnosis del neurólogo fran- cés Jean Charcot, quien trabajaba en el hospital Salpetriere de París, de tal manera que abandonó sus estudios de leyes y se dedicó a las cien- cias y la medicina. Se doctoró en ciencias naturales y comenzó a traba- jar como investigador asociado en el laboratorio de la Sorbona en 1891, llegando en 1895 a ser director del laboratorio de Psicología Fisiológica de L’Ecole Pratique des Hautes Etudes, cargo que mantuvo hasta su muer- te. Binet empezó trabajando sobre hipnosis e histeria, los temas de tra- bajo de su mentor, Charcot, para pasar posteriormente a realizar estudios sobre personalidad y psicología experimental. Binet estaba interesado en estudiar el razonamiento y en buscar formas de medir las funciones men- tales superiores, como muestran sus publicaciones de esa época: La psy- chologie du raisonnement (1886), Le magnétisme animal (1887), On dou- ble consciousness (1887) y L’étude expérimentale de l’intelligence (1903), en la que utiliza los datos obtenidos examinando a sus propias hijas, Armande y Marguerite. En 1895 Binet fundó un laboratorio (en la Escue- la de la Rue de la Grange aux Belles) para el estudio del desarrollo de la inteligencia y la revista L’Année Psychologique, donde publicó gran par- te de su obra. Binet se interesó por los estudios de Galton y se inspiró en sus méto- dos para examinar a muchas personalidades famosas de la época, entre los que se encontraban brillantes jugadores de ajedrez, matemáticos, escritores y artistas. Pero son los estudios sobre la inteligencia de los niños, impelido por las demandas del gobierno, que deseaba poder dis- tribuirlos en clases de acuerdo con sus capacidades cognitivas, los que producen el resultado de una herramienta útil para la medición de las dife- rencias individuales, la primera escala Binet-Simon (1905), que tiene de inmediato gran aceptación. Esta escala constaba de 30 ítems con tareas intelectivas complejas, aunque no estaba exenta de algunas senso-moto- ras y se aplicaba a niños con edad mental entre 3 y 13 años, edad que podía coincidir o no con su edad cronológica. Esta escala sufre sucesi- vas revisiones (Binet y Simon, 1908 y 1911) y se internacionaliza, adap- tándola para su uso en Vineland (Nueva Jersey, EEUU), sobre todo tras la revisión que hace Terman (1916) de la Universidad de Stanford, siendo el test de Stanford-Binet y sus sucesivas revisiones (Terman y Merril, 1937, 1973; Becker, 2003) el test de inteligencia más conocido y comúnmente utilizado durante décadas. Cuadro 1.1 Por otra parte, los principios de la correlación y de la regresión enunciados por Galton, así como su hipótesis acerca de la existencia de un término único, al que se le podría denominar aptitud mental general de los humanos, ayudaron a Spearman a descubrir las intercorrelaciones positivas entre todas las medidas de las diferencias individuales en pruebas mentales complejas y a concluir que las actividades cognitivas son todas función de un factor general g y de un fac- tor s específico de cada operación. Spearman es así pionero en el desarrollo de los métodos ahora conocidos bajo la denominación genérica de Análisis Fac- torial. Es imprescindible reseñar en este contexto psicométrico que, junto a las aportaciones anteriormente mencionadas, se fue desarrollado un importante cuerpo teórico acerca de las escalas de medida y que tiene su figura más signi- ficada en Thurstone. Volviendo a las primeras décadas del siglo XX, hay que reseñar que la partici- pación de EEUU en la primera Guerra Mundial (1914-1918) impulsa el desarro- llo de los tests, pues los ejércitos se encuentran con la necesidad de evaluar y cla- sificara los reclutas. Se da el paso definitivo de la aplicación individual a la colectiva 26 Principios de Psicometría Sir Francis Galton (Birmingham, 1822-1911), para apoyar sus teorías sobre la herencia próximas a las de su pariente Darwin, hace experimentos y toma multitud de medidas sobre millares de sujetos. Aunque no es un matemáti- co, es el primero en aplicar razonamientos estadísticos al estudio de las apti- tudes mentales. La idea de la correlación (co-relation originalmente), como índice cuantitativo de la mayor o menor aproximación en ciertas caracterís- ticas físicas entre personas relacionadas por un parentesco específico y la de la regresión, como la tendencia que en el proceso hereditario tienen los valores extremos en las estaturas de los sujetos a regresar hacia la media, son conceptos propuestos por Galton. Es Karl Pearson (1857-1936), esta- dístico de la Universidad de Londres, contemporáneo y colaborador de Gal- ton, al que comúnmente se cita como fundador de la ciencia estadística, quien formaliza ambos conceptos y los hace manejables. Cuadro 1.2 y a los tests no verbales (los llamados tests beta), pues esos tests son imprescin- dibles para hacer posible su aplicación a analfabetos, o a extranjeros desconoce- dores de la lengua inglesa. Son muchos los autores cuyas aportaciones e influencia han sido relevan- tes, tanto en aspectos teóricos como metodológicos y de divulgación, así como en la generación de tests, aunque los objetivos y las limitaciones propias de esta obra no permiten que se haga mención a muchos de ellos. En un tratado sobre el tema ocuparían un lugar muy destacado, por ejemplo, obras como Theory of mental tests de Gulliksen (1950a), las aportaciones en la construcción de escalas de Guttman (1941) y de Stevens (1946) o uno de los tests de inteligencia más difundidos, el de Wechsler (1939) que se sigue utilizando en sus versiones WAIS para adultos (Wechsler, 1997), y WISC para niños (Wechsler, 2003), pues per- miten diferenciar distintos tipos de inteligencia a través de las puntuaciones en sus subtests. También habría que hacer mención a las acciones individuales o institucionales que ayudaron a investigar, a difundir y a propiciar la utilización masiva de los tests. La creación de empresas para la difusión de los tests, como la de Catell, en los años veinte del siglo XX, y muy especialmente la creación del Educational Testing Service en 1947, han propulsado el gran desarrollo de la psi- cometría. m1.4. Tipos de testsm Los tests se han desarrollado con distintos propósitos y se identifican median- te multiplicidad de denominaciones, pues hay tests que reciben su nombre de los contenidos, o de la forma en que se van a interpretar las puntuaciones, o de la forma de dar la respuesta, o si hay un tiempo limitado que afecta a la ejecu- ción, etc. También hay diferentes términos que se usan como sinónimos para la palabra test en diversos contextos, como son denominaciones tales como cuestionario, inventario y escala. Los tests referidos al contenido son los tests de inteligencia, de persona- lidad, de memoria, de actitudes, etc. Entre las denominaciones que se refie- ren a la interpretación y al uso destacan los tests referidos a la norma y los referi- dos al criterio, o al dominio. Los tests referidos a la norma se utilizan más en la interpretación que los referidos al criterio, cuyo uso está más ligado a la toma de decisiones, especialmente en el ámbito educativo. En los tests referidos al 27Capítulo 1. Psicometría y teoría de tests: Introducción criterio se fija una puntuación de corte, en relación con un criterio, para esta- blecer una división de los sujetos en dos categorías, los que sus calificaciones superan esa puntuación y los que no. Luego las interpretaciones de las pun- tuaciones de un sujeto en el rasgo y las decisiones que se derivan de ello están referenciadas al criterio establecido. En los tests referidos a la norma, lo que se comparan son las puntuaciones del sujeto en el test con las de una mues- tra representativa o con las de una población, es decir, con las del denomina- do grupo normativo. En las clasificaciones en relación con el tipo de respuesta, se suele distin- guir entre los tests de respuesta abierta, en la que los sujetos pueden responder diciendo lo que les parezca oportuno, y los de respuesta cerrada, en los que los sujetos deben elegir entre diferentes alternativas que se les proponen. Los de respuesta cerrada a su vez pueden recibir la denominación en relación con el número de alternativas que presenta la respuesta, tests de respuesta multicategóri- ca, o del tipo de variable con el que se valora la respuesta, tests de respuesta dico- tómica, etc. Otra clasificación que se suele hacer es distinguir entre los que se denominan tests de velocidad y los tests de potencia o de fondo. La diferencia entre ambos es que, en un test de velocidad, los ítems suelen ser muy homogéneos, de similar dificultad y las diferencias individuales se manifiestan principalmen- te por el número de ítems resueltos correctamente en un tiempo limitado, que se considera que es insuficiente para que se cumplimente la totalidad del test. Por el contrario, un test de potencia suele comenzar con ítems fáciles que aumen- tan en dificultad a medida que se avanza en el test, y no hay teóricamente tiem- po límite. En ambos casos, la puntuación en el test se suele obtener contabili- zando el número de respuestas correctas, pero la interpretación de esa puntuación en uno y otro caso puede ser diferente. La identificación de un test como de velocidad o de potencia a veces no es obvia, y se han presentado algu- nos procedimientos para su clasificación que suelen basarse en el análisis de los errores por comisión y por omisión (algunos de estos procedimientos pueden consultarse en Santisteban, 1990a). m1.5. Variabilidad de las puntuacionesm Las puntuaciones de los tests se utilizan para establecer e interpretar las dife- rencias interindividuales e intraindividuales en las mediciones de los rasgos. Por 28 Principios de Psicometría lo tanto, una de las cuestiones más inmediatas es saber cómo se distribuyen esas puntuaciones. Esto implica conocer alrededor de qué valor se concentran esas pun- tuaciones, así como cuál es su dispersión y sus relaciones. Las medidas de tenden- cia central se obtienen con los valores de los estadísticos tales como la media arit- mética, o la mediana. Las medidas de dispersión usuales son la varianza y su raíz cuadrada, la desviación típica. Entre las medidas que evalúan la asociación entre variables están la covarianza y la correlación. Todas estas medidas se van a utilizar muy a menudo en el texto, así que indi- camos brevemente sus expresiones y notación. Usualmente se utilizarán letras latinas para los estadísticos calculados con valores muestrales, y las griegas para los parámetros poblacionales o cuando se da la forma genérica de una ex- presión. Medidas de tendencia central La media aritmética de una variable X de la que se tienen N observaciones es y se sustituirá por µ si se refiere a la media poblacional. También se utilizará el operador esperanza matemática E para indicar esta operación: E (X) = . Medidas de dispersión La varianza es una medida de dispersión, pues es un valor promedio de las desviaciones de los valores Xi con respecto a la media. Para una muestra de tamaño N es: que se denotará por σ2 si es la varianza de la población. Las desviaciones típicas son s y σ respectivamente. También se utilizará el operador esperanza matemáti- ca para indicar esta operación, ya que: σ2X = E[X – E(X )] 2. € s X X N i2 2 = −∑( ) € X € X € X X Ni=∑ / 29Capítulo 1. Psicometría y teoría de tests: Introducción Medidas de asociación La covarianza entre dos variables X e Y se refiere a cómo covarían ambas variables. Es decir, como covaría Y con X y X con Y. La covarianza de X con Y se calcula mediante la expresión: y de esta expresión se puede deducir que Cov (X, Y) = Cov (Y, X). Porello, en esta obra, cuando se haga referencia a la covarianza de forma general, diremos covarianza entre las variables, pero cuando en una expresión hay que incluir la cuantificación de esa covarianza, se expresará como 2 Cov (X, Y). Si se usa el ope- rador E, la covarianza responde a la expresión E {[X – E(X)] [Y – E (Y)]}. La correlación entre las variables X e Y viene dada por la expresión: Distribución de las puntuaciones La representación gráfica de la distribución de las puntuaciones es un medio sencillo y muy útil para obtener información del test y de los sujetos a los que se les administra ese test. Un ejemplo y algunas de estas representaciones se dan a continuación. Ejemplo 1.1 La distribución de puntuaciones de un test X constituido por 6 ítems dico- tómicos que se han administrado a una muestra de 200 sujetos se da en la Tabla 1.1, donde Ni es el número de sujetos que obtienen la puntuación Xi. En este caso la puntuación Xi se corresponde con el número de aciertos y fi = Ni / N es la frecuencia relativa. Cualquier puntuación, por ejemplo X6 = 5, € r Cov X Y s sXY X Y = ( , ) € Cov X Y X X Y Y N i i( , ) ( ) ( ) = − −∑ 30 Principios de Psicometría con frecuencia relativa f6 = 0.15 (f6 = 30 / 200), indica que de los 200 sujetos sólo un pequeño número obtiene esa puntuación. Esta simple descripción permite conocer, por ejemplo, que el 25% de la muestra presentan puntuacio- nes muy altas (5 o 6), en tanto que puntuaciones muy bajas (0, 1 o 2) las ob- tienen el 15%. Figura 1.1. Representación gráfica de la distribución de frecuencias de la Tabla 1.1. Los estadísticos que definen a la distribución anterior son: a) La media de las puntuaciones, que es = 3.80. b) La desviación típica, que es sx = 1.25. c) La moda como valor más frecuente, que es Mo = 4. € X 31Capítulo 1. Psicometría y teoría de tests: Introducción Tabla 1.1. Distribución de las puntuaciones de un test administrado a 200 sujetos. Xi 0 1 2 3 4 5 6 Ni 0 10 20 40 80 30 20 fi 0 0.05 0.10 0.20 0.40 0.15 0.10 Las representaciones gráficas que corresponden a las distribuciones de las puntuaciones tendrán una forma geométrica u otra dependiendo de los valores de sus medidas de tendencia central (media, mediana, moda) y de sus medidas de dispersión (desviación típica o varianza, coeficiente de variación u otros momen- tos). El estudio de esas gráficas es muy útil para una primera aproximación al conocimiento del test y de cómo pudiera estar distribuido el rasgo en distintas muestras o en diferentes poblaciones. Distribución normal Si las puntuaciones se distribuyen según una ley normal, la media, la media- na y la moda coinciden. Las frecuencias se distribuyen simétricamente con respecto a esos valores pues la media es el centro de la distribución y el valor de mayor probabilidad. Una varianza o desviación típica mayor o menor indi- ca que la curva estará más o menos apuntada, ya que la desviación típica mide la distancia entre la media y los puntos de inflexión. Un ejemplo de distribu- ciones normales con distinto apuntamiento se presenta en la Figura 1.2, en donde se puede observar que hay mayor concentración de puntuaciones (mayor número de sujetos) con valores próximos a la media en la más apuntada que en la más aplanada. Distribuciones de puntuaciones con estas características indican que el test tiene muchas cuestiones (ítems) de dificultad intermedia a las que responden correctamente la mayor parte de los sujetos. También se presupone que están incluidos en el test algunos ítems de muy alta dificultad, pues son muy pocos los sujetos que también los responden correctamente. También se podría inferir que el rasgo se distribuye normalmente en la pobla- ción. Distribución uniforme Una curva de distribución de frecuencias que sea una línea recta paralela al eje X de las puntuaciones respondería a una distribución uniforme o rectan- gular, donde se puede considerar que todos los valores son modales, o bien, que no hay moda, pues todos tienen la misma frecuencia. Un test que genere este tipo de distribución en que todas las puntuaciones, sean altas, bajas o inter- medias, las obtienen el mismo porcentaje de sujetos, sería muy poco útil para extraer conclusiones. 32 Principios de Psicometría Figura 1.2. Representación gráfica de dos distribuciones normales con media cero y desviaciones típicas 0.5 y 1. Distribuciones asimétricas Distribuciones asimétricas se obtienen cuando las frecuencias se concen- tran en un valor alejado de la media. En la Figura 1.3 se representan dos dis- tribuciones asimétricas, una desviada a la izquierda (a) y otra a la derecha (b). Un test tendrá una distribución de puntuaciones desviada a la derecha si tiene muchos ítems fáciles, por lo que la mayor parte de los sujetos obtienen altas puntuaciones. En caso contrario, si el test tiene un gran número de ítems de alta dificultad, la mayor parte de los sujetos no darán respuesta correcta a ellos y la curva estaría desviada a la izquierda. Puesto que las desviaciones tienen relación con la diferencia que haya entre la puntuación media y la mediana, una distribución será más asimétrica cuanto mayor sea esta diferencia y un índice de esa asimetría es: € δ µ σ = −Me 33Capítulo 1. Psicometría y teoría de tests: Introducción denotando por Me a la mediana y siendo µ y σ la media aritmética y la desviación típica. Diversos índices de asimetría, así como el coeficiente de asimetría de Fis- her se suelen incluir en los manuales de estadística. Figura 1.3. Distribuciones asimétricas de puntuaciones X en el test. Distribuciones con más de una moda La representación de las distribuciones de las puntuaciones permite que se pue- da detectar si en esa población hay dos o más grupos que estén bien diferenciados con respecto a las mediciones del rasgo que representan esas puntuaciones. Esto se evidencia cuando en las distribuciones de puntuaciones de una población se pre- sentan varios máximos o valores modales, lo que sugiere que en la población hay grupos que se comportan de forma diferente en el test, o que se diferencian en sus valores del rasgo (por ejemplo, hombres y mujeres, niños y adultos, etc.), o que el test esté sesgado a favor de alguno de esos grupos. Por ejemplo, una distribución bimodal como la que se presenta en la Figura 1.4 sugiere que hay dos grupos en esa población que se comportan diferencialmente, y si no era esperable, habrá que ave- riguar cuáles son las razones. Se han expuesto aquí algunas de las formas de las distribuciones más comu- nes y su significado. Entre otras, una de las cuestiones en las que se puede estar interesado es en la concentración de puntuaciones en torno a la media (apunta- miento) y sobre todo en la evaluación de la asimetría. Los índices para valorar tan- to el apuntamiento (curtosis) como la asimetría se encuentran en los manuales de estadística y también se pueden consultar en Santisteban (1990a). 34 Principios de Psicometría Figura 1.4. Distribución bimodal. m1.6. La interpretación de las puntuacionesm Obtener una puntuación de 35 puntos en un cuestionario de agresividad, o de neuroticismo, o 22 puntos en un test de inteligencia no tiene ningún significado. Sin embargo, lo tiene decir que la distancia entre dos ciudades es de 200 km. La diferencia entre una información y otra es que la medida física va acompa- ñada de la unidad de medida, en tanto que las psicológicas que se han dado no lo están. La medida física se ha realizado con un instrumento, el metro, que aunque es una medida arbitraria, se ha adoptado como unidad para medir lon- gitudes. Para realizar las medidas psicométricas también se han generado ins- trumentos adecuados, que son los tests, sin embargo, las unidades de medida en los tests, además de ser arbitrarias, no cuentan con una unidad aceptada uni- versalmente con la que comparar la medición de cada rasgo. No hay una uni- dad de medida de la inteligencia, ni del neuroticismo, ni de la agresividad o de otras característicasde los sujetos. Así pues, cuando se construye un test hay que tener muy claro desde su inicio qué es lo que se quiere medir, cómo se va a medir, cómo se van a obtener las puntuaciones, qué reflejan esas puntuacio- nes, cómo se pueden organizar para que se puedan establecer las correspon- 35Capítulo 1. Psicometría y teoría de tests: Introducción dientes diferencias individuales que reflejen adecuadamente las diferencias que existen entre los sujetos en el rasgo, y cómo expresar todo ello para que quie- nes utilicen ese test puedan interpretar correctamente las puntuaciones que con él se obtienen. Son muchos los conceptos y los procedimientos implicados en todo lo ante- riormente dicho, y se irán tratando a lo largo de esta obra. Sin embargo, antes de entrar a estudiar los modelos concretos en los que se puede basar la construc- ción de los tests, es conveniente clarificar algunos aspectos. Por ejemplo, que los números que representan puntuaciones en los tests deben estar conectados con el significado y la cuantía de aquello que se mide, que con ellos se puedan expre- sar tanto similitudes como diferencias, que se pueda operar con esas puntuacio- nes, que sean susceptibles de comparación con otras puntuaciones, etc. Otra cuestión interesante es el significado del número cero. El número cero es una puntuación que puede tener muchos significados. Una es la ausencia del atri- buto que se mide y otra puede corresponder a una cantidad, en principio arbitra- ria, para fijar el origen de una escala. Por ejemplo, el cero en una escala centígrada es un valor arbitrario que no significa ausencia de temperatura, sino el origen de esa escala, pudiendo existir temperaturas en grados centígrados menores y mayo- res que cero, es decir, positivas y negativas, que serán diferentes a las expresadas en otra escala (por ejemplo en grados Fahrenheit o en Kelvin). En psicología es difícil definir qué significa el cero, pues la ausencia del rasgo difícilmente se corres- ponde con la realidad, nadie tiene inteligencia cero, ni ausencia total de neuroti- cismo, o de agresividad. Se asigna el valor cero a multitud de situaciones, cuando no se ha alcanzado un cierto nivel en el rasgo, cuando se ha cometido un error, cuando no se completa una prueba, etc. También se suele utilizar el cero para fijar el origen de las escalas. Por lo tanto, la interpretación de las puntuaciones en los tests psicológicos, está relacionada con el significado que tiene el cero en ese test. Las puntuaciones tipificadas (puntuaciones z) Una puntuación aislada y sin referencia a alguna unidad de medida no tiene una clara interpretación. Al menos habría que conocer cómo es de alta o de baja esa puntuación en relación con otros sujetos y hacia qué valores tienden las puntua- ciones de la población. Las puntuaciones tipificadas permiten algunas de esas comparaciones. 36 Principios de Psicometría Se llama puntuación tipificada z de una puntuación X a la que se obtiene mediante la relación: o bien Las puntuaciones tipificadas o puntuaciones estándar indican, por un lado, cuánto se desvían de la media µ de la población (o de la de la muestra), usando la desviación típica como unidad de medida de esas diferencias. Las puntuaciones estandarizadas permiten hacer algunas comparaciones. Por ejemplo, MC tiene 32 puntos en un test con µ = 30 y σ2 = 4 y JL y JM obtienen 42 puntos y 33 respectivamente en otro test que mide el mismo rasgo y cuya media y varianza son µ = 36 y σ2 = 9. ¿Se diferencian esos tres sujetos en sus niveles en el rasgo? Las puntuaciones directas de JL y JM son comparables en algún sentido, pues se obtienen con el mismo test. Para compararlas con las de MC se obtienen las correspondientes puntuaciones tipificadas de los tres suje- tos, que son: Esas puntuaciones z, en las que incluso una es negativa, se interpretarían mejor en ciertos contextos si vinieran dadas en valores enteros y positivos. Para ello se podría hacer una transformación a otras puntuaciones también tipificadas, pero con media y desviación típica determinadas. o sea, Si para la escala de puntuaciones transformadas se elige que la media sea 100 y la desviación típica 10, entonces las puntuaciones de MC, JL y de JM serían 110, 120 y 90, respectivamente. A estas puntuaciones y a su correspondiente escala se les suele llamar puntua- ciones estandarizadas derivadas. € z T T T = − σ € T z TT= +σ € z3 33 36 3 1= − = − € z2 42 36 3 2= − = € z1 32 30 2 1= − = € z X = −µ σ € z X X s = − 37Capítulo 1. Psicometría y teoría de tests: Introducción Por lo tanto, una vez ordenadas las puntuaciones, la escala primaria estaría constituida por las puntuaciones directas, que hay que transformar en otras para hacerlas comparables. Las escalas y las normas La escala primaria de un test estaría constituida por todas las puntuaciones X ordenadas por su cuantía. Si calculadas la media µ y la desviación típica σ se res- ta µ y esas diferencias se dividen por σ, entonces se tendrá una nueva escala, for- mada por puntuaciones z, con origen en µ y cuya unidad de medida es σ. El paso de esta escala a una escala estandarizada con media cero y desviación típica uno es muy simple, ya que como se ha indicado antes, la puntuación z se puede asi- milar a la de otra T, cuya distribución tenga media cero y desviación típica uno. El paso de puntuaciones directas a puntuaciones z (las estamos llamando típicas o estandarizadas) se ha realizado mediante una transformación lineal y poste- riormente se ha pasado a puntuaciones estandarizadas derivadas también median- te otra transformación lineal. Luego mediante transformaciones lineales se pue- den transformar las puntuaciones directas en estandarizadas y pasar de una escala estandarizada a otra. El paso de puntuaciones estandarizadas a normalizadas (que las puntuacio- nes z sigan distribuciones normales) no es posible hacerlo con una transfor- mación lineal, además de que no es adecuado cuando la distribución de las pun- tuaciones se desvíe mucho de la normalidad, como se ha visto en los gráficos del Apartado 1.5. Desviaciones de la normalidad se dan en numerosos casos y es mucho más probable encontrarlas cuando se trata con muestras pequeñas. Entre las escalas que no resisten las transformaciones lineales están las escalas percentílicas (estas escalas y algunas escalas normalizadas más usuales se dan en el Apartado 15.6). A las transformaciones de las puntuaciones que mantienen su orden relativo y su significado, se les llama transformaciones admisibles. El establecimiento de esas puntuaciones y lo que ello conlleva en la orde- nación de los sujetos, en relación con su nivel en el rasgo que se evalúa, dan origen a las normas del test, que son las que indican la posición del sujeto en el rasgo. Si el test se ha construido en el contexto de los modelos lineales, mode- los que trataremos en los siguientes capítulos, esa posición se interpreta en rela- 38 Principios de Psicometría ción con la distribución de las puntuaciones en el grupo o población a la que pertenece (grupo normativo). El nivel del sujeto en el rasgo (la puntuación ver- dadera) se infiere y se interpreta en relación con esos parámetros y con el gra- do de precisión estimado para el test. Si el test se ha construido bajo los supues- tos de modelos no lineales (que trataremos como modelos TRI) la interpretación de la posición del sujeto en el rasgo (su nivel en el rasgo), se hace de acuerdo con su respuesta y con las características del ítem (o de los ítems). Estas carac- terísticas las recoge una curva de probabilidad que proporciona información de cómo se relaciona la puntuación del sujeto con los valores del rasgo. La esti- mación y la interpretación de los niveles de un sujeto en el rasgo no se hace depender en estos modelos de cuántos sujetos del grupo han respondido correc- tamente a ese ítem o cuáles han sido sus puntuaciones en el test, sino que sólo va a depender de la forma de la curva que caracteriza a ese ítem y decuál es la posición de esa curva (indica la dificultad de ítem) en relación con la escala de valores del rasgo. m1.7. Teorías y modelosm Desde que Galton en el siglo XIX tuvo la idea de medir las diferencias individua- les de las aptitudes mentales por métodos puramente objetivos, son muchos los trabajos y procedimientos que se han desarrollado con el fin de construir instru- mentos que sean adecuados para realizar tales mediciones. En esos desarrollos han intervenido figuras destacadas como algunas de las anteriormente citadas, o como Thomson, Thurstone, Hurt, Vernon, Jöreskog, etc., pero son las aporta- ciones de Galton, Pearson, Binet y Spearman las que constituyeron los pilares básicos en los que durante más de medio siglo se han sustentado las teorías de los tests psicométricos: – El modelo lineal de Spearman. – La tipificación o normalización de las puntuaciones. – La evaluación de las intercorrelaciones. Durante años, y aún hoy en día, se construyen instrumentos para la medida de las diferencias individuales utilizando los procedimientos que han surgido tomando como base teórica el modelo lineal de Spearman, propuesto en 1904 y des- 39Capítulo 1. Psicometría y teoría de tests: Introducción de el que se ha generado la denominada teoría clásica de los tests (TCT). Una de las principales características de los tests construidos en el contexto de esta teoría es que las puntuaciones que obtiene un sujeto en el test se supone que están linealmente relacionadas con las que se consideran que son sus puntuaciones verdaderas, y hay que interpretarlas en relación a aquellas que se obtuvieron en el grupo normativo, que es el grupo que constituyó la muestra con la que se deter- minaron las características psicométricas del test y con la que se construyó la escala. Esta necesidad de referenciar la puntuación individual a la del grupo nor- mativo no deja de ser una limitación, además de que puede producir importantes distorsiones en la interpretación de las puntuaciones, si los sujetos a los que se les administra el test no pertenecen a la población de la que la muestra era repre- sentativa. Una de las limitaciones del modelo de Spearman es que en su formulación se considera que una única variable error resume todos los errores aleatorios provenientes de distintas fuentes. Sin embargo, en cualquier modelo es funda- mental identificar y separar los errores de medida, pues unos estarán directa- mente relacionados con el procedimiento de medición, otros con las condicio- 40 Principios de Psicometría Las limitaciones arriba reseñadas propias de estos instrumentos de medida no justifican la fuerte corriente crítica que en los años cincuenta del siglo XX se produjo, especialmente en EEUU, contra la aplicación de los tests, acu- sándolos de toda clase de inexactitudes, arbitrariedades y sesgos provoca- dores de la toma de decisiones socialmente discriminadoras e injustas. La teoría y la práctica han demostrado que las deficiencias que a priori parecen ser propias de los instrumentos que tratan de medir capacidades humanas complejas a través de simples manifestaciones observables, son general- mente conocidas y controlables y que, por lo tanto, basta considerarlas para hacer un uso correcto del test. Asimismo se deberán tener en cuenta esas limitaciones al hacer la interpretación de las puntuaciones, puesto que es obvio que en cualquier proceso de medición, al hacer la interpretación de la medida, hay que tomar también en consideración las características del ins- trumento con el que se ha realizado esa medida. Cuadro 1.3 nes ambientales, etc. Por ello, se han propuesto muchos modelos identificando diferentes componentes del error, como el denominado modelo platónico, pero un modelo que persiste y que permite un buen tratamiento de los datos es el que se conoce bajo la denominación de la teoría de la generalizabilidad (Cronbach et al., 1963; Gleser et al., 1965; Cronbach et al., 1972). En este modelo se reconoce que cada puntuación observada es una entre las muchas posibles, que todas están afectadas por múltiples fuentes de error y que, por lo tanto, el interés y la utili- dad de esas puntuaciones está en el grado en que sean generalizables, con las debidas garantías, a una multiplicidad de situaciones, lo que los propios autores denominan universo de generalización. En estos modelos la cuestión clave no es pre- guntarse sólo por la fiabilidad del test, sino por la precisión con la que se pue- de realizar la generalización. El modelo estadístico que conecta la teoría de la generalizabilidad con el análisis de los datos es el análisis de la varianza, que sir- ve para identificar y evaluar las principales fuentes de error que afectan a las medidas. Otro modelo que se puede considerar como una extensión de la TCT es el modelo factorial simple. Spearman, al mismo tiempo que propone el modelo lineal anteriormente citado (Spearman, 1904a), publica otro artículo (Spear- man, 1904b) mostrando cómo se puede reconocer si ese test mide un atribu- to común, a partir de los datos que aporta el test. Al igual que décadas después y tras múltiples desarrollos el primer artículo da origen a la TCT, este otro con- duce al establecimiento del denominado modelo factorial simple, que en un principio se utilizó para comprobar la teoría sobre la estructura factorial de la inteligencia y que, posteriormente, se ha utilizado y se viene utilizando para detectar factores fundamentales en los procesos de cognición, factores de la personalidad, etc. El alejamiento del modelo de Spearman da lugar al inicio de una nueva con- cepción de la teoría de los tests donde el foco de atención se centra en la res- puesta individualizada al ítem, más que en cómo los sujetos de un determina- do grupo responden al test. Los modelos se expresan en función de las características del ítem, en lugar de en las del test. Por lo tanto, estos modelos están basados en la independencia entre los ítems y en las distribuciones pro- babilísticas de cada uno de ellos, a las que se les llama curva característica del ítem, que son las que describen el comportamiento de las puntuaciones en los ítems y sus relaciones con las medidas del rasgo. Un tema crucial en estos modelos es la búsqueda de estadísticos suficientes para las estimaciones de sus pará- 41Capítulo 1. Psicometría y teoría de tests: Introducción metros, y esta cuestión es el eje fundamental sobre el que giran muchas de estas aproximaciones. Esta búsqueda de alternativas tratando de evitar las limita- ciones del modelo de Spearman genera modelos que se desarrollan bajo la denominación de la teoría del rasgo latente, denominación que posteriormen- te fue sustituida en parte por la de teoría de la respuesta al ítem (TRI). Casi todos los aspectos, modelos y teorías del rasgo latente se contemplan y son objeto de posteriores desarrollos bajo la TRI. Esta última denominación se ajusta más fielmente a los conceptos ya citados que subyacen en dicha teoría y a los métodos de construcción de tests basados en ella, en cuanto a que en estos modelos el elemento central es el ítem, caracterizado por su forma pro- babilística y por las características diferenciales de las que lo dotan sus pará- metros, con independencia de las características de las muestras particulares sobre las que que se aplican. No obstante, la consideración de la latencia del ras- go podría considerarse común a todos los métodos y teorías de los tests, pues- to que son los tests psicométricos y otros instrumentos de medición estanda- rizados los que vienen a resolver el problema de la medición de esos rasgos inobservables (latentes), infiriéndose esas medidas desde las de sus manifesta- ciones observables. Las propuestas de modelos no lineales (TRI y de clase latente) se desarrollan a comienzos de los años sesenta del siglo XX, aunque se gestan con anteriori- dad, y generan nuevas formas de concebir los tests, de abordar el análisis de sus elementos y de inferir las medidas de los inobservables en los que se está inte- resado.Estas teorías y procedimientos no sustituyen ni destierran a los ante- riores, sino que ambos conviven. Por ejemplo, cuando hay que indicar las pro- piedades psicométricas de un test o cuestionario, se suele dar su coeficiente alfa de consistencia interna, casi siempre calculado con métodos derivados de las teorías y modelos que hemos dado en denominar clásicos. En cuanto a la varia- ble de interés, en la teoría clásica, al inobservable que se quiere evaluar se le lla- ma puntuación verdadera (V) y en los desarrollos posteriores, a estas capacida- des inobservables se las suele denominar genéricamente aptitud o rasgos (θ). En los modelos no lineales se pueden incluir modelos basados en las distribu- ciones probabilísticas como la distribución binomial de donde se deriva el mode- lo de error binomial, o en distribuciones de Poisson, que dieron lugar a los modelos poissonianos que usa Rasch, o en la distribución normal acumulada, con la que se generan los modelos de ojiva normal. Sin embargo, han sido las distribuciones logís- ticas, y en algunos casos la normal, las que se consideran de mayor interés y han 42 Principios de Psicometría recibido y siguen recibiendo mayor atención, siendo sus modelos objeto de un desarrollo espectacular. Entre los que originalmente fueron más tratados y mejor conocidos se encuentran los modelos logísticos de dos, tres o cuatro parámetros, pero es el modelo logístico de dos parámetros y sobre todo el denominado mode- lo de Rasch, que se puede asimilar a un modelo logístico de un parámetro, los modelos que más se han desarrollado tanto teóricamente como en las aplica- ciones y de los que se han derivado muchos otros modelos. Actualmente muchos de estos modelos y procedimientos para generar tests a partir de ellos se han clasificado dentro de la denominación de modelos de la teoría de la respuesta al ítem (TRI). Una de las características de los modelos de la TRI, y la más destacada por todos los autores, porque establece una de las más claras diferencias con la teo- ría clásica, es que la interpretación de las puntuaciones de los sujetos no se reali- za en relación con las puntuaciones del grupo normativo, sino que la estimación del nivel del rasgo que pretende medir el test está determinada por la forma mate- mática y la posición sobre el rasgo (la dificultad) que tenga la curva característica de cada ítem, expresada en forma probabilística, pues es la que relaciona la proba- bilidad de éxito en un ítem con la aptitud. 43Capítulo 1. Psicometría y teoría de tests: Introducción Los antecedentes de la TRI se pueden situar en las primeras décadas del siglo XX, con los trabajos de Binet y Simon (1911) y los de Thurstone (1925) quien retoma la idea de los anteriores, escalando los ítems de acuerdo con la edad. En las décadas posteriores, Richardson (1936), Lawley (1943), Ferguson (1942) y Tucker (1946) son principalmente quienes establecen conexiones formales entre la TCT y la TRI, siendo a este último a quien se le debe la acuñación del término curva característica del ítem. En estas contribuciones se basan otras posteriores, como las de Lord (Lord, 1952, 1953a, 1953b; Lord y Novick, 1968). La figura clave en el desarrollo de estos modelos es Rasch, que en 1960 presenta un conjunto de modelos, entre los que el conocido modelo de Rasch es el que hasta el momento ha sido el más relevante en la TRI. Trabajos tan conocidos como los de Wright y Stone (1979) o los de Fischer y Molenaar (1995) tienen como base el modelo de Rasch. Cuadro 1.4 No dedicaremos en este capítulo mayor atención a los modelos TRI ni a sus referencias, ya que se tratan en otros capítulos de esta obra. Sin embargo, con- viene clarificar aquí algunos conceptos sobre el análisis de estructura latente, pues algunos de los modelos que se incluyen en esa teoría no se tratan en esta obra, al igual que no podemos hacerlo con muchos otros modelos derivados del modelo de Rasch, o con modelos de respuesta politómica o los modelos multidimensionales, que son y se consideran modelos TRI, aunque los mode- los clásicos TRI sólo tratan con modelos unidimensionales y con respuestas dicotómicas. En algunas clasificaciones, el análisis de estructura latente comprende un con- junto de modelos que abarca a todos los de la TRI y a los denominados de cla- se latente. La distinción entre ambos grupos de modelos se hace en relación con la distribución del rasgo (θ) en la población de sujetos, según se considere con- tinua o discreta. En los modelos TRI se asume la continuidad del rasgo, supo- niéndose que θ es discreta en los modelos de clase latente. Por otra parte, aun admi- tiendo la continuidad, el rasgo θ puede ser unidimensional, bidimensional o multidimensional y los ítems pueden ser dicotómicos o politómicos, aunque los modelos más desarrollados son los unidimensionales con ítems dicotómicos. La familia de modelos de Rasch, los logísticos de uno, dos o tres parámetros, el mode- lo de respuesta graduada de Samejima, los modelos de crédito parcial y muchos otros for- man parte de los modelos TRI, y los modelos de clase latente, se clasifican según el número de clases que contienen, distinguiéndose a su vez unos modelos de otros, dentro del mismo tipo de clase, por las restricciones que se impongan a sus parámetros. La denominación de latente, como se ha indicado anteriormente, se dese- chó en los modelos anteriormente mencionados que se han encuadrado den- tro de la denominación TRI. Sin embargo, se consideran en psicometría otro grupo de modelos a los que se les ha dado la denominación de modelos de varia- bles latentes (LVM, usando sus siglas en inglés). Estos modelos incluyen tanto variables no observadas (latentes) como variables observadas (manifiestas) y el modelo expresa las relaciones matemático-probabilísticas entre las variables latentes y las observadas. El estudio de estos modelos es de gran interés en muchos campos y muy especialmente en sociología, economía, psicología y, en general, en todos aquellos ámbitos en los que el objeto de estudio puede con- siderarse como un conjunto o red de relaciones que constituyen un construc- to hipotético, cuya medición no puede hacerse directamente, sino a través de 44 Principios de Psicometría esas relaciones. En una obra dirigida a quienes investigan en ciencias sociales, indicando cómo deben hacer los análisis e interpretar datos multivariantes (Bartholomew et al., 2002), se describen bastante minuciosamente esas rela- ciones para algunos constructos como la inteligencia, o en la medición de acti- tudes. Un tema básico en estos modelos es conocer la naturaleza de la escala de medición que se va a considerar, tanto para las variables latentes como para las manifiestas. Según sea la métrica que se adopte en una u otra escala, se ten- drán diferentes modelos. La más simple de esas clasificaciones es la que dan Knott y Bartholomew (1999), que se resume en la Tabla 1.2. En esa tabla, se denominan variables métricas, a las que son medibles, es decir, aquellas que pueden tomar valores numéricos, ya sea de forma aislada (variables discretas) o continua. Cuando las variables categóricas son las manifiestas, los indicado- res que se dan a las categorías son de tipo binario u ordinal y, por lo tanto, las distribuciones condicionales para los modelos LTM y LCM son distribuciones binomiales o multinomiales. Aun cuando la descripción de los modelos LVM ha sido muy somera, nos hemos permitido incluirla, pues éste será probablemente el único lugar de la obra donde se haga mención a estos modelos. Por el contrario, el modelo lineal (TCT) se tratará ampliamente en extensión y profundidad en diversos capítulos y de los modelos TRI se darán los conceptos básicos y se estudiarán con suficiente deta- lle los modelos unidimensionales más relevantes. Tabla 1.2. Modelos LVM según la métrica de las variables latentes y de las observadas. Variables latentes Variables observadas Métricas Categóricas Métricas Análisis Factorial Modelos de Rasgo (AF) Latente (LTM) Categóricas
Compartir