Logo Studenta

Principios de psicometría - Carmen Santisteban Requena - Carmen Ramirez

¡Este material tiene más páginas!

Vista previa del material en texto

PRINCIPIOS DE PSICOMETRÍA
Consulte nuestra página web: wwwwww..ssiinntteessiiss..ccoomm
En ella encontrará el catálogo completo y comentado
PRINCIPIOS DE PSICOMETRÍA
CARMEN SANTISTEBAN REQUENA
EDITORIAL
SINTESIS
Vallehermoso, 34
28015 MADRID
Telf: (91) 593 20 98
Fax: (91) 445 86 96
Diseño y óleo de cubierta: Verónica Rubio
Reservados todos los derechos. Está prohibido, bajo las sanciones 
penales y el resarcimiento civil previstos en las leyes, reproducir, registrar
o transmitir esta publicación, íntegra o parcialmente,
por cualquier sistema de recuperación y por cualquier medio, 
sea mecánico, electrónico, magnético, electroóptico, por fotocopia
o por cualquier otro, sin la autorización previa por escrito 
de Editorial Síntesis, S. A.
© Carmen Santisteban Requena
© EDITORIAL SÍNTESIS, S. A.
Vallehermoso, 34. 28015 Madrid
Teléfono 91 593 20 98
http://www.sintesis.com
ISBN: 978-84-975663-0-8
Depósito Legal: M. 11.211-2009
Impreso en España - Printed in Spain
Prólogo 13
1. Psicometría y teoría de tests: Introducción 19
La medición de los atributos psicológicos y los instrumentos 
que la hacen posible
1.1. Cuantificación y experimentación: Los inicios de la psicología 
como ciencia cuantitativa 19
1.2. Los fundamentos de la psicometría 21
1.3. La medición de las aptitudes mentales 22
Algunos antecedentes 24
1.4. Tipos de tests 27
1.5. Variabilidad de las puntuaciones 28
Distribución de las puntuaciones 30
1.6. La interpretación de las puntuaciones 35
Las puntuaciones tipificadas (puntuaciones z) 36
Las escalas y las normas 38
1.7. Teorías y modelos 39
1.8. La construcción del test 46
La redacción de los ítems 48
La administración de los tests 48
Puntos clave 50
Actividades 51
2. Teoría clásica de los tests 53
El modelo lineal de Spearman
2.1. Formalización del modelo de Spearman 54
Hipótesis 54
Índice
2.2. Relaciones e índices que se deducen de las hipótesis 55
2.3. Condiciones de paralelismo entre medidas: Consecuencias 60
Medidas paralelas 60
Medidas tau-equivalentes 64
Comprobación del paralelismo 65
Consecuencias prácticas 66
Puntos clave 73
Actividades 73
3. Fiabilidad 75
Precisión de las medidas
3.1. El concepto de fiabilidad 76
3.2. Ecuaciones para definir y calcular la fiabilidad 78
Definiciones 78
Ecuación para un test compuesto por subtests 80
Valores e interpretación 81
3.3. Formas usuales de generar medidas repetidas 83
Test-retest 84
Formas paralelas 84
División en dos partes 85
3.4. Cálculo práctico de los coeficientes e índices de fiabilidad 86
3.5. Otras ecuaciones para el cálculo de la fiabilidad 90
Ecuación de Rulon 91
Ecuación de Flanagan y Guttman 94
Puntos clave 95
Actividades 96
4. Fiabilidad 99
Variabilidad y longitud de las pruebas
4.1. Fiabilidad y variabilidad de las puntuaciones 99
4.2. Fiabilidad y longitud de las pruebas 103
Ecuación de Spearman-Brown 104
Los valores de k 108
Variaciones de la fiabilidad con la longitud 108
Cambios en la longitud para valores prefijados de la fiabilidad 111
4.3. Relaciones entre fiabilidad, longitud y varianza 116
Puntos clave 119
Actividades 119
6 Principios de Psicometría
5. Fiabilidad 121
Consistencia interna: El coeficiente α
5.1. El coeficiente αα y las ecuaciones de Kuder-Richardson 122
Coeficiente α 123
Ecuaciones de Kuder-Richardson 123
5.2. El coeficiente αα: Cota inferior de la fiabilidad en tests compuestos 125
5.3. Casos particulares del coeficiente αα 130
Ecuaciones de Rulon y de Flanagan y Guttman 130
Ecuación de Hoyt 131
5.4. El coeficiente ββ 136
5.5. Cálculo de αα con técnicas de análisis de varianza 138
5.6. Coeficientes derivados del análisis factorial 141
El coeficiente Ω 141
El coeficiente θ 143
5.7. Variaciones de la fiabilidad 144
Cuantía 144
La fórmula de cálculo 145
Aplicación de la ecuación de Spearman-Brown 146
Puntos clave 149
Actividades 150
6. Inferencias 153
Estimación y contrastes de significación
6.1. Predicciones de la puntuación verdadera 153
6.2. Errores de medida, de estimación y de predicción 156
Tipos de errores 157
Relación entre los errores 159
6.3. Intervalos de confianza para la puntuación verdadera 159
6.4. Contrastes de medias 164
Diferencias entre la media de una muestra y la de la población 165
Diferencia de medias en muestras independientes 167
Diferencia de medias en muestras relacionadas 168
6.5. Significación e inferencias de los coeficientes de fiabilidad 173
Contrastes de coeficientes de correlación 174
Contrastes para coeficientes α 176
Puntos clave 179
Actividades 180
7Índice
7. Teoría de la generalizabilidad 183
¿Cómo afectan a las medidas distintas facetas y fuentes de error?
7.1. Conceptos básicos y terminología 184
7.2. Estudios G 189
Diseño de una faceta 189
Diseño de dos facetas 193
7.3. Estudios D 196
Coeficientes de generalizabilidad y toma de decisiones 197
Diseño de una faceta 198
Diseño de dos facetas 201
7.4. Diseños anidados versus diseños cruzados 204
Puntos clave 205
Actividades 206
8. La validez 209
¿Qué es la validez?
8.1. El concepto de validez 209
8.2. Tipos de validez 211
8.3. Validez en relación con el contenido 216
Validez de contenido versus validez aparente 218
8.4. Asociaciones con otras variables: Evidencias de validez convergente 
y discriminante 218
8.5. Validez en los procesos de respuesta 221
8.6. Validez en relación con el criterio 222
8.7. Validez de la estructura interna del test 223
8.8. Validez de constructo 224
Puntos clave 227
Actividades 227
9. La validez 229
Evaluación de las evidencias de validez
9.1. Validación del contenido 230
9.2. El coeficiente de validez 231
Validez y fiabilidad 232
Validez y longitud 236
Acotación del valor del coeficiente de validez 239
Coeficientes derivados del coeficiente de validez 240
Validez y representación muestral 243
8 Principios de Psicometría
9.3. Validez relativa al criterio 247
Pronóstico mediante regresión lineal simple 247
Pronósticos mediante una batería de predictores 250
Selección de las variables predictoras 252
9.4. Evaluación de la validez convergente y discriminante 253
Red nomológica y correlaciones 255
El método de Westen y Rosenthal 256
Matrices multirrasgo-multimétodo 257
9.5. Validez de la estructura interna del test 260
Puntos clave 264
Actividades 265
10. La validez 267
Coeficiente de validez y toma de decisiones
10.1. Detección, clasificación y diagnóstico 267
Sensibilidad y especificidad 270
Curvas ROC 273
10.2. Interpretaciones y uso práctico del coeficiente de validez 276
BESD 276
Tablas de Taylor-Russell 279
10.3. Análisis de la utilidad 284
Puntos clave 290
Actividades 291
11. Teoría de la respuesta al ítem 293
Aspectos generales
11.1. Orígenes y objetivos de la teoría de la respuesta al ítem 294
11.2. Aspectos generales 297
Dimensionalidad del espacio del rasgo 297
Independencia local 299
La curva característica del ítem (CCI) 306
Regresión y curvas características 307
11.3. La puntuación verdadera y la escala de aptitud 310
Puntos clave 312
Actividades 313
9Índice
12. Teoría de la respuesta al ítem 315
Modelos
12.1. Modelos ojiva normal 316
Tipos de modelos ojiva normal 317
12.2. Significado de los parámetros ai y bi 319
12.3. Modelos logísticos 325
Modelo logístico de dos parámetros 327
Modelo logístico de tres parámetros 331
Modelo logístico de cuatro parámetros 333
12.4. El modelo de Rasch 335
12.5. Otros modelos 339
12.6. Estimación de los parámetros de los modelos 341
El método de máxima verosimilitud 343
Métodos condicionales y no condicionales 346
Puntos clave 350
Actividades 351
13. Teoría de la respuesta al ítem 353
Funciones de información y aplicaciones
13.1. Funciones de información 354
Función de información del ítem 354
Función de información del test 357
13.2. Las funciones de información en diferentes modelos 358
13.3. Curvas de información 361
Ponderaciones 363
Aplicabilidad 367
Bancos de ítems 368
Tests adaptativos computarizados 368
13.4. Eficiencia relativa 369
13.5. La métrica y los valores de las funciones de información 372
13.6.Resumen de los procedimientos 373
Puntos clave 374
Actividades 375
14. El sesgo en los tests 377
Sesgos y comportamiento diferencial de los ítems
14.1. El sesgo en los tests 378
14.2. Detección y estimación de sesgo en la evaluación del constructo 379
10 Principios de Psicometría
Consistencia interna 380
Índices de discriminación 380
Rango de dificultad 380
Análisis factorial 381
Funcionamiento diferencial de los ítems 382
14.2. El método Mantel-Haenszel para estimar el DIF 384
Significación estadística de los valores αMH 386
14.3. Estimación del DIF haciendo uso de las CCI 392
Puntos clave 398
Actividades 399
15. Medición y psicometría 401
Medición, escalas e interpretación de las puntuaciones
15.1. Psicología, psicometría y medición 402
15.2. Métrica y espacios métricos 404
15.3. Medición, estructuras, representación y escalas 405
El problema de la representación 406
El problema de la unicidad 407
El problema del significado 408
15.4. Medición directa e indirecta 409
15.5. Tipos de escalas 411
Escalas ordinales 413
Escalas de intervalo y de razón 413
Transformaciones admisibles 415
15.6. Interpretación de las puntuaciones: Escalas y normas 417
Escalas estandarizadas 419
Normas centiles 419
Escalas de puntuaciones normalizadas 421
Equiparación de puntuaciones 423
La escala de aptitud θ en la TRI 426
Puntos clave 427
Actividades 428
Bibliografía 431
Índice de contenidos 445
11Índice
Prólogo
Los avances científicos y tecnológicos están cimentados en la cuantificación y en la
experimentación, estableciendo la diferenciación entre ciencia y creencia. Esta dife-
renciación no es específica de las ciencias sociales y de la conducta, al enfrentarse
con el reto de hacer ciencia en su intento de comprender y predecir la conducta
humana, sino que abarca todos los campos del saber. La contraposición entre Astro-
nomía y Astrología o entre Química y Alquimia son sólo dos ejemplos clásicos del
divorcio entre ciencias y creencias, aunque estas últimas puedan incluir un gran baga-
je de conocimientos acumulados durante siglos y se aborden con el mayor rigor filo-
sófico, con la máxima seriedad y buenas intenciones. La aportación indiscutible del
experimento, debidamente cuantificado, para la comprobación de teorías y de hipó-
tesis generadas por el desarrollo científico, es la que ha convertido a la Psicología en
una de las Ciencias con un desarrollo más espectacular durante el siglo XX, siendo
la Psicometría la parte de la Psicología que sirve de soporte a esta cuantificación.
Los conceptos métricos se introducen en ciencia para que, aprehendiendo el
significado de algunas propiedades de los elementos, sujetos y objetos, poder estu-
diarlos de forma sistematizada y, a ser posible, de una forma generalizada. La
medición es el núcleo de la ciencia y de sus aplicaciones, incluyendo a las ciencias
del comportamiento. Los estudios que se abordan desde la psicología, la educa-
ción u otras ciencias sociales y políticas se basan en la posibilidad de obtener 
mediciones adecuadas de los atributos psicológicos y conductuales de los sujetos. 
Este libro trata de cómo obtener mediciones utilizando tests psicológicos
como instrumentos de medida, evaluar la calidad de esas medidas y su aplicabili-
dad, que es el objetivo de la Psicometría. La exposición de estos temas se hace
desde el supuesto de que el lector pueda no tener conocimientos previos de esta
materia, por lo que los contenidos van fluyendo, desde el concepto a la técnica,
de forma monótona hasta alcanzar un nivel en el que, si se quiere ir más allá, no
se requieran nuevos conceptos, sino el uso de métodos y técnicas más avanzadas
que permitan abordar muchos de los temas que ya se apuntan en el texto. El libro
está dirigido a universitarios, tanto de grado como de posgrado, y a los profe-
sionales de las ciencias de la conducta (psicología, educación, medicina, sociolo-
gía, etc.), quienes pueden encontrar en este texto los fundamentos y la lógica de
muchos de los procedimientos que utilizan en la práctica. Este libro no sustitu-
ye, ni es su objetivo, a aquellos textos que se centran en aspectos puramente téc-
nicos en la construcción de tests, sin embargo, puede servir de ayuda y ser un
buen complemento de esos otros. Para hacer su lectura comprensiva al mayor
número de lectores posible, a veces se ponen ejemplos y se clarifican conceptos
o expresiones provenientes de otros contextos. También se aclara el significado
de algunos términos que son propios del ámbito de la estadística.
Al ser un libro de fundamentos, se ha puesto el acento en los aspectos más
básicos y conceptuales, aunque tratando en lo posible de dar una visión aplicada
de cada uno de ellos, vinculando esos conceptos con aspectos técnicos y aplica-
ciones. Con esta finalidad en este libro se incluyen ejercicios, tablas, gráficos y ejem-
plos tomados de la literatura, que ilustran los métodos y los procedimientos. Para
conseguir una mejor y más inmediata comprensión de dichos fundamentos, todos
los ejercicios y ejemplos se han simplificado de tal manera que el lector pueda repli-
carlos con ayuda de una simple calculadora manual, sin que tenga necesariamen-
te que acudir (aunque lógicamente puede hacerlo) a ninguno de los múltiples pro-
gramas informáticos que hay disponibles. Por otra parte, un texto de fundamentos
debe incluir deducciones formales que justifiquen el porqué de muchas de las afir-
maciones y ecuaciones que se proponen. Este libro incluye deducciones cuyo gra-
do de complejidad no exceda en exceso el propio de esta obra. Aun así, esos con-
tenidos se insertan en el texto generalmente en forma de cuadros cuya lectura
puede omitir el lector, al menos en una primera fase, sin que ello sea óbice para
seguir adecuadamente el desarrollo del tema que se esté tratando, procurando en
todo momento hacerlo asequible al tipo de lector al que va destinado. 
La organización de los contenidos de los capítulos se hace procurando que el
lector vaya adentrándose en ellos de forma paulatina y que cada uno de los cono-
cimientos que adquiere demande alguno o algunos de los que se exponen a con-
tinuación. Por ello, al finalizar cada capítulo se hace una breve recopilación de
aquellos puntos o conceptos (Puntos clave) que el lector debe revisar antes 
de pasar al siguiente capítulo. El primer capítulo se dedica a introducir al lector
14 Principios de Psicometría
en el significado de la medición psicológica, de sus orígenes y desarrollo, inci-
diendo en la importancia y el significado de las puntuaciones que se obtienen uti-
lizando los tests, haciendo mención expresa a los modelos psicométricos. Se tra-
ta pues de una visión general que de alguna manera anticipa cuáles son los temas
que se van a tratar posteriormente. Se recomienda, especialmente a aquellos lec-
tores con un conocimiento previo de algunos aspectos de la Psicometría, que tras
este capítulo primero aborden la lectura del capítulo 15. Probablemente habrá
partes de dicho capítulo 15 que les resulten demasiado complejas o difíciles de
entender, pero pueden pasar muy ligeramente por todo el capítulo y seguir con
el normal ordenamiento del libro para reemprender su lectura cuando hayan asi-
milado los contenidos del resto de capítulos. 
En el capítulo 2 se presenta el modelo lineal que ha dado origen a la teoría clá-
sica de los tests, dedicándose los capítulos 3 al 5 a tratar el concepto de fiabilidad,
que es un concepto central en la teoría clásica, su estimación y su importancia en
la construcción, desarrollo y aplicaciones de los tests. En esos capítulos se insis-
te en la diferenciación entre diversos tipos de fiabilidad, en los conceptos y en los
procedimientos, dedicando en exclusiva el capítulo 5 al tratamiento de la consis-
tencia interna. La comprobación de la significación de los indicadores de la fia-
bilidad, así como la de las estimaciones de las puntuaciones, se pone a prueba
mediante los procedimientos de inferencia estadística, y es a lo que se dedica el
capítulo 6. Una extensión delmodelo clásico que intenta superar las limitaciones
que el contexto clásico impone a la fiabilidad, aunque manteniéndose en el seno
de los modelos lineales, se presenta en el capítulo 7, donde se exponen los con-
ceptos básicos de la teoría de la generalizabilidad. Se incluyen en este capítulo
explicaciones y ejemplos de los métodos y de las técnicas más básicas que se uti-
lizan en esta teoría para realizar estudios de generalización y de decisión.
Los capítulos 8, 9 y 10 se dedican al tratamiento de la validez. Se examina el
concepto de validez, sus diferentes acepciones y clasificaciones en psicometría,
posicionándonos en la visión más actualizada que reflejan las Normas de 1999
(AERA, APA & NCME, 1999, las últimas publicadas cuando este libro se impri-
me). Se examinan los diferentes métodos para evaluar la validez y su utilidad en
el pronóstico y en el diagnóstico cuando para ello se utilizan tests. A lo largo de
esos capítulos se ha tratado de poner el énfasis en el significado de la validez en
cuanto a que es crucial que la posean los tests, desde su gestación hasta la inter-
pretación de las puntuaciones que con ellos se obtienen, puesto que la validez es
una condición imprescindible para poder establecer conclusiones.
15Prólogo
En los capítulos 11 al 13 se presenta la teoría de la respuesta al ítem. Los con-
ceptos básicos se abordan en el capítulo 11, dedicando el 12 al tratamiento de los
modelos concretos (ojiva normal, logísticos y el modelo de Rasch). Se explicita la
forma y el significado de los modelos y de sus parámetros y cómo realizar la esti-
mación, tanto de esos parámetros como del rasgo, esto es, del nivel de aptitud del
sujeto que realiza la prueba. El capítulo 13 trata de la evaluación de la informa-
ción que cada ítem aporta al test y la cantidad de información que proporcionan
cada ítem y el test en los diferentes niveles del rasgo. Se introducen las expresio-
nes de las funciones de información para los diferentes modelos, presentando
algunas de sus aplicaciones.
En el capítulo 14 se abordan los problemas de sesgo en los tests y sus cone-
xiones con la validez, ya que la validez de un test implica ausencia de sesgos. Se
presentan algunos métodos para detectar las fuentes y evaluar el sesgo, en los que
se incluyen el estudio del comportamiento diferencial de los ítems. Especial énfa-
sis se pone en advertir que diferentes fuentes de sesgo pueden llevar a la no equi-
dad en la valoración de los sujetos y en las repercusiones personales y sociales que
el uso de tests sesgados puede tener en diversos ámbitos (educativos, empresa-
riales, jurídicos, clínicos, etc.). 
Finalmente, el capítulo 15 se dedica a exponer el significado de la medición
en general y de la medición psicológica en particular, y las propiedades que
deben poseer las representaciones numéricas para que legítimamente estén
representando las magnitudes de aquello que se desea evaluar. Se explicitan esas
propiedades y cómo dan origen a las diferentes escalas. Por último, se presen-
tan algunos tipos de escalas, cómo se puede operar con ellas, las transforma-
ciones que admiten conservando sus propiedades y cómo se interpretan sus
puntuaciones. Muchos lectores se pueden preguntar por qué este capítulo se
ha situado al final, cuando debería ser el primero, pues las bases de la psico-
metría están en la medición. Las razones son que el tema de la medición no es
un tema fácil que se pueda abordar en un primer capítulo, sin más conocimientos
de sus implicaciones. Sin embargo, es más fácilmente comprensible si se pre-
senta después de haber tratado con modelos, con puntuaciones, con transfor-
maciones de las puntuaciones y haber percibido los problemas estructurales
que conlleva la medición. Por ello, se ha recomendado que se aborde la lectu-
ra, aunque sea superficial, de este capítulo antes de empezar con el segundo,
para volver a él cuando el lector lo considere conveniente y retomándolo como
capítulo final. 
16 Principios de Psicometría
Hay que añadir que, además de los ejercicios y de las aclaraciones y deduccio-
nes que se dan en los cuadros que se insertan en los capítulos, se ha considerado
que el conocimiento de los orígenes y de la evolución de aspectos cruciales en psi-
cometría pueden ayudar a comprender mejor los conceptos y ser un incentivo
sobre todo para aquellos lectores para los que ésta es su primera aproximación a
la psicometría, además de que les permite situar en el marco adecuado los cono-
cimientos actuales y contemplar con perspectiva una prospectiva hacia donde con-
ducen los nuevos desarrollos. Para no interrumpir la lectura del tema, esta infor-
mación se da en cuadros a los que el lector puede prestar atención en ese u otro
momento. 
Con la convicción de que la información no es formación y que el conoci-
miento se adquiere con el trabajo personal, se proponen al final de cada capítu-
lo, además del examen de los puntos más importantes tratados en el mismo, un
conjunto de actividades que es recomendable que el lector realice, unas porque
son una aplicación directa de lo expuesto en el capítulo, y otras porque suponen
que el lector dé un paso más con su elaboración personal.
Este libro está dedicado a Ángel Santisteban y Angustias Requena, mis padres,
y a mi esposo Manuel Cortijo.
17Prólogo
Psicometría y teoría de tests:
Introducción
La medición de los atributos psicológicos y
los instrumentos que la hacen posible 1
El término psicometría indica medición en psicología. La psicometría actual
trata de las teorías, modelos, métodos, procedimientos y herramientas que
se utilizan en la medición psicológica, en sentido amplio. En este texto se
exponen las teorías y los modelos para el estudio de las diferencias indivi-
duales. Es conveniente conocer los orígenes de los tests e interpretar el sig-
nificado de las puntuaciones que con ellos se obtienen para entender los
principios básicos de la psicometría. Todo ello sin perder la perspectiva de
que otras materias, entre las que se incluyen la medición psicofísica, son
temas psicométricos que también estudian las diferencias individuales. 
En este capítulo se va a tratar:
ãLos inicios de la psicología como ciencia cuantitativa.
ãLa psicometría y la medición de las aptitudes mentales.
ãLos tipos de tests.
ãLa variabilidad e interpretación de las puntuaciones.
ãQué es un test y una breve reseña de las teorías y de los modelos
que dan soporte a la construcción de los tests psicométricos.
m1.1. Cuantificación y experimentación: Los iniciosm
de la psicología como ciencia cuantitativam
La psicología cuantitativa y experimental se puede decir que empieza con la publi-
cación en 1860 de Elemente der psychophysick por el científico alemán Fechner, un
físico preocupado por estudiar cuestiones psicológicas desde la medición y la
experimentación. La medición y la experimentación son los procedimientos que
comúnmente se consideran válidos en Ciencia, y son los que Fechner adopta
para abordar la investigación de las relaciones entre estímulos y sensaciones,
naciendo entonces la psicofísica como una nueva área científica de estudio. Tras
la publicación de esta obra, y durante varias décadas, la psicofísica fue la princi-
pal rama de la psicología en la que se intentó la cuantificación y el establecimiento
de relaciones entre las magnitudes, hasta que surgió el interés por la medición de
las aptitudes mentales. A principios del siglo XX, la medición de aptitudes y el
desarrollo de técnicas que la hicieran posible, fue cobrando tanta importancia
que colocó a la psicofísica en un segundo plano, dejando de ser el ámbito único
y preponderante de la psicología científica. Hacia mediados del siglo XX se avan-
za en la formalización y aparecen modelos para el estudio de algunos procesos
psicológicos, así como el desarrollo de métodos para su medición. Se puede decir
que la psicometría ha sido una de las mayores contribuciones que la psicología
moderna ha hecho a la sociedad a lo largo del siglo XX.
Es usual que muchos autores clasifiquenlas tareas de cuantificación de las
que se ocupa la psicometría en dos grandes grupos: a) la de las diferencias indi-
viduales, utilizando tests psicológicos como instrumentos de medición, que es
lo que comúnmente se suele identificar con la psicometría y b) la cuantificación
de los estímulos y de los efectos percibidos, o más precisamente, la de las carac-
terísticas de las señales y la de los comportamientos de los sujetos que las reci-
ben, que se suele identificar con la psicofísica, como materia independiente de
la psicometría. No obstante, tanto si se utiliza una cuestión (ítem) planteada en
el contexto de los clásicamente denominados tests (psicometría), como si se uti-
liza un estímulo físico (psicofísica), ambos se podrían considerar como señales
o como estímulos. A esos estímulos son a los que el sujeto debe dar una res-
puesta, que es la que se evalúa en relación con las condiciones experimentales,
entre las que deben destacarse las propias características del estímulo. Además,
consideramos que tampoco está justificado llamar estudios de las diferencias
individuales sólo a aquellos que se derivan de la aplicación de tests psicológicos,
pues también existe un comportamiento diferencial de los sujetos cuando se apli-
can otros métodos como los psicofísicos. Lo que se puede afirmar es que una y
otra rama, unas veces juntas y aliadas, otras veces independientes y aparente-
mente contrapuestas, se han enfrentado al reto de la medición y de la experi-
mentación en el ámbito de la psicología, utilizando para su estudio y para la cons-
trucción de sus modelos métodos estadísticos y matemáticos, casi siempre de
naturaleza probabilística. Ambas disciplinas han generado sus propios procedi-
20 Principios de Psicometría
mientos de medición y han dado normas para la interpretación de las medidas
con la determinación de umbrales, la construcción de escalas de puntuaciones,
el escalamiento de los estímulos, etc. En la actualidad están emergiendo nuevas
teorías y, sobre todo, nuevas técnicas para el estudio del comportamiento huma-
no, abordándolo a través de la medida de la activación cerebral, son las llamadas
técnicas de imagen o de neuroimagen. Las más relevates son la magnetoencefa-
lografía (MEG), la resonancia magnética funcional (fMRI) y la tomografia de
emisión de positrones (PET). Utilizando estas técnicas se están abriendo nue-
vos horizontes en el conocimiento de las actitudes, procesos atencionales, ras-
gos de personalidad, etc., cuyo estudio hasta ahora se había abordado con téc-
nicas tradicionales. Las relaciones estímulo/s-respuesta/s se habían evaluado
fundamentalmente mediante puntuaciones, número de errores, tiempos de reac-
ción y tiempos de respuesta. Estos datos ahora se ven implementados con los
que se obtienen a través de la medición de la activación cerebral. 
m1.2. Los fundamentos de la psicometríam
La psicometría es un campo de conocimiento cuyo nombre, compuesto por psi-
co y metría, la define como la medición de lo psicológico, o la medición en psi-
cología. Esta definición es aparentemente tan amplia e inespecífica que hay auto-
res que mencionan las dos ramas principales cuyo desarrollo se ha impulsado
desde la psicometría, los métodos psicofísicos y los de construcción de tests. Algu-
nos autores también definen la psicometría por sus objetivos, diciendo que sirve
para obtener estimaciones de las características de los sujetos, y otros la conside-
ran sólo en su acepción de herramienta para distintos fines, con lo que en casi
todos los casos se está tomando la parte por el todo. Revisando la definición que
se da en los manuales de diferentes países y en diferentes épocas, lo más frecuente
es que todos los autores mantengan en sus definiciones ese carácter general de
que la psicometría es medición en psicología, pero también muchas veces, bajo
esa amplia generalización hay alguna palabra que la restringe, como llamarla méto-
do, o técnica, aunque la extiendan a todos los aspectos de la psicología. El alto
grado en que la psicometría está al servicio de la medición psicológica y de los
instrumentos adecuados para efectuarla hace olvidar que tiene un bagaje teórico
propio y bien estructurado, que constituye un campo de conocimiento de donde
se nutren sus modelos y se inspiran muchas de sus técnicas.
21Capítulo 1. Psicometría y teoría de tests: Introducción
En la literatura también se dan definiciones de la psicometría por extensión,
enumerando y describiendo los aspectos que la integran, tanto los teóricos como
sus aplicaciones. Por ello, al relacionar sus contenidos, hay autores que los redu-
cen a la teoría de tests y otros que incluyen no sólo las teorías, sino los métodos
estadísticos que se van desarrollado para contrastar y validar los modelos forma-
les que se ajustan a esas teorías, dándoles soporte, permitiendo la experimenta-
ción y, por ende, avances tanto en la teoría como en la práctica psicométrica.
m1.3. La medición de las aptitudes mentalesm
Es una creencia común, y de hecho es de fácil comprobación, que las personas
difieren en sus capacidades o aptitudes mentales. Basta con proponer un pro-
blema que implique algún tipo de razonamiento y muy probablemente, se pre-
sentarán distintas aproximaciones al problema y diferentes formas de solucio-
narlo, aun cuando los sujetos que responden tengan la misma edad, el mismo
nivel cultural, vivan en la misma ciudad, etc. Se supone que las aptitudes men-
tales son características propias de las personas y también se asume que esas
aptitudes son las principales responsables de las diferencias individuales que se
observan en la resolución de diferentes tareas intelectivas, aunque hay que admi-
tir la posible influencia de otras muchas variables, como por ejemplo, la moti-
vación, los diferentes rasgos de personalidad, así como la de algunos factores
ambientales o de contexto.
Las teorías que se han desarrollado bajo la hipótesis de la existencia de dife-
rencias individuales en las aptitudes mentales son muchas y variadas. Los pri-
meros intentos formales de medición de las aptitudes mentales aparecen en la
literatura con los trabajos de Binet (1903) y de Spearman (1904a, 1904b), inten-
tándose su medición a través de determinadas pruebas. Estas pruebas, que se
conocen universalmente bajo la denominación de tests psicométricos, y que se
aplican bajo condiciones relativamente estandarizadas, suelen estar compues-
tas por un conjunto de cuestiones o de problemas que se presentan a las per-
sonas para que den su respuesta, a veces eligiendo entre diferentes alternativas
o llegando a una determinada solución u otro tipo de respuesta, de acuerdo con
unos criterios previamente establecidos. Las formas de plantear las cuestiones,
así como los formatos de respuesta, son muy variados. Los tests son de diver-
sa complejidad y las cuestiones que se plantean pueden ir desde una simple ase-
22 Principios de Psicometría
veración con la que se pide consignar si se está o no de acuerdo, o el grado en
que se está de acuerdo, o marcar o descubrir el elemento que sigue en una deter-
minada secuencia lógica, hasta responder a algo más complejo, como puede ser
dar la resolución de un problema del que se pide que se especifiquen los pasos
para llegar a esa solución.
A cada una de las cuestiones o problemas que se plantean en la prueba (test)
es a lo que se le llama elemento, o más universalmente, ítem del test. El uso de las
denominaciones test, en lugar de prueba, e ítem, en lugar de elemento, se han
generalizado en la literatura, aun en los textos en español. En esta obra, salvo que
se indique lo contrario de forma expresa, se utilizan indistintamente los términos
prueba y test, como términos indiferenciables e intercambiables dentro de su con-
texto. Igualmente se hace con los términos elemento e ítem del test aunque, en
algunos casos, se verá que está justificado el que se consideren elementos que son
un compuesto, o sea, elementos que a su vez pueden estar compuestos por un
conjunto de otros elementos o de ítems.Las respuestas a los ítems del test proporcionan una puntuación, que es la
que se pone en relación con los niveles de la aptitud u otro rasgo que se preten-
de medir en los sujetos a los que se aplica la prueba. Otra cuestión relevante es
saber si la prueba es aplicable a toda la población o solamente a algunos grupos
específicos, así como las condiciones que se han de dar para poder extrapolar
y/o generalizar los resultados.
Por lo tanto, un test es un instrumento diseñado para inferir una medida de
capacidades o ciertas características de los sujetos a través de las respuestas que
dan a los ítems de ese test. Se puede decir también que es un instrumento para
obtener una muestra de un comportamiento individual. Cada aptitud, actitud o
característica que se quiera medir necesitará la construcción de una prueba o test
diferente que contenga al menos un elemento que dé cuenta de ello.
Los tests, los cuestionarios y otras medidas estandarizadas han sido las herra-
mientas más utilizadas en psicología, extensiva e intensivamente, tanto en los
ámbitos aplicados de la psicología clínica, del trabajo, educativa, etc., como en
investigación. Su aplicación se demanda desde las empresas, generalmente en los
procesos de selección de personal, o desde los ámbitos educativos, o por los ser-
vicios de salud, los gobiernos, etc. El uso de los tests está tan extendido que es
difícil imaginar que cualquier persona a lo largo de su vida no haya cumplimen-
tado algunas decenas de tests. Desafortunadamente en algunos casos se encuen-
tran tests y cuestionarios que están escritos, administrados y/o interpretados por
23Capítulo 1. Psicometría y teoría de tests: Introducción
personas que no tienen un entrenamiento adecuado. Esta obra pretende ayudar
a comprender los principios, los métodos y las destrezas técnicas necesarias para
generar y usar los tests responsablemente.
Algunos antecedentes 
Desde que Galton (1822-1911) tuvo la idea de medir las diferencias individua-
les de las aptitudes mentales por métodos puramente objetivos, son muchos
los trabajos y procedimientos que se han desarrollado con el fin de construir
instrumentos que sean adecuados para realizar tales mediciones. Entre los pio-
neros más destacados se encuentran Catell, quien acuñó en 1890 la expresión
de test mental, y Binet (1857-1911), quien generó el primer test de inteligencia
que resultó ser útil en la práctica y en el que, en su tiempo y posteriormente, se
han inspirado un amplio grupo de tests muy conocidos y utilizados. En 1895
Binet y Henri publican un artículo en el que se alejan de la medición simple de
aspectos sensoriales y motores, defendiendo el uso de tareas de carácter más
complejo y, en consecuencia, la construcción de pruebas para medir memoria,
atención, comprensión, etc. Mientras tanto, Ebbinghaus también trabaja con
escolares aplicando tests de este tipo, proponiendo tareas como completar fra-
ses, hacer cálculos aritméticos, recordar palabras, etc. En 1904 el Ministerio de
Instrucción Pública de Francia crea una comisión para tratar el problema de la
instrucción a niños con bajos niveles de inteligencia, e implica a Binet en la bús-
queda de una solución a este problema, quien, dada su experiencia, propone
un test de inteligencia que se comienza a utilizar para la selección de estudian-
tes en las escuelas de París (Binet y Simon, 1905). También se debe a Binet la
introducción del concepto de edad mental. Este concepto fue utilizado por Stern
(1912) para establecer el denominado cociente de inteligencia (CI), definido como
el cociente entre la edad mental y la edad cronológica y que ha tenido una gran
trascendencia a lo largo de la primera mitad del siglo XX, al menos por su influen-
cia en los numerosos estudios dirigidos a la determinación de las diferencias
individuales en el campo de los procesos intelectivos. Con la definición del CI
se estableció en el marco de la teoría psicométrica la primera escala de puntua-
ciones referida a las aptitudes mentales, o bien, se puede decir que se realizó la
primera normalización de las puntuaciones, si la consideramos bajo ciertas condi-
ciones de estandarización.
24 Principios de Psicometría
25Capítulo 1. Psicometría y teoría de tests: Introducción
Alfred Binet (Niza, 1857-1911) estudiaba derecho en París, cuando tenien-
do veinte años se interesó por los estudios de hipnosis del neurólogo fran-
cés Jean Charcot, quien trabajaba en el hospital Salpetriere de París, de
tal manera que abandonó sus estudios de leyes y se dedicó a las cien-
cias y la medicina. Se doctoró en ciencias naturales y comenzó a traba-
jar como investigador asociado en el laboratorio de la Sorbona en 1891,
llegando en 1895 a ser director del laboratorio de Psicología Fisiológica
de L’Ecole Pratique des Hautes Etudes, cargo que mantuvo hasta su muer-
te. Binet empezó trabajando sobre hipnosis e histeria, los temas de tra-
bajo de su mentor, Charcot, para pasar posteriormente a realizar estudios
sobre personalidad y psicología experimental. Binet estaba interesado en
estudiar el razonamiento y en buscar formas de medir las funciones men-
tales superiores, como muestran sus publicaciones de esa época: La psy-
chologie du raisonnement (1886), Le magnétisme animal (1887), On dou-
ble consciousness (1887) y L’étude expérimentale de l’intelligence (1903),
en la que utiliza los datos obtenidos examinando a sus propias hijas,
Armande y Marguerite. En 1895 Binet fundó un laboratorio (en la Escue-
la de la Rue de la Grange aux Belles) para el estudio del desarrollo de la
inteligencia y la revista L’Année Psychologique, donde publicó gran par-
te de su obra.
Binet se interesó por los estudios de Galton y se inspiró en sus méto-
dos para examinar a muchas personalidades famosas de la época, entre
los que se encontraban brillantes jugadores de ajedrez, matemáticos,
escritores y artistas. Pero son los estudios sobre la inteligencia de los
niños, impelido por las demandas del gobierno, que deseaba poder dis-
tribuirlos en clases de acuerdo con sus capacidades cognitivas, los que
producen el resultado de una herramienta útil para la medición de las dife-
rencias individuales, la primera escala Binet-Simon (1905), que tiene de
inmediato gran aceptación. Esta escala constaba de 30 ítems con tareas
intelectivas complejas, aunque no estaba exenta de algunas senso-moto-
ras y se aplicaba a niños con edad mental entre 3 y 13 años, edad que
podía coincidir o no con su edad cronológica. Esta escala sufre sucesi-
vas revisiones (Binet y Simon, 1908 y 1911) y se internacionaliza, adap-
tándola para su uso en Vineland (Nueva Jersey, EEUU), sobre todo tras
la revisión que hace Terman (1916) de la Universidad de Stanford, siendo
el test de Stanford-Binet y sus sucesivas revisiones (Terman y Merril, 1937,
1973; Becker, 2003) el test de inteligencia más conocido y comúnmente
utilizado durante décadas.
Cuadro 1.1
Por otra parte, los principios de la correlación y de la regresión enunciados
por Galton, así como su hipótesis acerca de la existencia de un término único,
al que se le podría denominar aptitud mental general de los humanos, ayudaron a
Spearman a descubrir las intercorrelaciones positivas entre todas las medidas
de las diferencias individuales en pruebas mentales complejas y a concluir que
las actividades cognitivas son todas función de un factor general g y de un fac-
tor s específico de cada operación. Spearman es así pionero en el desarrollo de
los métodos ahora conocidos bajo la denominación genérica de Análisis Fac-
torial.
Es imprescindible reseñar en este contexto psicométrico que, junto a las
aportaciones anteriormente mencionadas, se fue desarrollado un importante
cuerpo teórico acerca de las escalas de medida y que tiene su figura más signi-
ficada en Thurstone.
Volviendo a las primeras décadas del siglo XX, hay que reseñar que la partici-
pación de EEUU en la primera Guerra Mundial (1914-1918) impulsa el desarro-
llo de los tests, pues los ejércitos se encuentran con la necesidad de evaluar y cla-
sificara los reclutas. Se da el paso definitivo de la aplicación individual a la colectiva
26 Principios de Psicometría
Sir Francis Galton (Birmingham, 1822-1911), para apoyar sus teorías sobre
la herencia próximas a las de su pariente Darwin, hace experimentos y toma
multitud de medidas sobre millares de sujetos. Aunque no es un matemáti-
co, es el primero en aplicar razonamientos estadísticos al estudio de las apti-
tudes mentales. La idea de la correlación (co-relation originalmente), como
índice cuantitativo de la mayor o menor aproximación en ciertas caracterís-
ticas físicas entre personas relacionadas por un parentesco específico y la
de la regresión, como la tendencia que en el proceso hereditario tienen los
valores extremos en las estaturas de los sujetos a regresar hacia la media,
son conceptos propuestos por Galton. Es Karl Pearson (1857-1936), esta-
dístico de la Universidad de Londres, contemporáneo y colaborador de Gal-
ton, al que comúnmente se cita como fundador de la ciencia estadística,
quien formaliza ambos conceptos y los hace manejables. 
Cuadro 1.2
y a los tests no verbales (los llamados tests beta), pues esos tests son imprescin-
dibles para hacer posible su aplicación a analfabetos, o a extranjeros desconoce-
dores de la lengua inglesa.
Son muchos los autores cuyas aportaciones e influencia han sido relevan-
tes, tanto en aspectos teóricos como metodológicos y de divulgación, así como
en la generación de tests, aunque los objetivos y las limitaciones propias de esta
obra no permiten que se haga mención a muchos de ellos. En un tratado sobre
el tema ocuparían un lugar muy destacado, por ejemplo, obras como Theory of
mental tests de Gulliksen (1950a), las aportaciones en la construcción de escalas
de Guttman (1941) y de Stevens (1946) o uno de los tests de inteligencia más
difundidos, el de Wechsler (1939) que se sigue utilizando en sus versiones WAIS
para adultos (Wechsler, 1997), y WISC para niños (Wechsler, 2003), pues per-
miten diferenciar distintos tipos de inteligencia a través de las puntuaciones en
sus subtests. También habría que hacer mención a las acciones individuales o
institucionales que ayudaron a investigar, a difundir y a propiciar la utilización
masiva de los tests. La creación de empresas para la difusión de los tests, como
la de Catell, en los años veinte del siglo XX, y muy especialmente la creación del
Educational Testing Service en 1947, han propulsado el gran desarrollo de la psi-
cometría. 
m1.4. Tipos de testsm
Los tests se han desarrollado con distintos propósitos y se identifican median-
te multiplicidad de denominaciones, pues hay tests que reciben su nombre de
los contenidos, o de la forma en que se van a interpretar las puntuaciones, o de
la forma de dar la respuesta, o si hay un tiempo limitado que afecta a la ejecu-
ción, etc. También hay diferentes términos que se usan como sinónimos para
la palabra test en diversos contextos, como son denominaciones tales como
cuestionario, inventario y escala. 
Los tests referidos al contenido son los tests de inteligencia, de persona-
lidad, de memoria, de actitudes, etc. Entre las denominaciones que se refie-
ren a la interpretación y al uso destacan los tests referidos a la norma y los referi-
dos al criterio, o al dominio. Los tests referidos a la norma se utilizan más en la
interpretación que los referidos al criterio, cuyo uso está más ligado a la toma
de decisiones, especialmente en el ámbito educativo. En los tests referidos al
27Capítulo 1. Psicometría y teoría de tests: Introducción
criterio se fija una puntuación de corte, en relación con un criterio, para esta-
blecer una división de los sujetos en dos categorías, los que sus calificaciones
superan esa puntuación y los que no. Luego las interpretaciones de las pun-
tuaciones de un sujeto en el rasgo y las decisiones que se derivan de ello están
referenciadas al criterio establecido. En los tests referidos a la norma, lo que
se comparan son las puntuaciones del sujeto en el test con las de una mues-
tra representativa o con las de una población, es decir, con las del denomina-
do grupo normativo. 
En las clasificaciones en relación con el tipo de respuesta, se suele distin-
guir entre los tests de respuesta abierta, en la que los sujetos pueden responder
diciendo lo que les parezca oportuno, y los de respuesta cerrada, en los que los
sujetos deben elegir entre diferentes alternativas que se les proponen. Los de
respuesta cerrada a su vez pueden recibir la denominación en relación con el
número de alternativas que presenta la respuesta, tests de respuesta multicategóri-
ca, o del tipo de variable con el que se valora la respuesta, tests de respuesta dico-
tómica, etc. Otra clasificación que se suele hacer es distinguir entre los que se
denominan tests de velocidad y los tests de potencia o de fondo. La diferencia entre
ambos es que, en un test de velocidad, los ítems suelen ser muy homogéneos,
de similar dificultad y las diferencias individuales se manifiestan principalmen-
te por el número de ítems resueltos correctamente en un tiempo limitado, que
se considera que es insuficiente para que se cumplimente la totalidad del test.
Por el contrario, un test de potencia suele comenzar con ítems fáciles que aumen-
tan en dificultad a medida que se avanza en el test, y no hay teóricamente tiem-
po límite. En ambos casos, la puntuación en el test se suele obtener contabili-
zando el número de respuestas correctas, pero la interpretación de esa
puntuación en uno y otro caso puede ser diferente. La identificación de un test
como de velocidad o de potencia a veces no es obvia, y se han presentado algu-
nos procedimientos para su clasificación que suelen basarse en el análisis de los
errores por comisión y por omisión (algunos de estos procedimientos pueden
consultarse en Santisteban, 1990a). 
m1.5. Variabilidad de las puntuacionesm
Las puntuaciones de los tests se utilizan para establecer e interpretar las dife-
rencias interindividuales e intraindividuales en las mediciones de los rasgos. Por
28 Principios de Psicometría
lo tanto, una de las cuestiones más inmediatas es saber cómo se distribuyen esas
puntuaciones. Esto implica conocer alrededor de qué valor se concentran esas pun-
tuaciones, así como cuál es su dispersión y sus relaciones. Las medidas de tenden-
cia central se obtienen con los valores de los estadísticos tales como la media arit-
mética, o la mediana. Las medidas de dispersión usuales son la varianza y su raíz
cuadrada, la desviación típica. Entre las medidas que evalúan la asociación entre
variables están la covarianza y la correlación. 
Todas estas medidas se van a utilizar muy a menudo en el texto, así que indi-
camos brevemente sus expresiones y notación. Usualmente se utilizarán letras
latinas para los estadísticos calculados con valores muestrales, y las griegas para
los parámetros poblacionales o cuando se da la forma genérica de una ex-
presión.
Medidas de tendencia central
La media aritmética de una variable X de la que se tienen N observaciones es 
y se sustituirá por µ si se refiere a la media poblacional. También se utilizará el
operador esperanza matemática E para indicar esta operación: E (X) = .
Medidas de dispersión
La varianza es una medida de dispersión, pues es un valor promedio de las
desviaciones de los valores Xi con respecto a la media. Para una muestra de
tamaño N es:
que se denotará por σ2 si es la varianza de la población. Las desviaciones típicas
son s y σ respectivamente. También se utilizará el operador esperanza matemáti-
ca para indicar esta operación, ya que: σ2X = E[X – E(X )]
2.
 
€
s
X X
N
i2
2
=
−∑( )
 
€
X
 
€
X
 
€
X X Ni=∑ /
29Capítulo 1. Psicometría y teoría de tests: Introducción
Medidas de asociación
La covarianza entre dos variables X e Y se refiere a cómo covarían ambas
variables. Es decir, como covaría Y con X y X con Y. La covarianza de X con Y
se calcula mediante la expresión: 
y de esta expresión se puede deducir que Cov (X, Y) = Cov (Y, X). Porello, en
esta obra, cuando se haga referencia a la covarianza de forma general, diremos
covarianza entre las variables, pero cuando en una expresión hay que incluir la
cuantificación de esa covarianza, se expresará como 2 Cov (X, Y). Si se usa el ope-
rador E, la covarianza responde a la expresión E {[X – E(X)] [Y – E (Y)]}. 
La correlación entre las variables X e Y viene dada por la expresión:
Distribución de las puntuaciones 
La representación gráfica de la distribución de las puntuaciones es un medio
sencillo y muy útil para obtener información del test y de los sujetos a los que
se les administra ese test. Un ejemplo y algunas de estas representaciones se dan
a continuación.
Ejemplo 1.1
La distribución de puntuaciones de un test X constituido por 6 ítems dico-
tómicos que se han administrado a una muestra de 200 sujetos se da en 
la Tabla 1.1, donde Ni es el número de sujetos que obtienen la puntuación Xi.
En este caso la puntuación Xi se corresponde con el número de aciertos y 
fi = Ni / N es la frecuencia relativa. Cualquier puntuación, por ejemplo X6 = 5,
 
€
r
Cov X Y
s sXY X Y
=
( , )
 
€
Cov X Y
X X Y Y
N
i i( , )
( ) ( )
=
− −∑
30 Principios de Psicometría
con frecuencia relativa f6 = 0.15 (f6 = 30 / 200), indica que de los 200 sujetos
sólo un pequeño número obtiene esa puntuación. Esta simple descripción 
permite conocer, por ejemplo, que el 25% de la muestra presentan puntuacio-
nes muy altas (5 o 6), en tanto que puntuaciones muy bajas (0, 1 o 2) las ob-
tienen el 15%. 
Figura 1.1. Representación gráfica de la distribución de frecuencias de la Tabla 1.1. 
Los estadísticos que definen a la distribución anterior son:
a) La media de las puntuaciones, que es = 3.80. 
b) La desviación típica, que es sx = 1.25.
c) La moda como valor más frecuente, que es Mo = 4.
 
€
X
31Capítulo 1. Psicometría y teoría de tests: Introducción
Tabla 1.1. Distribución de las puntuaciones de un test 
administrado a 200 sujetos.
Xi 0 1 2 3 4 5 6
Ni 0 10 20 40 80 30 20
fi 0 0.05 0.10 0.20 0.40 0.15 0.10
Las representaciones gráficas que corresponden a las distribuciones de las
puntuaciones tendrán una forma geométrica u otra dependiendo de los valores
de sus medidas de tendencia central (media, mediana, moda) y de sus medidas de
dispersión (desviación típica o varianza, coeficiente de variación u otros momen-
tos). El estudio de esas gráficas es muy útil para una primera aproximación al
conocimiento del test y de cómo pudiera estar distribuido el rasgo en distintas
muestras o en diferentes poblaciones.
Distribución normal
Si las puntuaciones se distribuyen según una ley normal, la media, la media-
na y la moda coinciden. Las frecuencias se distribuyen simétricamente con
respecto a esos valores pues la media es el centro de la distribución y el valor
de mayor probabilidad. Una varianza o desviación típica mayor o menor indi-
ca que la curva estará más o menos apuntada, ya que la desviación típica mide
la distancia entre la media y los puntos de inflexión. Un ejemplo de distribu-
ciones normales con distinto apuntamiento se presenta en la Figura 1.2, en
donde se puede observar que hay mayor concentración de puntuaciones (mayor
número de sujetos) con valores próximos a la media en la más apuntada que
en la más aplanada. Distribuciones de puntuaciones con estas características
indican que el test tiene muchas cuestiones (ítems) de dificultad intermedia a
las que responden correctamente la mayor parte de los sujetos. También se
presupone que están incluidos en el test algunos ítems de muy alta dificultad,
pues son muy pocos los sujetos que también los responden correctamente.
También se podría inferir que el rasgo se distribuye normalmente en la pobla-
ción. 
Distribución uniforme
Una curva de distribución de frecuencias que sea una línea recta paralela al
eje X de las puntuaciones respondería a una distribución uniforme o rectan-
gular, donde se puede considerar que todos los valores son modales, o bien,
que no hay moda, pues todos tienen la misma frecuencia. Un test que genere
este tipo de distribución en que todas las puntuaciones, sean altas, bajas o inter-
medias, las obtienen el mismo porcentaje de sujetos, sería muy poco útil para
extraer conclusiones. 
32 Principios de Psicometría
Figura 1.2. Representación gráfica de dos distribuciones normales con media cero 
y desviaciones típicas 0.5 y 1.
Distribuciones asimétricas
Distribuciones asimétricas se obtienen cuando las frecuencias se concen-
tran en un valor alejado de la media. En la Figura 1.3 se representan dos dis-
tribuciones asimétricas, una desviada a la izquierda (a) y otra a la derecha (b).
Un test tendrá una distribución de puntuaciones desviada a la derecha si tiene
muchos ítems fáciles, por lo que la mayor parte de los sujetos obtienen altas
puntuaciones. En caso contrario, si el test tiene un gran número de ítems de
alta dificultad, la mayor parte de los sujetos no darán respuesta correcta a ellos
y la curva estaría desviada a la izquierda. Puesto que las desviaciones tienen
relación con la diferencia que haya entre la puntuación media y la mediana, una
distribución será más asimétrica cuanto mayor sea esta diferencia y un índice
de esa asimetría es:
 
€
δ
µ
σ
=
−Me
33Capítulo 1. Psicometría y teoría de tests: Introducción
denotando por Me a la mediana y siendo µ y σ la media aritmética y la desviación
típica. Diversos índices de asimetría, así como el coeficiente de asimetría de Fis-
her se suelen incluir en los manuales de estadística. 
Figura 1.3. Distribuciones asimétricas de puntuaciones X en el test.
Distribuciones con más de una moda
La representación de las distribuciones de las puntuaciones permite que se pue-
da detectar si en esa población hay dos o más grupos que estén bien diferenciados
con respecto a las mediciones del rasgo que representan esas puntuaciones. Esto se
evidencia cuando en las distribuciones de puntuaciones de una población se pre-
sentan varios máximos o valores modales, lo que sugiere que en la población hay
grupos que se comportan de forma diferente en el test, o que se diferencian en sus
valores del rasgo (por ejemplo, hombres y mujeres, niños y adultos, etc.), o que el
test esté sesgado a favor de alguno de esos grupos. Por ejemplo, una distribución
bimodal como la que se presenta en la Figura 1.4 sugiere que hay dos grupos en esa
población que se comportan diferencialmente, y si no era esperable, habrá que ave-
riguar cuáles son las razones. 
Se han expuesto aquí algunas de las formas de las distribuciones más comu-
nes y su significado. Entre otras, una de las cuestiones en las que se puede estar
interesado es en la concentración de puntuaciones en torno a la media (apunta-
miento) y sobre todo en la evaluación de la asimetría. Los índices para valorar tan-
to el apuntamiento (curtosis) como la asimetría se encuentran en los manuales de
estadística y también se pueden consultar en Santisteban (1990a).
34 Principios de Psicometría
Figura 1.4. Distribución bimodal.
m1.6. La interpretación de las puntuacionesm
Obtener una puntuación de 35 puntos en un cuestionario de agresividad, o de
neuroticismo, o 22 puntos en un test de inteligencia no tiene ningún significado.
Sin embargo, lo tiene decir que la distancia entre dos ciudades es de 200 km.
La diferencia entre una información y otra es que la medida física va acompa-
ñada de la unidad de medida, en tanto que las psicológicas que se han dado no
lo están. La medida física se ha realizado con un instrumento, el metro, que
aunque es una medida arbitraria, se ha adoptado como unidad para medir lon-
gitudes. Para realizar las medidas psicométricas también se han generado ins-
trumentos adecuados, que son los tests, sin embargo, las unidades de medida
en los tests, además de ser arbitrarias, no cuentan con una unidad aceptada uni-
versalmente con la que comparar la medición de cada rasgo. No hay una uni-
dad de medida de la inteligencia, ni del neuroticismo, ni de la agresividad o de
otras característicasde los sujetos. Así pues, cuando se construye un test hay
que tener muy claro desde su inicio qué es lo que se quiere medir, cómo se va
a medir, cómo se van a obtener las puntuaciones, qué reflejan esas puntuacio-
nes, cómo se pueden organizar para que se puedan establecer las correspon-
35Capítulo 1. Psicometría y teoría de tests: Introducción
dientes diferencias individuales que reflejen adecuadamente las diferencias que
existen entre los sujetos en el rasgo, y cómo expresar todo ello para que quie-
nes utilicen ese test puedan interpretar correctamente las puntuaciones que con
él se obtienen.
Son muchos los conceptos y los procedimientos implicados en todo lo ante-
riormente dicho, y se irán tratando a lo largo de esta obra. Sin embargo, antes de
entrar a estudiar los modelos concretos en los que se puede basar la construc-
ción de los tests, es conveniente clarificar algunos aspectos. Por ejemplo, que los
números que representan puntuaciones en los tests deben estar conectados con
el significado y la cuantía de aquello que se mide, que con ellos se puedan expre-
sar tanto similitudes como diferencias, que se pueda operar con esas puntuacio-
nes, que sean susceptibles de comparación con otras puntuaciones, etc.
Otra cuestión interesante es el significado del número cero. El número cero es
una puntuación que puede tener muchos significados. Una es la ausencia del atri-
buto que se mide y otra puede corresponder a una cantidad, en principio arbitra-
ria, para fijar el origen de una escala. Por ejemplo, el cero en una escala centígrada
es un valor arbitrario que no significa ausencia de temperatura, sino el origen de
esa escala, pudiendo existir temperaturas en grados centígrados menores y mayo-
res que cero, es decir, positivas y negativas, que serán diferentes a las expresadas
en otra escala (por ejemplo en grados Fahrenheit o en Kelvin). En psicología es
difícil definir qué significa el cero, pues la ausencia del rasgo difícilmente se corres-
ponde con la realidad, nadie tiene inteligencia cero, ni ausencia total de neuroti-
cismo, o de agresividad. Se asigna el valor cero a multitud de situaciones, cuando
no se ha alcanzado un cierto nivel en el rasgo, cuando se ha cometido un error,
cuando no se completa una prueba, etc. También se suele utilizar el cero para fijar
el origen de las escalas. Por lo tanto, la interpretación de las puntuaciones en los
tests psicológicos, está relacionada con el significado que tiene el cero en ese test.
Las puntuaciones tipificadas (puntuaciones z)
Una puntuación aislada y sin referencia a alguna unidad de medida no tiene una
clara interpretación. Al menos habría que conocer cómo es de alta o de baja esa
puntuación en relación con otros sujetos y hacia qué valores tienden las puntua-
ciones de la población. Las puntuaciones tipificadas permiten algunas de esas
comparaciones. 
36 Principios de Psicometría
Se llama puntuación tipificada z de una puntuación X a la que se obtiene
mediante la relación:
o bien
Las puntuaciones tipificadas o puntuaciones estándar indican, por un lado,
cuánto se desvían de la media µ de la población (o de la de la muestra), usando la
desviación típica como unidad de medida de esas diferencias.
Las puntuaciones estandarizadas permiten hacer algunas comparaciones. Por
ejemplo, MC tiene 32 puntos en un test con µ = 30 y σ2 = 4 y JL y JM obtienen
42 puntos y 33 respectivamente en otro test que mide el mismo rasgo y cuya
media y varianza son µ = 36 y σ2 = 9. ¿Se diferencian esos tres sujetos en sus
niveles en el rasgo? Las puntuaciones directas de JL y JM son comparables en
algún sentido, pues se obtienen con el mismo test. Para compararlas con las de
MC se obtienen las correspondientes puntuaciones tipificadas de los tres suje-
tos, que son: 
Esas puntuaciones z, en las que incluso una es negativa, se interpretarían mejor
en ciertos contextos si vinieran dadas en valores enteros y positivos. Para ello se
podría hacer una transformación a otras puntuaciones también tipificadas, pero
con media y desviación típica determinadas. 
o sea,
Si para la escala de puntuaciones transformadas se elige que la media sea 100
y la desviación típica 10, entonces las puntuaciones de MC, JL y de JM serían 110,
120 y 90, respectivamente.
A estas puntuaciones y a su correspondiente escala se les suele llamar puntua-
ciones estandarizadas derivadas.
 
€
z
T T
T
=
−
σ 
€
T z TT= +σ
 
€
z3
33 36
3
1=
−
= −
 
€
z2
42 36
3
2=
−
=
 
€
z1
32 30
2
1=
−
=
 
€
z
X
=
−µ
σ 
€
z
X X
s
=
−
37Capítulo 1. Psicometría y teoría de tests: Introducción
Por lo tanto, una vez ordenadas las puntuaciones, la escala primaria estaría
constituida por las puntuaciones directas, que hay que transformar en otras para
hacerlas comparables.
Las escalas y las normas
La escala primaria de un test estaría constituida por todas las puntuaciones X
ordenadas por su cuantía. Si calculadas la media µ y la desviación típica σ se res-
ta µ y esas diferencias se dividen por σ, entonces se tendrá una nueva escala, for-
mada por puntuaciones z, con origen en µ y cuya unidad de medida es σ. El paso
de esta escala a una escala estandarizada con media cero y desviación típica uno
es muy simple, ya que como se ha indicado antes, la puntuación z se puede asi-
milar a la de otra T, cuya distribución tenga media cero y desviación típica uno.
El paso de puntuaciones directas a puntuaciones z (las estamos llamando típicas
o estandarizadas) se ha realizado mediante una transformación lineal y poste-
riormente se ha pasado a puntuaciones estandarizadas derivadas también median-
te otra transformación lineal. Luego mediante transformaciones lineales se pue-
den transformar las puntuaciones directas en estandarizadas y pasar de una escala
estandarizada a otra. 
El paso de puntuaciones estandarizadas a normalizadas (que las puntuacio-
nes z sigan distribuciones normales) no es posible hacerlo con una transfor-
mación lineal, además de que no es adecuado cuando la distribución de las pun-
tuaciones se desvíe mucho de la normalidad, como se ha visto en los gráficos
del Apartado 1.5. Desviaciones de la normalidad se dan en numerosos casos y
es mucho más probable encontrarlas cuando se trata con muestras pequeñas.
Entre las escalas que no resisten las transformaciones lineales están las escalas
percentílicas (estas escalas y algunas escalas normalizadas más usuales se dan
en el Apartado 15.6).
A las transformaciones de las puntuaciones que mantienen su orden relativo
y su significado, se les llama transformaciones admisibles.
El establecimiento de esas puntuaciones y lo que ello conlleva en la orde-
nación de los sujetos, en relación con su nivel en el rasgo que se evalúa, dan
origen a las normas del test, que son las que indican la posición del sujeto en el
rasgo. Si el test se ha construido en el contexto de los modelos lineales, mode-
los que trataremos en los siguientes capítulos, esa posición se interpreta en rela-
38 Principios de Psicometría
ción con la distribución de las puntuaciones en el grupo o población a la que
pertenece (grupo normativo). El nivel del sujeto en el rasgo (la puntuación ver-
dadera) se infiere y se interpreta en relación con esos parámetros y con el gra-
do de precisión estimado para el test. Si el test se ha construido bajo los supues-
tos de modelos no lineales (que trataremos como modelos TRI) la interpretación
de la posición del sujeto en el rasgo (su nivel en el rasgo), se hace de acuerdo
con su respuesta y con las características del ítem (o de los ítems). Estas carac-
terísticas las recoge una curva de probabilidad que proporciona información
de cómo se relaciona la puntuación del sujeto con los valores del rasgo. La esti-
mación y la interpretación de los niveles de un sujeto en el rasgo no se hace
depender en estos modelos de cuántos sujetos del grupo han respondido correc-
tamente a ese ítem o cuáles han sido sus puntuaciones en el test, sino que sólo
va a depender de la forma de la curva que caracteriza a ese ítem y decuál es la
posición de esa curva (indica la dificultad de ítem) en relación con la escala de
valores del rasgo.
m1.7. Teorías y modelosm
Desde que Galton en el siglo XIX tuvo la idea de medir las diferencias individua-
les de las aptitudes mentales por métodos puramente objetivos, son muchos los
trabajos y procedimientos que se han desarrollado con el fin de construir instru-
mentos que sean adecuados para realizar tales mediciones. En esos desarrollos
han intervenido figuras destacadas como algunas de las anteriormente citadas, o
como Thomson, Thurstone, Hurt, Vernon, Jöreskog, etc., pero son las aporta-
ciones de Galton, Pearson, Binet y Spearman las que constituyeron los pilares
básicos en los que durante más de medio siglo se han sustentado las teorías de los
tests psicométricos:
– El modelo lineal de Spearman.
– La tipificación o normalización de las puntuaciones.
– La evaluación de las intercorrelaciones.
Durante años, y aún hoy en día, se construyen instrumentos para la medida
de las diferencias individuales utilizando los procedimientos que han surgido
tomando como base teórica el modelo lineal de Spearman, propuesto en 1904 y des-
39Capítulo 1. Psicometría y teoría de tests: Introducción
de el que se ha generado la denominada teoría clásica de los tests (TCT). Una de las
principales características de los tests construidos en el contexto de esta teoría
es que las puntuaciones que obtiene un sujeto en el test se supone que están
linealmente relacionadas con las que se consideran que son sus puntuaciones
verdaderas, y hay que interpretarlas en relación a aquellas que se obtuvieron en
el grupo normativo, que es el grupo que constituyó la muestra con la que se deter-
minaron las características psicométricas del test y con la que se construyó la
escala. Esta necesidad de referenciar la puntuación individual a la del grupo nor-
mativo no deja de ser una limitación, además de que puede producir importantes
distorsiones en la interpretación de las puntuaciones, si los sujetos a los que se
les administra el test no pertenecen a la población de la que la muestra era repre-
sentativa. 
Una de las limitaciones del modelo de Spearman es que en su formulación
se considera que una única variable error resume todos los errores aleatorios
provenientes de distintas fuentes. Sin embargo, en cualquier modelo es funda-
mental identificar y separar los errores de medida, pues unos estarán directa-
mente relacionados con el procedimiento de medición, otros con las condicio-
40 Principios de Psicometría
Las limitaciones arriba reseñadas propias de estos instrumentos de medida
no justifican la fuerte corriente crítica que en los años cincuenta del siglo XX
se produjo, especialmente en EEUU, contra la aplicación de los tests, acu-
sándolos de toda clase de inexactitudes, arbitrariedades y sesgos provoca-
dores de la toma de decisiones socialmente discriminadoras e injustas. La
teoría y la práctica han demostrado que las deficiencias que a priori parecen
ser propias de los instrumentos que tratan de medir capacidades humanas
complejas a través de simples manifestaciones observables, son general-
mente conocidas y controlables y que, por lo tanto, basta considerarlas para
hacer un uso correcto del test. Asimismo se deberán tener en cuenta esas
limitaciones al hacer la interpretación de las puntuaciones, puesto que es
obvio que en cualquier proceso de medición, al hacer la interpretación de la
medida, hay que tomar también en consideración las características del ins-
trumento con el que se ha realizado esa medida.
Cuadro 1.3
nes ambientales, etc. Por ello, se han propuesto muchos modelos identificando
diferentes componentes del error, como el denominado modelo platónico, pero
un modelo que persiste y que permite un buen tratamiento de los datos es el que
se conoce bajo la denominación de la teoría de la generalizabilidad (Cronbach et al.,
1963; Gleser et al., 1965; Cronbach et al., 1972). En este modelo se reconoce que
cada puntuación observada es una entre las muchas posibles, que todas están
afectadas por múltiples fuentes de error y que, por lo tanto, el interés y la utili-
dad de esas puntuaciones está en el grado en que sean generalizables, con las
debidas garantías, a una multiplicidad de situaciones, lo que los propios autores
denominan universo de generalización. En estos modelos la cuestión clave no es pre-
guntarse sólo por la fiabilidad del test, sino por la precisión con la que se pue-
de realizar la generalización. El modelo estadístico que conecta la teoría de la
generalizabilidad con el análisis de los datos es el análisis de la varianza, que sir-
ve para identificar y evaluar las principales fuentes de error que afectan a las
medidas.
Otro modelo que se puede considerar como una extensión de la TCT es 
el modelo factorial simple. Spearman, al mismo tiempo que propone el modelo
lineal anteriormente citado (Spearman, 1904a), publica otro artículo (Spear-
man, 1904b) mostrando cómo se puede reconocer si ese test mide un atribu-
to común, a partir de los datos que aporta el test. Al igual que décadas después
y tras múltiples desarrollos el primer artículo da origen a la TCT, este otro con-
duce al establecimiento del denominado modelo factorial simple, que en un
principio se utilizó para comprobar la teoría sobre la estructura factorial de la
inteligencia y que, posteriormente, se ha utilizado y se viene utilizando para
detectar factores fundamentales en los procesos de cognición, factores de la
personalidad, etc.
El alejamiento del modelo de Spearman da lugar al inicio de una nueva con-
cepción de la teoría de los tests donde el foco de atención se centra en la res-
puesta individualizada al ítem, más que en cómo los sujetos de un determina-
do grupo responden al test. Los modelos se expresan en función de las
características del ítem, en lugar de en las del test. Por lo tanto, estos modelos
están basados en la independencia entre los ítems y en las distribuciones pro-
babilísticas de cada uno de ellos, a las que se les llama curva característica del ítem,
que son las que describen el comportamiento de las puntuaciones en los ítems
y sus relaciones con las medidas del rasgo. Un tema crucial en estos modelos
es la búsqueda de estadísticos suficientes para las estimaciones de sus pará-
41Capítulo 1. Psicometría y teoría de tests: Introducción
metros, y esta cuestión es el eje fundamental sobre el que giran muchas de estas
aproximaciones. Esta búsqueda de alternativas tratando de evitar las limita-
ciones del modelo de Spearman genera modelos que se desarrollan bajo la
denominación de la teoría del rasgo latente, denominación que posteriormen-
te fue sustituida en parte por la de teoría de la respuesta al ítem (TRI). Casi
todos los aspectos, modelos y teorías del rasgo latente se contemplan y son
objeto de posteriores desarrollos bajo la TRI. Esta última denominación se
ajusta más fielmente a los conceptos ya citados que subyacen en dicha teoría
y a los métodos de construcción de tests basados en ella, en cuanto a que en
estos modelos el elemento central es el ítem, caracterizado por su forma pro-
babilística y por las características diferenciales de las que lo dotan sus pará-
metros, con independencia de las características de las muestras particulares
sobre las que que se aplican. No obstante, la consideración de la latencia del ras-
go podría considerarse común a todos los métodos y teorías de los tests, pues-
to que son los tests psicométricos y otros instrumentos de medición estanda-
rizados los que vienen a resolver el problema de la medición de esos rasgos
inobservables (latentes), infiriéndose esas medidas desde las de sus manifesta-
ciones observables.
Las propuestas de modelos no lineales (TRI y de clase latente) se desarrollan
a comienzos de los años sesenta del siglo XX, aunque se gestan con anteriori-
dad, y generan nuevas formas de concebir los tests, de abordar el análisis de sus
elementos y de inferir las medidas de los inobservables en los que se está inte-
resado.Estas teorías y procedimientos no sustituyen ni destierran a los ante-
riores, sino que ambos conviven. Por ejemplo, cuando hay que indicar las pro-
piedades psicométricas de un test o cuestionario, se suele dar su coeficiente alfa
de consistencia interna, casi siempre calculado con métodos derivados de las
teorías y modelos que hemos dado en denominar clásicos. En cuanto a la varia-
ble de interés, en la teoría clásica, al inobservable que se quiere evaluar se le lla-
ma puntuación verdadera (V) y en los desarrollos posteriores, a estas capacida-
des inobservables se las suele denominar genéricamente aptitud o rasgos (θ).
En los modelos no lineales se pueden incluir modelos basados en las distribu-
ciones probabilísticas como la distribución binomial de donde se deriva el mode-
lo de error binomial, o en distribuciones de Poisson, que dieron lugar a los modelos
poissonianos que usa Rasch, o en la distribución normal acumulada, con la que se
generan los modelos de ojiva normal. Sin embargo, han sido las distribuciones logís-
ticas, y en algunos casos la normal, las que se consideran de mayor interés y han
42 Principios de Psicometría
recibido y siguen recibiendo mayor atención, siendo sus modelos objeto de un
desarrollo espectacular. Entre los que originalmente fueron más tratados y mejor
conocidos se encuentran los modelos logísticos de dos, tres o cuatro parámetros,
pero es el modelo logístico de dos parámetros y sobre todo el denominado mode-
lo de Rasch, que se puede asimilar a un modelo logístico de un parámetro, los
modelos que más se han desarrollado tanto teóricamente como en las aplica-
ciones y de los que se han derivado muchos otros modelos. Actualmente muchos
de estos modelos y procedimientos para generar tests a partir de ellos se han
clasificado dentro de la denominación de modelos de la teoría de la respuesta al
ítem (TRI).
Una de las características de los modelos de la TRI, y la más destacada por
todos los autores, porque establece una de las más claras diferencias con la teo-
ría clásica, es que la interpretación de las puntuaciones de los sujetos no se reali-
za en relación con las puntuaciones del grupo normativo, sino que la estimación del
nivel del rasgo que pretende medir el test está determinada por la forma mate-
mática y la posición sobre el rasgo (la dificultad) que tenga la curva característica de
cada ítem, expresada en forma probabilística, pues es la que relaciona la proba-
bilidad de éxito en un ítem con la aptitud.
43Capítulo 1. Psicometría y teoría de tests: Introducción
Los antecedentes de la TRI se pueden situar en las primeras décadas del
siglo XX, con los trabajos de Binet y Simon (1911) y los de Thurstone (1925)
quien retoma la idea de los anteriores, escalando los ítems de acuerdo con
la edad. En las décadas posteriores, Richardson (1936), Lawley (1943),
Ferguson (1942) y Tucker (1946) son principalmente quienes establecen
conexiones formales entre la TCT y la TRI, siendo a este último a quien se
le debe la acuñación del término curva característica del ítem. En estas
contribuciones se basan otras posteriores, como las de Lord (Lord, 1952,
1953a, 1953b; Lord y Novick, 1968). La figura clave en el desarrollo de
estos modelos es Rasch, que en 1960 presenta un conjunto de modelos,
entre los que el conocido modelo de Rasch es el que hasta el momento
ha sido el más relevante en la TRI. Trabajos tan conocidos como los de
Wright y Stone (1979) o los de Fischer y Molenaar (1995) tienen como base
el modelo de Rasch.
Cuadro 1.4
No dedicaremos en este capítulo mayor atención a los modelos TRI ni a sus
referencias, ya que se tratan en otros capítulos de esta obra. Sin embargo, con-
viene clarificar aquí algunos conceptos sobre el análisis de estructura latente,
pues algunos de los modelos que se incluyen en esa teoría no se tratan en esta
obra, al igual que no podemos hacerlo con muchos otros modelos derivados
del modelo de Rasch, o con modelos de respuesta politómica o los modelos
multidimensionales, que son y se consideran modelos TRI, aunque los mode-
los clásicos TRI sólo tratan con modelos unidimensionales y con respuestas
dicotómicas.
En algunas clasificaciones, el análisis de estructura latente comprende un con-
junto de modelos que abarca a todos los de la TRI y a los denominados de cla-
se latente. La distinción entre ambos grupos de modelos se hace en relación con
la distribución del rasgo (θ) en la población de sujetos, según se considere con-
tinua o discreta. En los modelos TRI se asume la continuidad del rasgo, supo-
niéndose que θ es discreta en los modelos de clase latente. Por otra parte, aun admi-
tiendo la continuidad, el rasgo θ puede ser unidimensional, bidimensional o
multidimensional y los ítems pueden ser dicotómicos o politómicos, aunque los
modelos más desarrollados son los unidimensionales con ítems dicotómicos. La
familia de modelos de Rasch, los logísticos de uno, dos o tres parámetros, el mode-
lo de respuesta graduada de Samejima, los modelos de crédito parcial y muchos otros for-
man parte de los modelos TRI, y los modelos de clase latente, se clasifican según
el número de clases que contienen, distinguiéndose a su vez unos modelos de
otros, dentro del mismo tipo de clase, por las restricciones que se impongan a
sus parámetros.
La denominación de latente, como se ha indicado anteriormente, se dese-
chó en los modelos anteriormente mencionados que se han encuadrado den-
tro de la denominación TRI. Sin embargo, se consideran en psicometría otro
grupo de modelos a los que se les ha dado la denominación de modelos de varia-
bles latentes (LVM, usando sus siglas en inglés). Estos modelos incluyen tanto
variables no observadas (latentes) como variables observadas (manifiestas) y el
modelo expresa las relaciones matemático-probabilísticas entre las variables
latentes y las observadas. El estudio de estos modelos es de gran interés en
muchos campos y muy especialmente en sociología, economía, psicología y, en
general, en todos aquellos ámbitos en los que el objeto de estudio puede con-
siderarse como un conjunto o red de relaciones que constituyen un construc-
to hipotético, cuya medición no puede hacerse directamente, sino a través de
44 Principios de Psicometría
esas relaciones. En una obra dirigida a quienes investigan en ciencias sociales,
indicando cómo deben hacer los análisis e interpretar datos multivariantes
(Bartholomew et al., 2002), se describen bastante minuciosamente esas rela-
ciones para algunos constructos como la inteligencia, o en la medición de acti-
tudes. Un tema básico en estos modelos es conocer la naturaleza de la escala
de medición que se va a considerar, tanto para las variables latentes como para
las manifiestas. Según sea la métrica que se adopte en una u otra escala, se ten-
drán diferentes modelos. La más simple de esas clasificaciones es la que dan
Knott y Bartholomew (1999), que se resume en la Tabla 1.2. En esa tabla, se
denominan variables métricas, a las que son medibles, es decir, aquellas que
pueden tomar valores numéricos, ya sea de forma aislada (variables discretas)
o continua. Cuando las variables categóricas son las manifiestas, los indicado-
res que se dan a las categorías son de tipo binario u ordinal y, por lo tanto, las
distribuciones condicionales para los modelos LTM y LCM son distribuciones
binomiales o multinomiales.
Aun cuando la descripción de los modelos LVM ha sido muy somera, nos
hemos permitido incluirla, pues éste será probablemente el único lugar de la obra
donde se haga mención a estos modelos. Por el contrario, el modelo lineal (TCT)
se tratará ampliamente en extensión y profundidad en diversos capítulos y de los
modelos TRI se darán los conceptos básicos y se estudiarán con suficiente deta-
lle los modelos unidimensionales más relevantes.
Tabla 1.2. Modelos LVM según la métrica de las variables latentes 
y de las observadas.
Variables latentes Variables observadas
Métricas Categóricas
Métricas Análisis Factorial Modelos de Rasgo
(AF) Latente (LTM)
Categóricas

Continuar navegando