Logo Studenta

Medicion_y_evaluacion_en_psicyedu thorndike - Saydi Herrera

¡Este material tiene más páginas!

Vista previa del material en texto

MEDICiÓN Y EVALUACiÓN 
EN PSICOLOGíA Y EDUCACiÓN 
Robert L. Thorndike 
Elizabeth P. Hagen 
Durante el siglo xx se desarrollaron numerosas 
técnicas de evaluación del individuo, aplicándose a 
muchos aspectos de su personalidad y sus habilidades. 
En esta obra se destacan las consideraciones más 
recientes ~cerca de la forma correcta de hacer una 
evaluación justa, en la que se combinen los elementos 
útiles de las nuevas teorías de la medición psicológica 
con los conocimientos desarrollados en las últimas 
siete décadas en esta materia. 
Los autores comienzan por hacer una aproximación 
hacia el uso de las pruebas y, no obstante que este 
libro trata sobre medición, dedican un capítulo a las 
técnicas estadrsticas básicas por la relación que éstas 
guardan con la medición psicológica. 
A través de los diferentes capítulos se muestran al 
estudíante de psicología, las cualídades deseadas en 
los instrumentos de medición, las normas y unidades 
utilizadas en la evaluación y se le orienta acerca de 
cómo diseñar y construir pruebas específicas: de 
aprovechamiento escolar, de inteligencia, de conducta 
y de aptitudes laborales. 
Además, se exponen cuestionarios e inventarios de 
autoapreciación y se analizan los problemas sociales 
y políticos de la evaluación al individuo evaluado por 
otros, así como la manera de calificar las pruebas. 
OTROS TíTULOS 
ELABORACiÓN DE TESTS 
Desarrollo e interpretació.'1 de los tests de 
aprovechamiento 
Dorothy Adkins Wood 
En pocas páginas, proporciona los principios 
básicos de medición, técnicas y estadísticas 
aplicables a cualquier campo temático, 
procedimientos específicos, sugerencias prácticas y 
múltiples consejos para construir, analizar y calificar 
MEDICiÓN Y 
EVALUACiÓN EN 
PSICOLOG~ y EDUCACiÓN 
" " . ".1 " 
6 PREFACIO 
qu~ contiene claves d~ nuestro texto publicada por John Wiley & Sons, Inc. 
ASImIsmo, contlen~ lIstas maestras de conceptos clave con notas de página 
ayud~s de estudIO, lectUlas complementarias, ejercicios de estudio v prueba~ 
de practIca. . 
RORERT L. T HORI\:DIH 
ELlV. Il~TH P. HAGEI\: 
, 
[71 
LU 
Indice de contenido 
Prefacio 5 
Cap. 1. Una aproximación hacia el uso de las pruebas 9 
Cap. 2. . Técnicas estadísticas básicas 30 
Cap. 3. Cualidades deseadas en los instrumentos de medición 61 
Cap. 4. Nonnas y unidades utilizadas en la evaluación 115 
Cap. 5. Dónde encontrar información acerca de pruebas específicas 153 
Cap. 6. Pruebas de aprovechamiento escolar y decisiones educati-
vas 166 
Cap. 7. Diseño y construcción de una prueba 196 
Cap. 8. Pruebas de aprovechamiento estandarizadas 266 
Cap. 9. Pruebas estandarizadas de inteligencia o de aptitud escolar 288 
Cap. 10. Medición de aptitudes especiales 342 
Cap. 11. Cuestionarios e inventarios de auto apreciación 383 
Cap. 12. El individuo evaluado por otros 433 
Cap. 13. Pruebas y observaciones de la conducta 476 
Cap. 14. Planeación de un programa de pruebas escolares 517 
Cap. 15. Calificaciones y forma de calificar 569 
Cap. 16. Problemas sociales y políticos de la evaluación 589 
Apéndices 607 
7 
Catalogación en la fuente 
Thorndike, Robert L. 
Medición y evaluación en psicología y educación. --
2a ed. -- México : Trillas, 1989 (reimp. 2006). 
680 p. ; 23 cm. 
Traducción de: Measurement and evaluation in 
psychology and education 
Incluye bibliografías e índices 
ISBN 968-24-3144-1 
1. Pruebas mentales. l. Hagen, Elizabeth P. 11. t. 
D- 153.94'T773m 
Versión autorizada en españoi 
de la edición publicada en inglés por 
John Wiley & Sons, Nueva York, N. Y. EUA 
La presentación y 
disposición en conjunto de 
MEDICIÓN y EVALUACIÓN EN 
PSICOLOGíA Y EDUCACIÓN 
son propiedad del editor 
Ninguna parte de 
esta obra puede ser 
reproducida o trasmitida, mediante ningún 
sistema o método, electrónico o mecánico 
(incluyendo el fotocopiado, la grabación 
o cualquier sistema de recuperación y 
almacenamiento de información), 
sin consentimiento por escrito del editor 
Derechos reseNados en lengua española 
© 1970, Editorial Trillas, 5 . A. de C. \1. 
División Administrativa 
Av. Río Churubusco 385 
Col. Pedro María Anaya, C. P. 03340 
México, D. f 
Tel. 56884233, FAX 56041364 
LC- LB1l31 'T4.5 247 
División Comercial 
Calzada de la Viga 1132 
C. P. 09439, México, D. f 
Tel. 56330995 
FAX 56330870 
www.trillas.com.mx 
Miembro de la Cámara Nacional de 
la Industria Editorial 
Reg. núm. 158 
Primera edición en español ES 
ISBN 968-24·0166-6 
(El, EA, EE, EX, EO, XR, XA, XM) 
Segunda edición en español XO 
ISBN 968-24-3144-1 
(01; QM, QX, 51; 51) 
Reimpresión, 2006 
Se imprimió en 
Rotodiseño y Color, 5 . A. de C. V 
AO 75XSS 
.: , .... : ... ; .. : 
Prefacio 
Cuando apareció la primera edición de este libro, hace 22 años, la educa-
ción y el público estadounidenses eran presas de un impulso apresurado por 
alcanzar la excelencía, en respuesta a los triunfos espaciales de los rusos. Des-
de entonces han surcado los cielos muchos sputniks y han soplado muchos 
vientos distintos sobre las mediciones psicológicas y educativas. Dentro de la 
sociedad, la presión para la integración, por la igualdad de derechos para todos 
y para el derecho al empIco ha llamado la atención acerca de la cuestión de lo 
apropiado de las pruebas de admisión a la licenciatura y de selección de perso-
n:l!. Dentro de las escuelas, las propuestas revividas para la instrucción per-
sonalizada han hec.ho que se reconozca que la comparación de un alumno con 
sus compañeros no siempre proporciona la información que se necesita para 
las decisiones educativas¡ sin embargo, la necesidad de contar con informa-
ción objetiva'y confiable como base para tomar decisiones continua inalte-
rable y los procedimientos de pruebas y medidas constituyen una fuente 
importante de información. 
En esta edición, que es la cuarta, destacamos las consideraciones recientes 
acerca de una evaluación que sea justa, considerando los derechos de los indi-
viduos y las pruebas de criterio en las que se toma lo que es útil de lo nuevo sin 
acumularlo todo, combinándolo con los cimientos sólidos de la medición psi-
cológica y educativa desarrollados a lo largo de los 70 últimos años. Nuestro 
propósito es hacer un tratamiento balanceado mediante el cual se consideren 
las preocupaciones de la dée¡lda de los setenta sin perder la fundamentación 
sólida del pasado. 
En esta edición partimos de la suposición de que las pruebas y las medidas 
ayudan a tomar decisiones acerca del tema principal. Hemos identificado un 
amplio rango de decisiones personales y educativas y nos hemos preguntado 
cómo pueden contribuir los procedimientos de pruebas y mediciones en cada 
una de ellas. Parece que esto es la esencia de la materia. El valor de las pruebas 
y las mediciones está dado en 'la medida en que su empleo permite tomar 
mejores decisiones. Si siempre se tiene en cuenta este fin, una valoración sóli-
da de las pruebas como un medio para ello parece factible . 
También nos gustaría sugerir que si los estudiantes de psicología buscan 
ayudas adicionales en el área de la medición y la evaluación, es conveniente 
que lean la obra Perspectives in Measurement and Evaluation, que es una 
guía-estudio elaborada por Daniel J. Mueller, de la Universidad de Indiana, y 
5 
Traducción: Elisa María González, maestra en psicología clínica por la 
Universidad de las Américas, México 
Revisión técnilia: Arturo Silva Rodríguez, maestro en psicología por la Escuela 
Nacional de Estudios Profesionales-Iztacala, Universidad Nacional 
Autónoma de México, y profesor e investigador en la misma 
institución 
, 
MEDICION y , 
EVALUACION EN 
PSICOLOGíA Y EDUCACiÓN 
MEDICiÓN Y EVALUACiÓN 
EN PSICOlOGfA y EDUCACiÓN 
Robert L Thorndike 
Elizabeth P. Hagen 
Durante el siglo xx se desarrollaron numerosas 
técnicas de evaluación del individuo, aplicándose a 
muchos aspectos de su personalidad y sus habilidades. 
En esta obra se destacan las consideraciones más 
recientes ~cerca de la forma correcta dehacer una 
evaluación justa, en la que se combinen los elementos 
útiles de las nuevas teorías de la medición psicológica 
con los conocimientos desarrollados en las últimas 
siete décadas en esta materia. 
Los autores comienzan por hacer una aproximación 
hacia el uso de las pruebas y, no obstante que este 
libro trata sobre medición, dedican un capítulo a las 
técnicas estadísticas básicas por la relación que éstas 
guardan con la medición psicológica. 
A través de los diferentes capítulos se muestran al 
estudiante de psicología, las cualidades deseadas en 
los instrumentos de medición, las normas y unidades 
utilizadas en la evaluación y se le orienta acerca de 
cómo diseñar y construir pruebas específicas: de 
aprovechamiento escolar, de inteligencia, de conducta 
y de aptitudes laborales. 
Además, se exponen cuestionarios e inventarios de 
autoapreciación y se analizan los problemas sociales 
y políticos de la evaluación al individuo evaluado por 
otros, así como la manera de calificar las pruebas. 
OTROS TíTULOS 
ELABORACIÓN DE TESTS 
Desarrollo e interpretación de los tests de 
aprovechamiento 
Dorothy Adkins Wood 
En pocas páginas, proporciona los principios 
básicos de medición, técnicas y estadísticas 
aplicables a cualquier campo temático, 
procedimientos específicos, sugerencias prácticas y 
múltiples consejos para construir, analizar y calificar 
,. 
MEDICION y 
EVALUACiÓN EN 
PSICOLOG~ y EDUCACiÓN 
. , .: -' -~. : -;". . : .:. . 
1 
Una aproximación hacia 
el uso delas pruebas 
Este mundo está lleno de decisiones, algunas de ellas a ni\"el nacional e in-
ternacional, que se relacionan con la política concerniente a los presupuestos
 
y tratados, a la energía ya la contaminación, pero esto no nos preocupa por el
 
momento. Algunas decisiones son acerca de ciertas cosas, por ejemplo, si sería
 
bueno comprar un automóvil nuevo y de qué marca, pero estas decisiones
 
tampoco constituyen nuestra preocupación actual; sin embargo, muchas de
 
estas decisiones conciernen a las personas, ya sea de manera individual o en
 
grupos, y esto es lo que se relaciona con la evaluación y medición psicológica
 
y educacional. El maestro, el asesor, el administrador escolar, e! psicólogo 
industrial o de trabajo constantemente participan en la toma de decisiones
 
acerca de la gente o ayudan a ésta a hacerlo respecto de su propia vida. El obje-
tivo de los procedimientos de medición es proporcionar la información que
 
permita tomar estas decisiones de manera mris apropiada. 
TIPOS DE DECISIÓN ACERCA DE 
LAS PERSONAS 
Existen diversos tipos de decisiones, algunas pueden ser instrucciol1a-
les, muchas de las que toman los maestros son de este tipo. En ocasiones esta 
clase de decisiones consideran al grupo de clase en su totalidad; por ejemplo,
 
si se debe tomar el tiempo de la clase para revisar el concepto de "pedir pres-
tado" en una resta, o si la mayoría de! grupo ya tiene una competencia ade-
cuada en esta habilidad. Algunas decisiones instruccionales se relacionan
 
con algunos estudiantes específicos en la clase, por ejemplo, ¿qué libros
 
serían recomendables para María, de acuerdo con sus intereses y su habili-
dad para la lectura? Para que estas decisiones se puedan tomar adecuada-
mente es importante conocer en el primer ejemplo el nivel de habilidad que
 
') 
10 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS 
tiene la clase para "pedir prestado" yen el segundo qué tan competente lec-
tora es María. 
En otras ocasiones las decisiones son de tipo curricular. Las autoridades 
educativas de una escuela pueden estar considerando hacer cambios en el 
programa, como incluir el Phonetic initial teaching (método de enseñanza 
fonética del alfabeto) para las etapas iniciales en la instrucción de la lectura. 
¡Debería llevarse a cabo este cambio? La decisión adecuada requiere que se 
determine, ya sea por medio de la investigación directa dentro de la escuela o 
mediante la conjunción de voluminosos resultados de investigaciones ante-
riores, qué tanto progresan los niños cuando emplean este enfoque en lugar 
del convencional. Esta investigación sólo puede ser satisfactoria en tanto lo 
sean las medidas de habilidad para leer, por medio de las cuales se evalúan los 
resultados de los dos procedimientos educativos mencionados. 
También existen las decisiones de selección, que hacen las empresas o 
las instituciones educativas. Una universidad muy popular debe decidir, con 
fundamentos, cuáles estudiantes admitirá en el primer año de licenciatura. 
Los criterios para la admisión son múltiples y complejos¡ uno de ellos sue-
le ser que el estudiante admitido sea capaz de realizar con éxito el trabajo 
académico que le proporciona la universidad. Esta universidad busca infor-
mación en parte por medio de los registros escolares, pero también median-
te un p;ograma de pruebas que le permite juzgar cuáles de los solicitantes 
tienen probabilidades de alcanzar éxito en su programa. La decisión de selec-
cionar a la gente surge en los empleos lo mismo que en la educación, y la 
empresa, en la búsqueda de identificar a los empleados potencialmente más 
eficientes, también puede encontrar que la ejecución típica en una situación 
de prueba controlada proporciona la información que puede mejorar la pre-
cisión y la objetividad de sus decisiones. 
Algunas veces, las decisiones son de ubicación o de clasificación. Es pro-
bable que en una escuela secundaria se tenga que decidir si a un estudiante 
debe colocársele en la sección de estudiantes de rápido aprendizaje o en la sec-
ción regular del programa de matemáticas. En la Armada se tiene que decidir 
si un nuevo recluta debe ser asignado a la escuela de técnicos en electrónica o 
a la de cocineros y reposteros. Para ubicar y clasificar, quien va a tomar la 
decisión necesita información que le permita predecir qué tanto aprenderá el 
individuo o qué tanto éxito logrará en programas alternativos. Las medicio-
nes de aptitud, intereses y aprovechamiento previo pueden ser útiles para 
obtener esta información. 
Finalmente, hay muchas decisiones cuyo mejor nombre es el de decisio-
nes personales, porque son opciones que tiene el ind~viduo acerca de s! mis-
mo en las múltiples encrucijadas de su vida. Al termmar la preparatOrIa, ¿el 
estudiante deberá ir a la universidad o a una escuela técnica?; ¡deberá buscar 
un trabajo?, pero ¡qué tipo de trabajo? De acuerdo con la decisión tomada, 
¡qué especialidad deberá cursar en una escuela técnica? Para contestar estas 
preguntas, el estudiante deberá preguntarse: ¿qué ~Iase de persona so~?, 
;cómo podría compararme con otras personas?, ¡que debo hacer para satIs-
facer los requisitos de este tipo de trabajo?, ¿me gustará? Las mediciones de 
habilidades, intereses y temperamento pueden proporcionarle al estudiante 
información suficiente que le permitirá obtener una respuesta fundamentada. 
PAPEL QUE DESEMPEÑA LA MEDICIÓN 
EN LA TOMA DE DECISIONES 
11 
A lo largo de este libro la pregunta central será: ¡cómo pueden ayudar las 
técnicas de medición educativa y psicológica a las personas para que tomen 
mejores decisiones? Todas las otras preguntas que surjan se desarrollarán y se 
retroalimentarán de esta pregunta central. Pero, ¡ qué propiedades deben tener 
los instrumentos de medición para que nos ayuden a tomar decisiones sólidas 
v confiables? N ospreguntaremos en qué forma deberán presentarse los resul-
tados de una prueba, a fin de que nos sean más útiles en la toma de decisio-
nes. A medida que estudiemos las técnicas de evaluación que han sido diseña-
dos nos preguntaremos para qué tipos de decisiones puede contribuir con 
inf~rmación valiosa una técnica específica. También consideraremos una 
variedad de factores, como baja motivación, trastornos emocionales, escolari-
dad inadecuada o antecedentes culturales, que puedan distorsionar la infor-
mación proporcionada por las pruebas, los cuestionarios o cualquier tipo de 
evaluación¡ asimismo, analizaremos las precaucionesnecesarias para emplear 
la información de cada técnica de evaluación en la toma de decisiones. 
Por supuesto, los procedimientos de evaluación no toman las decisiones, 
~ino que son las personas quienes lo hacen. Lo más que pueden hacer los pro-
cedimientos de medición es ofrecer información relevante para tomar la deCI-
sión. Una prueba de aptitud escolar puede indicar qué tan bien podrá realizar 
Pedro tareas académicas en el nivel universitario y, al combinar esta informa-
ción con las demandas académicas de un programa de ingeniería en una uni-
versidad específica, la puntuación de la prueba puede proveer una estimación 
aproximada acerca de qué tantas posibilidades tiene Pedro de estudiar el pro-
grama de ingeniería, pero sólo Pedro puede decidir si quiere estudi~r dic?o 
programa en esa universidad, pues ¿está realmente interesado en la mgeme· 
ría?, ¡tiene alguna razón personal para querer inscribirse en una deter~in,ad,a 
universidad?, ¡cuáles son los factores económICOS dentro de esta declsJOn'l 
¡a qué aspira Pedro en la vida? Tal vez a él le gustaría ser un granjero o un 
haragán¡ quizá no tiene la menor motivación ni ningún interés por la educa-
ción superior. 
El ejemplo anterior debe dejar en claro que las decisiones acer~a de las 
acciones que deben tomarse involucran no sólo a los hechos reales smo tam-
bién al sistema de valores. ¡Debe Pedro inscribirse en Siwash o en Harvard? 
Una prueba de aptitud escolar produce una puntuación o calificación que es 
un hecho, el cual permite predecir que Pedro tiene cinco oportunidades de 
seis de ser admitido en Siwash y sólo una de seis de ser admitido en Harvard¡ 
pero si Pedro considera a ésta 10 veces más deseable que aquélla, quizá aún sea 
una decisión sensata dejarle que solicite su inscripción en Harvard en vez de 
en Siwash, a pesar de que tiene más bajas probabilidades, de que lo ad~itan. 
Así vemos que la prueba no proporciona ninguna información-en el conjunto 
de valores, y esta información debe complementarse por medio de otras fuen-
tes antes de que se pueda tomar una decisión sensata. 
Otro ejemplo, una prueba de aptitud puede permitirnos estimar la proba-
bilidad de éxito para un estudiante negro o para uno hispánico, comparada 
con la probabilidad de estudiantes blancos, en algún tipo de entrenamiento 
12 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS 
profesional¡ sin embargo¡ una decisión con respecto a su admisión tendría que 
incluir¡ explícita o implícitamente¡ algunos juicios acerca de los valores relati-
vos de la sociedad al incluir más personas blancas en esa profesión¡ en com-
paración con el valor de incrementar la representación de negros o de hispá-
nicos. Estos puntos acerca del sistema de valores suelen ser complejos y 
controvertidos¡ y por lo general deben tomarse en cuenta en la toma de deci-
siones. Es necesario reconocer la.importancia de este tema¡ así como que los 
procedimientos de evaluación sean demasiado precisos para que no puedan 
culparse de las ambigüedades y los conflictos susceptibles de encontrarse en 
nuestro sistema de valores. 
La función de la evaluación educativa y psicológica es sólo ofrecer in-
formación en cuanto a las decisiones que podrían tomarse. Esperamos que 
proporcionen información útil¡ Y que ésta sea mejor que otras opciones. El 
estudio de la evaluación educativa y psicológica deberá permitirnos conocer 
con detalle los recursos y las técnicas disponibles para obtener información 
acerca de las personas. Más allá de eso ¡ estos estudios deberán aportar criterios 
para evaluar la información que ya está provista mediante tales recursos¡ a fin 
de determinar el grado de confianza que debe tener la información que apor-
tan y para advertir las limitaciones inherentes a esa misma información. 
Hasta 'aquí hemos considerado las decisiones prácticas que conducen a 
actuar¡ pero la medición también es importante para proveer la información 
que guíe las decisiones teóricas. En estos casos¡ el resultado deseado no es la 
acción¡ sino la comprensión. ~Leen más rápido las niñas que los niños? Se 
necesita una prueba de lectura que proporcione la suficiente información en 
la cual basar esta decisión. ¡Obtienen más baja calificaCión los estudiantes que 
se angustian con las pruebas¡ en comparación con los que no se angustian? 
Para responder esta pregunta se debe usar un cuestionario acerca de la (J angus-
tia ante las pruebas¡¡¡ así como una prueba de aprovechamiento escolar. La 
medición es fundamental para contestar prácticamente todas las preguntas 
que formula la ciencia¡ no sólo las ciencias físicas¡ sino también las biológi-
cas y las sociales. 
ASPECTOS DEL INDIVIDUO QUE SON 
RELEVANTES PARA LAS DECISIONES 
Algunas de las decisiones en las que pudiéramos estar interesados están en 
relación con la información acerca de lo que puede hacer en el momento de la 
evaluación una persona o un grupo de personas. Muchas decisiones instruc-
cionales en las escuelas requieren información de esta naturaleza. Por ejem-
plo¡ si Óscar comete muchas equivocaciones al leer en voz alta¡ ¡podrá apa-
rear las palabras con su sonido consonante inicial? U na prueba breve acerca de 
esta habilidad particular puede ayudarnos a decidir si la falta de ella forma 
,rarte del problema de lectura de Óscar. ¡Cuántos compañeros del grupo de 
Osear dominan la regla para escribir con mayúscula los nombres propios? 
Una prueba para tal propósito puede proporcionar evidencia para guiar la 
decisión acerca de si se necesita más enseñanza de esta habilidad en especial. 
¿Produce un aprovechamiento satisfactorio el programa de matemáticas 
ASPECTOS DEl INDIVIDUO 13 
yigente en Centerville? Una investigación acerca de esta prueba de matemáti-
cas con normas en los niveles nacionales y regionales permitirá comparar a los 
estudiantes de Centerville con los estudiantes del resto del país¡ además de 
que esta comparación puede combinarse con otra información respecto de los 
alumnos de Centerville y sus escuelas¡ para llegar a un juicio acerca de si este 
progreso es satisfactorio. 
El tipo de prueba de habilidad que describe lo que una persona ha aprendi-
do a hacer se lIama prueba de aprovechamiento. Las pruebas de aprovecha-
miento señaladas en los ejemplos anteriores son dos tipos de pruebas que con-
u'astan marcadamente. La prueba de las consonantes iniciales y su sonido está 
reIJcion.lda con el dominio de una habilidad específica para un solo estudian-
te¡ y no surge ninguna pregunta acerca ~e si Óscar es mejor o peor que ningún 
otro alumno; la única pregunta es si Oscar puede realizar esta tarea lo sufi-
cientemente bien para que sea adecuada a su lectura. Asimismo¡ la maestra de 
Óscar puede estar preocupada por el nivel de dominio de una habilidad espe-
cífica del uso del inglés dentro de un grupo. Las pruebas que conciernen al 
dominio de habilidades tan definidas se suelen llamar pruebas referidas al 
contenido o pruebas referidas al criterio¡ porque el enfoque se centra exc1u-
si\"amente en lograr un estándar de ejecución de una habilidad específica a la 
que se pretende medir por medio de los ejercicios de una prueba. Tal vez 
la mayoría de las evaluaciones necesarias para tomar decisiones instrucciona-
les t'on de este tipo. 
Con base en lo anterior¡ podemos contrastar la investigación acerca de la 
prueba de matemáticas que se utilizó en Centerville. En ésta¡ la decisión es si 
Ccntcrville demuestra un aprovechamiento satisfactorio cuando se le com-
p,lra COIl otros pueblos parecidos. El punto de referencia no está dado en la 
t¡lIT<l per se¡ sino en el desempeño en un grupo de referencia más general. Este 
tipo de pruebas se denomina prueba referida a la normal porque la norma 
para un desempeño aceptable se fija por medio de la comparación con otro 
grupo. Una prueba referida a la norma se puede usar apropiadamente para 
tom,lf decisiones en el curriculum de una profesión¡ en orientación vocacio-
n,II y en inycstigación. Más adelante se compararán y contrastarán las pruebas 
de aprovechamientoreferidas t'anto al criterio como a la normal en cuanto a 
sus aspectos de construcción¡ características deseadas v uso. 
Algunas decisiones que necesitamos tomar requier~n tener información 
acerc\ de lo quc una persona puede aprender a haceL ¡Será capaz Elena de 
dominar las técnicas de programación de computadoras, ¡ ¡qué tan rapido asi-
llllla . Ricardo el cálculo: Las decisiones de selección y colocación implican las 
prethCCIOBes ~c~rca del aprendizaje futuro¡ basadas en las características pre-
S~I.ltCS del mdlVlduo. Una prueba que se usa como predictor de alguna ejecu-
clOn futura recibe el nombre de prueba de aptitud. 
Es ncc~sario scñ~lar que entre los predictorcs eficaces de un aprendizaje 
futuro cstan las medldas de aprendizaje logrado en el pasado. Por lo tanto, 
par,1 los programas de computación y de cálculo¡ un predictor efectivo sería 
UIl;l prueba quc midiera el grado de dominio logrado en álgebra¡ en la escuela 
prep;lratona. Tal prueba nos ayudaría a medir previamente el conocimiento i 
las habd!dades aprendidas¡ pero también podríamos usarla para predecir el 
;lprel1lk:alc futuro. Debe reconocerse que cualquier prueba¡ sin importar su 
: , 
! . 
: .¡ . 
, , . 
. . . . 
14 CAP. 1. APROXIMACIÓN Al USO DE LAS PRUEBAS 
nombre, evalúa las habilidades presentes de una persona. No podemos medir 
directamente en una persona una habilidad "naturalH o lIinnata"; lo único que 
podemos medir es lo que una persona es capaz de hacer en el momento de la 
evaluación. Así, esta información puede ser usada para evaluar su aprendizaje 
pasado, como cuando se aplica una prueba de álgebra para decidir si Ricardo 
debería obtener una calificación aprobatoria en su curso de álgebra, o bien 
para predecir su aprendizaje futuro, como cuando se usa con el fin de decidir 
si Ricardo tiene una probabilidad razonable de completar el curso de cálculo 
de manera exitosa. La diferencia entre una prueba de aptitud y una de aprove-
chamiento r¡:¡dica más en el uso final que se le dará a los resultados de ambas, 
que en la naturaleza del contenido de las pruebas mismas. 
Algunas decisiones requieren la información de lo que a una persona le 
gusta hacer. En estos casos tratamos con la evaluación de intereses o de valo-
res. En las decisiones que toma un individuo en cuanto a su elección educativa 
o vocacional, es muy importante que pueda evaluar si un futuro en particular 
le brindará satisfacción completa, así como juzgar si es probable que logre un 
alto nivel de éxito. Los procedimientos sistemáticos para obtener de una per-
sona un catálogo de lo que le gusta y lo que desearía ser nos permite producir 
una calificación que indicaría la probabilidad de que se interesara en cual-
quiera de varias ocupaciones o actividades. 
Algunas decisiones en relación con las personas requieren información 
acerca de lo que cada quien hace típicamente. En interacción con otros, 
¡María toma la iniciativa y lucha para obtener el papel de líder?, o se conforma 
con permanecer sentada y espera que alguien lo asuma. Bajo la presión de un 
examen o de algún evento importante ¿"se mantiene tranquilo" José o se 
"pone nervioso"? Las evaluaciones del estilo de vida, del temperamento o de la 
personalidad, constituyen algunos de los instrumentos psicométricos más 
variados, más interesantes y también más engañosos. 
Finalmente, algunas decisiones, sobre todo aquellas que se relacionan con 
el entendimiento de la conducta humana, requieren medidas de estados inna-
tos y de rasgos de los individuos. Éstos son los constructos, es decir, los atri-
butos de los individuos que construimos expresamente para ayudamos a 
explicar o teorizar acerca de su conducta. Expresiones como angustia, intro-
versión, dependencia de campo, autoritarismos y muchas otras, se refieren a 
aspectos de sentimientos, los cuales son útiles para algunos psicólogos a fin de 
comprender mejor la organización y la dinámica de la conducta. 
En los capítulos siguientes estudiaremos las medidas de habilidades {tanto 
de aprovechamiento como de aptitud!, de intereses, de temperamento y de 
constructo s que pueden ayudarnos a entender la conducta de las personas. Sin 
embargo, primero consideraremos de dónde proviene la información acerca 
de las personas, a qué se le llama un buen proc~dimiento de medición y cuáles 
son algunos de los puntos claves en la medición psicológica y educativa. 
SITUACIONES EN LAS QUE SE OBTIENE 
INFORMACIÓN ACERCA DE UNA PERSONA 
¡De dónde proviene la evidencia por medio de la cual podemos evaluar las 
características de una persona? Las fuentes. se dividen en dos tipos principales: 
.... . 
. .; ; •• , >.' .•. • . .... , 1 ° 
.-.- . 
INFORMACIÓN ACERCA DE UNA PERSONA 15 
situaciones naturales que ocurren en la vida cotidiana y situaciones de "prue-
ba" especialmente estructuradas. 
Es importante recordar, especialmente en un libro acerca de las pruebas y 
mediciones, que mucha de la evidencia por medio de la cual obtenemos las 
características de una persona proviene de eventos que ocurren de manera 
natural. Un maestro observa a sus estudiantes diariamente en el. salón de cla-
ses a medida que interactúan con sus compañeros y con los materiales para 
efectuar las tareas del día. Un supervisor observa a sus empleados en el tra-
bajo. Todos nosotros nos relacionamos con nuestra familia y con nuestros 
amigos tanto en el trabajo como en el juego. A partir de estas interacciones 
nos formamos impresiones de la persona observada, las cuales suelen ser bur-
das y asistemáticas, pero están basadas en un amplio rango de situaciones de la 
vida diaria. 
Podemos tratar de sistematizar y usar estas observaciones de la vida dia-
ria en varios modos. Cuando se pretende usar las observaciones acumuladas 
que han ocurrido en el pasado, podemos tratar de organizarlas y cuantificar-
las mediante algún tipo de reporte o registro. Los problemas y los beneficios 
de usar procedimiento de registro se analizarán en el capítulo 12. Es posible 
observar la conducta como ocurre, por ejemplo, la conducta en un salón de 
clases de una escuela primaria o la conducta en un área de juego de un kín-
der; pero la conducta natural es el conjunto complejo que reúne muchos 
aspectos, por lo cual será necesario definir cuidadosamente lo que se va a 
observar, a fin de utilizar procedimientos adecuados para registrar las carac-
terísticas deseadas y entrenar observadores para que apliquen las definicio-
nes y usen dichos procedimientos. Los problemas y procedimientos para 
evaluar aspectbs de una persona por medio de la observación directa tam-
bién se analizan detalladamente en el capítulo 12. 
De las varias ventajas que existen en basar las apreciaciones en la conduc-
ta que ocurre de manera natural, la primordial reside en que la conducta es 
espontánea, y no artificial; es la manera como los individuos se comportan 
cuando son ellos mismos y está libre de fachadas o distorsiones intenciona-
das. De esta manera, el individuo que es observado no muestra lo que quisiera 
ser, sino a la persona que realmente es. No obstante también existen muchas 
desventajas. La observación es demandante y requiere mucho tiempo. La 
memoria de la conducta pasada está sujeta a toda clase de distorsiones; la clase 
de conducta en la que podríamos estar interesados quizá no ocurra de manera 
espontánea de tal modo que podamos observarla o, por lo menos, tan a menu-
do que pudiera darnos una fuente de observación adecuada. Por estas razones, 
en, .. múltiples ocasiones es más eficaz apoyamos en situaciones especialmente 
estructuradas y diseñadas para provocar aquella en la ·~ue estamos interesa-
dos, de tal forma que podamos observarla convenientemente. 
. La prueba de aprovechamiento o de aptitud de papel y lápiz es un tipo de 
situación específicamente estructurada de mediciones psicológicas y educati-
vas. En el capítulo 7 se analizarán la preparación de estas pruebas y en los ca-
pítulos 8, 9 y 10, su aplicación. También podemos usar el formato del papel y 
el lápizpara obtener una descripción de los sentimientos y las reacciones per-
sonales de un individuo. Los inventarios de autorreporte son especialmente 
importantes para evaluar intereses, actitudes, valores y características del 
16 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS 
temperamento y ajuste emocionaL Los instrumentos de este tipo se estu-
diarán en el capítulo 11. 
Las situaciones de "prueba" artificiales no están limitadas a las que se pre-
sentan en un folleto de pruebas en un salón de clases o en un lugar semejante. 
La prueba puede requerir que los individuos demuestren poseer alguna habili-
dad, por ejemplo, mediante una prueba de mecanografía; también se les puede 
poner en alguna situación interpei-sonal con una determinada tarea que se 
realice en grupo; o bien se les puede proporcionar herramientas y un televisor 
descompuesto y pedirles que localicen y corrijan la falla. Estas medidas de eje-
cución son bastante menos convenientes que las tareas que pueden presentar-
se en un folleto, pero tienen una función relevante para evaluar las habilida-
des de ejecución que son importantes tanto en los aspectos educativos como 
en la vida misma. Algunos problemas peculiares de este tipo de pruebas se des-
criben en el capítulo 13. 
PASOS ESENCIALES EN LA MEDICIÓN 
En este libro nos referimos a la medición de habilidades humanas, de il).-
tereses y de rasgos de personalidad. Sin embargo, necesitamos aclarar lo que 
implica la medición de qué requisitos debemos satisfacer para hablar de medi-
ción de una manera válida. Es más, necesitamos preguntarnos qué tan bien 
satisfacen estos requerimientos las técnicas para medir los aspectos de las per-
sonas en los que estamos interesados. 
En cualquier campo la medición siempre implic·a tres etapas: 
a) Identificación y definición de la cualidad o el atributo que se va a 
medir. 
b) Determinación del conjunto de operaciones por medio de las cuales se 
puede manifestar y percibir ese atributo. 
e) Establecimiento de un conjunto de procedimientos o definiciones para 
convertir las observaciones en enunciados cuantitativos de grado y 
cantidad. 
Comprender cada una de estas etapas y las dificultades que presentan per-
mitirá contar con bases sólidas para entender los procedimientos y problemas 
de la medición en la psicología y la educación. 
Identificación y definición de un atributo 
Nunca medimos una cosa o una persona. Las mediciones que hacemos 
siempre son de las cualidades o los atributos de las cosas o personas; por ejem-
plo, medimos la longitud de una mesa, la temperatura de un horno, la dura-
bilidad de una llanta de automóvil, el sabor de un cigarrillo, la inteligencia 
de un niño, la madurez emocional de un adolescente. Cuando tratamos con 
los atributos físicos más simples, como la longitud, rara vez nos preguntamos 
acerca del significado o de la definición de ese atributo. El significado de la 
PASOS ESENCIALES EN LA MEDICiÓN 17 
longitud fue establecido hace mucho tiempo en la historia de la humanidad. A 
pesar de que el dominio de los conceptos largo y corto pueden representar 
logros significativos en la vida de un niño en edad preescolar, los conceptos 
son automáticos y axiomáticos en la vida adulta, pues todos sabemos lo que 
significa el concepto de longitud. Sin embargo, esto no siempre ocurre para 
todos los atributos físicos, porque ¿qué entendemos por durabilidad de una 
llanta de automóvil?, ¡resistencia al desgaste y abrasión por contacto con la 
carretera; resistencia al deterioro y al desgaste con el paso del tiempo; resisten-
cia a las ponchaduras con objetos puntiagudos, o una combinación de estos 
tres elementos y posiblemente algunos otros más? Hasta que no lleguemos a 
un acuerdo acerda de lo que significa durabilidad, no podremos hacer ningún 
progreso respecto a su medición. En la misma proporción en que estamos en 
desacuerdo con lo que significa durabilidad, también estaremos en desacuer-
do con los procedimientos para medirla, y si usamos diferentes procedirnien-
tos, estaremos en desacuerdo acerca del valor que obtenemos al presentar la 
durabilidad de una marca particular de llanta. 
El problema de establecer acuerdos en lo que respecta a un concepto dado 
es aún más complejo cuando consideramos atributos con los que trata el 
psicólogo y el educador. Por ejemplo, ¡qué se define como inteligencia?, ¿qué 
clase de conducta se considerará como inteligente?, ise definiría el concepto 
principalmente en términos de ideas y conceptos abstractos que maneja el 
individuo o tendríamos que inch,lÍ[ la forma en que maneja eventos concre-
toS!, ¡se referiría principalmente a la conducta en situaciones novedosas o 
incluiría respuestas en ambientes familiares y habituales?, ¡no se refería a la 
rapidez y a la fluidez de sus respuestas, o al nivel de complejidad sin consi-
derar el tiempo? Casi todos tenemos una idea general acerca de lo que quere-
mos decir cuando caracterizamos una conducta como inteligente, pero 
existen muchos puntos específicos en lo que podríamos estar en desacuerdo 
cuando tratamos de elaborar una definición precisa. Esto pasa a menudo con 
casi todos los conceptos psicológicos, aunque en distintos grados, y el primer 
problema que afronta el psicólogo o el educador conforme trata de medir los 
atributos en los que está interesado es lograr una definición precisa, clara y 
aceptada universalmente del atributo que se propone medir. 
Sin embargo, anterior a esto debemos decidir qué atributos son los rele-
vantes e importantes de medir si nuestra descripción va a tener alguna utilidad 
para nuestras necesidades actuales. Una descripción puede no ser útil para el 
problema que afrontamos si seleccionamos características irrelevantes para 
su descripción. ASÍ, para describir un cuadro que deseamos enviar a otra ciu-
dad debemos especificar su longitud, su anchura y su peso, y puede ser que lo 
hagamos con gran precisión. Por otra parte, si nuestro propósito es caracteri-
zar el cuadro ~omo una obra de arte, la descripción anterior no tendría ningún 
yalor; los atnbutos del cuadro que acabamos de describir serán totalmente 
Irrelevantes en su calidad como obra de arte. 
De manera similar, la descripción de una persona puede ser de muy poco 
valor para .n~estro propósito si seleccionamos las características equivocadas 
para descnbula. Por ejemplo, una compañía que selecciona empleados para 
que ocupen el puesto de choferes de camión, puede poner a prueba las habili-
dades de comprensión verbal y las de resolución de problemas cuantitativos 
" 
:'¡ 
18 CAP. 1. APROXIMACIÓN Al USO DE lAS PRUEBAS 
de los solicitantes, y obtener medidas muy precisas de estas funciones· sin 
e~bargo, es probable que esta información sea de muy poca ayuda para iden-
tifICar a las person~s que tendrían pocos accidentes en carretera y que fueran 
esta~l~s en su trabaJo: Otros factores, como la coordinación ojo-mano, la per-
cepCIOn de profundIdades y no poseer impulsos agresivos incontrolados 
podrían ser mucho más relevantes en las tareas y presiones que tiene qu~ 
afrontar un chofer de camión. . 
C:0nsidérese el caso siguiente: un maestro de música de secundaria que 
examma con mucho detalle el conocimiento de sus alumnos acerca de datos 
tales como quién esSribió el Concierto Emperador y si un andante es más rápi-
do que un allegro. Sm presentarles a sus alumnos nunca una nota musical ni 
músi~ real, ni u~ .solo te~a O una melodía o una sola interpretación d~ su 
aprecIo P?r la musIc.a en VIVO! ,el maestro de música obtuvo una apreciación 
~uy c~nh~ble de la mformacIOn del gusto musical, obviamente la prueba no 
tIene mngun valor, porque el maestro utilizó trozos de conocimiento factual 
acerca de la música y los compositores, en vez de cualquier indicación de pro-
greso en la apreciación del campo musical mismo. 
Identificación de operaciones para 
medir un atributo 
El segundo aspecto de la medición es encontrar o crear una serie de opera-
ciones que aíslen el atributo en el que se está interesadoy que así se nos mues-
tre con claridad. El sistema para medir la longitud de un objeto (por ejemplo, 
una mesal_se postuló .~n las primeras etapas de la historia de la humanidad, y 
se lo ensenamos al mno muy temprano dentro de su educación escolar. La 
regla, el metro y las medidas están uniformemente aceptadas como los instru-
mentos apropiados, y sólo ponerlos a lo largo del objeto es un procedimiento 
apropia.do para mostrar la lo~gitud de la mesa, del escritorio o de cualquier 
otro obJe~o que .estem<;>s estudIando. P~ro las operaciones para medir la longi-
tud o la dIstancIa no SIempre son tan sImples. ¿Por medio de qué operaciones 
podeI?os medir la distancia entre Nueva York y Chicago?, ¿de la Luna al So!?, 
¿del sIsteI?a solar ~ la nebulosa espiral gigante de Andrómeda?; ¿cómo pode-
mos medu la longItud del bacilo tuberculoso o el diámetro de una neurona? 
La ciencia física ha progresado más allá de un enfoque directo y simple de 
poner una vara de medir a lo largo de un objeto, al desarrollar tantos instru-
m~ntos ~ue ~an ampliado las capacidades de nuestros sentidos como procedi-
mIentos IndIrectos que nos hacen accesibles las cantidades demasiado grandes 
. o pequeñas. Las operaciones para medir la longitud O la distancia se han vuel-
to indirectas, elaboradas y muy precisas, y han sido aceptadas porque dan 
resultados consistentes, verificables y muy útiles. 
Si reconsideramos el ejemplo de durabilidad de la llanta de un automóvil 
podremos ver que las operaciones para evaluar este atributo dependerán de l~ 
definición que hemos aceptado para ella. Si nuestra definición es en térmi-
no~ de resistencia a la abrasión, necesitamos desarrollar algún procedimiento 
um.forme y estándar para aplic~r una fuerza abrasiva a un e~pécirnen y medir 
el ntmo al que la llanta se detenora: una prueba de carretera simulada yestan-
. 0 .... '- .- ' . ..... 
. 0 '., ',' 
PASOS ESENCIALES EN LA MEDICIÓN 19 
darizada. Si dicha definición se refiere a la resistencia a las ponchaduras con 
objetos puntiagudos, n~cesitamos.aplicar fuerzas ~aduales de puntas. Si la 
definición implica detenoro a partIr del sol, del aceIte y de otros agentes des-
tructivos nuestro procedimiento deberá exponer a los especímenes a esos 
agentes"; proporcionar al~n. ípd~ce de la p~rdida de fuerza y de resistencia... 
resultantes. Si nuestra defInICIOn mcluye mas de un aspecto, entonces debe-
mos incorporar a cada uno de ellos, con sus valores apropiados, en nuestra 
evaluación. . 
La definición de un atributo interactúa con las operaciones que lo pro-
vocan. Por un lado, la definición que hemos fijado determina lo ~ue acepta-
remos como operaciones relevantes y razonables. De manera mversa, las 
operaciones que seamos capac~s de diseña~ p~ra provo~a~ ~ ,mostrar ~l atri-
buto constituyen, en un sentido muy practIco, la defmIcIon del. atnbuto. 
Habíamos entonces de una definición operacional, la cual implIca que la 
serie de procedimientos que estamos ~ispuestos a ~ceptar, para de~o.s~r.ar 
la durabilidad de una llanta de automovIl, se conVIerten en una defmIcIon 
eficaz de la durabilidad. . - . 
Durante este siglo la historia de la medición psicológica y educa~IV~ ha 
sido en gran parte la historia de la invención de instrumentos y procedImIen-
toS para mostrar de manera estandarizada y en condiciones uniformes las 
conductas que sirvan como fndicadores de los atributos relevantes de l~s per-
sonas. Así la serie de tareas diseñadas por Binet y sus sucesores constItuyen 
operacion~s para medir conductas que son indi~adoras de la inteligen.ci~ .. Tan-
to la prueba de Stanford-Binet como otras mas han propuesto defIn~cIOnes 
operacionales de la inteligencia. El que no haya una sola prueba umversal-
mente aceptada y las diferentes pruebas varíen de alguna mane~a en ~as tareas 
que incluyen y en el rango en que colocan a ~as p~rs0Il:as, es eV1dencIa de que 
no existe un consenso acerca de lo que es la mtehgencIa, por un lado, o de lo 
que serían los procedimientos apropiados para provocarla, p<;,~ el ~tro',E~ta 
falta de consenso es característica del estado actual de la medIclon pSlcologlca 
y educativa. Debido a que existe mucha ambigüedad en nuestras ?efinicio-
nes y se han diseñado una gran variedad de instru~entos pa~a medIr las con-
ductas pertinentes, distintos instrumentos que miden un mIsmo rasgo colo-
can a las personas en un orden bastante distinto. Por.ejemplo, consideremos 
el rubro de "buena conducta" que aparece como un rasgo que debe calificarse 
en un gran número de boletas de reporte escolares. i Qué significa tener buena 
conducta para los niños de edad escolar?, ¿qué tanto podríamos ponemos de 
acuerdo para definirla? Inclusive, después de haber hecho un buen esf?erzo 
para definirla, ¿qué operaciones debemos diseñar para evaluar la presencia o la 
ausencia de ella? 
Cuantificación del atributo en unidades 
de grado o de cantidad 
Después de haber aceptado una serie de operaciones para mostrar un atri-
buto, la tercera etapa consiste en expresar el resultado de esas operaciones en 
", o " 
- ,. ;-. 
20 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS 
términos cuantitativos. Al respecto, cabe preguntarnos: ¿cuánto o cuántos? 
En el caso de la longitud de una mesa, la pregunta se convierte en: ¿cuántos 
centímetros? Un centímetro representa una unidad básica, y podemos demos-
trar que un centímet~o es igual a otro si se ponen uno alIado del otro y se com-
prueba su igualdad. Esta es la prueba más directa y clara de la prueba de igual-
dad para algunas de las mediciones físicas más simples. Para otros ins· 
trumentos de medición, como el termómetro, la igualdad de las unidades 
depende de una definición. Así, definimos que a incrementos iguales de tem-
peratura les corresponden cantidades iguales de expansión de un volumen de 
mercurio. Una amplia experiencia con esta definición ha mostrado su utili-
dad, ya que proporciona resultados que se relacionan de manera ordenada y 
significativa con muchas otras medidas físicas. 
Ninguno de nuestros atributos psicológicos tiene unidades cuya igual-
dad pueda demostrarse mediante una comparación directa, de la manera 
como pueden compararse el centímetro o el kilo. ¿Cómo podemos demostrar 
que el problema aritmético X es iguaC en cantidad de la habilídad aritméti-
ca que representa, al problema aritmético?, y ¿cómo podemos demostrar que 
un síntoma de angustia es igual a otro indicador de angustia? Por lo tanto, en 
las cualidades que conciernen al psicólogo y al educador, siempre es necesario 
tener alguna definición que .nos proporcione una forma de cuantificación. 
Con frecuencia consideramos a una serie de tareas como semejantes -definir 
palabras, resolver problemas aritméticos o hacer analogías- y contamos las 
respuestas correctas de un individuo en la serie. Para un prueba referida al cri-
terio acerca de una habilidad específica, podemos establecer el porcentaje de 
éxito ¡por ejemplo, 80 o 90) como nuestro criterio de 'ejecución y determinar 
si el individuo alcanza o no el estándar. Para una prueba referida a la norma, 
las puntuaciones crudas de las tareas ejecutadas correctamente se convierten 
en un enunciado referente a la edad o al grupo o grado al que la persona perte-
nece, o acerca de cómo se coloca dentro de ese grupo, por medio de los pro-
cedimientos que se estudiarán con más amplitud en el capítulo 4. 
La suma de tareas realizadas correctamente o de determinadas opciones 
de un cuestionario proporciona una definición posible y manejable de cane 
tidad, pero no tenemos evidencias adecuadas reales de la equivalencia de las 
diferentes tareas o de las distintas respuestas al cuestionario. ¡Con base en qué 
afirmamos que un reactivo de serie de números, como" 1 3 6 10 15 .. :", mide 
la misma cantidad de habilidad intelectual que, por ejemplo, un reactivo ana-
logía verbal, como "el calor es al frío como lo húmedo es a lo .. . "? 
Entonces, la definición de tareas equivalentes y, en consecuencia, de uni-
dades para pruebas psicológicas es bastantedébiL Por ejemplo, cuando revi-
samos la calificación de un maestro acerca de la cooperación de un niño o la 
evaluación de un supervisor de la iniciativa de un empleado, en la que se utili-
zan categorías tales como "superior", "muy buena", "buena", "satisfactoria" e 
"insatisfactoria", el significado de las unidades en las que se expresan estas 
calificaciones es aún más endeble. 
En la medición psicológica y educativa encontramos problemas en rela-
ción con las tres etapas que acabamos de describir. Primero, tenemos pro-
blemas para seleccionar y definir claramente los atributos a los que debemos 
avocamos. Aun para algo tan evidente como "habilidad para la lectura" pode-
CUALIDADES DESEADAS 21 
mas tener un rango de interpretación. ¡En qué medida nuestra definición 
debería incluir las siguientes características? 
a) Velocidad de lectura. 
b) Habilidad para convertir los símbolos visuales en sonidos. 
e) Obtención de significados literales de un texto. 
d) Obtención de inferencias con base en lo que se afirma en el texto direc-
tamente. 
e) Tener conciencia del sesgo del autor o de su punto de vista. 
A medida que tratamos con conceptos más complejos.e intangibles, como 
cooperación, ansiedad, ajuste emocional o rigidez, podremos esperar mayor 
diversidad en las definiciones. 
Segundo, encontramos problemas para diseñar lo.s pr?cedimientos qu.e 
midan los atributos relevantes. En algunos atnbutos pSlcologlCOS hemos tem-
do bastante éxito al descubrir las operaciones que se requieran para que un 
individuo muestre el atributo y nos permita observarlo bajo condiciones uni-
formes v estandarizadas. Esto es especialmente cierto en el área de las ha-
bilidade~ donde se han desarrollado pruebas estandarizadas en las que se pide 
al sujeto que tenga comprensión de la lectura, perciba relaciones de cantidad o 
indentifique las formas correctas de expresión idiomática. 
También existen muchos atributos en los que claramente no hemos teni-
do tanto éxito. iPor medio de qué operaciones estandarizadas seríamos capa-
ces de mostrar, de forma en que podamos evaluarlas, la iniciativa potencial de 
un empleado, la angustia de un niño escolar o la adaptabilidad de un soldado 
para el combate? Con una investigación continua y más ingenio podríamos 
diseñar mejores tareas por medio de las cuales se logren manifestar algunas de 
estas cualidades. Pero se supone que aún hay muchas más cualidades psicoló-
gicas para las que la identificación adecuada de las operaciones de medición 
permanecerán como un problema. 
Finalmente, aun las mejores unidades de medición psicológica tienen 
inconvenientes. Por definición, las unidades son iguales. Una definición 
puede tener cierto grado de certeza, pero la igualdad de unidades no puede 
establecerse directamente de la definición. Por lo tanto, la adición, la sustrac-
ción y la comparación de puntuaciones siempre serán, de alguna manera, 
dudosas. Más aún, la precisión con que se ev,11úa el atributo, la confiabilidad 
de una ocasión a otra o de una apreciación a otra, suele ser desalentadora-
mente baja. 
CUALIDADES DESEADAS EN EL 
PROCEDIMIENTO DE MEDICIÓN 
De las tres etapas que acabamos de considerar para el desarrollo de un 
procedimiento de medición se deducen las principales cualidades de éste para 
ayudar a que la gente tome mejores decisiones: proporcionar información 
relacionada con la decisión que se tome y proveer una información precisa. 
! . 
22 CAP. 1. APROXIMACiÓN AL USO DE LAS PRUEBAS 
Para algunos tipos de decisión, no es posible detenninar directamente su 
relevancia, sino a través del análisis de la tarea que se asigna al examinado o 
la clase de respuesta que produce. Así, si deseamos contratar a una mecanó-
grafa y sabemos que la principal parte de su trabajo consistirá en transcribir a 
máquina de manera limpia y precisa un borrador defectuoso, esta tarea nos 
proporcionará la infonnación necesaria para tomar la decisión de emplearla o 
no. A fin de decidir si un grupo necesita instrucción para aprender a poner el 
punto decimal en las multiplicaciones, aplicar un conjunto de problemas, 
como 11.33 X 4.5 = 50985, en el que se pide al examinado que coloque el 
punto decimal en el lugar apropiado, es el mejor procedimiento para tomar 
una decisión. 
En otros casos, la evaluación de la relevancia es bastante más compleja. 
¿Sería relevante basarse en la ejecución de lectura de Elena para tomar la deci-
sión de aceptarla o no en la Escuela de Derecho deSiwash?, ¿un inventario que 
evalúa la ascendencia social será relevante para decidir si Jaime debería buscar 
trabajo como vendedor de seguros de vida?, ¿una prueba de habilidad para en-
contrar las figuras ocultas de un complejo "camuflado" será adecuada para 
identificar a los individuos con "dependencia de campo" en un grupo, a fin de 
estudiar la relación que existe entre la H dependencia de-campoR y la sociabili-
dad? N o es fácil encontrar la respuesta a esta interrogante, pero la que se dé es 
central en la evaluación de la utilidad de los procedimientos de medición que 
se ofrecen dentro del campo de la psicología y la educación. Los problemas 
para valorar la relevancia o pertinencia de la prueba y. la medición que den 
como resultado decisiones educativas y psicológicas se considerarán con más 
detalle en el capítulo 3, bajo el encabezado de "Validez de la prueba". 
La evidencia es que el procedimiento de medición debe ser no sólo perti-
nente sino también exacto y representativo. Si un candidato para el empleo 
como mecanógrafo escribe 70 palabras por minuto en una prueba de mecano-
grafía, el personal de la oficina quiere tener cierta seguridad de que esta cifra es 
ciertamente representativa del ritmo de trabajo del solicitante y que no ten-
dría en una segunda prueba una velocidad de 40 a 100 palabras por minuto. Si 
Viviana obtuvo nueve reactivos correctos de lOen una serie de problemas de 
punto decimal en un lunes, y el maestro decide que ella domina esta habili-
dad, queremos tener la suficiente seguridad de que Viviana obtendrá más de 
cinco o seis respuestas correctas si se le aplica una prueba semejante el viernes. 
Por supuesto, no hay una sola medida que sea completamente precisa -aun 
cuando se mida algo tan simple como la longitud o el peso-, pero es necesario 
saber qué tanta variación podremos esperar en nuestros procedimientos de 
medición y, en consecuencia, cuánta confianza podemos tener en las califi-
caciones que obtengamos. Estos problemas también se estudiarán más de-
talladamente en el capítulo 3, bajo el encabezado de "Confiabilidad". 
ALGUNOS TEMAS ACTUALES ACERCA DE 
LA MEDICIÓN 
Las evaluaciones educativas y psicológicas están muy lejos de llegar a la 
perfección. Desde que se hicieron los primeros intentos para desarrollar téc-
.: ..... : '. 
'. > \ ~ 
TEMAS ACERCA DE LA MEDICiÓN 23 
nicas de medición de manera sistemática, éstas han tenido demasiadas criti-
cas muchas de las cuales han estado justificadas como respuesta a algunos 
ent~siasmos ingenuos de los teóricos de la medición, a otras aplicaciones con-
cebidas erróneamente ya las interpretaciones de los resultados de la medi-
ción. Al analizar la interpretación de una prueba y su uso en los capítulos ulte-
riores, tendremos en cuenta las criticas previas y los problemas más técnicos 
concernientes a la confiabilidad y validez de los resultados de la prueba. 
A continuación identificaremos y comentaremos brevemente algunos temas 
que han sido de una preocupaCión especial en el pasado reciente. 
Aplicación de pruebas a gmpos minoritarios 
Un tema que ha recibido mucha atención recientemente es el uso y la 
interpretación de las pruebas con los grupos minoritarios y con otras personas 
cuya experiencia y cultura diferían de lo que es típico de la población de Esta-
dos Unidos en general. Por supuesto, hay toda clase de subgrupos en la socie-
dad estadounidense, que difieren unos de otros de muchas maneras; empero, 
las minorías étnicas y lingüísticas son probablemente los ejemplos más clarosde esto, y son aquellos para los que se discute lo apropiado de las pruebas y 
los cuestionarios diseñados para la clase media blanca típica. 
Surgieron algunas inquietudes en relación con las pruebas de aprovecha-
miento mediante las cuales se realizaba la evaluación de lo que ha aprendido a 
bacer un estudiante. En parte, las discusiones se centraron en el grado en que 
se mantenían .los mismos objetivos educativos para los grupos de las minorías 
culturales. ¿Es importante para los niños negros, hispánicos o indios com-
prender al leer el inglés estándar?, ¿es tan relevante para estos grupos como lo 
es para los niños de la clase media blanca que están en el octavo grado, el cono-
cimiento de la Constitución de los Estados Unidos? De alguna manera, en lo 
que respecta a las habilidades básicas de lenguaje y de los números, muchos de 
los mismos objetivos se aplicarían, pero a medida que analizamos el conte-
nido de las áreas de historia, literatura y otras, debe haber más divergencia. 
Parcialmente, las preguntas se enfocan hacia los materiales específicos 
por medio de los cuales se exhiben las habilidades básicas. ¿El mismo capítu-
lo de un libro acerca de la vida de los esquimales sería apropiado como una 
prueba de lectura para un chico de un ghetto o de una reservación india?, o 
¿deberían elaborarse materiales específicos para la vida y las experiencias de 
cada uno de estos grupos~ Debido a que todavía sabemos muy poco acerca del 
efecto de los factores de contenido específico en la ejecución en áreas como 
la comprensión de la lectura, debemos investigar más para determinar su im-
portancia. 
Por otra parte, estos temas se refieren a la motivación de los grupos mi-
noritarios para tratar de responder correctamente las pruebas en el medio 
escolar. ¿Acaso no han desalentado las experiencias desafortunadas con las 
pruebas escolares a los miembros de los grupos minoritarios, de tal manera 
que se apartan de la tareé! y ni siquiera la intentan? Tal vez éste sea un desafío 
para todo el sistema escolar, así como para la selección de los instrumentos de 
prueba, a fin de equilibrar razonablemente experiencias exitosas y satisfac-
. .. ,. " . '. ~ .'.' , .'.' . , . 
j' 
24 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS 
torias en la escuela con todo tipo de tareas escolares. Las tareas y las pruebas 
deben adaptarse a las capacidades actuales y a los intereses del estudiante in-
dividual. 
Cada vez surgen muchas preguntas más serias conforme se emplean las 
pruebas como base para tomar decisiones acerca de lo que un individuo puede 
aprender a hacer, es decir, de las medidas de aptitudes. La inferencia de que 
una persona puede "aprender a hacer" con base en la puntuación obtenida 
en una prueba en el tiempo 1 es más "dudosa" que la inferencia que afirma 
solamente lo que él puede hacer hoy. Existen muchos eventos que pueden 
hacer que la predicción se invalide y, consecuentemente, hay más posibilida-
des de que factores prejuiciados o sesgados distorsionen de manera sistemáti-
ca la predicción para los miembros de los grupos minoritarios. La informa-
ción actual que implica una predicción para la mayoría puede involucrar una 
predicción muy diferente para miembros de grupos minoritarios cuyas expe-
riencias anteriores a la aplicación de la prueba diferían mucho de las típicas. 
Nuestro problema consiste en determinar qué tipos de inferencias pode-
mos hacer apropiadamente para los individuos con antecedentes diferentes a 
los de la mayoría, y qué clases de ajustes o modificaciones debemos hacer que 
produzcan las inferencias y decisiones más precisas y equitativas para estas 
personas. 
Invasión de la privacidad 
Una segunda preocupación que con frecuencia se ha expresado recien-
temente se relaciona con la invasión de la privacidad. ¡Qué clase de infor-
mación es razonable que se pida a un individuo acerca de sí mismo y en qué 
circunstancias? Este problema se plantea en relación no sólo con las pruebas, 
sino también con todo tipo de información acerca de una persona. ¡Qué 
tipos de registros deben conservarse y para quién deben estar disporiibles? En 
un extremo de la escala existen pruebas para medir el conocimiento y las 
habilidades para el trabajo, como las pruebas de mecanografía, a las que 
nadie debería poner objeciones si la habilidad es clara y está directamente 
relacionada con la posición para la que la persona hace una solicitud. En el 
otro extremo de la escala están algunos de los instrumentos de imtodescrip-
ción que conducen al uso de inferencias acerca de la estabilidad emocional o 
a una diversidad de pruebas con las que se trata de evaluar la honestidad; por 
ejemplo, poner al individuo en circunstancias de tentación de mentir o de 
robar, a fin de obligarlo a dar una información acerca de sí mismo sin tener 
conciencia de los datos que aporta o de cómo se empleará esa información. 
Entre estos extremos están varios instrumentos que incluyen diversos gra-
dos de información personal. 
En este punto se cuestiona no sólo la información obtenida, sino también 
el propósito para el que se obtiene. ¡Se ha obtenido esta información para 
brindarle al individuo alguna ayuda con sus problemas personales o vocacio-
nales o por razones terapéuticas? El que la persona solicite ayuda implica que 
tiene la voluntad de dar la información que se necesita para poder recibir ayu-
da, y que está dispuesta a ser inspeccionada; en este caso la invasión de su pri· 
TEMAS ACERCA DE LA MEDICIÓN 2S 
vacidad no es importante. Sin embargo, cuando la información se obtiene 
para ciertos objetivos institu:i~nal~\ es decir, para el usó de ~?a institución 
educativa o para el uso de la CIenCIa, entonces la preocupaClOn por el dere-
cho a la privacidad del individuo sí es importante y se deben equilibrar los 
valores personales y sociales de éste. Por ejemplo, un mayor número de estu-
diantes que de empleados de ba~co (7 S c?~tra 34) a~eptaron cont~star un 
cuestionario diseñado para medu la establhdad emOCIOnal de un pIloto de 
avión. Los derechos del individuo no son absolutos, pero con frecuencia se 
afirma que tales derechos no han sido reconocidos totalmente. 
Uso de comparaciones normativas 
Otro aspecto diferente ha surgido en relación con el énfasis en la interpre-
tación de la prueba o en la comparación de la ejecución de un estudiante con 
la norma representada por la ejecución típica de una muestra de estudiantes 
en el nivel grupal e incluso nacional. Este tema ha sido demasiado polémico 
hasta afirmar que las decisiones para las que se usan estas pruebas, especial-
mente las decisiones instruccionales, no son necesarias ya veces sólo produ-
cen confusión cuando se realizan comparaciones con otras personas. La infor-
mación esencial se limita a verificar si el estudiante puede realizar una tarea 
específica; ésta es la información que debe guiar las decisiones acerca de qué es 
lo que debe enseñársele o qué tareas debería realizar. 
Por supuesto, existen ciertas situaciones en las que la comparación con 
otras personas es esencial para tener un juicio sólido a fin de tomar una deci· 
sión. ¡El último solicitante es un buen mecanógrafo?, ¡de qué otra manera 
definiríamos el concepto "buen mecanógrafo" si no en términos de la ejecu-
ción de los otros solicitantes al mismo trabajo? Un ritmo de 40 palabras por 
minuto con dos errores no tendría ninguna significación, a menos que 
supiéramos que el egresado promedio de una escuela comercial puede escri-
bir 50 palabras por minuto, aproximadamente, con tal vez un error en ese 
tiempo. La empresa necesita un empleado que logre los estándares de una 
ejecución típica, y estos estándares sólo pueden fijarse en comparación con 
la ejecución de los demás. De la misma manera, un sistema escolar que trata 
de evaluar el aprovechamiento en lectura de los niños del sexto grado de pri-
maria como "bueno", "satisfactorio" y "necesita mejorar", debe tener un 
promedio con base en el cual comparar el desempeño en su propia escuela. 
No existeun estándar absoluto en cuanto al desempeño en la lectura, por lo 
tanto, sólo podemos determinar si es o no razonable que estos estudiantes 
comprendan un determinado artículo de Selecciones con base en el prome-
dio de comprensión de lectura de los alumnos del mismo grado en el nivel 
nacional; es decir, si éstos son capaces de comprender dicho artículo. 
En ocasiones las comparaciones con la norma de un grupo de referencia 
externo empleadas con el fin de guiar las decisiones, han tenido muy poca o 
ninguna relevancia. En la actualidad, existe una reacción en contra del uso 
equivocado de estos datos normativos y se ha dado una gran importancia a 
las pruebas referidas al contenido, las relativas al criterio y las de dominio 
de una habilidad. Estas pruebas son muy importantes para algunas cla-
26 CAP. 1. APROXIMACIÓN Al USO DE LAS PRUEBAS 
ses de decisiones, peru no para todas. Es necesario saber qué tipos de com
-
paraciones son útiles para cada situación. ¿Cuándo debemos preguntarnos
 si 
un estudiante puede desempeñarse satisfactoriamente al realizar una tare
a 
específica, y cuándo debemos preguntarnos qué lugar ocupa en relación co
n 
sus compañeros~ . 
UN PUNTO DE VISTA ACTUAL 
Para concluir este capítulo, a continuación presentamos brevemente seis 
premisas que representan las bases para un punto contemporáneo acerca de 
la 
medición psicológica y educativa y el papel que desempeña en las escuelas y 
en la sociedad. Estas premisas están estrechamente relacionadas con el propó
-
sito de este libro. . 
l. Es necesario tomar decisiones. Un maestro debe decidir qué hará 
durante el periodo de lectura del día siguiente; en una escuela de medicin
a 
se tiene que decidir a cuántos candidatos admitirá, y un joven de 17 años 
tiene que decidir si presentará solicitud de admisión a la universidad y, e
n 
caso de que así sea, en q\lé universidad. Todos éstos son ejemplos de los tipo
s 
de decisiones que deben tomarse, sobre cierta base, día a día. 
2. Mientras más adecuada y precisa sea la información, mejor será 
la decisión. En cierto sentido, esta premisa se basa en la creencia de que cuan-
to más sepamos de la situación, la controlaremos mejor. Se afirma que la igno
-
rancia no es una bendición, sino una tontería. Por supuesto, la informació
n 
no puede ser equivalente de la sabiduría. Saber más o con mayor precisió
n 
acerca de una situación no garantiza que una persona actuará sabiamente. 
El 
conocimiento es una condición necesaria pero no suficiente para tomar dec
i-
siones convenientes. 
3. Los instrumentos y procedimientos de medición proporcionan 
recursos que mejoran la información disponible para la toma" de decisiones. 
Se puede demostrar que mucha de la evidencia sobre la que se basa la tom
a 
de decisiones tradicionalmente es subjetiva, parcial y poco confiable. A pe-
sar de estar lejos de la perfección, los instrumentos de medición psicológica
 y 
educativa cuidadosamente planeados y desarrollados aumentan de maner
a 
significativa la validez y confiabilidad de la información disponible para 
la 
toma de decisiones. 
4. El usuario de cualquier tipo de información para la toma de deci-
siones necesita saber 10 que significa la información y hasta dónde puede 
confiar en ella. Cuando alguien nos dice que la carretera entre Oxford y 
Wentworth es "un poco estrecha y con curvas", necesitamos saber si es
to 
significa sólo que no es una carretera interestatal o que es un camino de trán
-
sito para cabras. También necesitamos saber si nuestro informante ha viaj
a-
do por esa carretera o solamente ha oído decir que así es. Asimismo, en lo
s 
procedimientos de evaluación de las personas, el usuario debe saber qué tipo 
de inferencia se puede hacer de ellos, bajo qué condiciones y con cuánta con
-
fianza. 
, " •. .. '.' ,' 'c:- " ' ,' •... ~.', .. . :.' ." . .-•. '.:' .,~.' " • . .'~ '1 \ '" .' ~ ..... _ . 
PREGUNTAS Y EJERCICIOS 27 
S. Los hechos y los valores implicados en cualquier decisión son com-
plejos. Un procedimiento de medición puede proporcionar sólo algunos de 
los hechos. Para la toma de decisiones, esta información debe ser complemen
-
tada con hechos posteriores y el análisis de los valores implicados. 
6. El conocimiento profundo de quien decide es primordial. En reali-
dad, aunque los instrumentos de medición proporcionan información valio
-
sa, el conocimiento profundo del usuario juega e! pape! clave. El usuario deb
e 
organizar y analizar la información que aportan las pruebas y cualquier otr
a 
fuente para establecer e! marco de referencia de los valores, en el cual pued
a 
realizarse la decisión final. 
El objeto de este libro es aumentar la eficiencia de los que tienen que 
tomar decisiones, para lo cual se proporcionan mejores bases para elevar lo
s 
diferentes procedimientos de medición, así como para saber lo que signific
a 
cada uno y qué tanta confianza puede tenerse en ellos. Para este fin, describ
i-
remos los procesos de elaboración de reactivos¡ desarrollaremos los criterio
s 
generales de validez y con fiabilidad por medio de los cuales se evalúan to
-
dos los tipos de medidas¡ presentaremos las distintas maneras de reportar la
s 
calificaciones obtenidas en las pruebas¡ por último, describiremos y evaluare
-
mos varias de las técnicas y los instrumentos que se emplean comúnment
e 
para apreciar las características humanas. Nuestro éxito se medirá por medi
o 
del grado en que nuestros lectores empleen los resultados de la medición at
i-
nada y congruentemente en las decisiones que se les pida que tomen. 
PREGUNTAS Y EJERCICIOS 
1. Enumere algunos ejemplos, preferiblemente recientes, de las decisiones qu
e usted 
ha tomado o de las que otros han tomado por usted en cuyos resultados formó
 par-
te alguna clase de medición psicológica o educativa¡ clasifíquelos como: al instruc· 
cional¡ bl de selección¡ el de colocación o clasificación, o dI personales. 
2. Describa uno o más ejemplos de decisiones personales en las cuales consid
ere que 
una medición psicológica o educativa le pudo haber servido, pero no estuvo d
ispo-
nible. ¡Sobre qué base se realizó la decisión? 
3. ¡Cuáles son las alternativas para las medidas educativas o psicológicas com
o guías 
en las decisiones siguientes? 
al ¡Cuánto tiempo se debe enseñar fonética en el primer año de un programa de 
lectura? 
bl ¡Cuáles de cinco de los 15 solicitantes deberían contratarse como empleados de 
estadística? 
el ¡Debería alentarse a Pedro G. en sus deseos de inscribirse en la escuela de Dere-
cho para ser abogado? 
4. ¡Cuáles son las ventajas y desventajas de las alternativas que ha propuesto u
sted en 
la pregunta anterior, si se comparan con algunos tipos de pruebas y cuestionario
s? 
5. Con base e~ las tres decisiones enunciadas en la pregunta número 3, ¡en qué medi-
da. y de ~ue manera estarían implicados los valores en cada caso? 
6. De un ejemplo de cada uno de los siguientes tipos de pruebas: 
al Prueba de aprovechamiento referída al criterio. 
bl Prueba de aprovechamiento referida a la norma. 
', ." .. . .... , . . " 
28 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS 
e) Prueba de aptitud. 
d) Medida de gustos y preferencias. 
e) Medida de un rasgo o de un constructo. 
7. Para cada uno de los atributos que se nombran 'enseguida indique cómo se debe: l. 
definir el atributo; 2. fijar un procedimiento para hacerlo observable, y 3. cuantifi-
carlo. 
a) Pensamiento científico. 
bl "Buena ciudadanía" en un niño, de cuarto grado de primaria. 
e) Sociabilidad. 
d) Competencia como chofer de automóvil. 
8. La utilidad de las pruebas para la toma de decisiones que incluye a un grupo de las 
minorías, puede depender del tipo de decisión que se tome. ¿Para qué tipos de deci-
siones sería más recomendable una prueba?, y ¿para qué tipos de decisiones sería 
más t.:uestionable? 
9. ¡Cuáles de los siguientes ejemplos considera usted aceptables y cuáles considera 
que atacan la privacidad? ¿Qué factores influyen en sudecisión? 
al Pedir a los solicitantes de una escuela de medicina que tomaran: l. una prueba 
de aprovechamiento de biología; 2. un cuestionario diseñado para evaluar la 
estabilidad emocional, o 3. una escala de actitudes hacia la socialización de 
la medicina. 
b) Pedir a los solicitantes de un trabajo secretarial que tomaran: l. una prueba de 
inteligencia en general; 2. una prueba de velocidad y precisión para escribir a 
máquina, o 3. un cuestionario diseñado para apreciar la dependencia. 
el Dar a un niño de 10 años de edad que tiene dos años de retraso en la lectura: l. 
una prueba no verbal de habilidad intelectual; 2. una entrevista acerca de las 
condiciones de su hogar, o 3. una serie de pruebas diagnósticas de las habilida-
des específicas para la lectura. 
LECTURAS ADICIONALES 
Airasian, P. W. y Madaus, G. F., "Functional types of student evaluation", en Measu-
rement and Evaluation in Guidanee, 1972, 4, págs. 221-233. 
Barday, R., Controversial Issues in Testing, Cuidance Monograph Series (Series III: 
Testing), Houghton Mifflin, Boston, 1968. 
Buchwald, A. M., "Values and the use of tests", en loumal of Consulting Psyehology, 
29, 1965, págs. 49-54. 
Coffman, W . E., "Concepts of achievement and proficiency", en Payne, D. A. Y 
McMorris R. F. (dirs.', Educational and psychologieal measurement, General 
Learning Press, Morristown, N. J., 1975. 
Cronbach; 1. J. Y Gleser, G. c., Psyehological tests and persollnel decisiones, Uni-
versity of Illinois Press, Urbana, Ill., 1965. 
DuBois, P. H., A history of psychologieal testing, AlIyn and Bacon, Boston, 1970. 
Ebel, R. L., "The social consequences of educational testing", en Proceedings of the 
1963 Invitational Conference on Testing Problems, Educational Testing Service, 
Princeton, N. J., 1964. 
Glaser, R. y Nitko, A. J., "Measurement in learning and instruction/l, en Thorndike, R. 
1. (dir.), Edueational Measurement, American Council on Education, Washing-
ton, D. c., 1971. 
I 
LECTURAS ADICIONALES 29 
Linden, J. D. y Linden, K. W., Test on trial, Guidance Monograph Series (Seríes III: 
Testing', Houghton Mifflin, Boston, 1968. 
Linden, K. W., Linden, J. D. Y Bodine, R. L., "Test bias: Fuss n' facts" en Measure-
ment and Evaluatíon in Guidance, 7, 1974, págs. 163-168. ' 
MiIler, L. P. (dir.', The testing of black students: A symposium Prentice-Hall Engle-
wood Cliffs, N. J., 1974. " 
Sarason, S. B., "The unfortunate fate of Alfred Binet and school psychology", en Tea-
chers College Record, 77, 1976, págs. 579-592. 
"The responsible use of tests: A posii:ion paper of AMEG, APGA, and NCME", en 
Measurement and Evaluation in Guidance, 5, 1972, págs. 385-388. 
Thorndike, R. L., "Educational decisions and human assessments" en Teachers 
College Record, 66, 1964, págs. 103-112. ' 
Tittle, C. K., "Sex bias in educational measurement: Fact or fiction", en Measurement 
and Evaluation in Guidanee, 6, 1974, págs. 219-226. 
Wolf, T. H., Alfred Binet, University of Chicago Press, Chicago, 1973. 
2 
Técnicas estadísticas 
básicas 
Los maestros Catherine J ohnson y Peter Cordero querían conocer más 
sus respectivos grupos de sexto grado, por lo que decidieron aplicar una 
prueba de lectura, una prueba de revisión de un libro de aritmética y un dic-
tado para probar la ortografía, basado en las palabras que ambos maestros 
habían enseñado durante las últimas seis semanas. Éstos calificaron las prue-
bas, contaron el número de aciertos en cada una y anotaron las puntuacio-
nes. Después hicieron una lista que contenía las tres puntuaciones para cada 
alumno, yen ese momento se dieron cuenta de que tenían una gran cantidad 
de números y se preguntaron cómo deberían organizarlos. 
Las pruebas generan puntuaciones en forma de números; por lo tanto, si 
deseamos analizar las puntuaciones de las pruebas, debemos pensar en cómo 
trabajar con los números. Por medio de los números las puntuaciones de 
prueba pueden organizarse para dar la respuesta a un rango de preguntas bas-
tante amplio, sin embargo, anterior a este proceso, primero debemos saber 
qué tipo de preguntas formular. Una vez que hayamos establecido cuáles son 
las preguntas, empezaremos a cuestionamos de qué manera se pueden organi-
zar los números para obtener las respuestas. 
En la tabla 2.1 se presentan los números (puntuaciones) asignados a los 
niños de sexto grado de los dos grupos. ¿Qué preguntas pudieron haberse 
hecho a la señorita Johnson y el señor Cordero para esta serie de números?, 
¿qué preguntas podría hacerse el lector? Antes de continuar, supongamos que ·
 
el lector estudia esta serie de puntuaciones y escribe las preguntas en relación 
con tales puntuaciones. Vea el lector cuántas preguntas puede hacer. 
Al principio, el lector puede plantearse préguntas generales, como ¿cuál 
es el patrón general de esta serie de puntuaciones?, ¿cómo se organizan?, 
¿cómo podríamos, por ejemplo, analizar la serie de puntuaciones de lectura a 
fin de tener una idea del grupo en su totalidad? Para contestar estas preguntas 
30 
... .. 
.. 
~.~ 
.~, 
;~ 
'! 
-' 
~~ 
'i-
=4 
~~ 
:~ ., 
;-, 
t'( 
~ 
~i 
(1 
" ~ ~ 
ff 
~ 
~ 
~ 
~ 
~ 
~ 
~ 
~ 
~ 
Toblo 2.1. Hoja de registro poro los alumnos del sexto grado de la escuela X 
Puntuaciones de prueba 
Nombre lectura Aritmética 
1. (orol A. 32 3 
2. Mary B. 27 27 
3. Ruby C. 31 9 
4. Alíce D. 36 18 
5. Theresa E. 47 21 
6. Ido F. 42 24 
7. Vivion G. 22 4 
8. Groce H. 50 42 
9. Opol!. 20 18 
10. Ursula J. 37 2 
11. Bealóee K. 25 10 
12. Karen L. 37 13 
13. Susan M. 2B 20 
14. Jone N. 34 15 
15. Dorolhy o. 31 19 
16. Frances P. 21 2 
17. Elizabelh Q. 35 48 
18. Pearl R. 59 41 
19. Joon S. 44 41 
20. Noney T. 32 40 
21. Judilh U. 56 24 
22. Edilh V. 38 24 
23. Louise W. 38 18 
24. Helen X. 29 12 
25. Mor/ha Y. 24 26 
26. Doris Z. 36 12 
27. James A. 36 29 
28. Albert B. 21 16 
29. Donald C. 27 7 
30. Peler D. 37 29 
31. Samuel E. 46 36 
32. George F. 33 10 
33. Roger G. 17 14 
34. Newlon H. 35 18 
35. Korll. 30 12 
36. Isidore J. 22 30 
37. John K. 43 9 
38. Benjamin L. 31 15 
39. Tbeodore M. 50 38 
40. Michae/ N. 34 20 
41. Herman O. 30 15 
31 
Ortografía 
27 
26 
23 
32 
38 
38 
13 
46 
12 
36 
21 
30 
lB 
32 
28 
17 
30 
54 
39 
28 
54 
37 
30 
24 
22 
28 
33 
13 
24 
31 
37 
31 
14 
30 
25 
17 
37 
29 
48 
27 
29 
32 
Tabla 2.1. (Continuación.) 
Puntuaciones de prueba 
Nombre Lectura Aritmético 
Ortografía . 
42. Charles P. 52 39 
47 
43. Patrick O. 40 33 
33 
44. William R. 42 6 
33 
45. Mortin S. 17 26 
17 
46. Frank T. 32 20 
23 
47. Ralph U. 38 20 
30 
48. Thomos V. 29 29 33 
49. Henry W. 36 25 
44 
50. Oscor X. 43 19 
45 
51. Edword Y. 27 19 
35 
52. leonard l. 39 19 
44 
es necesario.considerar formas simples para organizar y graficar las puntua-
ciones. 
Posteriormente, surgirán las siguientes preguntas: ¿cómo ~s este grupo, 
en promedio? . qué tan similares son los resultados a los obtemdos por otro
 
grupo de sext~ ~rado?, ¡cuál es el ~!ve! típico de desempeño en el grupo? Estas 
preguntas requieren una puntuacIOn un?ca que represe~te al grupo en su tota-
lidad es decir una medida que proporCIOne el promedIO del grupo. Para con-
testa; las preguntas anteriores tenemos que familia~izarnos con lo~ pro,cesos 
estadísticos que nos permitan representar el promedIO o la puntu~cIOn tlplCO.
 
Después, para describir al grupo q~izá ellec.tor sienta la necesIdad de des-
cribir la medida en la cual las puntuacIOnes se dIspersan alrededor del prome-
dio. 'Todos los niños del grupo han alcanzado el mismo progreso o muestran
 
un r!ngo amplio de aprovechamiento?, ¿se pod~ía esperar de ellos que P!ogre-
sarán casi al mismo ritmo, o podríamos predeCIr un progreso muy vanabl~?,
 
¿cómo se compara este grupo con los otros del mismo grado respecto ~ la dIS-
persión de las puntuaciones? Para contestar estas preguntas se reqUIere un
 
estudio de las medidas de variabilidad. 
El lector podría preguntarse dónde se ubiea un individ~o en particul~r en 
alguna de las

Continuar navegando

Materiales relacionados