Logo Studenta

manual_de medicion y evaluacion psicologica_-_2012

¡Este material tiene más páginas!

Vista previa del material en texto

1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Elaborado por 
Psic. Fernando Reyes Baños 
 2
ALGUNAS APROXIMACIONES A LA MEDICIÓN EN PSICOLOGÍA 
 
 
María Luisa Morales: 
 
 Con la psicometría se intenta comprender la naturaleza de las personas a través de la 
medición de la conducta del ser humano (y de los animales). 
 
Tiene su origen en el estudio de las diferencias individuales, es decir, en trabajos 
que investigan en qué difieren las personas y en qué se parecen. 
 
Lo que en psicología se mide son los atributos, características, habilidades o rasgos 
que en las personas se expresan conductualmente de manera externa y observable, para lo 
cual se usan modelos, esto es, representaciones simplificadas que contienen las 
características del fenómeno estudiado, que sirven de guía para identificar los elementos del 
mundo real con los elementos que a estos caractericen. 
 
En psicología, por ejemplo, se usa como guía el modelo matemático para la 
medición de la conducta; para ello, se siguen los siguientes pasos: a) Identificación del 
objeto que va a ser medido; b) Identificación de las propiedades o conducta que va hacer 
medida, y c) Identificación de las reglas, mediante las cuales, asignamos un número a tales 
propiedades o conducta. 
 
En conclusión, podemos decir que medición es: un procedimiento, mediante el cual, 
asignamos números a las propiedades, atributos o características de los objetos, 
estableciendo las reglas específicas sobre las que se fundamentan tales asignaciones. 
 
 
Lewis R. Aiken: 
 
 La utilización más rentable del método estadístico ha sido la construcción, 
aplicación y evaluación de las pruebas psicológicas, particularmente debido a las funciones 
que estas tienen: de diagnóstico, de selección, de ubicación y promoción, de decisiones 
prácticas y de investigación. 
 
 Como nota histórica interesante: en 1991, la cifra total de ventas para los tests 
estandarizados aplicados en los grados, desde el jardín de niños hasta el bachillerato, se 
calculó, según la Asociación Americana de Editores, en… ¡134 millones de dólares! 
 
 
Frederick G. Brown 
 
Las personas difieren en sus características de personalidad y en sus habilidades 
psicológicas. Así, los términos usados en psicología para describir a las personas se refieren 
entonces a características que varían mucho unas de otras: inteligencia, agresividad, 
habilidades para las matemáticas, intereses mecánicos, introversión, etc. 
 
 3
Un problema para el psicólogo es: ¿Cómo descubrir la naturaleza y la amplitud de 
esas diferencias individuales en forma precisa y exacta? 
 
En la descripción de las características de los individuos se ha llegado a identificar 
más de 40,000 términos, por lo que los psicólogos, han tratado de reducir su cantidad a un 
número más manejable. 
 
Una solución a esto fue la Teoría de los rasgos: término que describe a un grupo de 
conductas que tienden a producirse juntas. El proceso para identificar un rasgo es hacer que 
un grupo de personas respondan a un gran número de reactivos, para luego analizar 
estadísticamente los datos, y poder ver así, cuáles son los reactivos que se agrupan. 
Ejemplo: interés mecánico en una prueba que cubra actividades vocacionales. 
 
Para que los rasgos resulten útiles como construcciones descriptivas tienen que ser 
relativamente estables en el tiempo y en diferentes situaciones. Debido a esta estabilidad 
relativa, autores como Burt y Jensen sostienen que los rasgos se determinan genéticamente. 
Una alternativa a esta opinión es la de Ferguson, quien sostiene que los rasgos son modos 
habituales de reacción, es decir, patrones de conducta que se han aprendido tan bien que 
las personas se conducen de manera similar en muchas situaciones. 
 
Sin embargo hay quienes opinan, Brown por ejemplo, que los rasgos NO SON 
características tangibles y directamente mensurables, y por ello, las mediciones 
psicológicas son siempre indirectas. 
 
En cuanto a la naturaleza de las mediciones psicológicas, estas son más bien 
relativas que absolutas porque comparamos la ejecución de un individuo con la de otros y 
no con un estándar absoluto; en otras palabras, tenemos un continuo de conductas y 
tratamos de situar a cada individuo en el lugar que le corresponde a lo largo de él. 
 
Dos cosas que se deben de observar siempre: 1) Los numerosos grados de variación 
de cualquier rasgo, y 2) Que la medición se hará siempre con relación a algún grupo de 
comparación. Lo que si es definitivo es que, en psicología no hay estándares absolutos. 
 
 
Gloria Benedito 
 
Habiendo una importación de las matemáticas a la psicología, ¿Basta con esa 
importación para decir que la psicología ha adquirido cientificidad? Aún ahora prevalece 
una suposición de que la cientificidad de una disciplina depende del método que ésta 
emplee (y más si se trata de la cuantificación). Esta suposición tiene su origen en el 
positivismo, movimiento filosófico fundado en 1844 por Augusto Comte, quien postulaba 
ciertos principios para concebir a un conocimiento como científico, tales como un modelo 
acumulativo, observación de hechos, formulación de leyes, precisión racional y dogma 
progresista, que en conjunto definían lo que era ciencia, a saber: representación formal del 
objeto dado empíricamente expresado a través de un código matemático. 
 
 4
Sin embargo, a la suposición de que la dimensión cuantitativa es inherente a la 
naturaleza de los fenómenos y que por lo mismo es susceptible de ser “extraída” aplicando 
el método cuantitativo a los datos obtenidos por la experimentación, se opone la idea de que 
la cuantificación es posible porque antes está el número como objeto formal, el cual, es 
producto de la práctica científica de la matemática. 
 
En cuanto a la medición, los elementos distinguibles en su proceso son: a) Un 
instrumento o escala de medida; b) Una técnica de medición que está en función del 
instrumento y de las propiedades del objeto a medir; c) El sistema de números, y d) 
Interpretación de los datos. 
 
Se justifica la cuantificación en psicología por la elección de un objeto de estudio 
que, supuestamente, lo posibilita: la conducta, pero es precisamente por ello que entonces 
se omiten ciertos factores que son imprescindibles para el estudio psicológico del hombre: 
la concepción de un proceso de sujetación, de un aparato psíquico, de un modo de 
producción, de un conflicto, etc. Descartar esto equivale a hablar de una práctica 
ideológica, de una reproducción de lo aparente. 
 
Una justificación más certera para introducir en psicología la medición como parte 
de una práctica científica es la elaboración de un objeto formal que aluda a una explicación 
del fenómeno que se mide y que se constituya por la construcción de una teoría, proceso 
que reconoce dos momentos: 1) Trabajo teórico-conceptual, y 2) Trabajo conceptual-
experimental, eligiéndose entonces el método apropiado a esa práctica científica. Para ello, 
Gastón Bachelar sugiere tres tipos de vigilancia epistemológica: a) Vigilancia de Primer 
Grado, ejercida en el campo de lo empírico; b) Vigilancia al Cuadrado, cuidado de la 
rigurosidad y corrección, y c) Vigilancia al cubo, supervisión de la elección. 
 
Finalmente cabe una última pregunta: ¿Por qué se utiliza el método estadístico en 
psicología? Porque se considera a la conducta humana como un fenómeno de tipo 
probabilístico. 
 
 
Hernández Sampieri y otros 
 
Se dice que medir es “asignar números a objetos y eventos de acuerdo con reglas” 
(Stevens, 1951), pero esta definición no es apropiada, según Sampieri, para las ciencias 
sociales, ya que varios de los fenómenos que son medidos en estas no pueden caracterizarse 
como objetos o eventos, puesto que son demasiado abstractos para ello. 
 
Se sugiere entonces definir a la medición como “proceso de vincular conceptos 
abstractos con indicadores empíricos”, proceso que se realiza sistemáticamente para 
clasificar y cuantificar los datosdisponibles en términos del concepto que el investigador 
tiene en mente. 
 
Así, el instrumento de medición o de recolección de datos juega un papel central. 
Éste queda definido entonces, como el dispositivo que permite registrar datos observables 
que representan, verdaderamente, los conceptos que el investigador tiene en mente. 
 5
 
 
Kathia Ma. Costa Neiva 
 
 Un instrumento de medición en psicología es un conjunto de operaciones que nos 
permite llegar a obtener, objetivamente y con la mayor certeza posible, información acerca 
de la expresión de los fenómenos que se suceden en esa unidad biológica, social, 
psicológica, etc., que es la conducta humana. 
 
 Una prueba psicológica es un instrumento de medición que posee tres características 
fundamentales: 
 
1. Sirve de estímulo para extraer un segmento de la conducta de un sujeto. 
2. Es rigurosamente estandarizado, es decir, se construye, se administra y se califica 
según reglas preestablecidas. 
3. Permite comparar estadísticamente la conducta de un sujeto con un grupo de sujetos 
de una población definida. 
 
La medición de una conducta implica “la utilización de ciertos procedimientos, 
según reglas específicas, para obtener como resultado la asignación de valores numéricos a 
la ejecución de una persona 
 
 
Anastasi Urbina 
 
Un baremo es el resultado que se espera de una persona de determinada edad y que 
pertenece a determinado grupo, construido según procedimientos estadísticos que, a partir 
de muestras representativas, determinan cuáles son los rendimientos típicos o promedios de 
ese grupo que servirá de patrón de comparación. 
 
Ejemplo: al querer medir la memoria es preciso hacer una comparación entre el 
rendimiento de un sujeto respecto a esa facultad y el obtenido por el resto de los individuos 
que integran el grupo al que pertenece. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 6
SOBRE LAS PRUEBAS 
 
 
Utilidad 
 
• Para la selección. Se identifica a los solicitantes más prometedores (los que tengan 
mayores probabilidades de éxito). La decisión es la de rechazar o aceptar. 
• Para la clasificación. La meta es la de hacer coincidir los individuos y las 
alternativas que haya de manera óptima. 
• Para el diagnóstico. Se compara la ejecución de un individuo en varios campos para 
determinar sus puntos fuertes y débiles. Estos procedimientos implican la 
identificación de los campos de incapacidad de un individuo y la aplicación de un 
programa de corrección. 
• Para la prueba de hipótesis en las investigaciones psicológicas, para la construcción 
de hipótesis durante una asesoría y para la evaluación en las instituciones escolares. 
 
 
Actitudes hacia las pruebas 
 
• Sobreestimación. Posición cómoda porque no hay que sopesar una gran variedad de 
factores. 
• Desvalorización. Se cree en la inutilidad de las mismas porque depender de ellas 
puede traer como consecuencia tomar decisiones erradas. 
• Las pruebas como algo antidemocrático y como una intrusión en la vida privada. Se 
cree que ciertas características de personalidad no se relacionan necesariamente con 
el éxito y que las actitudes de un individuo son un asunto exclusivamente suyo. 
 
 
Las pruebas… 
 
• Son métodos para la observación sistemática de la conducta. 
• Son una muestra de todos los reactivos posibles, por lo que se debe determinar si la 
prueba contiene una muestra adecuada de reactivos del universo de reactivos 
posibles. 
 
 
Las pruebas pueden servir como… 
 
• Muestras. Los reactivos de la prueba son una muestra de todos los reactivos 
posibles en un dominio particular. 
• Signos. Enfatizan la naturaleza de la característica que se mide. 
• Predictoras. Predicen una conducta a futuro. 
 
 
 
 
 
 7
TIPOS DE PRUEBAS 
 
 
1. Según la conducta que miden: 
 - De inteligencia, 
 - De habilidades, 
 - De personalidad, 
 - De intereses y valores, 
 - Psicomotoras, 
 - De rendimiento, 
 - Etc. 
 
2. Según el objetivo: 
 
 - De ejecución máxima. Exigen del examinado su máximo rendimiento en las distintas 
tareas que componen la prueba. 
 
 - De ejecución típica. Llamadas también de clasificación tipológica o cualitativa. 
 
3. Según el tipo de respuesta exigida: 
 
 - Objetivas. El examinado elige una respuesta entre varias alternativas. 
 
 - Subjetivas. El sujeto proporciona libremente la respuesta. 
 
4. Según la forma de administración: 
 - De aplicación individual, 
 - De aplicación colectiva y 
 - Autoadministrables. 
 
5. Según la forma de dar las instrucciones: 
 - Orales y 
 - Escritas. 
 
6. Según la libertad de ejecución: 
 
 - De poder. Exigen que el sujeto emplee toda su capacidad. El tiempo límite a veces es 
controlado. 
 
 - De velocidad. Exigen que el sujeto ejecute la tarea asignada lo más rápido posible. La 
duración de la prueba es rigurosamente controlada. 
 
7. Según el material utilizado: 
 - De papel y lápiz, 
 - Completamente verbal, 
 - De ejecución y 
 - Mixtas. 
 8
 
8. Según la forma de calificación: 
 - Manual e 
 - Informatizada. 
 
9. Según la población a la que se destina: 
 - Para bebés, 
 - Para niños preescolares y escolares, 
 - Para adolescentes, 
 - Para adultos, 
 - Las que pueden aplicarse a dos o más etapas del desarrollo. 
 
 
Factores a considerar 
 
• La estandarización sirve para: 
 
 a) Reducir al mínimo la posible influencia de variables personales y situaciones 
irrelevantes. 
 
 b) Comparar directamente las calificaciones dadas a diferentes personas. 
 
• Una prueba mide sólo la conducta registrada por ella, esto es, las respuestas dadas 
por una persona a los reactivos de la prueba. 
 
• Una prueba contiene solamente una muestra de todos los reactivos posibles. 
 
• Ninguna prueba incluye todos los reactivos que podrían desarrollarse para medir lo 
que, a partir de ahora, denominaremos dominio conductual: agrupación hipotética 
de todos los reactivos posibles que cubren una determinada área. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 9
DISEÑO Y ELABORACIÓN DE TESTS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Tests de observación 
 
� Población destino: quienes solicitan empleo 
 
� Incluye un análisis de puestos: especificación de los componentes de un puesto de 
trabajo para desarrollar los reactivos del instrumento, y predecir con ellos, el 
desempeño del empleado. 
 
� El instrumento resultante es una muestra representativa de los comportamientos que 
resultan importantes para ocupar un puesto de trabajo determinado 
 
 
Tests de inteligencia 
 
Sus reactivos se desarrollan: 
 
� De acuerdo a una teoría específica del comportamiento inteligente 
 
� Refiriéndose a los tipos de tareas que se supone las personas más inteligentes 
realizan con mayor eficacia que aquellas menos inteligentes 
 
 
 
 
Trabajo invertido 
en la elaboración 
de un test 
Tipo de 
instrumento 
Exámenes 
De capacidad 
y personalidad 
Propósitos 
Planeación del contenido antes de 
redactar reactivos 
Definición de “constructos” que se desean medir y establecimiento 
del contenido 
 10
Escalas o inventarios de personalidad 
 
Se basa en planteamientos tales como: 
 
� Sentido común 
� Teorías de la personalidad 
� Investigación empírica 
 
 
Tests de rendimiento 
 
Evalúan y motivan a los estudiantes y proporcionan información sobre el grado de avance 
de los objetivos educativos 
 
 
En cuanto a las pruebas de rendimiento, mejor conocidas como exámenes (las pruebas 
escolares que se aplican en las instituciones educativas) deben considerarse varios 
aspectos: objetivos educativos basados en taxonomías; tabla de especificaciones; 
contexto curricular, en el cual, este tipo de pruebas se hayan circunscritas; aspectos 
prácticos, etc. 
 
 
Objetivos educativos: taxonomías 
 
� Preparar una prueba para medir objetivos educativos específicos resulta más 
efectivo cuando los comportamientos a evaluar se definen con claridaden la etapa 
preliminar 
 
Existen diferentes sistemas de clasificación para los objetivos educativos. Veamos un 
ejemplo: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
EVALUAR 
SINTETIZAR 
ANALIZAR 
APLICAR 
COMPRENDER 
CONOCER 
OBJETIVOS 
COGNOSCITIVOS 
 11
 
OBJETIVOS VERBOS SIGNIFICADO REACTIVO 
Conocimiento Definir, 
Identificar, 
Mencionar, 
Nombrar, etc. 
Recuerdo de hechos 
específicos 
Menciona las seis categorías 
principales de la taxonomía de 
Bloom 
Comprensión Convertir, 
Explicar, 
Resumir, etc. 
Entendimiento del 
significado o propósito de 
algo 
Explique lo que quiere decir el 
revisor de pruebas cuando dice 
que una prueba no es confiable 
Aplicación Calcular, 
Determinar, 
Resolver, etc. 
Uso de información e 
ideas en nuevas 
situaciones 
Calcule la media y la desviación 
estándar del siguiente grupo de 
calificaciones 
Análisis Diferenciar, 
Relacionar, etc. 
Dividir algo para revelar 
su estructura y la 
interrelación de sus partes 
Analiza esta unidad de 
instrucciones en las distintas 
categorías conductuales y de 
contenido 
Síntesis Diseñar, 
Desarrollar, 
Formular, 
Planear, etc. 
Combinar los distintos 
elementos de un todo 
estructural 
Diseñe una tabla de 
especificaciones para una 
prueba sobre estadística 
elemental 
Evaluación Comparar, 
Criticar, 
Evaluar, etc. 
Realizar un juicio con 
base al razonamiento 
Evalúa el procedimiento 
utilizado para la estandarización 
de esta prueba 
 
 
Dentro de la planeación de un instrumento es importante contar con una tabla de 
especificaciones, que sirva como guía para elaborar los reactivos. Al respecto: 
 
Ejemplo de una tabla de especificaciones: unidad referente al gobierno 
 
 HABILIDADES EVALUADAS 
TEMAS Comprender 
conceptos 
Hacer 
generalizaciones 
Localizar 
información 
Interpretar 
gráficas 
Total de 
preguntas 
Tendencias 
sociales 
4 4 1 1 10 
Eventos políticos 
nacionales 
2 3 3 2 10 
Métodos de 
investigación 
1 1 2 1 5 
Principales 
aspectos políticos 
3 6 4 2 15 
Total de 
preguntas 
10 14 10 6 40 
 
 
 12
� Se sugiere redactar inicialmente más reactivos de los necesarios 
� La objetividad de los reactivos denominados objetivos radica en su calificación 
� La información que se obtenga de los sujetos dependerá de las tareas implicadas en 
cada reactivo 
 
 
Hablando propiamente de exámenes… 
 
Si concebimos los exámenes como parte integral y formativa del proceso educativo 
(Pansza y Hernández, 1990) en lugar de pensar en ellos como una actividad desagradable, 
que debemos de anexar inevitablemente a dicho proceso, podemos comenzar a 
vislumbrarlos como herramientas útiles para evaluar el aprendizaje en los estudiantes. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Con relación a los exámenes deben considerarse diferentes factores, todos ellos 
relacionados con los objetivos educativos del programa de estudio de que se trate. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
EXÁMENES FUENTE 
DE… 
INFORMACIÓN 
MOTIVACIÓN 
El docente, al momento de hacer 
una prueba, deberá considerar los 
siguientes factores 
Temas y subtemas 
Las preguntas que deben de hacerse 
El formato 
Cuándo, dónde y cómo 
Forma de calificar 
OObbjjeett iivvooss 
eedduuccaatt iivvooss 
 13
En cualquier caso, uno como docente debe atender siempre a los propósitos que el 
programa de estudios plantea con relación a los temas y subtemas que se verán en el curso, 
porque los primeros expresan lo que pretende lograrse en los estudiantes con la revisión de 
los segundos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Otras consideraciones acerca de los exámenes 
 
 Extensión de la prueba, ¿Cuántos reactivos deben incluirse en una prueba?: Eso 
depende de 
 
� Los límites de tiempo 
� El Grado de lectura de los sujetos 
� La Extensión y dificultad de los reactivos 
 
Si tomamos en cuenta las diferencias individuales entre los estudiantes, debemos estar 
al tanto además de otra clase de factores: 
 
� Su Preparación 
� Su Personalidad 
� Su Estado emocional y físico 
� La Naturaleza del contenido de la prueba 
� El Entorno en que se aplica 
 
 Ordenamiento de las preguntas: Se hacen las siguientes sugerencias: 
 
� Los reactivos de opción múltiple y falso y verdadero se ordenan de manera que las 
respuestas no sigan ningún patrón establecido 
� Los reactivos de respuesta corta se colocan en grupos de 5 o una cantidad similar 
 
Objetivos educativos planteados por el plan de estudios. 
 
Objetivos educativos planteados por el programa de estudios. 
Nivel al que se pretende que los estudiantes aprendan los temas y 
subtemas: Conocer, comprender, aplicar, analizar, sintetizar o evaluar. 
Exámenes con reactivos que midan los temas y subtemas según el nivel 
señalado por el programa de estudios 
 14
� Cuando sean reactivos de aparejamiento, que todas las opciones aparezcan en la 
misma página 
� Otorgar espacio suficiente para responder reactivos de respuesta corta y de ensayo 
 
 Las instrucciones: Es importante que expresemos las instrucciones de la prueba o 
de cada una de las partes que la conforman lo más claramente posible, haciendo 
mención de cómo deberán los estudiantes registrar sus respuestas. En algunas 
ocasiones podemos agregar, si se juzga conveniente, cómo serán calificados cada 
uno de los reactivos. 
 
 Procedimiento general alternativo para calificar exámenes: Para pruebas 
objetivas conformadas por reactivos con n opciones de respuesta puede utilizarse la 
siguiente fórmula de corrección: 
 
 
 
 
 
 Donde N equivale al número de preguntas dividido entre 10 
 
Ahora bien, para usar un procedimiento como éste es recomendable 
contemplar criterios de acreditación y de evaluación. Véase el siguiente ejemplo: 
Un profesor, después de haber utilizado el procedimiento anterior, determinó para la 
acreditación y evaluación de sus alumnos en un examen, los siguientes criterios: 
 
a) Acreditación: puntuación igual o superior a 6 en el examen 
 
b) Un ejemplo de baremo de la nota final: 
 
- Hasta 5.99 = Malo 
- De 6 a 7.5 = Regular 
- De 7.6 a 8.5 = Bien 
- De 8.6 a 10 = Muy Bien 
 
 Sugerencias para calificar pruebas de ensayo.- Calificar la pregunta como un todo 
o asignar valores distintos a cada uno de los componentes que conforman al 
reactivo, considerar la extensión asignada para la tarea que se solicita y su 
importancia, redactar con anticipación una respuesta ideal para cada reactivo para 
poder hacer comparaciones, calificar las pruebas sin el conocimiento del nombre del 
examinado y evitar errores como: dar más importancia a la cantidad que a la calidad 
de la respuesta, dar por buena una respuesta demasiado general y calificar bien un 
reactivo sólo porque el estudiante obtuvo calificaciones altas en otros reactivos (o 
porque ha tenido buenos promedios anteriormente). 
 
 
 
 
Aciertos - Errores 
 N 
 15
En cuanto a las hojas de respuesta: 
 
� En los primeros años escolares se pide a los alumnos que marquen sus respuestas en 
los folletos de las pruebas. 
� Posteriormente, pueden utilizarse hojas separadas, que pueden calificarse manual o 
automáticamente 
 
 
Para administrar una prueba se recomienda: 
 
� Que el aplicador lea las instrucciones generales antes de distribuir los folletos de la 
prueba 
� Luego, que distribuya las hojas de respuestas y lea en voz alta las indicaciones para 
marcar estas 
� Después, que distribuya los folletos de la prueba volteados y pida a los alumnos 
verlos solamente hasta que indique que pueden empezar 
 
 
Finalmente, el aplicador debe expresar las instrucciones de la prueba lo más claramente 
posible, refiriéndose a: 
 
� El propósito de la prueba 
� Los límites del tiempo 
� Cómo deben registrarse las respuestas 
� Cómo se va a calificar 
 
 
Pruebas orales. 
 
Ventajas: 
 
� Situación social interactiva 
� Respuestas a un nivel intelectual más alto 
� Práctica en la comunicación oral 
� Revisión más detallada del material 
� El tiempo de evaluaciónes pequeño 
 
Desventajas: 
 
� Ineficaces 
� Falta de exactitud psicométrica 
� Consumen mucho tiempo 
� Muestra limitada de respuestas 
� Mal planeadas 
 
 
 
 16
Retro-alimentación 
 
 Una vez que se califican las pruebas y se hace entrega de los resultados, resulta 
más útil explicarles a los estudiantes en qué se equivocaron en lugar de explicarles en qué 
acertaron, pero resulta todavía más útil explicarles por qué se equivocaron. ¿Por qué? 
Porque de ese modo pueden aprender estrategias más convenientes para la próxima vez. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Preguntas guía para 
mejorar 
la comunicación de la 
retro-alimentación 
Sugerencias sobre cómo 
mejorar 
y comentarios sobre 
aspectos positivos 
Comentarios específicos 
sobre errores o estrategias 
negativas 
 
 
 
RETRO-
ALIMENTACIÓN 
¿Cuál es el error? 
¿Cuál es la razón probable por la que el alumno 
comete ese error? 
¿Cómo puedo guiar al alumno para evitar el error en 
el futuro? 
¿Qué hizo bien el alumno que se pueda hacer notar? 
 17
TIPOS DE REACTIVOS 
 
 
Preparación de los reactivos del Instrumento. Todos los reactivos de pruebas representan 
procedimientos para obtener información sobre los individuos, pero la cantidad y clase de 
información varia de acuerdo con la naturaleza de las tareas que implican los distintos tipos 
de reactivos. Pedir a los sujetos que comparen la Batalla Bulges con la Batalla de Hastings 
exige una clase de respuesta diferente que aquella que se obtiene cuando sólo se les pide 
que indiquen, de entre una serie de eventos, aquellos que ocurrieron en cada batalla. El 
primer reactivo o ítem requiere de capacidades complejas de integración y organización, en 
tanto que para contestar el segundo solo se necesita memoria cognoscitiva. 
 
 Se han sugerido distintos métodos para clasificar los reactivos de acuerdo con el 
formato, o la forma en que se requiere la respuesta. Completamiento o llenado contra 
selección, recuerdo contra conocimiento y construcción de respuesta contra identificación 
son maneras de diferenciar entre los reactivos en los cuales se requiere que los sujetos 
escriban o elaboren una respuesta y aquellos en los cuales se les pide indiquen cuál es la 
alternativa correcta. Otro método popular para clasificar los reactivos es ensayo contra 
objetivo. Todos los reactivos de ensayo son del tipo de completamiento o llenado porque la 
respuesta del sujeto es una respuesta construida. 
 
 Sin embargo, los reactivos objetivos pueden ser del tipo de llenado, 
completamiento, de selección, dependiendo de si los sujetos deben elaborar una respuesta o 
sólo seleccionar la mejor respuesta de una serie de alternativas. El rasgo crucial de los 
reactivos objetivos no es la forma de respuesta, sino qué tan objetivamente pueden 
calificarse. Con frecuencia, dos o más calificadores de un reactivo de ensayo están en 
desacuerdo hasta cierto punto sobre lo correcto de una respuesta determinada y cuántos 
puntos debe recibir. Pero, a excepción de los errores de oficina, los distintos calificadores 
de una prueba objetiva darán la misma calificación a un reactivo dado. 
 
Ejemplos de distintos tipos de reactivos de prueba 
 
I. Reactivos de ensayo: escriba una respuesta de media página para cada reactivo. 
 
1. Compare las ventajas y desventajas de los reactivos de ensayo y objetivos para pruebas. 
2. Explique las razones para realizar un análisis de reactivos de una prueba aplicable en el 
salón de clases. 
 
II. Reactivos objetivos 
 
A. Respuesta corta: escriba la (s) palabras (s) apropiada (s) en cada espacio. 
 
1. Lo único que es objetivo sobre una prueba objetiva es el _____________________. 
2. ¿Cuál es el primer paso formal en la elaboración de una prueba para predecir el grado 
de éxito en un trabajo en particular? ________________________________. 
 
 18
B. Falso y verdadero: encierre en un círculo la V si la afirmación es verdadera; encierre 
en un círculo la F si se trata de una afirmación falsa. 
 
V F 1. El sistema de clasificación de pruebas más comprensivo es el de The 
Mental Measurements Yearbooks. 
V F 2. El grupo de respuestas de conveniencia social es la tendencia a dar una 
calificación alta a una persona en un rasgo o característica solo porque 
se le califica así en otra característica. 
 
C. Aparejamiento: escriba la letra que corresponde al nombre correcto en el espacio 
adecuado del margen. 
 
_____ 1. Prueba de inteligencia de grupo A. Binet 
_____ 2. Prueba de inteligencia individual B. Darwin 
_____ 3. Inventario de intereses C. Galton 
_____ 4. Inventario de personalidad D. Otis 
_____ 5. Correlación producto-momento E. Pearson 
_____ 6. Pruebas sensoriomotrices F. Rorschach 
 G. Spearman 
 H. Strong 
 I. Woodworth 
 
 
D. Opción múltiple: escriba la letra de la opción correcta en el espacio del margen 
antes del ítem o reactivo. 
 
1. Los adverbios como nunca, a veces y siempre, que revelan la respuesta a una 
persona sin información sobre la materia del reactivo, se llaman 
 
A. generalidades brillantes B. grupos de respuestas 
C. adverbios de enlace D. determinantes específicos 
 
2. Jimmy, que tiene 8 años 4 meses de edad, obtiene una calificación de edad mental 
de 9 años 5 meses. De acuerdo con el texto, ¿cuál es su CI promedio? 
 
A. 88 B. 113 
C. 90 D. 120 
 
 
 
1. Reactivos de ensayo. La ventaja más importante de los reactivos de ensayo es que 
pueden medir la capacidad para organizar, relacionar y comunicar, comportamientos que no 
evalúan con facilidad los reactivos objetivos; además, un instrumento de ensayo requiere 
menos tiempo para prepararse y es poco probable que los sujetos contesten en forma 
correcta, los reactivos de ensayo mediante la adivinación. Una desventaja de los 
instrumentos de ensayo es que la cantidad de preguntas que pueden responderse en un 
tiempo de clase regular (aproximadamente seis respuestas de media página en 50 minutos) 
 19
tal vez no proporcionen un muestreo adecuado del conocimiento sobre la materia que 
tienen las personas. Otras desventajas de estos instrumentos son que la calificación es 
subjetiva; toma mucho tiempo y son susceptibles al engaño por parte de sujetos con 
facilidad de palabra, pero que carecen de información. 
 
 Un profesor de historia que conozco, en una ocasión informó haber aplicado un 
instrumento de ensayo que incluía la pregunta, “¿Cuáles fueron las causas y consecuencias 
de la Batalla de Hastings?” Un alumno flojo que no había tenido tiempo de llegar mas atrás 
del siglo XVI al estudiar la historia de Inglaterra empezó la respuesta a esta pregunta con la 
afirmación, “No puedo comentar sobre la Batalla de Hastings, pero prestemos atención a la 
Guerra de los Cien Años”. Este es un ejemplo bastante flagrante de la tendencia que 
presentan personas que no cuentan con información suficiente al responder de manera 
ligeramente diferente a la pregunta hecha con objeto de enfatizar lo que sí saben, en lugar 
de lo que no conocen•. 
 
Por regla general, no deben utilizarse los reactivos de ensayo cuando es posible 
realizar la misma evaluación con reactivos objetivos. Si se hacen preguntas de ensayo, la 
persona que redacta los reactivos debe tratar de realizar las preguntas objetivas. Esto puede 
lograrse al 1) definir la tarea y redactar los reactivos en forma clara, por ejemplo, pidiendo 
al sujeto que “compare” y “explique” en lugar de que “analice”; 2) utilizar una cantidad 
reducida de reactivos, deberán responder todas las personas; 3) estructurar los reactivos de 
manera que los expertos en la materia estén de acuerdo en que una respuesta es mejor que 
otra de forma demostrable y 4) pedir a las personas que respondan cada reactivo en una 
hoja de papel separada. 
 
 
Reactivos de respuesta corta, falso y verdadero y comparación. Los reactivos objetivos 
no se limitan a las cuatro formas tradicionales (respuesta corta o terminación, falso y 
verdadero,comparación y opción múltiple), pero estas son las más populares. Algunas de 
las ventajas que presentan las pruebas objetivas son que pueden calificarse con facilidad y 
de manera objetiva y que, como se necesita menos tiempo para responder cada reactivo, 
permiten un muestreo más extenso del material que las pruebas de ensayo. En la 
preparación de pruebas objetivas, debe ponerse especial cuidado en lograr que los reactivos 
sean claros, precisos y correctos en el aspecto gramatical. Deben redactarse con un lenguaje 
apropiado para el nivel de lectura del grupo que presentará la prueba. Deben incluir en el 
reactivo todos los datos y requerimientos necesarios para seleccionar una respuesta 
razonable, omitiendo las palabras y frases inútiles o estereotipadas. 
 
 A pesar de que puede existir una tendencia a elaborar los reactivos objetivos con el 
uso de afirmaciones de los libros de texto u otras fuentes, esto da mayor importancia al 
aprendizaje de memoria. Las personas que redactan los reactivos también deben tener 
 
• Una forma de manejar este problema, aunque representa mucho trabajo tanto para las 
personas que presentan la prueba como para quienes la califican, es el famoso 
procedimiento chino para los exámenes en el que se pide a los sujetos que… ¡escriban todo 
lo que saben! 
 
 20
cuidado de omitir las claves irrelevantes para la respuesta correcta y evitar reactivos que se 
interrelacionen y se entrelacen. Los reactivos se interrelacionan cuando la redacción de uno 
de estos ofrece una clave para la respuesta de otro. Los reactivos se entrelazan cuando es 
necesario saber la respuesta correcta de uno con objeto de contestar otro en forma correcta. 
 
 
2. Reactivos de respuesta corta. Un reactivo de respuesta corta es una tarea de tipo de 
completamiento, en la cual, se pide a las personas que completen o llenen uno o más 
espacios en blanco de una afirmación incompleta con las palabras o frases correctas o que 
den una respuesta breve a una pregunta. En términos de la longitud de la respuesta 
elaborada, los reactivos de respuesta corta se encuentran entre los reactivos de ensayo y de 
conocimiento. Se cuentan entre los reactivos que se elaboran con mayor facilidad, ya que 
requieren que las personas den la respuesta correcta en lugar de limitarse a reconocerla. A 
pesar de que los reactivos de respuesta corta son en especial útiles para evaluar el 
conocimiento de la terminología, tienen serias limitaciones. No son apropiados para medir 
objetivos de enseñanza complejos y, ya que puede haber más de una respuesta correcta, la 
calificación no siempre es por completo objetiva. 
 
 En la elaboración de reactivos de respuesta corta debe seguirse los lineamientos 
siguientes: 
 
1. Se prefieren las preguntas a las afirmaciones incompletas. 
2. Si se utiliza una afirmación incompleta, debe redactarse de manera que el espacio en 
blanco quede al final de ésta. 
3. Evitar varios espacios en blanco en el mismo concepto, en especial, si hacen que el 
significado de la tarea no sea claro. 
 
 
3. Reactivos de falso y verdadero. Uno de los tipos de reactivos para pruebas que son más 
sencillos de elaborar, pero que quizá sean los que menos agradan a los profesionales que 
aplican las pruebas, son los de falso y verdadero. Estos reactivos pueden redactarse y 
leerse con rapidez y, por tanto, permiten un muestreo extenso del contenido. Una 
desventaja importante de estos reactivos es que, con frecuencia, se ocupan de información 
trivial o se elaboran con afirmaciones que se toman al pie de la letra de los libros de texto. 
Como consecuencia, se dice que alientan el aprendizaje de memoria. Otro motivo de crítica 
para los reactivos de falso y verdadero es que con frecuencia son ambiguos, no pueden 
utilizarse para medir objetivos de enseñanza más complejos y, al basarse en el aprendizaje 
de memoria, dan una dirección errónea a los esfuerzos por aprender; además, ya que la 
calificación total de una prueba de falso y verdadero puede verse afectada por la tendencia 
del sujeto a adivinar cuando tiene duda o a estar de acuerdo (o en desacuerdo), el 
significado de ésta puede ponerse en entredicho••. 
 
•• La tendencia a estar de acuerdo cuando se tienen dudas (conformidad) es un ejemplo de 
un grupo de respuestas. Un grupo de respuestas es la tendencia por parte de la persona que 
presenta la prueba a contestar los reactivos con base a su forma, es decir, en la manera que 
están redactados, en lugar de su contenido. 
 
 21
 
En promedio, los sujetos responderán en forma correcta 50 por ciento de los 
reactivos de una prueba de falso y verdadero con sólo adivinar. Las calificaciones pueden 
aumentar aún más cuando los reactivos contienen determinantes específicos; palabras como 
todos, siempre, nunca y sólo, que indican que es probable que la afirmación sea falsa, o con 
frecuencia, algunas veces y por lo general, que indican que es probable que la afirmación 
sea verdadera. 
 
A pesar de estas desventajas, los reactivos de falso y verdadero no tienen que ser 
triviales ni ambiguos y no necesariamente dan una dirección errónea a los esfuerzos por 
aprender. En defensa de los reactivos de falso y verdadero, Ebel (1970) sostiene que “el 
grado del dominio por parte de los alumnos de un área del conocimiento en particular está 
indicado por su éxito al juzgar lo cierto o falso de las propuestas que se relacionan con 
ésta". Ebel argumentaba que estas propuestas son expresiones del conocimiento verbal, que 
considera, la esencia del logro educativo. 
 
La defensa por parte de Ebel de los reactivos de falso y verdadero puede ponerse en 
duda, pero no se pone en duda el hecho de que los reactivos de falso y verdadero puedan 
medir algo más que el aprendizaje de memoria, por ejemplo, al incluir dos conceptos, 
condiciones o eventos en un reactivo de falso y verdadero, la persona que administra la 
prueba puede preguntar si es cierto que están relacionados de manera estrecha a moderada. 
(Diekhoff, 1984). Otras posibilidades son preguntar si: 1) un concepto, condición o evento 
implica (es consecuencia de) otro; 2) un concepto, condición o evento es un subgrupo, 
ejemplo o categoría de otro, o 3) ambos conceptos, condiciones o eventos son verdaderos. 
Estos reactivos pueden medir la comprensión, así como el conocimiento significativo de 
los conceptos y eventos. 
 
Cualesquiera que sean los objetivos de una prueba de falso y verdadero, se aconseja 
tomar en cuenta las sugerencias siguientes al elaborar reactivos de este tipo: 
 
1. Asegúrese de que las afirmaciones planteen asuntos importantes (no triviales). 
2. Redacte las afirmaciones relativamente cortas y verdaderas o falsas sin lugar a dudas. 
3. Evite los reactivos en forma negativa, en especial aquellos que contienen doble 
negación. 
4. Evite los reactivos ambiguos y capciosos. 
5. Como regla general, evite los determinantes específicos. Si se utilizan determinantes 
específicos para hacer que cometan errores las personas sin conocimientos pero hábiles, 
deben incluirse en los reactivos verdaderos con tanta frecuencia como en los falsos. 
6. En las afirmaciones de opinión, cite la fuente o el texto del que provienen. 
7. Redacte las afirmaciones verdaderas y falsas más o menos con la misma longitud y 
procure que la cantidad de afirmaciones verdaderas sea aproximadamente igual a la 
cantidad de afirmaciones falsas. Puede argumentarse que, debido a que las afirmaciones 
falsas tienden a ser más discriminantes que las verdaderas, la cantidad de afirmaciones 
falsas debería ser mayor que las verdaderas. Sin embargo, si el maestro sigue esta 
práctica en pruebas subsecuentes, es probable que los alumnos se den cuenta de ello y 
empiecen a responder “falso” cuando tengan duda sobre la respuesta. 
 22
8. Haga que las respuestas incorrectas sean más atractivas al redactar los reactivos de 
modo que la lógica superficial, loserrores populares y los determinantes específicos 
sugieran que las respuestas erróneas son correctas. Las afirmaciones falsas que parecen 
verdaderas también pueden hacer que se equivoquen las personas sin conocimientos. 
 
 
4. Reactivos de aparejamiento. En cierto sentido, tanto los reactivos de falso y verdadero 
como los de opción múltiple son una variedad de los reactivos de aparejamiento. En estos 
tres tipos de reactivos, se compara un grupo de opciones de respuesta a un grupo de 
opciones de estímulo (premisas). La diferencia es que los reactivos de falso y verdadero y 
de opción múltiple tienen una sola opción de estímulo (el tronco de la respuesta) y dos o 
más opciones de respuesta, en tanto que los reactivos de aparejamiento pueden tener 
opciones de estímulo y de respuesta múltiples. 
 
La tarea en un reactivo de aparejamiento es indicar qué opciones de respuesta 
corresponden a cuáles opciones de estímulo. Por lo general, la comparación es de una a uno 
(una respuesta por estímulo), pero también puede ser de una a varios, de varias a uno o de 
varias a varios. Desde luego, los sujetos deben estar informados sobre cuales de estos 
procedimientos se aplican a un reactivo en particular. 
 
Los reactivos de aparejamiento son fáciles de elaborar y cubren el material con más 
eficacia que otros tipos de reactivos, pero por lo regular miden sólo el aprendizaje de 
memoria de los hechos; además, la necesidad de hacer que las opciones sean homogéneas 
(todas las opciones de la misma clase, como fechas, lugares o nombres) limita el tipo de 
material que puede adaptarse en un contexto de comparación. Los siguientes son algunos 
lineamientos para la elaboración de reactivos de aparejamiento: 
 
1. Ordene las opciones de estímulo (premisas) y respuesta en un formato de columnas 
claro y lógico, con las opciones de estímulo en la columna izquierda y las opciones de 
respuesta en la columna derecha. 
2. Numere las opciones de estímulo en forma sucesiva y coloque letras (a, b, c, etcétera) 
antes de las opciones de respuesta. 
3. Utilice entre seis y 15 opciones de estímulo, que tengan de dos a tres opciones de 
respuesta más que las opciones de estímulo. 
4. Especifique con claridad las bases de la comparación. 
5. Coloque todos los reactivos de este mismo tipo en una sola página. 
 
Un tipo especial de reactivo de aparejamiento es el reactivo de reordenamiento o 
jerarquización, en el cual se pide a las personas que clasifiquen un grupo de opciones en 
una cantidad fija de categorías determinadas previamente. Un tipo particular de reactivo de 
jerarquización es el reactivo de rango, en el cual, se ordena un conjunto de opciones de 
acuerdo con el rango de primera a última. 
 
 
5. Reactivos de opción múltiple. Nadie sabe quien elaboró el primer reactivo de prueba de 
opción múltiple, pero desde el punto de vista de la evaluación psicológica se trató de un 
 23
evento importante•••. Los reactivos de opción múltiple son los más versátiles de todos los 
reactivos para las pruebas objetivas en el sentido que pueden utilizarse para medir los 
objetivos de aprendizaje complejos y sencillos en todos los niveles y en cualquier materia. 
A pesar de que la elaboración de una respuesta para un reactivo de ensayo quizá requiera de 
mayor habilidad para la organización que la respuesta para un reactivo de opción múltiple, 
responder en forma correcta un reactivo de opción múltiple bien elaborado, requiere de 
gran capacidad para la discriminación y no sólo para reconocer o recordar la respuesta 
adecuada. Las calificaciones para este tipo de reactivos se ven menos afectadas por la 
adivinación y otros grupos de respuesta que las calificaciones para otros tipos de reactivos 
objetivos. Además, puede obtenerse información de diagnóstico útil a partir de un análisis 
de las opciones incorrectas (distractores) que eligen las personas. 
 
Entre las desventajas de los reactivos de opción múltiple se encuentra que: 1) es 
difícil elaborar los reactivos adecuados, en especial aquellos donde todas las opciones 
tengan el mismo atractivo para los sujetos que no conocen 1a respuesta correcta; 2) 
enfatizan el reconocimiento más que el recuerdo y organización de la información; y 3) 
requieren de más tiempo para contestarse y quizás ofrecen una muestra menos adecuada del 
área de la materia que los reactivos de falso y verdadero. También se establece, aunque no 
se ha comprobado, que las pruebas de opción múltiple favorecen a los lectores astutos, 
ingeniosos y rápidos y afectan a las personas que piensan con mayor profundidad las 
respuestas (Hoffman, 1962). 
 
Los lineamientos siguientes deben facilitar la elaboración de reactivos de opción 
múltiple de alta calidad: 
 
1. Debe utilizarse como tronco una pregunta o afirmación incompleta, pero se prefiere el 
formato de pregunta. En una afirmación incompleta, coloque el espacio en blanco al 
final del reactivo. 
2. Establezca en el tronco, el problema específico de la pregunta o afirmación incompleta 
de manera clara y en un nivel apropiado para las personas; evite tomar al pie de la letra 
preguntas o afirmaciones de los libros de texto. 
3. Coloque la mayor parte del reactivo en el tronco. No tiene caso repetir las mismas 
palabras en todos los conceptos. Para las personas es menos difícil revisar las opciones 
más cortas. 
4. Emplee pocas preguntas de opinión; cuando las utilice, cite la fuente o el libro de texto 
de donde proviene la opinión. 
5. Por lo general se utilizan cuatro o cinco opciones, pero también pueden redactarse sólo 
dos o tres opciones. 
6. Si las opciones tienen un orden natural, como fechas o épocas, se recomienda 
ordenarlos de acuerdo con éste. De otra manera, ordene las opciones de modo aleatorio 
o alfabéticamente (si esta ultima no proporciona alguna clave para las respuestas 
correctas). 
 
••• Es probable que el crédito por la creación del formato de reactivos de opción múltiple 
corresponda a Arthur Otis, quien al parecer, lo utilizó por primera vez en su prueba de 
inteligencia en grupo en 1916-1917. 
 
 24
7. Redacte todas las opciones de respuesta de modo que tengan una longitud, más o menos 
igual, que sean correctas en el aspecto gramatical y que sean apropiadas en relación con 
el tronco. Sin embargo, no permita que el tronco “revele” la opción correcta mediante 
asociaciones verbales u otras claves. 
8. Haga que todas las opciones sean posibles para las personas que no conocen la 
respuesta correcta, pero que sólo una opción sea la correcta o "la mejor". 
9. Al elaborar cada distractor, formule una razón por la cual un sujeto que no conoce la 
respuesta correcta podría seleccionarlo. 
10. Evite, o por lo menos reduzca al mínimo, el uso de expresiones como “no” tanto en el 
tronco como en las opciones. 
11. A pesar de que es apropiada cierta cantidad de originalidad e incluso humor y puede 
servir para interesar y motivar a las personas, no deben utilizarse troncos y opciones 
ambiguas ni capciosas. 
12. Use poco las expresiones “ninguna de las anteriores”, “todas las anteriores” o “más de 
una de las anteriores”. También evite los determinantes específicos como “siempre” o 
“nunca”. 
13. Coloque las opciones en formato (párrafo) de grupo en lugar de una tras otra; utilice 
números para designar los reactivos y letras para las opciones. 
14. Prepare la cantidad correcta de reactivos para el grado o nivel de edad que se pondrá a 
prueba, haciendo que cada reactivo sea independiente de los demás (que no se 
entrelacen ni se interrelacionen). 
 
Con sólo seguir estos lineamientos, que son sobre todo producto de la lógica y la 
experiencia más que de la investigación, no asegura la elaboración de una prueba de opción 
múltiple adecuada; en lugar de obedecer a ciegas un conjunto de reglas, la capacidad para 
redactar reactivos adecuados depende tanto o más del conocimiento de la materia que 
abarca la prueba, de entender lo que los alumnos debensaber sobre la materia, del arte o la 
habilidad para hacer preguntas, etc. Aún cuando los lineamientos no se sigan con precisión, 
los reactivos de opción múltiple tienden a ser bastante eficaces para medir el conocimiento 
y la comprensión1. 
 
 
Elaboración de distractores. Un proceso crucial para determinar la efectividad de los 
reactivos de opción múltiple es la selección o elaboración de distractores (opciones 
incorrectas). En la selección de reactivos puede emplearse un planteamiento racional o 
empírico. El planteamiento racional requiere que la persona que elabora la prueba realice 
juicios personales con respecto de los distractores apropiados. Por el contrario, el 
planteamiento empírico consiste en seleccionar distractores de acuerdo con la cantidad de 
respuestas que se dan al tronco del reactivo cuando se aplican como afirmaciones abiertas. 
No existe un consenso con respecto de qué planteamiento da como resultado mejores 
distractores, pero el juicio de la persona que aplica el examen parece ser por lo menos tan 
efectivo como el planteamiento empírico (Owens, Hanna y Coppedge, 1970; Hanna y 
Jonhson. 1978). 
 
 
1 Pueden encontrarse ejemplos de esta clase de reactivos en Woolfolk, Anita E. (1999), Psicología educativa. 
Prentice Hall: México. 
 25
 
Elaboración de reactivos complejos. Los creadores de pruebas por lo general tienen más 
problemas al elaborar los reactivos para medir la comprensión y el pensamiento que 
aquellos que miden el conocimiento directo de la materia de la prueba. Se han propuesto 
distintas formas de componer reactivos objetivos para evaluar objetivos de enseñanza más 
complejos. Las opciones como “todas las anteriores”, “ninguna de las anteriores”, “dos de 
las anteriores” y "todas las anteriores menos una” pueden hacer que la elección sea más 
difícil; además, hacer que todas las opciones sean correctas (o incorrectas) y pedir que las 
personas seleccionen la mejor o la opción más apropiada para cada reactivo complica la 
tarea. Otras formas de hacer que la decisión del sujeto sea más difícil son: 1) incluir 
reactivos de opción múltiple en los cuales una cantidad variable de opciones sea correcta y 
en los que la persona deba indicar cuáles opciones son correctas o incorrectas (en caso de 
haberlas); 2) hacer que seleccionen una respuesta y la mejoren, y 3) pedir que identifiquen 
el planteamiento correcto (como por ejemplo una ecuación o método de solución) para las 
tareas de solución de problemas. 
 
A continuación se ilustran procedimientos adicionales para aumentar la complejidad 
de los reactivos de opción múltiple. Todas estas técnicas se diseñaron para hacer que la 
elección de la opción correcta sea un proceso analítico y que requiera del pensamiento en el 
cual se emplean distintas capacidades mentales, en lugar de un simple proceso de memoria 
de reconocimiento. 
 
Algunas formas complejas de reactivos de opción múltiple 
 
1. Clasificación. El examinando clasifica una persona, objeto o condición en una de las 
varias categorías mencionadas en el tronco: 
 
Jean Piaget se caracteriza mejor como un psicólogo ________________ 
 
a. clínico c. psicométrico 
b. del desarrollo d. social 
 
2. Condiciones si-entonces. El examinando debe decidir la consecuencia correcta de 
una o más condiciones presentes: 
 
Si la varianza real de una prueba aumenta pero la varianza de error permanece 
constante, ¿cuál de las situaciones siguientes se presenta? 
 
a. aumenta la confiabilidad c. disminuye la varianza observada 
b. disminuye la confiabilidad observada d. no cambian ni la confiabilidad ni la varianza 
 
3. Condiciones múltiples. El examinando utiliza dos o más condiciones o afirmaciones 
mencionadas en el tronco para llegar a una conclusión: 
 
Suponiendo que la calificación bruta de Mary en una prueba es 60, la medida de la 
prueba es 59 y la desviación estándar es 2, ¿cuál es la calificación z de Mary? 
 
 26
a. –2.00 c. 0.50 
b. –0.50 d. 2.00 
 
4. Falso y verdadero múltiple. El examinando decide si una, todas o ninguna de las dos 
o más condiciones o afirmaciones mencionadas en el tronco es (son) correcta (s): 
 
¿Es cierto que 1) Alfred Binet es el padre de las pruebas de inteligencia y 2) su 
primera prueba de inteligencia se publicó en 1916? 
 
a. ambas, 1 y 2 c. 1 no, pero 2 sí 
b. 1 pero no 2 d. ni 1 ni 2 
 
5. Falta de correspondencia. El Examinando indica cuál de las opciones no pertenece 
al mismo grupo que las otras: 
 
¿Cuál de los nombres siguientes no corresponde con los otros? 
 
a. Alfred Adler c. Carl Jung 
b. Sigmund Freud d. Carl Rogers 
 
 
_________________________________________________________________________ 
Tomado textualmente de: Aiken, Lewis R. (1996). Tests psicológicos y Evaluación. 
México: Prentice Hall, páginas 29 a 37. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 27
BREVE REPASO DE ALGUNOS TÉRMINOS ESTADÍSTICOS 
 
 
MEDIDAS DE TENDENCIA CENTRAL 
 
 
Una característica de la distribución de datos es su tendencia a acumularse 
hacia el centro de la misma. Esta característica se denomina tendencia central. 
Las más importantes, al menos para la segunda parte de este curso sobre 
Teoría de la Medida, son: la moda, la mediana y la media. 
 
 
MODA , el valor más frecuente (Mo) 
 
Es la puntuación que ocurre con mayor frecuencia. La moda puede ser no 
única e inclusive no existir. Ejemplo: 
 
24 31 35 35 38 43 45 50 57 
 
Mo = 35 
 
Ejercicio 1. Hallar la moda en los siguientes datos: 
 
16 18 15 20 16 
 
 
MEDIANA , el valor central (Mdn) 
 
Es el valor que divide a la distribución por la mitad, o dicho de otra forma, el 
punto central de una serie de datos 
 
 
 Para calcularla 
 
 
Ejemplos: 
 
 Habiéndose ordenado los datos en forma creciente (o decreciente), se aplica 
la fórmula del inciso a dado que el número de datos es impar. 
 
a) No. Impar: N + 1 / 2 
 
b) No. Par: Media de los valores 
centrales 
 28
 24 31 35 35 38 43 45 50 57 
 
 
Mdn = 9 + 1 / 2 = 5 La mediana es 38 
 
 
 Ordenándose previamente los datos, se calcula la media de los valores 
centrales dado que el número de datos es par. 
 
7 10 10 12 13 15 
 
M = 10 +12 / 2 = 11 La mediana es 11 
 
Ejercicio 2. Hallar la mediana de los siguientes datos. 
 
25 30 28 26 32 
 
 
MEDIA , promedio aritmético de una distribución (M) 
 
Se trata de la suma de todos los valores divididos por el número de casos. 
 
Fórmula: M = ∑X / N 
 
 
Ejemplo: 
10 8 6 5 10 7 
 
M = 10 + 8 + 6 + 5 + 10 + 7 / 6 = 8 
 
Cuando los datos están agrupados en intervalos, la media se calcula así: 
 
1. Se obtiene el punto medio de cada intervalo. 
2. Se multiplica cada punto medio por las frecuencias correspondientes. 
3. Se aplica la siguiente fórmula: M = ∑fx / N 
 
 
Ejemplo: 
 
 29
INTERVALOS f x fx 
13 – 15 3 14 42 
10 – 12 4 11 44 
7 – 9 9 8 72 
4 – 6 2 5 10 
1 - 3 1 2 2 
N = 19 ∑fx = 170 
 
M = 170 / 19 = 8.95 
 
Ejercicio 3. Con la siguiente distribución de frecuencias, que muestra 
espesores en pulgadas de recipientes de acero, hallar la media aritmética. 
 
Espesores en 
pulgadas 
f 
0.327 – 0.330 1 
0.323 – 0.326 14 
0.319 – 0.322 22 
0.315 – 0.318 5 
0.311 – 0.314 5 
0.307 – 0.310 3 
 
 
 
MEDIDAS DE DISPERSIÓN 
 
 
Estas medidas indican la tendencia de los datos a dispersarse en torno al 
centro de la distribución. Las más importantes, para la segunda parte del curso 
en cuestión, son: el rango, la desviación estándar y la varianza. 
 
 
RANGO, amplitud o recorrido (R) 
 
Es la diferencia entre el dato mayor y el dato menor de un conjunto de datos. 
Su fórmula es: R = X máx. – X mín. 
 
Ejemplos: 
 30
 
4 5 5 5 6 7 7 20 
 
R = 16 
 
2 4 6 7 9 12 14 15 
 
R = 13 
 
 
 
DESVIACIÓNESTÁNDAR (s) Y VARIANZA (s2) 
 
Considérese el siguiente conjunto de datos: 
 
5 10 15 20 25 30 35, 
 
el cual, presenta una M de 20. La desviación de cada uno de esos datos con 
respecto a su media los presentamos en el siguiente cuadro: 
 
 
X 5 10 15 20 25 30 35 
X – M = d 5 - 20 10 - 20 15 - 20 20 - 20 25 - 20 30 - 20 35 - 20 
- 15 - 10 - 5 0 5 10 15 
 
 
Considerando lo anterior, la desviación estándar es un promedio de las 
desviaciones de las puntuaciones de una distribución con respecto a su media. 
Se define como: la raíz cuadrada de los cuadrados de las desviaciones de los 
valores de la variable con relación a su media. Cuanto mayor es la dispersión 
de los datos alrededor de la media, mayor es la desviación estándar. 
 
En lo que respecta a la varianza, ésta es el cuadrado de la desviación estándar. 
 
 
Fórmula de la desviación estándar: s = ∑ (X – M)2 / N 
 
 
 
 31
Procedimiento: 
 
1. Se ordenan las puntuaciones. 
2. Se calcula la media. 
3. Se determina la desviación de cada puntuación con respecto a la media. 
4. Se eleva al cuadrado cada desviación y se obtiene la sumatoria de las 
desviaciones elevadas al cuadrado. 
5. Se aplica la fórmula antes citada. 
 
Ejemplo: 
 
Las calificaciones en Teoría de la medida. 
 
M = 40 / 7 = 5.71 
 
X X - M (X – M)2 
9 3.29 10.82 
7 1.29 1.66 
6 0.29 0.08 
6 0.29 0.08 
5 - 0.71 0.50 
4 - 1.71 2.92 
3 - 2.71 7.34 
∑X = 40 ∑ (X – M)2 = 23.40 
 
s = 23.40 / 7 = 1.83 
 
s2 = 3. 34 
 
Ejercicio 4. Siendo su M de 9.5, hallar la desviación estándar y la varianza de 
la siguiente serie de datos: 
 
10 18 15 12 3 6 5 7 
 
 
 Cuando los datos están agrupados en una distribución de frecuencias: 
 
1. Se obtiene el punto medio de cada intervalo y se determina la media de 
la distribución (con la fórmula para los datos agrupados M = ∑fx / N). 
 32
2. Se determina la desviación de cada puntuación con respecto a la media 
(restando a los puntos medios lo que se haya obtenido como media). 
3. Se eleva al cuadrado cada desviación 
4. Se multiplica el cuadrado de cada desviación por las frecuencias 
correspondientes 
5. Se obtiene la sumatoria de las desviaciones elevadas al cuadrado y 
multiplicadas por las frecuencias. 
6. Se aplica la siguiente fórmula: 
 
 s = ∑ f (X – M)2 / N 
 
 
Ejemplo: 
 
M = 8.95 
INTERVALOS f X X -M (X – M)2 f (X – M)2 
13 – 15 3 14 5.05 25.5025 76.5075 
10 – 12 4 11 2.05 4.2025 16.81 
7 – 9 9 8 - 0.95 0.9025 8.1225 
4 – 6 2 5 - 3.95 15.6025 31.205 
1 – 3 1 2 - 6.95 48.3025 48.3025 
 N = 19 ∑ f (X – M)2 
= 180.9475 
 
 
s = 180.9475 / 19 = 9.5235 = 3.08 
 
 
s2 = 9.48 
 
Ejercicio 5. Siendo su M de 26.04, hallar la desviación estándar y la varianza 
para la siguiente distribución de frecuencias. 
 
INTERVALOS f 
34 - 39 6 
28 – 33 10 
22 – 27 13 
16 – 21 8 
10 – 15 2 
 33
CASO PRÁCTICO: 
 
Supóngase que se utilizó una escala de actitudes para medir la “actitud hacia 
el presidente” entre dos grupos pertenecientes a una misma nación, en la cual, 
se utilizaron 18 reactivos con un rango potencial de 1 a 5: 
 
 
 
 
 
 
 
Al promediarse los resultados, se obtuvieron los siguientes datos para cada 
uno de los grupos encuestados: 
 
Grupo A: Grupo B: 
- variable: actitud hacia el presidente 
- Moda: 4.0 
- Mediana: 3.9 
- Media: 4.2 
- Desviación estándar: 0.7 
- Puntuación máxima: 5.0 
- Puntuación mínima: 2.0 
- Rango: 3 
- variable: la misma 
- Moda: 1 
- Mediana: 1.5 
- Media: 1.3 
- Desviación estándar: 0.4 
- Puntuación máxima: 3.0 
- Puntuación mínima: 1.0 
Rango: 2 
 
PREGUNTA: Haciendo una comparación entre ambos casos, ¿En cual de los 
dos se obtuvieron promedios que reflejaran una actitud más favorable hacia el 
presidente? 
 
 
CORRELACIÓN (DE PEARSON) 
 
 
Mide la magnitud y la dirección de la relación existente entre dos variables. Se 
dice que hay correlación entre dos variables cuando éstas cambian de tal modo 
que los valores que toma una de ellas son, hasta cierto punto, predecibles a 
partir de los que toma la otra. 
 
Su fórmula es: 
1 2 3 4 5 
Actitud 
totalmente 
desfavorable 
Actitud 
totalmente 
favorable 
 34
rxy = Σxy – (Σx) (Σy) 
 N 
 
 [Σx2 – (Σx)2] [Σy2 – (Σy)2] 
 N N 
 
Ejemplo: Un investigador realizó un estudio entre la relación del consumo de 
cigarro y las enfermedades. Determinó, para ello, la cantidad de cigarros 
consumidos diariamente y los días de ausencia en el trabajo durante el último 
año debido a una enfermedad de 12 sujetos. Para calcular la correlación entre 
estas dos variables, basándose en la fórmula de Pearson, dicho investigador 
llevo a cabo el siguiente procedimiento: 
 
SUJETOS CIGARROS (X) 
DÍAS 
(Y) X
2 Y2 XY 
1 0 1 0 1 0 
2 0 3 0 9 0 
3 0 8 0 64 0 
4 10 10 100 100 100 
5 13 4 169 16 52 
6 20 14 400 196 280 
7 27 5 729 25 135 
8 35 6 1225 36 210 
9 35 12 1225 144 420 
10 44 16 1936 256 704 
11 53 10 2809 100 530 
12 60 16 3600 256 960 
Σ 297 105 12193 1203 3391 
 
rxy = 3391 – (297) (105) 
 12 
 
 [12193 – (297)2] [12032 – (105)2] 
 12 12 
 
rxy = 0.67 
 
RESPUESTAS A LOS EJERCICIOS: 
 
1. Mo = 16 
2. Mdn = 28 
3. 
 35
Espesores en 
pulgadas 
f X fX 
0.327 – 0.330 1 0.3285 0.3285 
0.323 – 0.326 14 0.3245 4.5430 
0.319 – 0.322 22 0.3205 7.0510 
0.315 – 0.318 5 0.3165 1.5825 
0.311 – 0.314 5 0.3125 1.5625 
0.307 – 0.310 3 0.3085 0.9255 
 N=50 ∑fX=15.9930 
M = 15.9930 / 50 = 0.3199 
4. 
X X - M (X – M)2 
10 0.5 0.25 
18 8.5 72.25 
15 5.5 30.25 
12 2.5 6.25 
3 - 6.5 42.25 
6 - 3.5 12.25 
5 - 4.5 20.25 
7 - 2.5 6.25 
∑X = 8 ∑ (X – M)2 = 190 
s = 190 / 8 = 4.87 s2 = 23.75 
5. 
INTERVALOS f X X -M (X – M)2 f (X – M)2 
34 - 39 6 36.5 10.46 109.4116 656.5 
28 – 33 10 30.5 4.46 19.8916 168.1 
22 – 27 13 24.5 - 1.54 2.3716 46.9 
16 – 21 8 18.5 - 7.54 56.8516 454.8 
10 – 15 2 12.5 -13.54 183.3316 366.7 
 N =39 ∑ f (X – M)2 = 
1693 
s = 1693 / 39 = 6.6 s2 = 43.4 
 
Respuesta a la pregunta. Es en el grupo A donde se obtuvieron promedios que reflejan 
una actitud más favorable hacia el presidente. Para verificarlo, observa la comparación 
gráfica que se hace de ambos casos a continuación: 
 
 
 
 
 
 
 
 
 
Grupo A: Actitud favorable Grupo B: Actitud muy desfavorable 
Mo 1 
R 2 
Mdn 
1.5 
M 1.3 
Mo 4 
Mdn 
3.9 
R 3 
M 4.2 
1 2 3 4 5 
Promedio de desviación (s) 0.7 Promedio de desviación (s) 0.4 
1 2 3 4 5 
 36
USO DE LA TABLA DE AREAS BAJO LA CURVA NORMAL 
 
- Parte 1 de 2 - 
 
 
 Dado un conjunto de datos que se distribuyen en forma normal, con media (M) y 
desviación estándar (s), se convierte el dato X en dato z2, mediante la expresión: 
 
Z = X - M / s 
 
Sí X >>>> M, z es positivo. Sí X = M, z = 0. Si X <<<< M, z es negativo. 
Por ejemplo, si M = 70 y s = 10, la conversión de los valores 60, 70 y 80 en datos z es la 
siguiente: 
 
z = 60 - 70 / 10 = -1 
z = 70 - 70 / 10 = 0 
z = 80 - 70 / 10 = 1 
 
2 Las calificaciones brutas se transforman con frecuencia a otras escalas, para facilitar el análisis y 
la interpretación. Estas calificaciones, como sucede en el caso de las calificaciones estándar, se 
llaman derivadas o transformadas. Una calificación estándar (z) expresa la ejecución de una 
persona en función de su desviación de la media en unidades de desviación estándar. Estas 
calificaciones derivadas en particular tienen varias ventajas: 
1. Miden en una escala de intervalos (al expresar la ejecución en términos de unidades de 
desviación estándar se transforman las calificaciones brutas en una escala de unidades de igual 
medida), y 
2. Nos permiten comparar calificaciones de varias pruebas en forma directa, inclusocuando 
tengan medias y desviaciones estándar diferentes. Un ejemplo ilustrará mejor esta ventaja: 
Tenemos el caso donde se desea comparar una distribución obtenida en una preprueba con otra 
obtenida en una postprueba (en un contexto experimental). Supongamos que se trata de un 
estímulo que incrementa la productividad. Un trabajador obtuvo en la preprueba una 
productividad de 130 (la media del grupo fue de 122.5 y la desviación estándar de 10). Y en la 
postprueba obtuvo 135 (la media del grupo fue de 140 y la desviación estándar de 9.8). ¿Mejoró 
la productividad del trabajador? Aparentemente la mejoría no es considerable. Sin transformar 
las 2 calificaciones en puntuaciones "z" no podemos asegurarlo porque los valores no 
pertenecen a la misma distribución. Entonces transformamos ambos valores a puntuaciones "z" 
donde la comparación es válida. El valor de 130 en productividad es en términos de unidades de 
desviación estándar igual a: 
 
 z = 130 - 122.5 / 10 = 0.75 
 
 Y el valor de 135 corresponde a una puntuación "z" de: 
 
 z = 135 - 140 / 9.8 = 0.51 
 
 Como podemos observar, en términos absolutos 135 es una mejor puntuación que 130, pero no 
en términos relativos (en relación a sus respectivas distribuciones). 
 
 37
 Obsérvese que la distancia entre la media 70 y el valor 80 es de una desviación 
estándar a la derecha de la media. La distancia entre 60 y la media también es de una 
desviación estándar pero por debajo de la media. La distancia entre el valor 70 y la media 
es cero. 
 El valor z que corresponde a un valor X mide la distancia que hay entre la media y 
el valor X. Esa distancia se mide en desviaciones estándar3. Por ejemplo, si M = 70 y s = 
10, entonces la distancia que hay entre 70 y 85 es de 1.5 desviaciones estándar a la derecha 
de la media, ya que 
 
z = 85 - 70 / 10 = 1.5 
 
 Cuando una distribución de frecuencias es de forma normal, el porcentaje de datos 
cuyos valores están comprendidos entre la media y un valor arriba de la media, a una 
distancia de una desviación estándar, es aproximadamente igual al 34.13 %. Esto es, si la 
distribución normal tiene media y desviación estándar, entonces el 34.13% de la totalidad 
de los datos 4 son valores comprendidos entre X y M + s. 
 Por ejemplo, las siguientes distribuciones normales tienen diferentes medias y 
desviaciones estándar, pero las distancias entre los valores dados y la media es de una 
desviación estándar: 
 
a) Si M = 24 y s = 7, entre 24 y 31 se encuentra el 34.13%, ya que la distancia entre 24 y 
31 es de una desviación estándar. 
 
z = 31 - 24 / 7 = 1 
 
b) Si M = 100 y s = 25, entre 100 y 125 se encuentra el 34.13%, ya que la distancia entre 
100 y 125 es de una desviación estándar. 
 
z = 125 - 100 / 25 = 1 
 
 Para el caso en que la distancia entre la media y un valor dado sea de dos o tres 
desviaciones estándar, se tiene lo siguiente: 
 
• El porcentaje de datos cuyos valores están comprendidos entre la media y un valor 
arriba de la media, a una distancia de dos desviaciones estándar es aproximadamente 
igual al 47.72%. 
• El porcentaje de datos cuyos valores están comprendidos entre la media y un valor 
arriba de la media a una distancia de tres desviaciones estándar, es aproximadamente 
igual al 49.87%. 
 
Por ejemplo: 
 
3 En resumen, z indica el número de desviaciones estándar que hay entre un valor dado y la media; 
por arriba de la media si z es positivo y por abajo si z es negativo. 
4 Simbólicamente: entre X y M + 2s se encuentra el 47.72% del total de datos y entre X y M + 3s se 
encuentra el 49.87% del total de datos. 
 
 38
a) Si M = 30 y s = 8, entre 30 y 46 se encuentra el 47.72%, ya que la distancia entre 30 y 
46 es de dos desviaciones estándar. 
 
z = 46 - 30 / 8 = 2 
 
b) Si M = 30 y s = 8, entre 30 y 54 se encuentra el 49.87%, ya que la distancia entre 30 y 
54 es de tres desviaciones estándar. 
 
z = 54 - 30 / 8 = 3 
 
 Los porcentajes de 34.13%, 47.72% y 49.87% correspondientes a los valores z = 1, 
z = 2 y z = 3, respectivamente, han sido obtenidos de la tabla de áreas bajo la curva 
normal. En esta tabla se encuentran los diferentes porcentajes que corresponden a los 
diferentes valores de z (consúltese el apéndice al final de este texto). Dicha tabla está 
constituida por un arreglo de números dispuestos en filas y columnas. La primera columna 
y el primer renglón dan los valores de z desde 0.00 hasta 3.095. En la tabla “Uso de la tabla 
de áreas bajo la curva normal” (ubicada en las páginas finales de este material) se indica 
cómo encontrar los porcentajes que corresponden a los valores de z = 0.4, z = 0.96, z = 1.32 
y z = 1.6, los cuales son respectivamente, 15.54%, 33.15%, 40.66% y 44.52%. 
 
 En una distribución normal el 34.13% del total de datos son valores comprendidos 
entre X y M + s. Como la curva es simétrica, el mismo 34.13% del total de datos son 
valores comprendidos entre M - s y X. 
 En general, el porcentaje de datos que se encuentra entre X y M + zs es el mismo 
que se da entre M - zs y X. 
 Por ejemplo, si M = 15 y s = 4, el porcentaje de datos entre 15 y 21 y entre 9 y 15 es 
de 43.32%, ya que 
 
z = 21 - 15 / 4 = 1.5, y 
z = 9 - 15 / 4 = -1.5 
 
lo cual significa que tanto 21 como 9 tienen la misma distancia en desviaciones estándar a 
la media, el primero por arriba de la media y el segundo por debajo de ella. 
 
 
 
PROBLEMA: 
 
 
 Para un conjunto de 500 datos que se distribuyen en forma normal con M = 65 y s = 
11, ¿Qué porcentaje de 500 son valores comprendidos entre 65 y 80? He aquí los pasos 
para dar respuesta a dicho cuestionamiento: 
1. Se calcula la distancia en desviaciones estándar que hay entre 65 y 80 (z = 80 - 65 / 11 
= 1. 36), 
 
5 Algunas tablas incluyen valores de z mayores que 3.09. 
 39
2. Se busca en la tabla de áreas bajo la curva normal el porcentaje que corresponde a z. 
Para esto se localiza la intersección del renglón 1.3 y la columna .06. En esta 
intersección se encuentra el número 41.31 (otras tablas tienen .4131). Por tanto, el 
41.31% de los 500 datos son valores comprendidos entre 65 y 80. Como el 41.31% de 
500 es 206.55 (500 x 41.31 = 20655 / 100 = 206.55); entonces alrededor de 206 o 207 
datos son valores entre 65 y 80. 
 
Con base a lo anterior, resuélvanse los siguientes casos: 
 
1. ¿Qué porcentaje de los datos son valores comprendidos entre 50 y 65? 
 
 
 
 
 
 
 
 
 
 
2. ¿Qué porcentaje de los datos son valores mayores que 65? 
 
 
 
 
 
 
 
 
 
 
3. ¿Qué porcentaje del total de datos son valores comprendidos entre la media y 
98?6 
 
 
 
 
 
 
 
. 
 
 
 
 
6 Resuelto este caso observe que, entre los números M - 3s y M +3s se encuentra el 99.74% de los 
datos. 
 40
USO DE LA TABLA DE AREAS BAJO LA CURVA NORMAL 
 
- Parte 2 de 2 - 
 
 
 
 Para el mismo conjunto de 500 datos que se distribuyen en forma normal con 
M = 65 y s = 11, también pueden darse los siguientes casos: 
 
1. Calcular el porcentaje arriba de un valor mayor que la media. 
2. Calcular el porcentaje arriba de un valor menor que la media. 
3. Calcular el porcentaje abajo de un valor mayor que la media. 
4. Calcular el porcentaje abajo de un valor menor que la media. 
5. Calcular el porcentaje entre un valor menor que la media y otro mayor que la media. 
6. Calcular el porcentaje entre dos valores mayores que la media. 
7. Calcular el porcentaje entre dos valores menores que la media. 
 
Se resolverán a continuación los primeros cuatro casos con la intención de que se 
conviertan en una especie de guía para el educando, quien posteriormente intentará 
resolver los últimos tres casos: 
 
Caso 1. ¿Qué porcentaje son valores mayores que 78? 
R. Primero: convierta 78 en dato z. 
 
z = 78 - 65 / 11 =1.18 
 
 Segundo: localice en la tabla de áreas bajo la curva normal, el porcentaje que 
corresponde a z = 1.18. Este porcentaje es de 38.10 y es el porcentaje de valores entre la 
media 65 y 78. 
 Tercero: como arriba de la media existe el 50% de los valores y como entre la media y 
78, el 38%, entonces la diferencia de estos porcentajes es el porcentaje de datos mayores 
que 78. Por tanto, el 11.90% son valores mayores que 78 (50.00 - 38.10 = 11.90). 
 
Caso 2. ¿Qué porcentaje son valores mayores que 45? 
R. Primero: convierta 45 en dato z. 
 
z = 45 - 65 / 11 = -1.82 
 
 Segundo: localice en la tabla del apéndice A, el porcentaje que corresponde a z = -1.82. 
Este porcentaje es 46.56 y es el porcentaje de valores entre 45 y la media 65. 
 Tercero: como 46.56% es el porcentaje entre 45 y la media y como el 50% de los 
valores son mayores que la media, entonces la suma de estos porcentajes es el porcentaje de 
datos mayores que 45. Por tanto, el 96.56% son valores mayores que 45 (46.56 + 50.00 = 
96.56). 
 
 
 41
Caso 3. ¿Qué porcentaje son valores menores que 72? 
R. Primero: 
 
z = 72 - 65 / 11 = .64 
 
 Segundo: el porcentaje entre la media 65 y 72, que corresponde a z = .64 es 23.89. 
 Tercero: como el 50% son valores menores que la media y como entre la media y 72 se 
encuentra el 23.89%, entonces la suma de estos porcentajes es el porcentaje de datos 
menores que 72. Por tanto, el 73.89% son valores menores que 72 (50.00 + 23.89 = 73.89). 
 
Caso 4. ¿Qué porcentaje son valores menores que 50? 
R. Primero: 
 
z = 50 - 65 / 11 = -1.36 
 
 Segundo: el porcentaje entre 50 y 65, que corresponde a z = -1.36, es 41.31. 
 Tercero: como el 50% son valores menores que la media y como entre 50 y 65 se 
encuentra el 41.31%, entonces la diferencia de estos porcentajes es el porcentaje de datos 
menores que 50. Por tanto, el 8.69% son valores menores que 50 (50.00 - 41.31 = 8.69). 
 
Resuelva de la misma manera los últimos tres casos: 
 
1. Caso 5: ¿Qué porcentaje son valores comprendidos entre 52 y 81? 
R. 
 
 
 
 
 
2. Caso 6: ¿Qué porcentaje son valores comprendidos entre 70 y 85? 
R 
 
 
 
 
 
3. Caso 7: ¿Qué porcentaje son valores comprendidos entre 44 y 58? 
R 
 
 
 
 
 
 
 
 
 
 42
APENDICE 
 
TABLA DE ÁREAS BAJO LA CURVA NORMAL 
 
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09 
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0754 
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 
 
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 
0.6 0.2258 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2518 0.2549 
0.7 0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 
0.8 0.2881 0.2910 0.2939 0.2967 0.2996 0.3023 0.3051 0.3078 0.3106 0.3133 
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 
 
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 
 
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 
 
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 
 
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 
 
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 
 
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 
 43
RESPUESTAS DE LOS EJERCICIOS 
 
 
 
A. De la parte 1: 
 
1. 41.31% 
2. En una distribución normal, arriba y debajo de la media se encuentra el 50% del total de 
datos. Por tanto, 50% de los datos son valores mayores que 65. 
3. El 49.87% del total de datos son valores comprendidos entre 65 y 98. 
 
 
B. De la parte 2: 
 
1. Como el 38.10% son valores comprendidos entre 52 y 65 y como el 42.65% son valores 
comprendidos entre 65 y 82, entonces la suma de estos porcentajes es el porcentaje de 
datos entre 52 y 81. Por tanto, el 80.75% son valores comprendidos entre 52 y 81 
(38.10 + 42.65 = 80.75). 
2. Como el 46.56% son valores entre 65 y 85 y como el 17.36% son valores entre 65 y 70, 
entonces la diferencia entre estos porcentajes es el porcentaje de datos entre 70 y 85. 
Por tanto, el 29.20% son valores comprendidos entre 70 y 85 (46.56 - 17.36 = 29.20). 
3. Como el 47.19% son valores comprendidos entre 44 y 65 y como el 23.89% son valores 
comprendidos entre 58 y 65, entonces la diferencia entre estos porcentajes es el 
porcentaje de datos entre 44 y 58. Por tanto, el 23.30% son valores comprendidos entre 
44 y 58 (47.19 - 23.89 = 23.30). 
 
 
 
Bibliografia 
 
 
• Portilla Chimal, E. (1998). Estadística, primer curso. México: McGraw-Hill. 
 
• Brown F. (1998). Principios de la medición en psicología y educación. México: El 
Manual Moderno. 
 
• Hernández Sampieri, R., C. Fernández Collado, y P. Baptista Lucio (1998). 
Metodología de la investigación. México: McGraw-Hill. 
 
 
 
 
 
 
 
 
 44
CALIFICACIÓN DE LAS PRUEBAS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Calificación de pruebas de ensayo 
 
� Para estos se sugiere estructurar claramente la tarea solicitada 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Recomendaciones para calificar pruebas de ensayo… 
 
� Calificar la pregunta como un todo (calif. general o global) o asignar valores 
distintos a cada uno de los componentes que conforman al reactivo (procedimiento 
analítico) 
� Consideración de la extensión asignada y de la importancia de la respuesta 
� Redacción de respuesta ideal 
Para una prueba 
formada por partes con 
diferentes contenidos o 
reactivos debe 
considerarse si se 
obtienen calificaciones 
separadas o una 
calificación como un 
todo 
¿Qué 
Procedimiento 
de calificación 
Utilizar? 
Otras consideraciones: 
-Restar aciertos por 
adivinar, 
-Reportar los resultados 
en forma de calificación 
bruta o convertirlos de 
alguna manera 
� Escritura & Calidad de la respuesta (Evaluación) 
 
� Ser demasiado general (Error de indulgencia) 
 
� Calificar bien un reactivo sólo porque

Continuar navegando