Logo Studenta

Resumen psicometricas

¡Este material tiene más páginas!

Vista previa del material en texto

Clasificación de técnicas 
La clasificación de técnicas sirve para encontrar las técnicas para objetivos determinados. 
Ámbitos: clínico, escolar, jurídico, laboral, etc.
Grupo etario: niños, adolescentes, adultos, gerontes.
Constructos (fenómenos no observables a los cuales podemos acceder a través de técnicas/indicadores): Inteligencia, ansiedad, personalidad, memoria, etc. 
Material: papel, lápiz, ejecución, etc. 
Cantidad de personas: individual o colectivo 
Generalidad: generales: por ej. entrevista, observación. Específicas: evalúan determinado constructo, por ej. test psicométricos, etc. 
Estructuración (clasificación de Pervin): psicométricas, proyectivas, subjetivas (el orientador tiene más peso en la interpretación), objetivas. 
· Psicométricas: test de evaluación y diagnostico elaborados a través de procedimientos estadísticos altamente sofisticados, con material rigurosamente estandarizado y tipificación en sus tres fases fundamentales: aplicación, corrección e interpretación. Dentro de esta categoría los test pueden dirigirse tanto a la exploración de las funciones cognitivas como emocionales, de rasgos o de rendimientos. 
· Proyectivas: instrumentos especialmente sensibles para revelar aspectos inconscientes de la conducta, permiten provocar una amplia variedad de respuestas subjetivas, son altamente multidimensionales y evocan respuestas y datos inusualmente ricos. Logran la proyección del mundo privado, permiten organizar el campo, interpretar el material y reaccionar ante él afectivamente. 
· Subjetivas: instrumentos cuyo material no está estandarizado y su corrección no es objetiva; el sustrato teórico también oscila entre enfoques fenomenológicos y teorías cognitivas. 
· Objetivas: aquellos instrumentos en que el sujeto no puede modificar sus respuestas voluntariamente. El material utilizado es estructurado y su base teórica se encuentra en los principios del aprendizaje y de la psicología cognitiva. 
Psicometría
La Psicometría es la rama de la Psicología que se ocupa de las cuestiones relacionadas con la medición. Hay contenidos tradicionales en Psicometría que son punto de acuerdo entre la mayoría de los autores: 
· Los procesos operacionales de medición en Psicología asociados a escalas de medida: El objetivo de la psicometría es hallar la mejor manera de observar, calificar y transformar categorías manifiestas en escalas cuantitativas. 
· Confiabilidad o precisión de los instrumentos de medida en Psicología: Si una prueba psicométrica no es confiable en su medición, su inconsistencia repercutirá negativamente no solo en la validez del instrumento, sino en todos los procesos relacionales que se incluyan. 
· Validez de una prueba: Permite decir de una prueba que mide lo que pretende medir. 
La Psicología es la rama que estudia la conducta de las personas en interacción con su contexto. La evaluación psicológica es un proceso de toma de decisiones cuyo objetivo es apuntar, con precisión y validez, a la tarea de psicología aplicada para solucionar problemas individuales, sociales y ambientales. 
¿Qué motiva la elaboración de pruebas nuevas?
3 fuentes principales de desarrollo: 
· Por necesidad práctica 
· A partir de un fundamento teórico importante. Las teorías pueden generar nuevas pruebas, que primero se utilizaran tan solo para fines de investigación, pero que después se emplean en contextos aplicados. 
· Adaptación y revisión de pruebas existentes. 
Los test y la evaluación psicológica 
Tests, pruebas, diagnóstico y evaluación psicológica. 
Las raíces de las pruebas y la evaluación psicológica contemporánea pueden encontrarse en Francia a principios del siglo XX. En 1905 Binet publicó una prueba que fue diseñada para ayudar a colocar a los niños de París en clases apropiadas. En poco tiempo se preparó la versión en inglés para usar en escuelas de Estados Unidos. En ese país se estaba estudiando el uso de pruebas psicológicas por primera vez en el ejército. Tanto en la primera como en la segunda guerra mundial, las pruebas cumplieron con el objetivo de examinar con rapidez a grandes cantidades de reclutas en busca de problemas intelectuales y emocionales. 
Evaluación psicológica: recopilación e integración de datos relacionados con la psicología con el propósito de hacer una valoración psicológica, lograda con el uso de herramientas como pruebas, entrevistas, estudios de caso, observación conductual y aparatos y procedimientos de medición diseñados en forma especial. 
Disciplina de la psicología que se ocupa de la exploración y análisis del comportamiento de un sujeto o grupo de sujetos, con distintos objetivos, a través de un proceso de toma de decisiones y de aplicación de técnicas de medida y/o evaluación. 
Se distingue del Psicodiagnóstico: trabaja con un caso único. Tiene el objetivo específico de dar diagnóstico, está centrado en la patología. 
Y del psicotécnico. 
Prueba psicológica: Proceso de medir variables relacionadas con la psicología por medio de dispositivos o procedimientos diseñados para obtener una muestra de comportamiento. 
Test: Instrumento de evaluación cuantitativa de los atributos psicológicos de un individuo. Procedimiento evaluativo por medio del cual una muestra de comportamiento de un dominio especificado es obtenida y posteriormente evaluada y puntuada empleando un proceso estandarizado. 
Situaciones de diagnóstico: aquellas en las que se produce el conocimiento mediato, no directo, sino a través de indicadores que son observables comportamentales y/o clínicos, de personas concretas, no de grupos ni colectividades. 
Técnicas psicométricas
2 tipos según sus propósitos: 
· Técnicas de rendimiento típico: pretender ubicar al sujeto dentro de una categoría (por ej. presencia o ausencia de síntomas positivos en esquizofrenia). No hay respuestas correctas o incorrectas. 
· Técnicas de rendimiento máximo: pruebas de habilidades y aptitudes. Se espera que el sujeto haga lo mejor posible el ejercicio. 
Ambos tipos de prueba se diferencian en función de lo que se le pide al evaluado. 
Entrevista 
Es la técnica madre. 
· Implica intercambio verbal, cara a cara o también puede ser telefónica o digital. 
· Se intentan obtener distintos tipos de información, en base al objetivo de la evaluación. 
· Se clasifican según su modalidad en: estructuradas, semi-dirigidas, abiertas. 
· Momentos de la entrevista: apertura o presentación, planteo de objetivos, consentimiento, información sobre qué va a acontecer, etc. 
Acontecer, entrevista propiamente dicha. 
Cierre 
Post-entrevista, reflexión y análisis de la información obtenida, temas tratados, repercusión y temas pendientes. 
· Cualidades del entrevistador: - está familiarizado con el objetivo de la entrevista. 
· Sigue una estructura mínima (apertura, acontecer, cierre).
· Es claro, amable, sonríe, mira a los ojos, tolera las pausas, no interrumpe. 
· Es sensible, escucha atentamente. 
· Es abierto y flexible. 
· Es directivo, sabe qué está buscando. 
· Es crítico, está dispuesto a señalar aquello que suena ambigüo (pero sin dejar de ser amable). 
· Recuerda.
· Interpreta lo que dijo el entrevistado. 
· Es equilibrado, no debe hablar demasiado ni poco. 
· Debe ir haciendo resúmenes. 
Observación 
Observar es advertir los hechos tal y como se presentan en la realidad y consignarlos por escrito. 
Componentes: - Observador
· Fenómeno o hecho observado 
· Información o dato que se busca. 
· Modo de participación del observador. 
Clasificación: - No controlada
· Controlada 
· Participante 
· No participante 
· Clínica 
Registro de conducta no verbal: - Paralingüística 
· Cinestésica 
· Proxémica 
La evaluación psicológica surgirá entroncada con la psicología diferencial, dada la necesidad de evaluar las características individuales diferenciales presentes en los seres humanos, y compartirán la paternidad de la constitución del Psicodiagnóstico como disciplina científica. 
Cada tipo de evaluación se sustenta en una teoría que se caracteriza por determinados supuestos conceptuales, objetivo, unidades de análisis,método y ámbito de aplicación. 
Fernandez Ballesteros define a la evaluación psicológica como aquella disciplina de la psicología científica que se ocupa de la exploración y el análisis del comportamiento (a los niveles de complejidad que se estime oportunos) de un sujeto humano o grupo especificado de sujetos con distintos objetivos básicos o aplicados (descripción, diagnóstico, selección, predicción, explicación, cambio y/o valoración) a través de un proceso de toma de decisiones en el que se encardinan la aplicación de una serie de dispositivos, test y técnicas de medida y/o evaluación. 
El psicodiagnóstico es la asignatura que capacita para el conocimiento, comprensión y aplicación de la conducta de un sujeto y que permite la orientación y predicción, orientación y/o tratamiento del sujeto individual con datos procedentes de la confluencia de fuentes múltiples y con dependencia de la intervención psicológica que se realice en ella. 
El constructo es un proceso de síntesis relacional del conocimiento que convencionalmente no alcanza aun la complejidad de una teoría, es decir, sería un proceso previo que conduce a una teoría. 
La teoría es un constructo explicativo de orden superior, un proceso de conocimiento que ha ido constatando hechos observables, describiéndolos en forma operativa. 
Un modelo, es una visión del mundo. 
Modelos de evaluación psicológica (modelo epistemológico de cómo se perciben determinados fenómenos) 
El objetivo de la evaluación psicológica es el análisis del comportamiento humano que se produce en un contexto determinado, sin embargo, el peso otorgado por cada enfoque a lo que prioritariamente determina esa conducta nos lleva a posiciones diferentes. 
· Modelos endógenos (evaluación psicológica centrada en la persona): 
El énfasis evaluativo está en lo que el sujeto “es”, interpretando la personalidad como la resultante de variables intraorganísmicas, relativamente estables, subyacentes al comportamiento observable y si bien existirán diferencias entre biologicistas, psicodinámicos, teóricos del rasgo y humanistas, todos ellos interpretan la conducta como signo de variables subyacentes que no pueden aprehenderse directamente pero que determinan el comportamiento de la persona. 
Evalúan variables endógenas, cuestiones intrapsíquicas. 
· Modelo médico o de la enfermedad
· Modelo psicométrico o de atributos
· Modelo psicodinámico
· Modelo cognitivo (ansiedad, depresión, BDI, BDH)
· Modelos exógenos: Se centran en las variables exógenas, cuestiones relacionadas con la situación y el contexto. 
· Modelo conductual – radical: evalúa solo variables observables. 
· Modelos interaccionistas: Se enfocan en evaluar las variables que interaccionan con el ambiente. 
· Modelo cognitivo-conductual 
· Modelo ecológico
En cada caso, cada modelo propone una solución en función de lo que considera relevante. 
MODELOS ENDÓGENOS
Modelo médico o de la enfermedad 
Parte del supuesto de que la conducta puede explicarse en función de variables endógenas o internas. 
· Formalización
C= F (O)
La conducta es en función del organismo. Donde O refiere a variables endógenas o internas asociadas al sustrato biológico de la persona o bien a alteraciones funcionales (síntomas). 
· Objeto de estudio
El síntoma, cuyas manifestaciones conductuales serán indicadores de procesos psicopatológicos o de alteraciones orgánicas subyacentes. 
· Objetivo de evaluación 
Diagnóstico por medo de la descripción de los síntomas. 
Pronóstico del trastorno, lo que facilitará su predicción y tratamiento. 
· Técnicas 
Entrevista, etc. 
· Contexto clínico. 
Modelo psicométrico o de atributos (Galton, Binet, Catell). 
· Formalización
C=F (P)
La conducta está determinada por atributos intrapsíquicos o variables organísmicas (habilidades, intereses o rasgos) que diferencian a unos sujetos de otros. La conducta es en función de la persona (organismo), específicamente, se habla de rasgos o atributos diferenciales del sujeto (CI, personalidad, memoria, etc.). 
La metodología empleada preferentemente es la correlacional focalizando en determinar las diferencias individuales y ubicar al sujeto en relación al grupo normativo respecto de un rasgo o dimensión cuantificable. 
· Objeto de estudio
Rasgos – factores – dimensiones 
El rasgo incluye tres elementos: 
· Debe tener consistencia en el tiempo
· Es una característica por la cual la persona difiere de otra 
· Debe ser identificable 
· 
· Objetivo de evaluación 
Descripción y explicación de las características más sobresalientes del comportamiento del sujeto a partir de los datos obtenidos a través de las diferentes técnicas de análisis.
Clasificación y organización de la información en función de criterios previamente fijados. 
Predicción: establecer una previsión probabilística de una conducta futura a partir de una conducta actual.
· Técnicas 
Tests (ej WAIS, NEO-P-IR) 
· Los ámbitos de aplicación más claros para el objetivo predictor son la selección de personal y la orientación escolar. 
Modelo psicodinámico o psicoanalítico
Muestra algunas contradicciones dentro de la evaluación psicológica ya que por un lado rechaza el diagnóstico nosológico de origen médico llegando a considerarlo como un obstáculo para el psicoanálisis y por otro el otro utiliza lenguaje médico y establece criterios para el diagnóstico diferencial por medio de técnicas proyectivas. Se constituye un diagnostico psicoanalítico centrado en la evaluación de los estados del yo y los mecanismos de defensa y adaptación y así las técnicas proyectivas son utilizadas por los psicoanalistas para facilitar el diagnóstico.
Este modelo considera que los factores intrapsíquicos constituyen la causa de la conducta manifiesta y se producen bajo la forma de impulsos, motivos, deseos y conflictos. 
· Formalización
C=F (P)
La conducta es función de la persona (organismo), específicamente de variables intrapsíquicas (estructuras internas de la personalidad), refiere a constructos intrapsíquicos. 
· Objeto de estudio
Procesos y contenidos inconscientes con el fin de conocer su dinámica, la estructura psíquica del yo y de los recursos adaptativos a su servicio; y la accesibilidad del sujeto al tratamiento psicoanalítico. 
· Objetivo de evaluación 
Psicodiagnóstico psicológico.
El objetivo básico es ayudar al cambio terapéutico, restando importancia a la clasificación nosológica o a la comparación interindividual. 
 
· Técnicas 
Proyectivas
· Ámbito de aplicación clínico, contextos de selección de personal y orientación vocacional. 
Modelo cognitivo (Beck, Piaget, Bruner) 
· Formalización
C = F (P) 
La conducta es función de los elementos o mundo cognitivo de la persona. 
Acontecimiento Sistema de creencias Conducta 
· Objeto de estudio
Estructuras internas mentales (representaciones, esquemas, estrategias de procesamiento de información, errores cognitivos, creencias). 
· Objetivo de evaluación 
Describir el comportamiento y explicarlo en base a entidades mentales. 
Predicción del comportamiento 
· Técnicas 
Auto informe 
Auto observación y registro
Pruebas de ejecución 
Modelo neuropsicológico 
· Formalización
C = F (O)
La conducta es función del organismo. Donde O es básicamente el SNC, y en especial, el cerebro. 
· Objeto de estudio
Relaciones entre aspectos cognitivos y alteraciones del SNC, en especial del cerebro, considerando aspectos anátomo-fisiológicos del mismo. 
· Objetivo de evaluación 
Identificar, describir y establecer las relaciones existentes entre la organización cerebral y las actividades cognitivas (percepción, atención, lenguaje, memoria). 
· Técnicas 
Modelo conductual-radical 
· Formalización
C = F (A)
La conducta es en función de variables situacionales o del ambiente. 
· Objeto de estudio
Estímulo respuesta 
· Objetivo de evaluación
Evaluación e intervención: modificación de la conducta 
Valoración: evaluación de la eficacia del tratamiento 
· Técnicas 
Observación directa 
Entrevista conductual 
Auto observación – auto registro 
Modelo cognitivo-conductual 
· FormalizaciónC = F (P x A) 
La conducta es función de la persona y el ambiente. 
· Objeto de estudio
Relaciones funcionales que tiene la conducta con sus antecedentes y consecuentes que pueden ser ambientales como cognitivos. 
· Objetivo de evaluación 
Evaluación e intervención: modificación de la conducta. 
Valoración: evaluación de la eficacia del tratamiento. 
· Técnicas
Observación directa 
Entrevista conductual 
Auto observación – auto registro – auto informes. 
Modelo ecológico 
· Formalización
La conducta es función de las relaciones recíprocas entre la persona y el medio. Los distintos sistemas en que se encuentra inmersa la persona influyen en ella. 
· Objeto de estudio
Relaciones recíprocas entre variables y conductas. 
· Objetivo de evaluación
Interesa conocer la forma en que el sujeto maneja las demandas del medio, su ajuste, su influencia y la forma en que dicho medio lo afecta. 
 
· Técnicas 
El psicodiagnóstico al análisis ecopsicológico
La evaluación psicológica a sufrido a lo largo de su desarrollo cambios conceptuales y metodológicos. En cuanto a sus objetivos, en sus comienzos prest´ó especial atención a las variables internas del sujeto como elementos determinantes o móviles de su actuación, luego, se amplió incluyendo el estudio de la presión del contexto próximo sobre la acción del sujeto, sin considerarlo a este como agente de su propia realidad. Después, se reconoció la actividad del sujeto agente en la construcción de su propia realidad a través de un diálogo continuo con su entorno; para finalmente ocuparse de los contextos en los que se produce la conducta danto importancia al estudio del contexto y los climas sociales. 
La evaluación psicológica ha vivenciado una evolución de tipo centrifugo e integrativa desde el interior del sujeto hacia el análisis de sus contextos. Esta evolución ha sido expansiva a partir del sujeto, y ha incorporado el tripe análisis de la realidad: 
· Como externa al sujeto: análisis de las circunstancias externas como entidades que por su relación funcional con el individuo creaban cambios o mantenían la conducta del sujeto. 
· Como interactiva y constructiva con el individuo: proceso de mutua determinación en la interacción sujeto y objeto 
· Como sustantiva en sí misma: análisis de contextos y análisis de la incidencia de las acciones psicosociales ejercidas sobre la conducta de los sujetos. 
Hemos arribado a una evaluación ecológica, multicontextual y que se focaliza en plurivariables personales, enfocada desde una perspectiva interaccional, ya que cuando se reconoce la influencia conjunta de una pluralidad de fenómenos para lograr la descripción y explicación de la conducta, no se puede renunciar a buscar las modulaciones de unas variables sobre otras y las pistas causales entre variables. En suma, una evaluación psicológica que pretenda tener en cuenta los contextos de inserción de los sujetos conlleva a una evaluación interaccional de plurivariables, que debe ser realizada bajo una perspectiva contextualizada o ecológica. 
La evaluación psicológica puede definirse como el estudio, análisis y valoración de las características de un sujeto, de sus formas de acción, reacción e interacción con los demás y con la realidad, y de sus procesos de cambio. Todo eso se analiza dentro de un sistema configurado por sujetos (concebidos como seres bio-psico-sociales), sometidos a unos procesos (internos y externos) que afectan y determinan funcionalmente las formas de contacto del sujeto con la realidad (y viceversa) y cuyos efectos se expresan en manifestaciones conductuales. Todas las variables influyentes están sometidas a mecanismos de covariación e interrelación recíproca. 
Técnicas 
Construcción de pruebas psicométricas 
Conocer el proceso de construcción nos sirve para saber si una técnica sirve o no, es válida o no para lo que queremos evaluar (además de que sirve para construir nuestras propias técnicas). 
Proceso de construcción de pruebas psicológicas 
FUNDAMENTO
DELIMITACIÓN DEL CONSTRUCTO Y DE LA FINALIDAD DEL INSTRUMENTO ¿por qué lo voy a hacer?
DISEÑO DEL INSTRUMENTO
 ELABORACIÓN DE ÍTEMS
 
 1° depuración REVISIÓN DE EXPERTOS
 PRUEBA PILOTO INFORMAL 
PRUEBA PILOTO FORMAL 
 2° depuración 
ANÁLISIS DE ÍTEMS
 3° depuración 
 Dificultad
Tipificación Validez y confiabilidad Discriminación 
 Análisis factorial 
Origen de los instrumentos 
3 fuentes principales: 
· Necesidad práctica: Necesito un instrumento que no existe o no con las características que necesito. Por ejemplo, la prueba de inteligencia de Binet se creó para identificar a los niños de las escuelas de París que podían necesitar lo que ahora se denomina educación especial. 
· A partir de un fundamento teórico: Las teorías a menudo generan nuevas pruebas, las cuales suelen utilizarse primero tan solo para fines de investigación, pero después se emplean en contextos aplicados. 
· Revisión y adaptación de instrumentos existentes 
Proceso de construcción de pruebas psicológicas
1. Definir la finalidad de la prueba
La elaboración de una prueba comienza con un claro planteamiento de la finalidad del instrumento, que consiste en delinear el o los rasgos que se medirán y la audiencia meta de la prueba. 
Fundamento: ¿por qué construirlo?
Definición del constructo y de sus dimensiones.
Definir la población de estudio. 
Especificar la finalidad del instrumento. 
Luego de que se ha establecido con toda claridad la finalidad de la prueba, uno no debe proceder de inmediato a elaborar el instrumento. La etapa siguiente debe ser determinar si ya existe una prueba apropiada. 
	 DEFINICIÓN TEÓRICA
DIMENSIONES
 
 Juicio de expertos
Informantes clave 
Discusión teórica
 	INDICADORES 
 
	 Empíricos observables
Una vez que se tienen los indicadores, se puede comenzar a armar los ítems. 
2. Aspectos de diseño preliminares 
Deben abordarse los siguientes aspectos del diseño: 
Diseño del instrumento 
Especificar características. 
· Formato de los reactivos: ¿Qué formato se utilizará para los reactivos?: opción múltiple, verdadero o falso, acuerdo o desacuerdo, construcción de respuesta. Un formato de construcción de respuesta permite siempre una respuesta más rica y una mayor flexibilidad, pero con certeza casi siempre será más difícil de calificar, y por tanto, su uso resultará más costoso. 
 
· Modo de aplicación: ¿Colectivo? ¿Individual? La aplicación colectiva será más eficaz, pero la individual permitirá una mayor adaptabilidad en los formatos de los reactivos y la observación clínica del examinado. 
· Duración: ¿Aproximadamente cuánto durara la prueba? Una prueba breve es más eficaz pero es posible que se traduzca en una confiabilidad muy limitada y una sola puntuación. La duración también se relaciona con la cuestión de qué tan sensible será la prueba. ¿Será un instrumento genera del rasgo u ofrecerá un fundamento para un análisis de diagnóstico sensible del rasgo?
· Cantidad de puntuaciones: ¿cuántas puntuaciones generará la prueba? Más puntuaciones permiten interpretaciones adicionales, pero también exigen más reactivos y, en consecuencia, más tiempo de prueba.
· Informe de las puntuaciones: ¿qué clase de reportes de las puntuaciones se producirá? ¿Qué se informará? ¿Sólo la puntuación total de la prueba o el desempeñoen conjuntos de reactivos?
· Capacitación del evaluador
· Investigación de antecedentes: Es posible que se necesite realizar una investigación de antecedentes sobre el ámbito que se probara. 
La redacción de los reactivos no debe iniciarse hasta que estas consideraciones de diseño preliminares hayan sido exploradas en detalle. Las consideraciones de diseño determinaran qué clase y qué cantidad de reactivos se redactarán. 
3. Preparación de reactivos: incluye tanto la redacción de estos como su revisión. 
El reactivo de una prueba posee cuatro partes: el estímulo al que responde el examinado denominado la base del reactivo, puede ser una pregunta, una afirmación o una imagen. 
El formato (o método) de respuesta, incluye factores respecto de si este es un reactivo de opción múltiple o de construcción de respuesta. 
Las condiciones que rigen cómo se da la respuesta al estímulo, entre ellas se hallan variables tales como el límite de tiempo para responder, o si quien aplica la prueba puede sondear respuestas ambiguas y cómo se registra exactamente la respuesta. 
El procedimiento para calificar la respuesta, en el caso de una prueba de opción múltiple de capacidad o aprovechamiento el reactivo podría calificarse como correcto o incorrecto. Otra posibilidad es que se dé un crédito parcial por elegir ciertas opciones. En algunas ocasiones, los reactivos de construcción de respuesta merecen dos puntos si se ofreció una muy buena respuesta, una respuesta aceptable pero no particularmente buena recibe un punto, en tanto una incorrecta no obtiene ninguno. 
	 - Tipo de estímulo 
	 Estímulo 	- ¿Positivo o negativo? 
	- Pregunta – afirmación – imagen 
	- Tipo de respuesta 
4. 	Respuesta 	- ¿Dicotómico?PARTES DE UN REACTIVO
5. 					- ¿Opción múltiple?	
	- ¿Cuántas opciones?
	- ¿Dónde registrar las respuestas? 
	Condiciones 	 - ¿Tiempo? 
	 - ¿Sondear respuestas?
	- Forma de 
	Procedimientos para calificar 	asignar los 
	puntajes.
	- Codificación
Tipos de reactivos 
Reactivos de selección de respuesta o de opción múltiple
Al examinado se le presentan al menos dos, pero no más de una razonable y pequeña cantidad de opciones, de las cuales debe elegir una respuesta. 
Los formatos de selección de respuesta son más familiares en el ámbito de la evaluación de capacidades y desempeño, sin embargo, también son ampliamente utilizados en pruebas de personalidad, intereses y actitudes. Un caso es el verdadero o falso, formato Likert (escala de cinco puntos que va de completamente de acuerdo a completamente en desacuerdo en cada respuesta). 
3 principales ventajas: 
· Confiabilidad de la calificación: dado que exige poco o ningún juicio, se elimina una de las principales fuentes de varianza inestable. 
· Eficacia temporal: En una determinada cantidad de tiempo, el examinado puede responder por lo general a más reactivos de selección de respuesta que de construcción de respuesta. 
· Eficacia de la calificación: Un empleado o un escáner electrónico pueden calificar estos reactivos de manera veloz. Este factor es independiente de la confiabilidad del calificador. 
Reactivos de construcción de respuesta 
Se presenta el estímulo pero no se restringe al examinado a elegir un conjunto fijo de respuestas, él debe crear o construir la respuesta. Aunque la respuesta del examinado es libre, en el sentido de que no está limitado por una serie fija de opciones, hay condiciones que rigen la respuesta. Una versión es el formato de llenar el espacio en blanco, otra es la prueba de ensayo. 
El formato de construcción de respuesta se utiliza mucho en las pruebas de personalidad. Los ejemplos clásicos de pruebas de personalidad con formato de construcción de respuesta son las técnicas proyectivas. 
Ventajas: 
· Permiten una observación más sencilla del comportamiento y los procesos al realizar una prueba. Facilita observar en el examinado su motivación, ansiedad, forma de abordar los problemas y otros, en formas que los reactivos de selección de respuesta no permitirían. 
· Permiten explorar áreas inusuales (sobre todo en el campo de las pruebas de personalidad), que probablemente tal vez nunca aflorarían con uno de selección de respuesta. Esto depende de qué tan completa sea la prueba. 
Sugerencias para la redacción de reactivos 
· Redactar ítems congruentes con el objetivo de medición. 
· Evitar ítems muy largos (más de 20 palabras). 
· Evitar oraciones complejas, expresiones extremas como nunca, siempre, todos. 
· Es preferible redactar ítems positivos, evitando las negaciones y doble negaciones, en especial si las opciones de respuestas son si – no. 
· Para evitar la aquiescencia (tendencia a responder siempre que sí) se suele invertir la dirección de un ítem sin recurrir a la negación. Por ejemplo: “me hago amigos con facilidad” a “me hago amigos con dificultad”. 
· Cuidar que cada ítem tenga un solo comportamiento y que no incluya sobretodo comportamientos indicadores de otros rasgos. 
· Evitar expresiones de frecuencia como “suelo” o “usualmente”, cuyo significado está sujeto a gran variabilidad interindividual. 
· Procurar que los ítems se refieran a comportamientos, no a dimensiones. Evitar vocablos como tímido, agresivo, etc. 
Revisión de expertos
Convocar a expertos, por lo menos 5 (2 que conozcan de psicometría, 2 que sepan del tema a evaluar, y 1 que conozca muy bien a la población). 
Revisión de los reactivos 
· Claridad semántica y corrección gramatical de los reactivos 
· Adecuación al nivel madurativo y educativo de la población meta 
· Suficiencia, relevancia y coherencia de los ítems para la medición del dominio propuesto. 
Los jueces revisan los ítems y los clasifican. Se hace un porcentaje de clasificaciones. 
4. Análisis de reactivos 
Es el conjunto de procedimientos que permiten ejercer el control sobre cómo será la prueba. Las características de los reactivos determinan características importantes de una prueba. 
3 procesos:
· Prueba de los reactivos (prueba piloto): dos etapas:
Primero se aplica a una prueba chica informal
Después se pasa a una muestra más amplia formal. 
· Análisis estadístico 
Los procedimientos tradicionales de análisis de reactivos dependen de dos conceptos: los índices de dificultad y de discriminación del reactivo. 
Índice de dificultad del reactivo: porcentaje de examinados que responden de manera correcta en aquellos calificados como correctos o incorrectos, o responden en cierta dirección en aquellos que no tienen una respuesta correcta. En el caso de los reactivos calificados como correctos o incorrectos, la “dificultad” del reactivo es, en realidad el índice de la “facilidad” del mismo, el porcentaje que responde con acierto. 
Discriminación del reactivo: es la capacidad de un reactivo para diferenciar en términos estadísticos en una forma deseada entre los grupos de examinados. En general, se pretende que el reactivo diferencie a los individuos que tienen más del rasgo que se trata de medir de quienes poseen menos de ese rasgo.
· Selección de los reactivos: De todos los reactivos preparados y evaluados, se seleccionan los que aparecerán en la prueba estandarizada. 
Directrices o características que rigen el proceso de selección de reactivos: 
· La cantidad total de reactivos en una prueba suele ser determinante más importante de su confiabilidad. Para aumentar la confiabilidad de una prueba se debe incrementar la cantidad de reactivos. 
· El grado de dificultad promedio de una prueba está en función directa de sus valores p (índices de dificultad de sus reactivos). La puntuación promedio en una prueba es la suma de los valores p. 
El valor p es en realidad un índice de facilidad y no de dificultad del reactivo, de modo que para obtener una prueba fácil se tendrían que emplear reactivos con valores p elevados y a la inversa, una prueba difícil contendría reactivos con valores p bajos. Que la prueba sea fácil o difícil es algo que depende de la finalidad del instrumento. 
· En general, se pretende que los reactivos tenganíndices de discriminación elevados. Tales reactivos contribuyen a la medición del rasgo. 
· Hay una relación importante entre el valor p de un reactivo y el índice de máxima discriminación posible (D). 
5. Programas de estandarización e investigación secundarios
El programa de estandarización genera las normas de la prueba. Se trata de un importante aspecto de la diligencia que se emprende al elaborar una prueba y que inicia después de haber seleccionado los reactivos en la fase final de la etapa de análisis de estos. La prueba que se estandariza debe ser la misma que habrá de publicarse al final, deben fijarse todas las instrucciones, cantidad de reactivos, límites de tiempo, etc. 
6. Preparación de los materiales finales y publicación 
La publicación de un instrumento psicométrico incluye también las instrucciones de aplicación e interpretación, los manuales técnicos, los reportes de puntuaciones y otros materiales complementarios. 
Una prueba publicada cuenta con un manual técnico que es la fuente de información fundamental sobre la finalidad, los fundamentos y la estructura de la prueba, mismo que debe contener información acerca de la confiabilidad, validez y procedimiento de normalización del instrumento. Debe contener también las directrices de interpretación de las puntuaciones de la prueba. 
Propiedades psicométricas - validez y confiabilidad 
VALIDEZ 
· Se refiere a lo que mide una prueba y no puede expresarse en general sino que debe consignarse el uso particular para el que se plantea utilizar el instrumento. 
· ¿Mide la prueba el constructo que pretende medir? ¿Sirve para el fin propuesto? 
· Proceso único de recogida de evidencias a través de estrategias de investigación diferentes. A veces se requiere validar un instrumento en determinado contexto, para eso hay que buscar evidencia de que el instrumento funciona en dicho contexto. 
· Ejemplo: si las preguntas de un examen no tienen nada que ver con el tema que se está evaluando, ese examen no tiene validez. 
Validez de constructo
Sobre lo que estoy midiendo. 
Es la más importante. 
Es el grado en que puede afirmarse que mide un constructo o rasgo teórico. 
¿En qué medida el instrumento refleja la teoría en la que se sustenta? Cada ítem está basado en la teoría. 
¿Se mide el constructo tal como se lo define a nivel teórico? 
· Estructura interna 
Un grado elevado de consistencia interna denota que la prueba mide algo de manera consistente. La consistencia interna elevada sustenta la afirmación de que una prueba mide un determinado constructo o rasgo. 
· Análisis factorial 
Técnica estadística para analizar las interrelaciones de los datos conductuales y reducir el número de variables o categorías en cuyos términos puede describirse el desempeño de cada individuo a un número relativamente pequeño de factores o rasgos comunes. Una vez que los factores se han identificado, sirven para describir la composición factorial de las pruebas. 
Permite trabajar la correspondencia entre la estructura interna de la prueba y las dimensiones (atributos de la variable). 
Por ej. en el inventario de competencias socioemocionales, las dimensiones son: conciencia de emociones, empatía, regulación emocional, etc. 
Se definen las dimensiones y se operacionalizan en ítems. 
A través del análisis factorial se crea una matriz de correlaciones. Esta matriz nos dice cómo se agrupan los ítems. 
· Efecto de variables experimentales
Formulación de hipótesis y verificación (poner a prueba). Experimentos sobre el efecto de variables seleccionadas en los resultado de las pruebas. 
· Correlación con otras pruebas 
Asociación positiva con una prueba validada. 
Se citan las correlaciones entre una prueba nueva y otros instrumentos similares como evidencia de que la nueva mide aproximadamente la misma área de conducta que otras. 
Validez de contenido 
Sobre la operacionalización de eso que estoy midiendo. 
¿Son, los ítems de un instrumento, suficientes y relevantes para medir el constructo? 
¿Cubre la prueba una muestra representativa de las habilidades y conocimientos especificados? ¿el desempeño en la prueba está razonablemente libre de influencia de variables irrelevantes?
Los procedimientos de validación por la descripción del contenido comprenden el examen sistemático del contenido de la prueba para determinar si cubre una muestra representativa del área de conducta que debe medirse. El área de conducta por examinar debe analizarse sistemáticamente para garantizar que los reactivos cubran todos los aspectos importantes y en la proporción correcta. 
La validez de contenido tiene que ver con la relación entre el contenido de una prueba y cierto campo de conocimiento bien definido. Para que una prueba tenga validez de contenido, debe haber una correspondencia adecuada entre el contenido de la prueba y el del campo de interés. 
Método: jueces expertos analizan la suficiencia, relevancia y calidad de los ítems. 
Dos aplicaciones primordiales: pruebas de aprovechamiento educativo y pruebas de aprovechamiento laboral. 
Su uso en otros ámbitos está limitado porque son muy pocas la áreas susceptibles de una especificación clara de los campos cubiertos. 
Validez aparente 
¿La prueba parece medir lo que dice medir? ¿Es aparentemente válida? 
Pertinencia de los ítems. 
Es cierto que se debe tener una validez factible de demostrarse de manera empírica, pero en casi todas las circunstancias también es útil que la prueba constituya una medición que parezca válida. 
La validez aparente nunca sustituirá a la validez empírica, no es posible tan solo ver una prueba y saber si tiene algún grado de validez, no obstante, la validez aparente puede ser de utilidad. Si dos pruebas contienen una validez establecida en forma empírica, es preferible utilizar la que tiene una mejor validez aparente. 
Validez de criterio 
Es en función del tiempo. 
Se compara el puntaje obtenido en la prueba con un criterio externo para ver si coinciden. Prueba ese criterio externo que estamos evaluando. 
La característica esencial de la validez relacionada con el criterio consiste en establecer el vínculo entre el desempeño en la prueba y algún otro criterio que se toma como indicador importante del constructo de interés. 
· Validez predictiva 
La prueba busca pronosticas la condición en algún criterio a la que se llegará en el futuro. 
¿En qué medida es posible anticipar un logro o comportamiento futuro? 
Permite anticiparse sobre un intervalo de tiempo y la información que proporciona es muy pertinente para las pruebas utilizadas en selección y clasificación de personal por ejemplo. 
Método: se correlaciona el desempeño en la prueba con algún criterio externo a futuro. La variable criterio se va a dar. 
Objetivo: anticipar un comportamiento o logro futuro. 
· Validez concurrente 
Se revisa la concordancia entre el desempeño en la prueba y la condición actual en alguna otra variable. 
Es simultánea, se da en el momento. Se comparan dos medidas. La prueba se aplica a personas que ya cuentan con datos de criterio, por ejemplo comparando los resultados obtenidos en la prueba por aspirantes universitarios con los promedios académicos al momento del examen. La validación concurrente es adecuada para diagnosticar el estado actual más que para predecir resultados futuros. 
Método: correlación con criterio externo en forma inmediata. 
Objetivo: Evaluar un rasgo actual. 
Validez ecológica 
Es fundante. 
Grado en que la prueba tiene sentido en el ámbito en el que se aplica. 
Insiste por un lado en la semejanza entre las condiciones de investigación y las condiciones del mundo real en que se produce un fenómeno; y por otro, en que el sujeto experimente la situación de investigación con las mismas propiedades que el fenómeno supone. 
El coeficiente de validez es la correlación entre la puntuación de la prueba y la medida de criterio. 
CONFIABILIDAD 
· Refiere a la consistencia de los puntajes obtenidos, es decir, si los puntajes que se obtienen son precisos. 
· Nos dice que tanto se puede confiar en un instrumento.· Un instrumento confiable es un instrumento que siempre mide de la misma manera, es consistente. Cualquiera que lo administre va a obtener el mismo puntaje. Pero, no siempre que de puntajes distintos es porque la prueba no sea confiable, puede deberse a otros factores. Por ejemplo, medir un constructo y volver a medirlo luego de un tratamiento. 
· La confiabilidad permite saber hasta qué punto las diferencias en las puntuaciones se deben a diferencias verdaderas existentes en las variables que intentamos medir o hasta qué punto se deben a errores del proceso de medición. 
· La contrapartida es el error. La varianza producida por el error (varianza de error) da inestabilidad. 
· Las diferencias en el desempeño de un sujeto en sucesivas ocasiones pueden estar causadas por diversas razones: distinta motivación en las diversas situaciones en que fue evaluado, distintos niveles de cansancio o ansiedad, etc. Por ello, la medición contiene una cierta cantidad de error. Es decir que el puntaje que obtiene una persona en una prueba incluye el puntaje real y un margen de error. Este error de medición, aleatorio e impredecible, se distingue de los errores sistemáticos. 
Fuentes de inestabilidad
· Calificación de la prueba (tiene que ver con la experticia del evaluador)
· Contenido de la prueba 
· Condiciones de aplicación (contexto) 
· Condiciones personales 
Fuentes de error 
· Al construir o adaptar un test: se debe prestar atención a la selección de los ítems y a la formulación de las consignas, pero principalmente se debe cuidar el muestreo de contenido para evitar que sea tendencioso o insuficiente. 
· Al administrar un test: se debe evaluar a todos los sujetos en las mismas condiciones. Las consignas deben ser estandarizadas desde la construcción del test hasta en su administración, especialmente en lo referido al control de los tiempos para la realización del mismo. 
· Al evaluar un test: se deben sostener los criterios de evaluación, no es posible cambiar los criterios de corrección en función de un criterio subjetivo del evaluador. 
Métodos para establecer la confiabilidad 
· Test – re test 
· Consiste en repetir la toma en una segunda oportunidad: del mismo instrumento a las mismas personas.
Se aplica la misma prueba a los mismos individuos en dos ocasiones diferentes. 
· Evalúa: - Los cambios en las condiciones personales 
- Los cambios en las condiciones de aplicación. 
- No aborda la influencia de los cambios en el contenido de la prueba, ya que se emplea exactamente el mismo instrumento.
· Se obtiene un coeficiente de estabilidad. 
· Inconvenientes: - el método no explica el error no sistemático debido a las variaciones en el contenido de la prueba. 
- Es poco práctico. Es un fastidio para las personas ser sometidas a la misma prueba en poco tiempo. 
- El efecto de aprendizaje que tiene la primer prueba en la segunda. 
· El intervalo entre la primer y segunda toma es un aspecto preocupante, ya que debe ser lo suficientemente largo para que la primera ejerza la mínima influencia en la segunda. Por otro lado, no debe ser tan largo que el tasgo medido pudiera sufrir algún cambio entre las dos evaluaciones. 
· Formas equivalentes (o confiabilidad de la forma alterna) 
· Exige que haya dos formas de la prueba, que deben ser iguales o muy similares en términos de cantidad de reactivos, límites de tiempo, especificaciones de contenido, y otros factores similares. El estudio de la confiabilidad de la forma alterna consiste en aplicar ambas formas de la prueba a los mismos examinados. La confiabilidad es la correlación entre las puntuaciones obtenidas de las dos formas. 
· Evalúa: - La falta de confiabilidad debido al muestreo de contenido. 
- El nivel de precisión. 
· Se obtiene un coeficiente de estabilidad de correlación entre las formas. 
· Inconvenientes: - Reduce pero no elimina el efecto de la práctica (porque el sujeto recuerda) 
- Es más costoso 
- Dificultad para establecer la equivalencia y diferencia entre las formas. 
· Consistencia interna:
 - División por mitades: Aplicación de una sola prueba, pero que se califica por mitades, como si cada mitad fuese una forma alterna de la prueba. Luego se correlacionan las puntuaciones sobre las dos mitades de la prueba. 
Luego que se administra la prueba, se dividen las respuestas en dos mitades y se correlacionan los puntajes obtenidos en cada una. 
· Coeficiente alfa de Cronback ítems politómicos
· Fórmulas de Kuder Richardson ítems dicotómicos. 
· Confiabilidad interjueces
· Aprueba el grado de acuerdo o consistencia que existe entre dos o más evaluadores, luego de calificar las respuestas de una prueba. 
· Se evalúa la variación no sistemática debida solo a quienes califican la prueba. La confiabilidad interjueces es la correlación entre las puntuaciones que asigna el primer y el segundo calificador. 
· Se obtiene el coeficiente de confiabilidad interjueces. 
· Ninguno de los dos calificadores debe influir en el otro. Dicha influencia contamina el estudio de confiabilidad, por ende deben trabajar en forma independiente. 
Proceso de adaptación de pruebas psicológicas 
La adaptación de un test es un proceso mucho más complejo que la simple traducción de ese test en un idioma diferente. Una adaptación implica considerar no solo las palabras utilizadas al traducir la prueba sino también las variables culturales involucradas. 
3 niveles principales: 
· Traducción o aplicación (de un idioma a otro) 
· Adaptación (cambiar algunos ítems): Transformación, adición o substracción de algunos ítems (sumado a la traducción). Algunos ítems pueden cambiar su significado a través de las culturas y por lo tanto necesitan modificaciones o ser eliminados. Así mismo, ítems que no existen en la versión original del test pueden representar mejor al constructo en la población en la cual se administrará la nueva versión. 
· Ensamble (con la modificación se crea una prueba distinta): La prueba se modifica tanto que se transforma en un instrumento nuevo. Esto ocurre cuando muchos de los ítems del test original son evidentemente inadecuados para representar el constructo a medir. Ej. evaluaciones en donde se utilizan láminas con dibujos de objetos que en determinada cultura no forman parte de la vida diaria de un sujeto. El ensamble también se da cuando el constructo no está representado de forma adecuada por la versión original en la cultura a la que se quiere adaptar la prueba. 
Para que una prueba esté adaptada tiene que haber equivalencia conceptual, lingüística y métrica. 
Adaptación conceptual o de constructo. 
¿Es el constructo equiparable a otras culturas?
Lo ético son constructos o instrumentos que reflejan equivalencias entre culturas. 
Lo émico habla de constructos que reflejan particularidades de una determinada cultura. 
Considerar: 
· Análisis del significado del constructo
· Análisis de los ítems, imágenes, objetos (reactivos).
· Análisis del formato de respuesta
· Análisis de las consignas o instrucciones. 
Adaptación lingüística 
Técnicas de traducción 
2 métodos comunes: 
· Método de traducción directa: Se traduce el test desde el idioma original al nuevo idioma. Luego, otro grupo de traductores juzga la equivalencia entre las dos versiones. 
· Método de traducción inversa: Se traduce desde el idioma original al nuevo idioma; luego un segundo grupo de traductores toma el test traducido (con el nuevo idioma) y vuelve a traducirlo al idioma original. Seguidamente se realizan las comparaciones entre la versión original y la versión retraducida al idioma original para determinar su equivalencia. 
Métodos para establecer la equivalencia entre Tests,
3 métodos: 
· Administración de la prueba en el idioma original y de la prueba traducida a sujetos bilingües: Se administran ambas versiones de la prueba (la original y su traducción al nuevo idioma) a sujetos que hablan ambos idiomas. 
Ej.Castellano 
Inglés
Bilingües 
Ventajas: Pueden controlarse las diferencias de las características de los participantes en el test (por ej su habilidad), yaque ambas pruebas son administradas a las mismas personas. 
Desventajas: - este diseño está basado en la premisa de que los sujetos son igualmente competentes en ambos idiomas, lo cual es difícil de sostener. Es probable que puedan observarse diferencias entre ambas versiones debido a una menor capacidad de algunas personas para entender los ítems en alguno de los dos idiomas. 
- Este diseño no puede asegurarse de que los bilingües posean el mismo nivel de competencia que la población general. Por el hecho de conocer otro idioma, es probable que se trate de personas con una mayor capacidad intelectual o mejor educación. 
· Administración de la versión original y su traducción inversa a monolingües en el idioma original: Se administra la versión original, y la versión obtenida de la traducción inversa a sujetos cuyo idioma natal es el inglés. 
Ej. Retraducción (en inglés)
Inglés 
Monolingües inglés 
Ventajas: Pueden controlarse las diferencias de las características de los participantes en el test (por ej su habilidad), ya que ambas pruebas son administradas a las mismas personas.
Desventajas: - este diseño no permite obtener datos con la versión en el idioma meta del test (español en el ejemplo). De esta manera, no es posible obtener puntajes de sujetos que hablen el idioma al que se intenta traducir el test. 
- falta de independencia entre los puntajes obtenidos, ya que es posible que exista un efecto de aprendizaje luego de la administración de la primer versión de la prueba. 
· Administración de la versión original a monolingües que hablan el idioma original y de la versión traducida a monolingües que hablan el idioma en que ha sido traducida la prueba: Se administra la versión en inglés (original) a evaluados cuyo idioma natal es el inglés y se administra la versión en español (o en el idioma al que se quiere traducir la prueba) a evaluados cuyo idioma natal es el español. 
Ej. Castellano
Inglés
Monolingües castellano 
Monolingües ingles 
	
	Ventajas: Se obtiene información de ambas versiones. 
	Desventajas: - No existe control de las diferencias individuales. 
	
Una vez que se obtienen los datos por medio de estos diseños, se debe realizar el análisis destinado a identificar la existencia de funcionamiento diferencial de ítems (FDI), es decir, ítems que se comportan de forma diferente a través de las diversas muestras transculturales. 
Adaptación o equivalencia métrica 
· Análisis del comportamiento de cada ítem 
· Hallar propiedades psicométricas del instrumento adaptado (validez y confiabilidad). 
· Elaborar normas o baremos para la nueva población. 
Baremación
· Selección de una muestra representativa de la población meta para la cual se elaboró el instrumento. 
· Administración del instrumento. 
· Obtención de puntuaciones originarias. 
· Transformación de las puntuaciones originarias en puntuaciones derivadas que indican la posición relativa de los puntajes directos o brutos. 
Etapas del proceso de adaptación: 
· Equivalencia de constructo
· Traducción inicial 
· Revisión por jueces expertos
· Prueba preliminar
· Prueba piloto
· Análisis estadístico de ítems 
· Evaluación de propiedades psicométricas
· Baremación
Fuentes de sesgo 
Estadísticamente existe sesgo cuando la ocurrencia de un error no aparece como un hecho aleatorio (al azar), advirtiéndose que este ocurre de forma sistemática. Un sesgo es un error constante o sistemático, en contraste con uno que se debe al azar. 
Existen diferentes fuentes de sesgo: 
· Sesgo de constructo: Se da cuando el constructo no es idéntico a través de los grupos culturales. La importancia que cada cultura otorga a ciertas conductas se encuentra en esta categoría. Conductas de ética y civismo que en algunas sociedades pueden ser normales en otras pueden constituir un verdadero rasgo de rigidez y asemejarse con una conducta obsesivo compulsiva. 
· Sesgo metodológico: Reconoce tres formas: 
· Sesgo de muestra: Se da cuando las muestras son incomparables entre sí. La cantidad de años de escolaridad, el nivel sociocultural, la motivación, la composición por género y edad de los sujetos son variables que pueden hacer incomparables a dos muestras que pueden mostrar resultados muy diferentes en un test determinado. 
· Sesgo en el instrumento: Proviene de las características del instrumento. Puede deberse a la familiaridad que los sujetos tienen con los estímulos presentados, al idioma, la disposición del texto en el completamiento de frases o interpretación de textos, sobre todo cuando implican conectar letras y números y los caracteres de los distintos idiomas son diferentes. 
· Sesgo de administración: Incluye problemas tales como dificultades en la comunicación, es decir, dificultades para que el entrevistado entienda las instrucciones del entrevistador ya sea por la dificultad de las palabras utilizadas, el modo de explicación o un inadecuado manejo del idioma por alguna de las partes. Se incluyen también las alteraciones en el modo de administrar las pruebas, sin seguir las instrucciones de los manuales. Normalmente los manuales incluyen instrucciones de administración que en muchos casos no son adecuadas para la población a aplicar. Los administradores del test entonces adaptan esas instrucciones según su criterio personal. Otro punto importante es el uso de cronómetros que produce serias alteraciones en los resultados. 
· Sesgo de ítem: Se produce cuando el ítem tiene diferentes significados en distintas culturas. Ciertos grupos culturales pueden obtener puntajes significativamente distintos en un ítem determinado a pesar de obtener un puntaje total similar. La deseabilidad social o la relevancia cultural también pueden producir el sesgo de ítem. 
Teorías psicométricas 
Modelos que explican el significado de las puntuaciones obtenidas en los Tests. Explican cómo se miden. 
Existen diversos paradigmas o modelos que permiten explicar el significado de las puntuaciones obtenidas con los Tests. El análisis o modelado de las matrices de datos obtenidas da como resultado: 
· La estimación del nivel en que poseen los sujetos las características que mide el test. 
· La estimación de los parámetros de los ítems. 
· El problema central de la teoría de los test es la relación que existe entre: el nivel del sujeto en la variable inobservable que se desea estudiar, y su puntuación observada en el test. 
El objetivo de cualquier teoría de test es realizar inferencias sobre el nivel en que los sujetos poseen la característica o rasgo inobservable que mide el test, a partir de las respuestas que estos han dado a los elementos que forman el mismo. Las distintas teorías de Tests difieren en la función que utilizan para relacionar la actuación observable en el test con el nivel del sujeto en la variable inobservable. 
TEORÍA CLÁSICA 
· Spearman 
· 2 características: validez y confiabilidad 
TEORÍA DE LA GENERALIZABILIDAD
· Cronbach y Gleser 
· Mejora a la teoría clásica en sus defectos 
TEORÍA DE RESPUESTA AL ÍTEM
· Rasch 
· No se concentra en el instrumento como totalidad, se enfoca en construir buenos ítems (lo cual es más difícil). Se genera un banco de ítems. 
Teoría clásica – TCT 
Conjunto de principios teóricos y métodos cuantitativos derivados de ellos, que fundamentan la construcción, aplicación, validación e interpretación de distintos tipos de Tests y que permiten derivar escalas estandarizadas aplicables a una población. 
Es un modelo de puntuación verdadera como valor esperado. La puntuación verdadera es función de la puntuación observada y de los errores de medición. 
El objetivo central es encontrar un modelo estadístico que permita la estimación de los errores de medida asociados a todo proceso de medición. 
La teoría clásica sostiene que la puntuación observable de una persona en un test es una función de dos componentes: su puntaje verdadero (inobservable) y el error de medición implícito en la prueba. El puntaje verdadero de un sujeto en un test seria el promedio aritmético de las puntuaciones empíricas obtenidas en infinitasaplicaciones. 
Limitaciones: - Depende de la muestra de sujetos.
· La estimación de habilidad del examinado depende del conjunto específico de ítems incluidos en la prueba. De modo que la habilidad del sujeto depende de la prueba. 
· Los coeficientes de fiabilidad obtenidos están centrados en el test más que en los reactivos se está trabajando con la prueba entera. 
Teoria de la generalizabilidad
Es una extensión del modelo clásico en el que diversas mediciones de un mismo individuo pueden variar tanto por efecto de una variación en lo que se mide como por el error de medición. 
Se considera una extensión de la teoría clásica en tanto reconoce el mismo modelo relativo a la existencia de errores junto a la puntuación verdadera, pero intenta resolver algunos de estos problemas mediante la aplicación del análisis de varianza para analizar dichas fuentes de error de medida. 
A diferencia de la TCT se toman en cuenta todas las fuentes de error las cuales reciben el nombre de facetas (por ej. diferencias individuales en rendimiento, dificultad de los ítems, errores aleatorios, etc.). 
Las distintas fuentes de variación asociadas a las facetas y a sus interacciones se estima que contribuyen a la varianza de error y disminuyen la generalizabilidad de los puntajes obtenidos en las personas examinadas. 
En esta teoría, las decisiones sobre la bondad de un instrumento se basan en estudiar las fuentes y tipos de error, utilizando el análisis de la varianza. Cuando se mide una variable se trata de generalizar los resultados a un dominio o universo confiable de observaciones. 
El puntaje del universo es semejante al puntaje verdadero en el modelo clásico. La diferencia es que en la TCT se considera que la varianza de error es de una sola clase y, en cambio, la TG reconoce que existen otros universos de generalización y por lo tanto muchos puntajes de universo posibles. Solo cuando el universo se ha definido podemos afirmar cuales son las fuentes de variación que producen el error. Las diferentes fuentes de error en esta teoría se denominan facetas, término que denomina cada una de las características de la situación de medición que pueden cambiar de un momento a otro y por tanto hacer variar los resultados obtenidos. 
Teoria de respuesta al ítem – TRI 
Proporciona estimaciones invariantes de las propiedades psicométricas de los ítems así como de las características psicológicas de los sujetos. Es decir no depende ni de la muestra de sujetos utilizada, ni de la muestra de ítems. 
El modelo se expresa a nivel del ítem más que a nivel del test. Proporciona una descripción detallada del funcionamiento de cada ítem. 
El modelo no requiere de pruebas paralelas para determinar el índice de confiabilidad. 
Provee una medida de precisión de cada índice de habilidad. 
Se independiza de la muestra. Trabaja sobre cómo funciona cada ítem, sobre qué medida de esa habilidad da el ítem. No usa validez y confiabilidad. 
Esta teoría fue desarrollada para resolver varios de los problemas que presentaba la TCT. Algunos de esos problemas son: - el uso de índices de los reactivos cuyos valores dependen de la población particular de la cuál fueron obtenidos. 
· La estimación de la habilidad del examinado depende del conjunto específico de reactivos incluidos en la prueba. 
Las características del examinado y las características de la prueba no pueden separarse en un instrumento elaborado conforme a los principios de la teoría clásica de los test, y por el contrario, cada uno solo puede ser interpretado en términos del otro. Las características del examinado en las cuales la teoría TRI está interesada, son la “habilidad” que mide el test. Para la TCT la noción de habilidad se expresa por medio del puntaje verdadero, el valor esperado a partir de la destreza observada en la prueba en cuestión. La habilidad del examinado se mide solo en términos de una prueba específica. El que un ítem sea difícil o fácil depende de la habilidad de los examinados a quienes se aplicó la prueba y a su vez la habilidad de los examinados depende de la dificultad de la prueba. 
Los coeficientes de los reactivos son dependientes del grupo al mismo tiempo que son dependientes del test. Esta clase de dependencia es la que se trata de eliminar mediante la TRI.
Principales características de la TRI 
· Las características de los reactivos no dependen del grupo del cual fueron obtenidos.
· Los puntajes que describen la habilidad del examinado no dependen del test en su conjunto. 
· El modelo se expresa a nivel del reactivo más que a nivel del test. 
· El modelo no requiere de pruebas paralelas para determinar el índice de confiabilidad. 
· Provee una medida de la precisión de cada índice de habilidad. 
Postulados de la TRI 
· El resultado de un evaluado en un ítem puede ser explicado por un conjunto de factores llamados rasgos latentes o aptitudes. 
· La relación entre la respuesta de un sujeto a un ítem y el rasgo latente que subyace puede describirse como una función monotónica creciente que se llama función característica del ítem. 
· Las estimaciones de la aptitud obtenidas con distintos ítems serian iguales y las estimaciones de los parámetros de los ítems obtenidos en distintas muestras serán iguales. Es decir que en la TRI los parámetros de aptitud y de los ítems son invariables. 
La ejecución de un examinado en una prueba pueden ser predichos por un conjunto de rasgos latentes y habilidades. 
Supuestos de la TRI 
Unidimensionalidad del rasgo latente (la variable que no podemos ver): que las respuestas del examinado estén determinadas por una única variable denominada rasgo. Ej: un ítem de habilidad espacial medirá solo habilidad espacial y no ninguna otra cosa. 
Independencia local: Los ítems no tienen nada que ver. Las respuestas de un evaluado a cualquier par de ítem son independientes y la probabilidad de responder correctamente a un ítem es independiente de la probabilidad de responder correctamente cualquier otro ítem. 
Cada ítem responde a una sola cosa, no hay solapamiento de ítems. A diferencia de la TCT en la que se busca que se agrupen los ítems para medir determinado rasgo. 
Informe psicológico
Proceso evaluativo objetivo Instrumento análisis informe. 
· Es una comunicación oral o escrita. 
· Presenta una síntesis de la evaluación 
· Indica el tratamiento más adecuado o las recomendaciones 
· Da respuesta al motivo de consulta u objetivos 
Tipos de informe 
ORAL: comunicación verbal al sujeto de los resultados del proceso evolutivo ENTREVISTA DE DEVOLCIÓN 
Características 
· Puede efectuarse en uno o varios encuentros
· Se le expone al sujeto los resultados de la evaluación y de las recomendaciones de intervención. 
· Participación activa del sujeto y del evaluador. 
· Es importante atender a la conducta del sujeto durante la devolución: sus reacciones frente a la información así como la aparición de nuevos datos, pueden contribuir en el diagnóstico y pronóstico. 
· La evaluación no termina nunca, el proceso es dinámico. Puede que la devolución genere un insight que cambie el espectro de lo que se había evaluado. 
· Lo ideal es que la devolución sea personal y no a través de un papel. 
· Comenzar por los aspectos más adaptativos y positivos del sujeto e ir incluyendo los aspectos menos positivos o patológicos en la medida en que el sujeto pueda tolerarlos. 
· No emplear lenguaje demasiado técnico, de manera que el sujeto pueda comprender la información que se le aporta. 
· Hay que poder ponerse en el lugar del otro desde la empatía, no desde la compasión. El otro tiene que poder entender lo que estamos diciendo. 
Destinatarios 
· Cuando el sujeto evaluado es un niño o adolescente, la entrevista de devolución se realiza con los padres que han pedido la consulta. 
· Cuando la demanda no deviene de los padres sino de otro profesional, la entrevista de devolución posibilita la toma de conciencia de conflicto.
· En el caso de los adultos no es necesaria la devolución a un familiar, excepto cuando la gravedad lo requiera o cuando es solicitadopor el propio sujeto. En cualquier caso se debe contar con el consentimiento del sujeto. 
Repaso: 
En el proceso de construcción de un test, primero se deben establecer las propiedades de validez y confiabilidad, antes de elaborar las normas baremos. – V. 
La validez concurrente indica la efectividad de la prueba para anticipar el desempeño – F. La predictiva anticipa, la concurrente no. 
La entrevista inicial debe ser semi estructurada – V. Sí debido a que tomamos datos de identificación, necesitamos sí o sí ciertos datos.
Equivalencia métrica es uno de los aspectos centrales de la adaptación – V 
El primer paso de la adaptación implica definir la población meta – F. Cuando hablamos de adaptación hablamos de la prueba. El primer paso es la traducción. 
Las pruebas de evaluación psicológica no se evalúan para un uso particular. – F. 
1
1
 
 
Clasificación de técnicas 
 
La clasificación de técnicas sirve para encontrar las técnicas para objetivos 
determinados. 
 
Ámbitos
: clínico, escolar, jurídico, laboral, etc.
 
Grupo etario
: niños, adolescentes, adultos, gerontes.
 
Constructos
 
(fenómenos no observables a los cuales podemos acceder a 
través de técnicas/indicadores): Inteligencia, ansiedad, personalidad, memoria, 
etc. 
 
Material
: papel, lápiz, ejecución, etc. 
 
Cantidad de personas
: individual o colectivo 
 
Generalidad
: generales: p
or ej. entrevista, observación. Específicas: evalúan 
determinado constructo, por ej. test psicométricos, etc. 
 
Estructuración
 
(clasificación de Pervin)
: psicométricas, proyectivas, subjetivas 
(el orientador tiene más peso en la interpretación), objetivas. 
 
-
 
Psicométricas
: 
test de evaluación y diagnostico elaborados a través 
de procedimientos estadísticos altamente sofisticados, con material 
rigurosamente estandarizado y tipificación en sus tres fases 
fundamentales: aplicación, corrección e interpretación. Dentro de 
esta cat
egoría los test pueden dirigirse tanto a la exploración de las 
funciones cognitivas como emocionales, de rasgos o de 
rendimientos. 
 
-
 
Proyectivas
: 
instrumentos especialmente sensibles para revelar 
aspectos inconscientes de la conducta, permiten provocar una 
amplia 
variedad de respuestas subjetivas, son altamente multidimensionales 
y evocan respuestas y datos inusualmente ricos. Logran la 
proyección del mundo privado, permiten organizar el campo, 
interpretar el material y reaccionar ante él afectivamente. 
 
 
1 
 
Clasificación de técnicas 
La clasificación de técnicas sirve para encontrar las técnicas para objetivos 
determinados. 
Ámbitos: clínico, escolar, jurídico, laboral, etc. 
Grupo etario: niños, adolescentes, adultos, gerontes. 
Constructos (fenómenos no observables a los cuales podemos acceder a 
través de técnicas/indicadores): Inteligencia, ansiedad, personalidad, memoria, 
etc. 
Material: papel, lápiz, ejecución, etc. 
Cantidad de personas: individual o colectivo 
Generalidad: generales: por ej. entrevista, observación. Específicas: evalúan 
determinado constructo, por ej. test psicométricos, etc. 
Estructuración (clasificación de Pervin): psicométricas, proyectivas, subjetivas 
(el orientador tiene más peso en la interpretación), objetivas. 
- Psicométricas: test de evaluación y diagnostico elaborados a través 
de procedimientos estadísticos altamente sofisticados, con material 
rigurosamente estandarizado y tipificación en sus tres fases 
fundamentales: aplicación, corrección e interpretación. Dentro de 
esta categoría los test pueden dirigirse tanto a la exploración de las 
funciones cognitivas como emocionales, de rasgos o de 
rendimientos. 
- Proyectivas: instrumentos especialmente sensibles para revelar 
aspectos inconscientes de la conducta, permiten provocar una amplia 
variedad de respuestas subjetivas, son altamente multidimensionales 
y evocan respuestas y datos inusualmente ricos. Logran la 
proyección del mundo privado, permiten organizar el campo, 
interpretar el material y reaccionar ante él afectivamente.

Más contenidos de este tema