Logo Studenta

Aplicacion de la estadística a la psicología

¡Este material tiene más páginas!

Vista previa del material en texto

Ia edición, julio del año 2005 
Ia reimpresión, junio del año 
2012 
©2005-2012 UNIVERSIDAD NACIONAL AUTÓNOMA DE 
MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ZARAGOZA 
©2005-2012 
Por características tipográficas y de diseño 
editorial 
MIGUEL ÁNGEL PORRÚA, librero-editor 
Derechos reservados conforme a 
la ley 
ISBN 970-701-587-X 
Queda prohibida la reproducción parcial o total, directa o indirecta del 
contenido de la presente obra, sin contar previamente con la 
autorización por escrito de los editores, en términos de la Ley Federal del 
Derecho de Autor y, en su caso, de los tratados internacionales 
aplicables. 
Esta investigación, arbitrada por pares académicos, se privilegia con 
el aval de la institución propietaria de los derechos correspondientes. 
A Osiris, Alan y Astrid, por lo que representan para mí. A 
Javier y Monse, por ser lo más importante en mi vida. 
En la realización de este libro participó un grupo de 
personas con aportaciones que fueron valiosas para el 
buen término de este proyecto: Cinthia Cruz del Castillo, 
Angélica Romero Palencia, Gerardo Benjamín, Tonatiuh 
Villanueva Orozco, Blanca Inés Vargas Núñez y Claudia 
López Becerra. 
También queremos agradecer a Argentina López 
Becerra por ayudar a transcribir estos apuntes 
MIRNA Y SOFÍA
Prólogo
 
La investigación en psicología es fundamental para el entendimiento del 
comportamiento humano y para el desarrollo de programas e intervenciones 
efectivas. Adicionalmente, la investigación representa un proceso complejo en el 
que los fenómenos o constructos a investigar son multidimensionales, 
multicausales y multideterminados. Hacer justicia a los eventos y problemáticas 
estudiadas y asegurar la validez y confiabilidad de los hallazgos requiere de una 
sofisticación conceptual y técnica profunda y sistemática. De hecho, es necesario 
que diferentes investigadores indaguen distintos aspectos de un mismo problema, 
obteniéndose así resultados que contribuyen a explicar el fenómeno de manera 
integral. 
La obtención de hallazgos contundentes y replicables implica una 
conceptualización teórica sólidamente fundamentada y la realización de una serie 
de pasos metodológicos y estadísticos sistematizados -protocolo científico- que 
permitan sopesar la congruencia de los resultados con la realidad y su grado de 
generalización. Como uno de estos pasos, el análisis estadístico de los datos, 
implica la selección de pruebas estadísticas contingentes con el nivel de medición, 
consistentes con el método planteado y aplicados e interpretados por el 
investigador de manera apropiada. 
Para los psicólogos que consumen investigación para sus intervenciones, 
realizan investigaciones o están en formación, la tarea de elegir la prueba 
estadística adecuada, requiere de apoyo didáctico. En este sentido, el que ese sea el 
objetivo principal de este libro es un evento afortunado, lo cual sólo es superado 
por el hecho de que su utilidad se multiplique al ser un texto planteado en 
términos didácticos, sencillos y precisos, que les permita discernir la lógica 
inherente a la estadística en general y a cada prueba en particular. 
Con el propósito de arribar a un utensilio concreto, aplicable, práctico, claro y 
útil, las autoras del texto desarrollan paso a paso las diferentes pruebas 
estadísticas necesarias a la investigación psicológica, acompañadas de su manejo 
minucioso a través del paquete estadístico para las ciencias sociales (SPSS), 
acompañados de la forma correcta de interpretación de los resultados. Los 
elementos de la obra hacen de ella una consulta indispensable, a partir de un 
material básico y comprensible. Colateralmente, el libro ofrece la aplicación de la 
estadística a partir de ejemplos relacionados a los problemas sociales del país. 
Como punto final, además de recomendar ampliamente el uso de la obra, felicito a 
las autoras y al programa PAPIME de la UNAM que a través del financiamiento del 
proyecto EN314903 hizo este trabajo posible. 
ROLANDO DÍAZ LOVING 
Introducción 
 
La curiosidad del ser humano por saber ¿por qué? y ¿para qué? de las 
relaciones interpersonales, y cómo ocurren éstas en diferentes contextos -pareja, 
familia, amigos, trabajo, escuela, etcétera- ha generado infinidad de explicaciones y 
descripciones en tomo al tema. Algunas de estas explicaciones surgen de la vida 
cotidiana y se asumen como hechos verdaderos, sin ser cuestionados; por ejemplo, 
la aseveración de que las mujeres son emocionalmente débiles. Esta es una 
afirmación compartida por muchos, sin embargo, carece de evidencia empírica y 
sustento teórico que la respalde, elementos que marcan la diferencia entre las 
aseveraciones populares y aquellas que están sustentadas teóricamente y que son 
medidas rigurosamente. 
En el ejemplo anterior surgen preguntas como, ¿todas las mujeres?, ¿las que 
caen dentro de un rango de edad determinado?, ¿las solteras, casadas, viudas, 
divorciadas o que viven en unión libre?, ¿las que tienen determinado nivel de 
escolaridad?, ¿las que trabajan o las que son amas de casa?... De una afirmación 
aparentemente simple emanan una serie de interrogantes, lo que conduce a uno de 
los puntos centrales de la investigación: el objetivo que se quiere alcanzar, esto es, 
para delimitar lo que se va a investigar es necesario tener claridad en el propósito 
de la investigación. 
En este escenario, la estadística es una herramienta que emplea el in-
vestigador para describir sus datos y para tomar decisiones. El tipo de prueba 
estadística a usar dependerá del objetivo de la investigación, de su diseño, del 
tamaño de la muestra y de sus hipótesis. 
De esta forma, la estadística es una colección de hechos numéricos que 
permiten hacer inferencias de una muestra a una población. Se clasifica en 
descriptiva e inferential. La estadística inferencial a su vez se clasifica en no 
paramétrica y paramétrica. 
13
Así, la estadística es una herramienta imprescindible del psicólogo, 
sobre todo cuando realiza investigación. Su aplicación en el campo de la 
psicología no es nueva, tal como lo señala Downie y Heat (1973) quienes 
refieren que en la década de 1880 Cattell se relacionó con estadísticos 
europeos, evento que influyó en la aplicación de los métodos estadísticos 
en el ámbito de la psicología. 
De igual forma, tampoco es de sorprender la complejidad que re-
presenta comprender y aplicar las pruebas estadísticas a situaciones 
específicas de investigación. Es el caso que al incursionar en el área de la 
investigación surja una serie de interrogantes con relación a, ¿qué prueba 
es la más adecuada para lo que se está investigando?, ¿el tipo de medición 
elegido será el apropiado para la prueba elegida?, ¿el modelo estadístico 
seleccionado: paramétrico o no paramétrico es congruente con el tamaño 
de la muestra y con el tipo de medición empleado? 
En fin, pueden ser muchas las dudas, y cuando se toman decisiones 
inapropiadas los resultados y conclusiones derivados de esa investigación 
pueden ser falsos, además de que se tiene el riesgo de cometer el error 
estadístico tipo 1 (Alfa) o el error estadístico tipo 2 (Beta) los cuales se 
describirán en este texto. 
Precisamente este manuscrito tiene la intención de proporcionar a los 
estudiantes y profesionales de la psicología un texto que incluya los ele-
mentos básicos de la estadística, descritos de una manera sencilla y apo-
yados con ejercicios, algunos de ellos, derivados de la investigación de la 
psicología en México, tratando de evitar explicaciones complicadas, por lo 
que las fórmulas que se presentan, así como el desarrollo de las mismas, 
tienen como propósito que el lector conozca las operaciones que subya- 
cen a cada una de éstas con la intención de que comprenda la lógica 
mediante la cual se obtienen. 
Al presente, por cuestiones prácticas es poco probable que el trata-
miento de los datos, derivados de una investigación,se realice en forma 
manual -sobre todo cuando las muestras son grandes- lo que conduce a 
utilizar el paquete estadístico SPSS que permite en poco tiempo obtener 
 Sofía Rivera Aragón 
14 Mirna García Méndez 
resultados precisos. Sin embargo, si las instrucciones dadas al SPSS fueron 
erróneas, los resultados se verán alterados lo que conlleva a interpretacio-
nes equivocadas. 
Con la intención de disminuir estos errores, después del desarrollo de 
las fórmulas inherentes a los estadísticos incluidos en el libro, se exponen 
ejercicios paso a paso de las pruebas estadísticas, a través del Statistical 
Package for the Social Science (SPSS: paquete estadístico aplicado a las 
ciencias sociales). En ambos casos -fórmulas desarrolladas y SPSS- cada 
ejercicio concluye con la interpretación de los resultados.1 
Con base en lo aquí expuesto, el libro inicia con la exposición de los ni-
veles de medición por considerarse fundamentales en la toma de decisiones 
referentes a los pasos que proceden en la investigación. Posteriormente se 
aborda lo relacionado con la estadística descriptiva en el capítulo 2, estadís-
tica que nos permite hacer una descripción de los hallazgos empíricos. En 
este capítulo se hace énfasis en el tipo de distribución, medidas de tenden-
cia central y de variabilidad, a través de una serie de ejemplos que tienen 
como objetivo facilitar la comprensión de los elementos expuestos. 
En el capítulo 3 se expone lo que compete a la estadística inferen- 
cial, la cual nos permite además de describir los datos encontrados, realizar 
generalizaciones a partir de los hallazgos reportados en una muestra a una 
población en términos de probabilidad. En esta parte del texto se presentan 
los principios que sustentan a los dos grandes modelos estadísticos 
derivados de la estadística inferencial: la estadística no para- métrica y la 
estadística paramétrica. 
Los capítulos 4 y 5 abordan de manera específica algunas de las 
pruebas no paramétricas y paramétricas más empleadas por el investigador 
social. En estos dos capítulos, la explicación de las pruebas es acompañada 
por ejemplos que permitan una mejor comprensión de las mismas. 
1Debido al uso de este sofware (SPSS), varias de las tablas reportadas en los diferentes 
capítulos de este libro aparecerán en inglés. 
Introducción 15 
Como parte final pero no por ello menos importante, cabe destacar que el
contenido de este libro se basa en los apuntes de la cátedra sobre estadística, 
dictada por la doctora Sofía Rivera Aragón, en el doctorado de psicología de la 
Facultad de Psicología de la Universidad Nacional Autónoma de México. Es
conveniente denotar que para su publicación se contó con la autorización y 
coautoría de la doctora Rivera Aragón. 
Medición 
 
Del o los objetivos de investigación derivan las fases subsiguientes del 
proceso de investigación. Una de estas fases se refiere al tipo de medición 
empleada para evaluar una o más variables de estudio, componente que tiene 
una relación directa con la estadística empleada en el tratamiento de los 
datos. 
De esta manera la medición consiste en reglas que asignan símbolos a 
objetos, de tal forma que a) representan numéricamente cantidades o 
atributos, o b) definen si los objetos caen en las mismas o en diferentes 
categorías con respecto a un atributo de medición. En esta definición, las 
reglas se refieren a que la asignación de números sea explícita; y los atributos 
denotan que la medición implica características particulares del objeto, esto 
es, los objetos per se no pueden medirse, se miden sus atributos (Nunnally y 
Bernestein, 1995). Nunnally y Bernestein, indican que los números 
representan cantidades en escalas de medición, lo que significa que la 
cuantificación implica qué tanto de un atributo está presente en un objeto. 
En la literatura se mencionan cuatro niveles de medición, aunque en 
psicología generalmente se emplean tres: nominal, ordinal e intervalar, los que 
se describen a continuación. 
Escalas de medición 
Nominal 
Es el nivel más bajo de medición de una variable en el que se le asignan 
números a los objetos, personas o características que se deseen evaluar, 
las cuales no pueden ordenarse o sumarse. Precisamente a todos los miem- 
bros de un conjunto se les asigna el mismo valor numérico, e.g. al preguntarles a 
100 ciudadanos del Distrito Federal, ¿para usted la infidelidad es positiva o 
negativa? Se está empleando una medida nominal al registrar la frecuencia de las 
respuestas, dándole el valor de 1 a la infidelidad positiva y el valor de 2 a la 
infidelidad negativa, lo que se muestra en la tabla 1. 
Esta medición coloca los casos dentro de categorías o conjuntos, y se cuenta la 
frecuencia de ocurrencia, sin asignar el mismo valor a dos categorías, e.g. sexo, no 
se puede clasificar a la misma persona como hombre y mujer. 
Ordinal 
Requiere que los objetos de un conjunto de variables puedan ser ordenados por 
rangos respecto a una característica o propiedad. Los valores numéricos asignados 
a los objetos ordenados se llaman valores de rango. En esta medición los números 
no indican cantidades absolutas ni tampoco que los intervalos entre los números 
sean iguales, por lo que marca la organización de los rangos pero no señala la 
magnitud de las diferencias entre éstos, e.g. las etapas del desarrollo humano: 
Niñez 
Adolescencia 
Adultez 
Vejez 
TABLA 1 
OPINIÓN DE LOS CIUDADANOS DEL DISTRITO FEDERAL SOBRE LA INFIDELIDAD 
Infidelidad Frecuencia 
1 40 
2 60 
Sofía Rivera Aragón 
20 Mirna García Méndez 
Otro ejemplo es el ciclo de vida de la pareja de acercamiento-alejamiento 
(Díaz-Loving, 1999): 
1. Extraño/desconocido 
2. Conocido 
3. Amistad 
4. Atracción 
5. Pasión 
6. Romance 
7. Compromiso 
8. Mantenimiento 
9. Conflicto 
10. Alejamiento 
11. Desamor 
12. Separación 
13. Olvido 
Como se puede observar en ambos ejemplos, no existe una distancia exacta 
entre cada una de las etapas y tampoco se sabe con exactitud cuándo termina una 
e inicia la siguiente. 
Intercalar 
Esta medición posee las características de las escalas nominales y ordinales, de 
manera particular las de rango. Las distancias numéricamente iguales de los 
intervalos representan distancias iguales en la propiedad de la variable que se 
mide. En este nivel de medición se incluyen las escalas tipo Likert, e.g. la 
clasificación de la inteligencia a través de la escala WAIS (Barragán, Benavides, 
Brugman y Lucio, 1988) presentada en la tabla 2. 
Tal como se observa en la tabla 2, existe la misma distancia entre los 
diferentes niveles de medición de la inteligencia, lo que indica una distribución 
igual de los intervalos de medición. 
 Medlción 21 
De razón 
Es el nivel más alto de medición de una variable. Es una medida poco empleada en 
la psicología, por ende, no se hablará más de él. 
Con base en lo expuesto, a continuación se presenta un ejemplo que involucra 
tres de los cuatro niveles de medición: nomina], de rangos e intervalar. 
Ejemplo 
En una investigación que tiene por objetivo conocer la relación entre la 
satisfacción marital, la escolaridad y el sexo. El sexo (hombres y mujeres) es una 
variable nominal en la que a los hombres (H) se les asigna el valor numérico de 1 y 
a las mujeres (M) se les asigna el valor numérico 
2. El nivel de escolaridad (primaria, secundaria, preparatoria, licenciatura y 
posgrado) es una variable ordinal que va de menor a mayor escolaridad, ordenada 
de la siguiente manera: 
Primaria 1 
Secundaria 2 
Preparatoria 3 
Licenciatura 4 
Posgrado 5 
TABLA 2 
CLASIFICACIÓN DE LA INTELIGENCIA EN ADULTOS 
Coeficiente intelectual Clasificación 
130 o más Muy superior 
120-129 Superior 
110-119 Normal brillante 
90-109 Normal 
80-89 Subnormal 
70-79 Limítrofe 
50-69 Deficiente mental superficial 
30-49 Deficiente mental medio 
29 o menos Deficiente mental profundoSofía Rivera Aragón 
22 Mirna García Méndez 
La satisfacción marital se medirá con el IMSM integrado por 47 enunciados 
positivos, con intervalos de respuesta del 1 al 5 (Cortés, Reyes, Díaz-Loving, Rivera 
y Monjaraz, 1994). 
Me gusta mucho = 5 Me 
gusta = 4 
Ni me gusta, ni me disgusta = 3 Me 
disgusta = 2 Me disgusta mucho = 1 
 Medición 23 
TABLA 3 
REPRESENTACIÓN DE LOS DIFERENTES NIVELES DE MEDICIÓN 
Clasificación Definición Función Propiedad Estadística 
empleada 
Ejemplo 
Nominal Categoriza 
una variable. 
Nombra 
categorías. 
Igualdad No 
paramétrica. 
Estado civil: 
solteros, ca-
sados, unión 
libre, viudos, 
divorciados: 
sexo: hombres y 
mujeres. 
Ordinal Ordena una 
variable. 
Jerarquiza las 
categorías 
> o < 
(mayor o 
menor) 
No 
paramétrica 
Escolaridad: 
primarla, se-
cundarla, pre-
paratoria. 
Intervalo Conoce la 
distancia entre 
intervalos. 
Cuantifica una 
variable. 
Cero 
Relativo. 
Paramétrica. Inteligencia: 
limítrofe, nor-
mal, nomal 
brillante, su-
perior. 
Razón Conoce la 
proporción 
entre las va-
riables. 
Cuantifica una 
variable. 
Cero 
absoluto. 
Paramétrica. Las medidas de 
distancia: 
metro, decá-
metro, hectó- 
metro y 
kilómetro. 
Por sus características, este inventario evaluará la satisfacción marital de 
manera intervalar, debido a que medirá las distancias o intervalos del constructo 
de interés. 
Las variables nominal (sexo) y ordinal (escolaridad) son generalmente 
denominadas variables sociodemográficas o de clasificación por el investigador. 
Ahora bien, si la satisfacción marital se mide preguntándoles a las personas si 
están o no satisfechas con su relación de pareja, la respuesta será dicotómica Sí o 
No, convirtiéndose la medición en nominal. Los resultados que se obtendrán serán 
frecuencias en relación con el número de hombres y mujeres que están satisfechos 
o insatisfechos maritalmente. Este ejemplo denota que el tipo de medición utili-
zada, estará en función de los objetivos que pretenda alcanzar el investigador. 
De esta manera, se observa que cada una de las escalas de medición tiene 
características y funciones específicas, las que se presentan en la tabla 3. 
Estadística descriptiva
La estadística descriptiva permite conocer la distribución de los datos a partir de 
la cuantificación de los atributos de una categoría o variable. De acuerdo con 
Nunnally (1995) no necesariamente incluye la generalización. 
Sus funciones son: 
a) Conocer el tipo de distribución. 
b) Representación gráfica. 
c) Obtener medidas de tendencia central (toma de decisiones). 
d) Calcular medidas de variabilidad. 
Conocer el tipo de distribución 
1. Frecuencia absoluta (f) 
2. Frecuencia relativa (fr %) 
3. Frecuencia ajustada (fa %) 
4. Frecuencia acumulada (fa) 
La frecuencia absoluta describe objetos, la relativa los ordena en porcentajes, 
la ajustada recalcula las frecuencias absolutas y relativas, eliminando datos con 
base en valores perdidos o missing, y la acumulada los ordena de mayor a menor o 
viceversa. 
Estas frecuencias se obtienen en el programa estadístico SPSS en cualquiera de 
sus versiones. Después de haber elaborado una base de datos e insertado los datos 
en bruto, se le pide al SPSS las frecuencias de la variable de estudio y despliega los 
cuatro tipos de frecuencia en una tabla. 
27
Para comprender la lógica de las operaciones involucradas en la 
distribución de frecuencias, se expondrá un ejemplo a partir del cual se 
explicará la forma en la cual se obtiene cada una de las frecuencias. 
Ejemplo 
Se encuesto con un cuestionario abierto a una muestra de 300 personas, 
hombres y mujeres, sobre el significado del funcionamiento familiar. Una vez 
que se obtuvieron los datos se procedió a su organización, lo que se hizo 
mediante una distribución de frecuencias, tal como se observa en la tabla 4. 
Esta tabla muestra el total de hombres y mujeres que participaron en la 
investigación, sin embargo, para identificar la preferencia de hombres y 
mujeres por uno u otro de los significados del funcionamiento familiar, se 
obtuvieron las frecuencias absolutas de ocurrencia de respuesta por sexo. 
Estos resultados se presentan en la tabla 5. 
En la tabla 5 se enuncian las frecuencias absolutas (f) de ocurrencia de 
respuesta de la categoría de análisis sexo: hombres (H) y mujeres (M), en 
cada uno de los significados generales de funcionamiento familiar. En 
este ejemplo la muestra no tiene una distribución igual en cuanto al nú- 
mero de H y M incluidos, por lo que para comparar a los dos grupos aun 
TABLA 4 
TOTAL DE HOMBRES Y MUJERES QUE OPINARON SOBRE EL SIGNIFICADO DEL 
FUNCIONAMIENTO FAMILIAR 
Sexo f 
Hombres 144 
Mujeres 156 
Total 300 
Sofía Rivera Aragón 
Mirna García Méndez 28 
TABLA 5 
FRECUENCIAS DEL SIGNIFICADO DE FUNCIONAMIENTO FAMILIAR EN HOMBRES Y 
MUJERES 
 Hombres Mujeres 
Significados generales f f 
Organización y estructura 25 20 
Emocional-valorativa 44 66 
Afectivo-funcional 53 54 
Funcional 16 13 
Afectiva 6 3 
total 144 156 
cuando existen diferencias en su tamaño se emplea la frecuencia relativa (fr %). 
La frecuencia relativa (fr %) se refiere a la ocurrencia de los niveles de una 
categoría -en este ejemplo (H y M)- por cada 100 casos. Su cálculo se obtiene al 
multiplicar cualquier proporción dada por 100 (Levin y Levin, 2002). 
Siguiendo con el ejemplo de los significados generales del funcionamiento 
familiar, para obtener la frecuencia relativa de los H que respondieron el 
cuestionario, se multiplica 100 por 144 y el resultado se divide entre 300 que es el 
total de personas que participaron en la investigación, y se extrae la fr que es de 48 
por ciento. 
La tabla 6 presenta que del total de la muestra, el 48 por ciento son hombres y 
el 52 por ciento son mujeres. 
Estadística descriptiva 29
Con respecto a las respuestas de la muestra en relación con los significados 
del funcionamiento familiar, éstas varían tal como se observa en la tabla 5 por lo 
que también se aplica la frecuencia relativa al igual que en la categoría de sexo. Los 
datos se presentan en la tabla 7. 
TABLA 7 
FRECUENCIAS ABSOLUTA Y RELATIVA DEL SIGNIFICADO DE FUNCIONAMIENTO 
FAMILIAR EN HOMBRES Y MUJERES 
 Hombres 
f fr(%) 
 Mujeres 
 f r(%) 
Organización y estructura 25 17.4 20 12.8 
Emocional-valorativa 44 30.6 66 42.3 
Afectivo-funcional 53 36.8 54 34.6 
Funcional 16 11.1 13 8.3 
Afectiva 6 4.2 3 1.9 
Total 144 100 156 100 
La frecuencia ajustada recalcula la frecuencia absoluta quitando datos o con 
base en elementos perdidos que generalmente se computan con cero (en el SPSS 
aparecen como missing). Estos elementos perdidos se refieren a los enunciados o 
preguntas que la muestra no respondió. Con base en el ejemplo del significado del 
funcionamiento familiar en H y M, la tabla 8 presenta las frecuencias absolutas, 
las relativas y las ajustadas. 
TABLA 6 
FRECUENCIAS ABSOLUTA Y RELATIVA DE LA CATEGORÍA SEXO 
Sexo f fr (%) 
Hombres 144 48.0 
Mujeres 156 52.0 
Total 300 100 
Sofía Rivera Aragón 
30      Mirna García Méndez 
TABLA 8 
FRECUENCIAS ABSOLUTA, RELATIVA Y AJUSTADA DEL SIGNIFICADO DE 
FUNCIONAMIENTO FAMILIAR EN HOMBRES Y MUJERES 
Significados generales Hombres Mujeres 
f fr (%) fa (%) f fr (%) fa (%) 
Organización y estructura 25 17.4 17.4 20 12.8 20 
Emocional-valorativa 44 30.6 30.6 66 42.3 86 
Afectivo-funcional 53 36.8 36.8 54 34.6 140 
Funcional 16 11.1 11.1 13 8.3 153 
Afectiva 6 4.2 4.2 3 1.9 156 
Total 144 100 100 156 100 
En esta tabla la fr y fa (%) son iguales debido a que no hubo valores perdidos. 
Con fines de ejemplificar la fa (%) la tabla 9 muestra las frecuencias del estado civil 
de la muestra. 
Tabla 9 
FRECUENCIAS DEL ESTADO CIVIL DE HOMBRES Y MUJERES 
Estado civil f fr(%) fa (%) 
Casado 120 40.0 40.3 
Soltero151 50.3 50.7 
Unión libre 13 4.3 4.4 
Divorciado 8 2.7 2.7 
Separado 3 1.0 1.0 
Viudo 3 1.0 1.0 
Total 298 99.3 100.0 
Valores perdidos 
(missing) 0 
2 .7 
Total 300 100.0 
Estadística descriptiva 31 
La frecuencia acumulada (la) ordena los puntajes del total de casos de una 
categoría. Se obtiene al sumar la frecuencia de un puntaje dado a la frecuencia de 
la categoría debajo de ella. Al resultado de esta operación, se suma en forma 
acumulativa el puntaje de la categoría debajo de ella, y así sucesivamente hasta 
tener incluidos el total de los casos. Siguiendo el ejercicio de los significados de 
funcionamiento familiar, la tabla 10 presenta las frecuencias absolutas, relativas, 
ajustadas y acumuladas por hombres y mujeres. 
Ejercicio SPSS 
Para obtener los cuatro tipos de frecuencia en SPSS de las 300 personas, se realizan 
los siguientes pasos: 
Paso 1. En la base de datos se coloca el cursor en Analyze, se presiona el 
botón izquierdo del mouse. 
Paso 2. Al presionar Analyze, aparece un menú en el que se coloca el cursor 
en Descriptive Statistics, se presiona con el botón izquierdo del mouse y aparece 
otro menú, se coloca el cursor en Frequencies y una vez más se presiona con el 
botón izquierdo del mouse. 
TABLA 10 
FRECUENCIAS ABSOLUTAS, RELATIVAS, AJUSTADAS Y ACUMULADAS DE HOMBRES Y
MUJERES CON RELACIÓN AL SIGNIFICADO DEL FUNCIONAMIENTO FAMILIAR 
Significados 
generales 
 Hombres Mujeres 
f fr (%) fa (%) fa f fr(%) fa (%) fa 
Organización 
y estructura 25 17.4 17.4 17.4 20 12.8 12.8 12.8 
Emocional-valorativa 44 30.6 30.6 47.9 66 42.3 42.3 55.1 
Afectivo-funcional 53 36.8 36.8 84.7 54 34.6 34.6 89.7 
Funcional 16 11.1 11.1 95.8 13 8.3 8.3 98.1 
Afectiva 6 4.2 4.2 100.0 3 1.9 1.9 100.0 
total 144 100 100 156 100 100 
Sofía Rivera Aragón 
Mirna García Méndez 32
Paso 3. Al presionar Frequencies, se abre un menú que contiene las 
variables de la investigación, se marca con el botón izquierdo del mouse la 
variable siggene (significados generales del funcionamiento familiar). 
Estadística descriptiva 33 
Paso 4. Una vez señalada la variable siggene, se coloca el cursor en el 
icono que está entre las variables de estudio y variable(s), se presiona el bo-
tón izquierdo del mouse, de esta operación siggene aparece en el cuadro de 
variable(s). 
Paso 5. Se coloca el cursor en el icono de OK, se presiona el botón iz-
quierdo del mouse obteniéndose los cuatro tipos de frecuencias, en donde: 
frequency es frecuencia absoluta, percent es frecuencia relativa, valid percent 
es frecuencia ajustada y cumulative percent es frecuencia acumulada. 
 Sofía Rivera Aragón 
34 Mima García Méndez 
Estos resultados indican que los significados de funcionamiento familiar con 
mayor ocurrencia de respuesta fueron el emocional-valorativo y el afectivo-
funcional.2 
Una vez descritos los cuatro tipos de frecuencias, se proseguirá con la 
distribución de frecuencias agrupadas, las que se emplean para incluir las 
frecuencias absolutas en intervalos de clase (Levin y Levin, 2002; Downie y Heat, 
1973). Estos intervalos de clase son comúnmente empleados cuando la 
distribución de frecuencia es tan amplia que resulta poco práctica. Es el caso del 
ejemplo de la tabla 11 que presenta una distribución de frecuencias por edad en 
una muestra de 
351 personas, que varía de 21 a 60 años. 
La tabla 11 indica que se tiene una persona de 21 años, dos personas de 22 
años, 13 personas de 23 años y así sucesivamente. 
Con el propósito de que los datos tengan una presentación sencilla y clara, se 
obtienen los intervalos de clase que para este caso es de cinco, tal como se observa 
en la tabla 12. La decisión del tamaño del intervalo es responsabilidad del 
investigador, quien generalmente parte de su base de datos y de los objetivos de su 
investigación. 
2Con fines didácticos se presentarán las tablas del SPSS, aunque éstas no se reportan en 
una investigación, se abstraen los datos que el investigador desea resaltar y se muestran en 
otro formato. 
SIGNIFICADOS GENERALES 
 Valia Cumulative 
 Frequency Percent Percent Percent 
 Valid organización 
y estructura 45 15.0 15.0 15.0 
emocional-valorativa 110 36.7 36.7 51.7 
afectivo-funcional 107 35.7 35.7 87.3 
funcional 29 9.7 9.7 97.0 
afectiva 9 3.0 3.0 100.0 
Total 300 100.0 100.0 
Estadística descriptiva 35 
A su vez los intervalos de clase tienen un límite inferior y un límite superior 
(véase tabla 13). 
Como se observa en la tabla 13, el límite inferior del intervalo de edad 21-25 es 
20.5 y su límite superior es 25.5, que también es el límite inferior del intervalo 26-
50, esto es, el límite superior de cada uno de los intervalos se convierte en el límite 
inferior del intervalo subsiguiente. 
TABLA 11 
DISTRIBUCIÓN DE EDAD POR FRECUENCIAS EN HOMBRES Y MUJERES. 
Edad f Edad f Edad f Edad f 
21 1 31 15 41 8 51 2 
22 2 32 18 42 1 
1 
52 5 
23 13 33 16 43 7 53 6 
24 13 34 13 44 7 54 1 
25 11 35 16 45 4 55 2 
26 17 36 9 46 7 56 0 
27 1 1 37 18 47 4 57 2 
28 13 38 14 48 3 58 0 
29 19 39 15 49 8 59 0 
30 15 40 13 50 8 60 
Total 
4 
351 
TABLA 12 
DISTRIBUCIÓN DE EDAD POR INTERVALOS EN HOMBRES Y MUJERES 
Intervalo de clase f 
56-60 6 
51-55 16 
46-50 30 
41-45 37 
36-40 69 
31-35 78 
26-30 75 
21-25 40 
 Total 351 
Sofía Rivera Aragón 
Mirna García Méndez 36
Representación gráfica 
Los resultados que se obtienen de la investigación se pueden representar en tablas 
o gráficas, pero nunca se deberán emplear ambas alternativas para presentar los 
mismos datos; por ejemplo, si la escolaridad de la muestra se presenta en tablas, 
ya no se utilizará la figura, porque ello implica repetir la información. Hay 
investigadores que se inclinan por el uso de figuras debido a que atraen la atención 
visual del observador. 
Una de las características de las gráficas consiste en que se basan en una 
recta numérica (véase gráfica 1). 
TABLA 13 
LÍMITES SUPERIOR E INFERIOR DE LOS INTERVALOS DE EDAD EN UNA 
MUESTRA DE 351 SUJETOS 
Limits inferior Intervalo de clase Límite superior 
55.5 56-60 60.5 
50.5 51-55 55.5 
45.5 46-50 50.5 
40.5 41-45 45.5 
35.5 36-40 40.5 
30.5 31-35 35.5 
25.5 26-30 30.5 
20.5 21-25 25.5 
 
GRÁFICA 1 
REPRESENTACIÓN DE LA RECTA NUMÉRICA 
Estadístico descriptiva 37 
Las gráficas que se utilizan con mayor regularidad son: 
1. Barras 
2. Pastel 
3. Histograma 
4. Ojivas 
5. Polígonos de frecuencia 
Las gráficas de barras y pastel se aplican únicamente a variables nominales y 
ordinales; mientras que los histogramas, ojivas y polígonos de frecuencia se 
emplean en variables ordinales, intervalares y de razón. 
Gráfica de barra 
En esta figura no hay continuidad en las barras cuando se emplea en datos 
nominales, razón por la que están separadas. La gráfica 2 muestra el grado de 
escolaridad de los 300 sujetos a los que se les aplicó el cuestionario abierto del 
significado de funcionamiento familiar. Los números que aparecen al interior de 
cada una de las barras son opcionales, se incluyen si el investigador quiere indicar 
el número de sujetos que corresponde a cada nivel educativo. Así el número 22 que 
aparece en la barra de primaria, indica que de la muestra total de 300 personas, 
22 de ellas tienen educación primaria. 
La gráfica 3 presenta las cinco categorías que resultaron de la aplicación del 
cuestionario abierto del significado de funcionamiento familiar (organización y 
estructura, emocional-valorativa, afectivo-funcional, funcional y afectiva) así como 
la distribución de la muestra en cada categoría. 
La diferencia entre las gráficas 2 y 3, es que en la gráfica 2 cada barra muestra 
el número exacto de sujetos ubicados en cada grado escolar, mientras que en la 
gráfica 3 se observa de manera general la distribución de la muestra en las cinco 
categorías de funcionamiento familiar.La elección de una u otra figura está en 
función de lo que el investigador quiera resaltar de sus resultados. 
Sofía Rivera Aragón 
Mirna García Méndez 38 
GRÁFICA 2 
NIVEL DE ESCOLARIDAD 
GRÁFICA 3 
DISTRIBUCIÓN DE LA MUESTRA EN LAS CATEGORÍAS DE 
FUNCIONAMIENTO FAMILIAR 
Estadística descriptiva 39 
Gráfica de pastel o de sectores 
Se utiliza con frecuencias absolutas y relativas, es útil para mostrar di-
ferencias de frecuencias en categorías de nivel nominal. La gráfica 4 
presenta la variable ocupación de una muestra de 352 personas, hombres y 
mujeres del Distrito Federal. 
Gráfica 4 
OCUPACIÓN DE HOMBRES Y MUJERES 
Cada sección de la gráfica tiene el número de individuos agrupados por 
cada uno de los cinco tipos de ocupación. 
También con la figura de pastel se puede presentar la distribución de la 
muestra con porcentajes, como se aprecia en la gráfica 5. Del total de las 
352 personas que integran la muestra, su escolaridad se distribuye de la 
siguiente manera: 18 por ciento tiene primaria, 36 por ciento secundaria, 
31 por ciento preparatoria y 25 por ciento licenciatura. 
Gráfica de histograma 
Se emplean en variables continuas3 y se elaboran con base en el límite 
inferior del intervalo. La gráfica 6 muestra los intervalos de edad de la 
3 Una variable continua es aquella que asume un conjunto ordenado de valores dentro de un 
rango (Kerlinger y Lee, 2001). 
 Sofía Rivera Aragón 
40 Mirna García Méndez 
GRÁFICA 5 
NIVELES DE ESCOLARIDAD EN HOMBRES Y MUJERES 
muestra de 351 sujetos de las tablas 12 y 13. Las barras están unidas por-
que denotan continuidad del intervalo de menor edad (21-25) al de mayor 
edad (56-60). 
GRÁFICA 6 
INTERVALOS DE EDAD EN UNA MUESTRA DE 351 
HOMBRES Y MUJERES 
Estadística descriptiva 41
Otro ejemplo relacionado con los histogramas es el caso del cons-
tructed esperanza, medida por una escala cuyos intervalos de respuesta 
van del 1 al 5. Esta escala se constituye por dos dimensiones: importancia y 
probabilidad, cada una con 10 factores (Vargas, García-Méndez, Díaz-
Loving y Rivera, 2004). El histograma de la figura 7 muestra el com-
portamiento de uno de los factores de probabilidad -ayuda paterna- en una 
muestra de 300 personas del D.E 
GRÁFICA 7 
NÚMERO DE PERSONAS POR INTERVALO DE RESPUESTA EN EL FACTOR DE AYUDA 
PATERNA EN LA ESCALA DE ESPERANZA 
Gráfica de ojiva o de polígono de
frecuencia acumulada 
Se basa en la frecuencia absoluta y se grafica con el límite superior. En esta 
figura, la línea que conecta los puntos es ascendente, razón por la que no 
toca la línea base horizontal (Downie y Heath, 1973). La gráfica 8 presenta 
los rangos de edad de una muestra de 351 personas, rangos distribuidos 
con base en el límite superior presentado en la tabla 13 de este capítulo. 
 Sofía Rivera Aragón 
42 Mirna García Méndez 
GRÁFICA 8 
RANGOS DE EDAD 
Gráfica de polígonos de frecuencia 
Se conoce también como curva. Es más fácil de graficar después de hacer
un histograma. Un ejemplo de polígonos de frecuencia se expone en la
gráfica 9, en una muestra de 168 parejas heterosexuales, cuyos años de
unión se distribuyeron por rangos. 
Gráfica 9 
RANGOS AÑOS DE UNIÓN 
Estadística descriptiva 43
Obtener medidas de tendencia central 
Es común en el ámbito de la investigación, querer saber lo típico o el 
promedio en el que se encuentra la muestra de estudio, con la finalidad de 
describirla en forma global. Este promedio o valor se conoce como medida 
de tendencia central debido a que se encuentra en el centro de una 
distribución en la que se localizan la mayoría de los puntajes de la muestra 
(Levin y Levin, 2002). La forma de obtener este promedio es a través de las 
medidas de tendencia central: media, mediana y moda expuestas en la 
tabla 14. 
1. Media → es un promedio. 
2. Mediana → divide en dos a la muestra. 
3. Moda → es el valor que se repite con mayor frecuencia. 
Tabla 14 
MEDIDAS DE TENDENCIA CENTRAL 
 Representación Nivel de medición Exactitud 
Paramétrica 
No paramétrica 
X μ (media) Intervalar 
Md (mediana) Ordinal 
Mo (moda) Nominal 
Exacta 
Variable 
Inestable 
Como se observa en la tabla 14 es usual emplear letras latinas para re-
presentar las características de una muestra y las letras griegas para los 
parámetros de una población (Downie y Heath, 1973). En el caso de la tabla 
14, la X(media) es un estimador debido a que es un valor que representa 
una característica de la muestra, y la μ (media) es un parámetro, porque es 
un valor que representa las características de una población. 
Estas medidas de tendencia central son empleadas en la toma de 
decisiones e indican el punto medio de una distribución, tal como se 
observa en la gráfica 10. 
44 
Sofía Rivera Aragón 
Mirna García Méndez 
GRÁFICA 10 
DISTRIBUCIÓN NORMAL 
Media 
La media aritmética X es la medida de tendencia central más utilizada en la 
investigación, se obtiene al sumar el total de puntajes obtenido por la muestra, 
dividido entre el número total de la muestra (Clark-Carter, 1997; Levin y Levin, 
2002; Downie y Heath, 1973). Su fórmula es: 
Estadística descriptiva 45
La media. 
La suma expresada por la letra griega sigma 
Datos crudos 
Número de casos 
Donde:
Esta fórmula se emplea en datos no agrupados (datos crudos) en muestras 
pequeñas. 
 
Ejemplo 1 
Conocer la media de edad de una muestra de diez sujetos 
Cuando se trabaja con datos agrupados por frecuencias o por intervalos y con 
muestras grandes, la media se obtiene con la siguiente fórmula: 
La media. 
La suma expresada por la letra griega sigma 
Los puntajes en crudo de la muestra 
Un puntaje multiplicado por su frecuencia de ocurrencia 
La suma de los fx 
Número de casos 
Sofía Rivera Aragón 
Mirna García Méndez 46
 
donde: 
Ejemplo 2 
Se aplicó a una muestra de 330 hombres y mujeres la escala de depresión de Zung 
(1965) (SDS).4 La presencia o ausencia de depresión se evaluó con base en cuatro 
niveles: 
1 = < 50% sin depresión 
2 = > 50% depresión leve 
3 = > 60% depresión moderada 
4 = > 70% depresión grave 
Primero se obtienen las frecuencias de ocurrencia en cada uno de los niveles de 
depresión. 
 Niveles de depresión f 
 1 264 
2 45 
3 14 
4 7 
Después se obtiene la fx, al multiplicar cada una de las frecuencias por el nivel 
de depresión correspondiente. 
4SDS son las siglas del nombre de la escala en inglés: Self-Rating Depression Scale. 
Estadística descriptiva 47 
Esta media de 1.3 indica que la mayoría de los 330 sujetos se ubican en el 
nivel 1, lo que significa que en promedio la muestra no tiene depresión. 
Ejemplo 3 
Para obtener la media de años de unión de una muestra de 352 sujetos que 
vivían con una pareja al momento de la investigación, los datos se agruparon en 
intervalos. Una vez derivados los intervalos, se obtiene la marca de clase (Mx) o 
punto medio de cada intervalo donde 33 es el, punto medio del intervalo 31-35 
porque 33 + 2 = 35 y 33- 2 = 31. 
Intervalo Mx 
31-35 33 
26-30 28 
21-25 23 
16-20 18 
11-15 13 
 6-10 8 
1-5 3 
Enseguida se obtiene la frecuencia de ocurrencia (f) de cada intervalo, así en 
el intervalo de 26-30 años de unión, se encuentran 24 personas. 
Intervalo Mx f 
31-35 33 8 
26-30 28 24 
21-25 23 34 
16-20 18 49 
11-15 13 84 
6-10 8 110 
1-5 3 43 
Sofía Rivera Aragón 
Mirna García Méndez 48
 Posteriormente se multiplica cada frecuencia por su respectiva Mx y 
se consiguen de esta manera las fx. 
De esta manera se concluye que la media deaños de unión de esta muestra es 
de 13.3. 
Mediana 
La mediana (Md) es el valor medio de la distribución, divide el total de los casos 
en dos, razón por la que se dice que divide en dos a la muestra, dejando el mismo 
número de casos a cada lado de ella (Downie y Heath, 1973). 
Cuando se tiene un número impar de casos, la Md se ubica exactamente a la 
mitad de la distribución. En los datos que a continuación se presentan, la Md de 
edad de los 145 sujetos es de 21 años y le quedan tres rangos de edad hacia arriba 
y tres rangos de edad hacia abajo. 
Edad f 
18 21 
19 22 
20 32 
21 26 
22 14 
23 18 
24 12 
 n = 145 
Estadística descriptiva 49 
Una vez obtenida la fa se localiza la posición de la Md 73 en la columna 
de la fa. El número más cercano al 73 es el 70 por lo que la Md de edad es 21. 
Si el número de casos es par, entonces se procede de acuerdo con el 
siguiente ejemplo. En una muestra de 90 sujetos, la posición de la Md 45.5 se 
ubica entre las fa 35-50 por lo que la Md es de 10.5 años de escolaridad, 
situada a la mitad de la distribución. 
Moda 
La moda (Mo) es una medida de tendencia central para datos no agru- 
pados, cuyo valor se presenta más veces. En el ejemplo anterior la Mo es 
Edad f fa 
18 21 145 
19 22 124 
20 32 102 
21 26 70 
22 14 44 
23 18 30 
24 12 12 
 n= 145 
De acuerdo con Levin y Levin (2002) la posición del valor de la Md también 
se puede obtener con la fórmula: 
 
 
Posición de la Md 
Siguiendo con el ejemplo de la edad: 
 
Posición de la Md 
 
Para localizar el número 73 se saca la frecuencia acumulada (fa) la cual se 
revisó al inicio de este capítulo. 
Sofía Rivera Aragón 
Mirna García Méndez 
50
10 años de escolaridad, debido a que su frecuencia es la más alta en la 
distribución: son 15 los sujetos que tienen estos años de escolaridad. 
Ejercicio SPSS 
Para obtener las medidas de tendencia central en SPSS, se retomará el ejercicio de 
los significados generales del funcionamiento familiar desarrollado para extraer 
los cuatro tipos de frecuencias. Recuerde que después de realizar los pasos 1, 2, 3 
y 4 en el SPSS se obtuvo un menú. En este menú, ahora se coloca el cursor en el 
icono de statistics y se presiona el botón izquierdo del mouse: 
Estadística descriptiva 51 
Al presionar statistics aparece un menú en el que se coloca el cursor en cada 
uno de los cuadros de las tres medidas de tendencia central de nuestro interés -
media, mediana y moda— se presiona en estos cuadros con el botón izquierdo 
del mouse, enseguida se coloca el cursor en el ícono de continue que se 
presiona con el botón izquierdo del mouse. 
Al presionar el icono de continue reaparece el menú del paso 4 y se presiona el 
icono OK. 
 Sofía Rivera Aragón 
52 Mirna García Méndez 
Después de presionado el icono de OK aparecen en una tabla las medidas de 
tendencia central con sus respectivos valores. 
El valor de la media, mediana y moda es de 2, lo que indica una 
distribución normal de las respuestas de la muestra. 
Calcular medidas de dispersión (variabilidad) 
Las medidas de dispersión son importantes en la descripción de la dis-
tribución, debido a que indican el grado en que varían los datos con relación a 
la parte central de la curva normal, lo que las convierte en un elemento 
inseparable de las medidas de tendencia central; además estas medidas de 
dispersión sólo pueden aplicarse a medidas de rango e intervalares. Las más 
empleadas son: 
1. Rango 
2. Desviación estándar 
3. Varianza 
4. Sesgo 
5. Curtosis 
6. Error estándar 
Rango (R) 
El rango también conocido como recorrido (Mendenhall, 1982; Downie 
y Heath, 1973) es la distancia entre el valor mínimo y el valor máximo de 
Estadística descriptiva 53 
 
STATISTICS 
Significados generales 
N Valid 300 
 Missing 0 
Mean 2.4900 
Median 2.0000 
Mode 2.00 
una distribución. Su cálculo es fácil y rápido, no requiere de fórmula y se puede 
utilizar en medidas ordinales e intervalares. Su desventaja radica en su inestabilidad, 
esto es, de una muestra a otra, presenta grandes variaciones, por lo que se 
recomienda emplearse como una medida preliminar. 
Un ejemplo de esta medida de variabilidad es conocer el rango de 
rendimiento escolar de 42 alumnos, cuya calificación más alta fue de 9 y la más 
baja de 2. El R se obtiene de la resta 9-2 esto es el R = 7. 
Desviación estándar 
(o = parámetro de la población) (s = estimador de la muestra) 
La desviación estándar únicamente se puede emplear en medidas intervalares. 
Es una puntuación que indica la distancia con relación a la media, razón por la 
que la media no tiene significado sin la desviación. De esta forma, como se 
observa en la gráfica 11, la desviación representa la variabilidad promedio de una 
distribución. 
GRÁFICA 11 
REPRESENTACIÓN DE LA DESVIACIÓN ESTÁNDAR EN 
UNA DISTRIBUCIÓN NORMAL 
 
 Sofía Rivera Aragón 
54 Mirna García Méndez
Para entender la desviación estándar de la cual depende la significancia, es 
necesaria la curva (véase gráfica 12) que representa el 100 por ciento de la 
probabilidad. De esta manera, 100 por ciento es el área bajo la curva. 
GRÁFICA 12 
REPRESENTACIÓN DE LA SIGNIFICANCIA A PARTIR DE LA DESVIACIÓN 
ESTÁNDAR EN UNA DISTRIBUCIÓN NORMAL 
Estadística descriptiva 54
 Suma de frecuencias de puntajes crudos elevados al cuadrado 
n = Número total de casos 
(X)2 = Media elevada al cuadrado 
s = Desviación estándar 
donde: 
Su fórmula es: 
 
Ejemplo 
Para calcular la desviación estándar del número de hijos en una muestra de 
176 parejas, se realiza lo siguiente: 
1. Se obtiene la distribución de frecuencia (/) 
Núm. de hijos (x) f 
1 49 
2 74 
3 34 
4 15 
5 4 
 n = 176 
2. Se multiplica cada frecuencia por el número de hijos, esto es, 49 parejas 
tienen un hijo, se multiplica 49 X 1; 74 parejas tienen dos hijos, se multiplica 74 X 
2, y así sucesivamente. 
Núm. de hijos (x) f fx 
1 49 49 
2 74 148 
3 34 102 
4 15 60 
5 4 20 
 n = 176 S/x = 379 
3. Se multiplica cada fx por el número de hijos y así se obtienen las fx2. 
Núm. de hijos (x) fx fx2 
1 49 49 
2 148 296 
3 102 306 
4 60 240 
5 20 100 
 2/x2 = 991 
Sofía Rivera Aragón 
Mirna García Méndez 56
Varianza (s2 o σ2) 
La varianza es la desviación estándar al cuadrado, indica una distancia con 
respecto a la X, su aplicación es el análisis de varianza (Anova)5 e indica cuánto 
de la variabilidad de la variable dependiente es explicada por la variable 
independiente. De esta forma muestra qué tanto de la variabilidad de la variable 
dependiente es explicada por las diferencias de los individuos, proceso al que se 
le conoce como varianza de error. 
5 Siglas en inglés del análisis de varianza. 
Estadística descriptiva 57
De acuerdo con la fórmula de la desviación estándar
se toma del punto dos. 
falta obtener la media por lo que 
 
4. Una vez que se tiene la X = 2.15 hijos, ésta se eleva al cuadrado (X)2 — 4.62 
y entonces: 
Sesgo 
El sesgo se refiere a la variación de una distribución, es el grado de asimetría de 
la distribución observada por el número de casos agrupados en una sola 
dirección. Su interpretación está asociada con el valor y el signo, esto es: 
Valor - 4 a + 4 
Signo + - 
El signo implica el nivel de asimetría de la curva, cuando más cercana está al 
cero, la curva es normal, cuando más cercana está al cuatro, la curva es asimétrica 
o sesgada. 
Ejemplos 
Una muestra de 60 mujeres se clasificó por la actividad que realizaban de la 
siguiente manera: 1. estudiantes, 2. empleadas, y 3. sin actividad. En la gráfica 13 
se puede ver que la mayoría de la muestra era estudiante, lo que se refleja en el 
sesgo positivo de la gráfica 13. 
GRÁFICA 13 
ACTIVIDADES REALIZADAS POR MUJERES 
 Sofía Rivera Aragón 
58 Mirna García Méndez 
Al indagar en torno a los elementos que intervienen en el funcionamientofamiliar en una muestra de 300 sujetos, se encontró que 232 reportaron que la 
comunicación es un indicador que interviene en el funcionamiento familiar. Estos 
hallazgos se observan en la gráfica 14 que muestra un sesgo negativo debido a que la 
curva está cargada a la derecha. 
GRÁFICA 14 
LA COMUNICACIÓN COMO ELEMENTO DEL 
FUNCIONAMIENTO FAMILIAR 
Curtosis (K) 
Es el nivel de picudez de una curva, esto es, su grado de elevación o 
aplanamiento. A diferencia del sesgo, la curtosis es una z4 sobre el número de 
sujetos. 
 
Estadística descriptiva 59
La curtosis al igual que el sesgo depende del valor y del signo: 
a) Valor. Si el cero va de + 4 a - 4 la curva es mesocúrtica. 
b) Signo. Si es positivo se habla de una curva leptocúrtica. 
Ejemplos 
El número de hijos en una muestra de 176 parejas fluctuó entre uno y cinco, 
predominando las parejas con dos hijos, tal como se observa en la gráfica 15, lo 
que hace que la curva sea alta o picuda (leptocúrtica). 
GRÁFICA 15 
NÚMERO DE HIJOS 
La gráfica 16, representa una curva mesocúrtica, esto es, una distribución 
normal en una muestra de 60 mujeres, 30 con diagnóstico que indica problemas 
de alimentación y 30 sin problemas alimenticios. 
La gráfica 17, muestra una curva platocúrtica hipotética, que se caracteriza 
por su distribución relativamente plana. 
De esta manera se observa que el sesgo y la curtosis indican la asimetría, el 
sesgo hacia uno u otro lado de la curva y la curtosis a través de la elevación de la 
misma. 
 Sofía Rivera Aragón 
60 Mirna García Méndez 
Error estándar (σ o e) 
El error estándar es la diferencia entre la media muestral y la media 
poblacional, está vinculado al error de muestreo. 
GRÁFICA 16 
DIAGNÓSTICO DE PROBLEMAS EN LA ALIMENTACIÓN 
GRÁFICA 17 
CURVA PLATOCÚRTICA 
Estadística descriptiva 61 
Ejercicio SPSS 
Para obtener las medidas de dispersión en SPSS de una muestra de 300 personas a 
las que se les aplicó la escala de depresión de Zung (1965) se llevan a cabo los 
siguientes pasos: 
Paso 1. En la base de datos se coloca el cursor en analyze, se presiona el botón 
izquierdo del mouse, aparece un menú en el que se coloca el cursor en descriptive 
statistics y se presiona el botón izquierdo del mouse, nuevamente se muestra un 
menú en el que se presiona con el botón izquierdo del mouse, frequencies. 
Paso 2. Al presionar frequencies, se abre un menú que contiene las variables de 
la investigación, se marca con el botón izquierdo del mouse la variable rangos 
(niveles de depresión). 
Paso 3. Una vez señalada la variable rangos, se coloca el cursor en el icono que 
está entre las variables de estudio y variable(s), se presiona el botón izquierdo del 
mouse, lo que resulta en que rangos aparece en el cuadro de variable(s). 
Posteriormente se coloca el cursor en el icono de statistics y se presiona el botón 
izquierdo del mouse. 
 Sofía Rivera Aragón 
62 Mirna García Méndez 
Paso 4. Al presionar el icono de statistics aparece un menú en el que se 
colocará el cursor en cada uno de los cuadros de las tres medidas
de dispersión -desviación estándar, varianza y rango- para después presio-
nar en cada cuadro con el botón izquierdo del mouse. De igual forma se 
Paso 3 
Estadística descriptiva 63 
Paso 5. Después de presionar las medidas de dispersión y la curtosis, se coloca 
el cursor en el icono de continue y se presiona con el botón izquierdo del mouse, de 
lo que resulta el menú del paso tres. En el menú del paso tres, se coloca el cursor 
en el icono de OK, se presiona el botón izquierdo del mouse y aparecen las medidas 
de dispersión y la curtosis con sus respectivos valores. 
coloca el cursor en el cuadro de kurtosis y se presiona el botón izquierdo del mouse. 
STATISTICS 
Rangos 
N Valid 
Missing 
330 
 22 
Std. Deviation .6458 
Variance .4171 
Kurtosis 6.138 
Std Error of Kurtosis .268 
Range 3.00 
Sofía Rivera Aragón 
Mirna García Méndez 64
Los valores de la tabla del SPSS indican que de los 330 casos analizados, 22 
quedaron fuera debido a que dejaron sin contestar varios de los reactivos que 
incluye la escala. Los valores de la desviación estándar y la varianza indican una 
distribución normal, la curtosis muestra que la mayoría de las personas se ubica 
en uno de los cuatro rangos de depresión, y el rango señala que de los cuatro 
intervalos de respuesta de la escala, el 3 fue el que obtuvo mayor frecuencia. 
Como parte final de este capítulo, la tabla 15 presenta las pruebas de la 
estadística descriptiva y los tipos de gráficas asociadas con el nivel de medición 
revisados en el capítulo uno. 
Estadística descriptiva 65 
 
TABLA 15 
ESTADÍSTICA DESCRIPTIVA 
 
Medidas de 
 Gráficas tendencia central 
Medidas de 
dispersión 
Correlación 
Nominal Barras 
Pastel 
Moda No hay Coeficiente Phl 
C de contingencia 
V de Cramer 
Ordinal Barras 
Pastel 
Moda 
Mediana 
No hay Tau b de Kendall 
Tau c de Kendall 
Gamma de KrusKal y 
Godman 
Spearman 
Incertldumbre 
Intervalar Ojiva 
Polígonos de 
frecuencia 
Histograma 
Moda 
Mediana 
Media 
1. Rango 
2. Error 
3. Desviación 
4. Varianza 
5. Sesgo 
6. Curtosis 
Eta 
Pearson 
Estadística inferencial
La estadística inferencial se basa en la prueba de hipótesis, se define como un 
conjunto de técnicas que permiten al investigador obtener conclusiones a partir 
de una muestra para después ser generalizadas a una población. De este modo, 
su principal función es la generalización en una población (parámetros) 
habitualmente en términos de probabilidad (Nunnally y Bernstein, 1995) a partir 
de las conclusiones obtenidas, resultado de la manipulación de variables en 
muestras observadas. 
Aplicaciones de la 
estadística inferencial 
a) Comparar parámetros. Un parámetro es cualquier característica de una 
población. 
b) Aplicar pruebas de hipótesis. 
Hipótesis conceptual 
 Deriva del marco teórico, parte de una teoría, un modelo teórico o un 
metanálisis. Son hipótesis que ya fueron planteadas por otro investigador. 
Ejemplo 
A mayor frustración mayor agresión (Dollar, Doob, Miller, Mowrer y Sears, 
1939). 
Hipótesis de trabajo 
Estas hipótesis se refieren a lo que espera encontrar el investigador a partir 
de un marco teórico. 
69
Ejemplo 
Existe relación entre el aprovechamiento escolar y la autoestima. 
Hipótesis estadísticas 
Se clasifican en nulas y alternas, presentan las siguientes características: 1. 
implican la relación entre variables, y 2. se plantean sólo cuando se aplica 
estadística en la investigación (véase tabla 16). Un punto importante de señalar 
es que en los estudios exploratorios no se deberán proponer ninguna de estas 
hipótesis (nulas y alternas). 
TABLA 16 
HIPÓTESIS ESTADÍSTICAS 
Tipo Notación Definición Formas Función 
Nula Ho Niega la relación o 
diferencia entre 
variables 
a) Comparación 
b) Relación 
Diferencias entre grupos 
Asociación entre variables 
Alterna H1 Presencia de la 
relación o la diferencia 
a) Comparación 
b) Relación 
I. Con dirección. Indica que 
uno de los parámetros es 
más bajo o más alto que 
otro. 
II. Sin dirección. Sólo 
compara grupos. 
II. Con dirección. Indica 
que las variables aumen-
tan o disminuyen. 
II. Sin dirección. Sólo 
establece relaciones. 
Sofía Rivera Aragón 
Mirna García Méndez 70
Ho de relación 
V1 = Agresión (X) 
v2 = Niveles de testosterona (Y) 
Ho = No existe relación entre agresión y el nivel de testosterona en hombres. 
Con notación estadística 
Ho: rxy = 0 
H1 de comparación sin dirección. Utiliza los dos lados de la curva. 
Estadística inferencial 71 
Ejemplos 
Ho de comparación 
Se identifica la variable dependiente (VD) y la independiente (VI) o de 
clasificación (VE). 
VD = Asertividad 
vc = Sexo: hombres y mujeres 
Ho = No existen diferencias estadísticamente significativas en la asertividad 
entre hombres y mujeres. 
Con notación estadísticaVD = Calidad de vida 
vc = Estado civil: casados y solteros 
H1 = Sí hay diferencias estadísticamente significativas en la calidad de vida 
entre solteros y casados. 
Con notación estadística 
Los solteros tienen mayor calidad de vida que los casados. Con notación 
estadística 
Sofía Rivera Aragón 
Mirna García Méndez 72
H1 de comparación con dirección. Se ocupa de un solo lado de la curva 
H1 de relación sin dirección 
V1 = identidad nacional (X) 
V2 - Edad (Y) 
H1 = Existe relación entre la identidad nacional y la edad en los uni-
versitarios. 
Con notación estadística 
H1 = rxy ≠ 0 
 H1 de relación con dirección 
H1 = a mayor identidad nacional mayor edad en los universitarios 
Con notación estadística 
H1 = rxy > + 0 
H1 = a mayor identidad nacional menor edad en los universitarios 
Con notación estadística 
H1 = rxy > - 0 
Clasificación de la estadística inferencial 
No paramétrico 
Es una estadística de distribución libre, se basa en frecuencias, porcentajes y 
rangos, estos últimos basados en rangos de ordenación los cuales son buenas 
medidas de variabilidad para muestras pequeñas, no así para muestras grandes. 
Las pruebas de la estadística no para- métrica se enfocan en las diferencias entre 
las medianas y parten de un modelo que especifica únicamente condiciones muy 
generales en torno a la distribución de la cual fue obtenida la muestra (Siegel y 
Castellan, 2003). 
Estadística inferencial 73 
Ventajas
a) Se puede aplicar a muestras pequeñas en las que la n > 4. 
b) Sus niveles de medición son nominal y ordinal. En el nivel nominal se 
pueden tratar datos que impliquen clasificación (sexo: hombre o mujer). En 
el nivel de medición ordinal, el investigador concluye que algunos sujetos 
de investigación tienen más o menos del atributo medido, sin determinar 
qué tanto más o qué tanto menos. 
c) Si se aplica a variables intervalares, éstas deberán ser convertidas en 
categorías. Por ejemplo: 
d) Está libre de parámetros. Se refiere a que su distribución es libre. 
Desventajas 
Cuando se aplica a variables intervalares sin ser convertidas en categorías, se 
infla el valor de la prueba y se comete el error estadístico conocido como error 
tipo 1 o alfa que consiste en rechazar la Ho cuando es verdadera, situación que 
conduce a conclusiones falsas. 
Dadas las características de la estadística no paramétrica, existe una 
diversidad de pruebas que pueden ser empleadas con base en los requisitos 
citados. En la tabla 17 se presentan las pruebas no paramétricas más utilizadas, 
así como una serie de elementos que facilitan la toma de decisiones con relación 
a las condiciones que se deben cubrir para emplear una u otra prueba. 
Sofía Rivera Aragón 
Mirna García Méndez 74
TABLA 17 
PRUEBAS DE LA ESTADÍSTICA NO PARAMÉTRICA 
Prueba Objetivo Nivel de 
medición 
Diseño Muestreo Instrumentos 
X2 
Bondad de 
ajuste 
Conocer la 
distribución de 
la muestra 
Nominal y 
ordinal 
De una muestra No 
probabi- 
lísticos 
Cuestionarios: 
abiertos cerrados 
Jerarquización 
observaciones 
Por homo-
geneidad 
Conocer si 
existen dife-
rencias entre 
dos o más gru-
pos 
Nominal y 
ordinal 
De dos o más 
muestras inde-
pendientes 
 
Indepen- 
dencia 
Conocer si 
existe relación 
entre dos o más 
variables 
Nominal y 
ordinal 
De una muestra 
Corrección de 
Yates 
Conocer dife-
rencias o aso-
ciación entre 
variables en 
muestras pe-
queñas 
Nominal y 
ordinal 
De una muestra o 
de dos muestras 
independientes 
 
McNemar Comparar si 
existen dife-
rencias antes y 
después de un 
evento 
Nominal y 
ordinal 
Pretest-postest 
Antes-después 
 Una sola muestra 
medida dos veces 
No proba-
bilístico 
Cuestionarios: 
abiertos cerrados 
jerarquización 
observaciones 
T de 
Wilcoxon 
Comparar si 
existen dife-
rencias antes y 
después de un 
evento 
Ordinal Pretest-postest 
Antes-después 
Una sola muestra 
medida dos veces 
No proba- 
bilístico 
Los mismos que 
en X2 y McNemar 
U de Mann 
Whitney 
Comparar si 
existen dife-
rencias entre 
dos grupos 
Ordinal Dos muestras in- 
depend ¡entes 
No proba-
bilístico 
Los mismos que 
en las pruebas 
a n t e r i o r e s , 
además de escalas 
Análisis de 
varlanza de 
KrusKall Wa-
llis 
Comparar si 
existen dife-
rencias entre 
tres o más gru-
pos 
Ordinal Más de dos 
muestras inde-
pendientes 
Probabilís- 
tico 
Escalas 
Estadística Inferencial 75 
Paramétrica 
La estadística inferencial paramétrica se sustenta en supuestos o parámetros 
y para poder emplearla es necesario cubrir los siguientes principios: 
1. Distribución normal. 
Indica que los grupos tienen una curva normal o mesocúrtica (esta curva 
se describe en el capítulo 2, figura 8). Con esta afirmación se asume 
que las muestras (n) con las que se está trabajando se han extraído de 
TABLA 17 
(Continuación) 
Prueba Objetivo Nivel de 
medición 
Diseño Muestreo Instrumentos 
Análisis de 
varianza de 
Friedman 
C o m p a r a r 
tres o más 
mediciones en 
un grupo 
Ordinal De medidas 
r e p e t i d a s 
Tres o más 
muestras re-
lacionadas 
No proba- 
bilístico 
Probabilís- 
tico 
Escalas 
Spearman rho 
(rs) coeficiente 
de asociación 
Conocer re-
laciones entre 
dos variables 
Ordinal De una sola 
muestra 
No proba- 
bilístico 
Probabllís- 
tico 
Escalas 
Phi Coeficiente 
de asociación 
Conocer re-
laciones entre 
dos variables 
N o m i n a l . 
Se aplica a 
tablas de 
contingencia 
de 2x2 (tablas 
pequeñas) 
De una sola 
muestra 
No proba- 
bilístico en 
m u e s t r a s 
grandes 
Pruebas* com-
paradas que se 
aplican en 
C de con-
tingencia 
Conocer re-
laciones entre 
dos variables 
N o m i n a l . 
Se aplica a 
tablas de 
contingencia 
mayores de 
2x2 (tablas me-
dianas) 
De una sola 
muestra 
No proba- 
bilístico 
Pruebas com-
paradas que se 
aplican en X2 
V de 
Cramer 
Conocer re-
laciones entre 
dos variables 
N o m i n a l . 
Corrección a la 
C de 
contingencia 
De una sola 
muestra 
No proba- 
bilístico 
Cuestionarios: 
abiertos 
cerrados 
jerarquización 
observaciones 
*La prueba Phi y la C de contingencia dependen de la X2.
Sofía Rivera Aragón 
Mirna O a roía Méndez 76
poblaciones normalmente distribuidas, si no es éste el caso, se dice que las 
pruebas estadísticas que dependen del principio do normalidad están 
viciadas, razón por la que las conclusiones obtenidas a partir de las 
observaciones de estas muestras estarán en tela de juicio. 
2. Homecedasticidad de varianza u homogeneidad de varianza. 
La distancia entre la calificación de un grupo y los de otro grupo deben ser 
iguales, esto es, la distancia de las X a todas las puntuaciones individuales. 
Este principio supone que las varianzas dentro de los grupos son es-
tadísticamente las mismas, o sea, que las varianzas son homogéneas de un 
grupo a otro (Kerlinger y Lee, 2001). Esta situación puede provocar el error 
estadístico tipo 2 o beta, que consiste en aceptar la Ho cuando es falsa. 
3. Selección y asignación aleatoria. 
Sólo se aplican muestreos probabilísticos entendidos como la técnica en la 
cual todos los sujetos tienen la misma probabilidad de ser elegidos. También 
en la estadística paramétrica se utiliza el muestreo no probabilístico, 
definido como aquel en el que las personas no tienen la misma probabilidad 
de ser elegidos. Sin embargo, al emplear alguna de las técnicas de muestreo 
no probabilístico es conveniente replicar los estudios. De acuerdo con 
Kerlinger y Lee (2001) el muestreo probabilístico no es necesariamente 
superior al no probabilístico en todas las situaciones. Refieren que en el 
primero el énfasis está en el método y la teoría que lo sustenta, mientras que 
en el segundo, el énfasis se encuentra en la persona que hace el muestreo. 
Puesto que no es el propósito de este apartado profundizar en las técnicas 
de muestreo, en la tabla 18 se mencionan algunas de ellas. 
4. La variable dependiente debe ser medida a nivelintervalar. 
Esto significa que las medidas deberán ser continuas con intervalos iguales, 
ejemplo, las escalas tipo Likert de estilos y estrategias de poder (Rivera y 
Díaz-Loving, 2001) y el inventario multifacético de satisfacción marital 
(Cañetas, 2000). Ambas son pruebas con cinco intervalos de respuesta. 
Estadística inferencial 77 
La tabla 19 muestra las pruebas paramétricas más empleadas por el 
investigador social, además de los criterios que se deben tomar en cuanta para 
emplear una u otra prueba. La revisión en detalle de algunas de estas pruebas se 
expondrá en el capítulo 5 de este texto. 
TABLA 18 
TÉCNICAS DE MUESTREO 
Técnicas de muestreo probabilístico Técnicas de muestreo no 
probabilístico 
Aleatorio simple Accidental 
 Aleatorio con reemplazo Intencional 
 Estratificado Por cuota 
 Por conglomerado 
 Estratificado 
TABLA 19 
PRUEBAS DE LA ESTADÍSTICA PARAMÉTRICA* 
Prueba Objetivo Nivel de 
medición 
Diseño Muestreo Instrumentos 
Coeficiente 
P r o d u c t o - 
m o m e n t o de 
Pearson 
Relacionar dos 
variables 
Intervalar De una sola 
muestra 
C o r r e l a c i o -
nal bivariado 
Proba bilis- 
tico: 
M u e s t r a 
grande 
Escalas 
Prueba t de 
student 
Discrimina-
ción de 
reactivos 
VD a nivel 
I n t e r v a l a
r 
De dos muestras 
independientes 
Probabilís- 
tico: 
M u e s t r a 
p e q ue ñ a n 
< 3 0 
Escalas 
 Comparar dos 
grupos 
VI {Nominal 
VC {y 
VE {Ordinal 
De dos muestras 
independientes 
 
 Comparar dos 
condiciones o 
mediciones 
Prueba post hoc 
del Anova 
 Dos muestras 
relacionadas 
pretest-pos- test 
Antes-después 
M u e s t r a 
grande n > 
30 
 
Sofía Rivera Aragón 
Mirna García Méndez 
78
Prueba Objetivo Nivel de 
medición 
Diseño Muestreo Instrumentos 
Anova 
(análisis de 
varianza) 
a) simple de 
una vía 
Compara tres o 
más grupos 
La VD debe ser 
in-ervalar 
Tres o más 
muestras in-
dependientes 
Probabilisti- 
co: 
Muestra 
grande 
Escalas 
b) factorial de 
dos vías 
Comparar dos o 
más variables 
Independientes 
con tres o más 
categorías 
vi {Nominal 
vc {y 
ve {Ordinal 
Factoriales Muestra 
grande 15 
sujetos míni- 
mo por cel-
dilla 
 
*VC se refiere a las variables de clasificación y VE a las variables de estímulo. 
 
Pruebas de la estadística no
paramétrica 
Cuando existe duda respecto a la normalidad de la población o 
cuando la población no es normal es conveniente emplear una prueba no
paramétrica, que como ya se mencionó en el capítulo 3 no parten del principio
de normalidad. Asimismo, las pruebas no paramétricas se clasifican en tres 
grupos: para una muestra simple, para muestras relacionadas y para muestras 
independientes. 
Debido a la amplia variedad de pruebas en cada uno de estos grupos, en 
este capítulo sólo se describirán las de mayor uso en la investigación en 
psicología. 
Pruebas para una muestra simple 
Generalmente las pruebas para una muestra simple son pruebas de bondad de 
ajuste que tienen como objetivo conocer la distribución de la muestra. 
Chi cuadrada (X2) 
La chi cuadrada es la prueba más empleada en la investigación en psicología. 
Esta prueba se aplica para comparar las frecuencias esperadas (poblacionales) 
y las frecuencias obtenidas (muestra) y a partir de esta comparación decidir si 
existen diferencias significativas. Las frecuencias esperadas se refieren a la 
hipótesis nula (Ho) y las frecuencias obtenidas son los resultados alcanzados 
por el investigador. De este modo, mientras mayor sea el valor de X2 menor es 
la probabilidad de que las frecuencias obtenidas se deban a la población, esto 
83
La fórmula para obtener las fe es 
fe= N /k 
donde: 
N = número de personas. 
k = número de categorías o columnas. 
De esta manera, el procedimiento para obtener la X2 consiste en restar cada 
frecuencia esperada de su correspondiente frecuencia obtenida, la diferencia de 
esta resta, se eleva al cuadrado y se divide entre la frecuencia esperada, estos 
resultados parciales se suman y se obtiene el valor de la chi cuadrada. 
Una vez que se obtiene el valor de la chi cuadrada, se requiere conocer los 
grados de libertad (gl) que se definen como la amplitud de variación contenida 
en una condición de investigación, lo que significa la posibilidad de variación 
(Kerlinger y Lee, 2001; Downie y Heath, 1973). Asimismo, junto con los grados 
de libertad, se requiere de una tabla de valores de X2 para conocer de acuerdo 
con los gl y al valor de la X2, si ésta es o no significativa. 
Sofía Rivera Aragón 
Mirna García Méndez 
84
significa que el valor de chi cuadrada es significativo si la diferencia entre las 
frecuencias esperadas y las frecuencias obtenidas es lo suficientemente grande 
(Siegel y Castellan, 2003; Levin y Levin, 2002). Su fórmula es: 
suma de todas las casillas, de la primera a la última. 
frecuencia obtenida, 
frecuencia esperada. 
donde: 
La fórmula para obtener los grados de libertad es: 
gl = k - 1 
donde: 
k = número de columnas de la tabla de contingencia 
También la X2 se utiliza en muestras independientes, en este caso se le 
conoce como prueba de homogeneidad y su objetivo es conocer si existen 
diferencias entre dos o más grupos. 
Un tercer uso de esta prueba, es como prueba de independencia, aquí su 
objetivo es conocer si existen relaciones entre dos o más variables en una 
muestra. 
Un cuarto uso es como prueba de corrección por continuidad de Yates, la cual le 
da mayor precisión a la X2 cuando tiene fe pequeñas. 
En los tres primeros casos -bondad de ajuste, homogeneidad, independencia- la chi 
cuadrada se obtiene con la misma fórmula. 
Reglas para su empleo 
1. Las observaciones deben ser independientes, no se puede observar o 
medir a la misma persona más de una vez. 
2. El nivel de medición utilizado será nominal u ordinal. 
3. Se aplicará en muestreos no probabilísticos. 
4. La muestra deberá ser mayor a 20 {N > 20). 
5. Si la muestra N < 20 entonces se utiliza la prueba de probabilidad exacta 
de Fisher. 
6. Las frecuencias esperadas deben ser mayores a 5. 
7. Si la frecuencia esperada es > 5 y < 10, entonces se aplica la corrección por 
continuidad de Yates. 
8. Si la N > 20 y < 40, se aplica la prueba de corrección por continuidad de 
Yates. 
9. Si la tabla de contingencias es de 1 X i columnas, se aplica la X2 de 
bondad de ajuste. 
Pruebas de la estadística
no paramétrica 85 
10. Si la tabla de contingencia ese de 2 x 2 y cumple los requisitos 7 y 8, se 
aplica la prueba de corrección por continuidad de Yates. 
Procedimiento 
1. Plantear las hipótesis estadísticas. 
2. Determinar la probabilidad con la que se trabajará: p = .05, p = .01. 
3. Distribuir los puntajes en la tabla de contingencia. 
4. Calcular las frecuencias esperadas: 
5. Aplicar la fórmula. 
6. Obtener los gl. 
7. Plantear regla de decisión. 
Este estudio tiene como propósito identificar el consumo de productos chatarra, 
en una muestra de 60 niños preescolares de la ciudad de México, así como la 
preferencia por alguno de estos productos. Entendiéndose por productos 
chatarra: pastelitos, frituras, refrescos y dulces. 
Paso 1. Hipótesis. 
Ho: no existen diferencias significativas en el consumo de productos 
chatarra en niños preescolares. 
H1: existen diferencias significativas en cuanto al consumo de productos 
chatarra por parte de los niños preescolares. 
Paso 2. Nivel de significancia p = .05. 
Paso 3. Distribución de los datos. 
Pastelitos Frituras Refrescos Dulces N 
 fo fe 
 15 15 
 fo fe 
 28 15 
 fo fe 
 0 15 
 fo fe 
 7 15 
 
60 
Paso 4. Cálculo de fe.
Sofía Rivera Aragón 
Mirna García Méndez 86
Paso 6. Obtener los grados de libertad. 
 gl = k - 1 
gl = 4 - 1 
gl = 3 
 
Paso 7. Reglade decisión. 
X2 ≥ X2t  H1 se acepta y Ho se rechaza. 
X2t = chi cuadrada en tablas. En la tabla A del apéndice, se busca en la parte 
horizontal, el nivel de significancia previamente establecido .05, y en la parte 
vertical los gl, que en este ejemplo fue de 1. Esto resulta en lo siguiente: 
17.18 ≥ 7.82. Se acepta la H1 
Pruebas de la estadística
no paramétrica 87
Paso 5. Desarrollo de la fórmula. 
Interpretación de resultados 
Se encontraron diferencias significativas X2 = 1 7 . 1 8 , p = .05 en el consumo de 
alimentos chatarra en los niños preescolares, lo que significa que difieren en el 
consumo de estos productos. 
Ejercicio SPSS 
Se empleará el mismo ejercicio desarrollado por la fórmula de preferencias de 
productos chatarra por niños preescolares. 
Paso 1. Se crea una variable que se denominará preferencias e incluirá 5 
niveles de respuesta: 1 = pastelitos; 2 = frituras; 3 = refrescos; y 4 = dulces. 
Debido a que incluir las respuestas de los 60 niños en la base de datos implica 
mucho espacio, únicamente se presentarán los datos de 10 niños, pero el análisis y 
los resultados se llevarán a cabo con el total de las respuestas de los participantes. 
De esta manera la base de datos queda así: 
Sofía Rivera Aragón 
Mirna García Méndez 88
Paso 2. Se coloca el cursor en Analyze, se presiona el botón izquierdo del mouse y 
se muestra un menú en el que se coloca el cursor en Non-parametric test, aparece un 
menú en el que se coloca el cursor en Chi- Square y se da clic. 
Paso 3. Al hacer clic en Chi-Square se abre un menú. 
Pruebas de la estadística 
no paramétrica 89
Paso 4. En el menú del paso 3, se marca con el cursor la variable preferencias, se 
da clic en el icono ubicado entre la variable preferencia y Test Variable List, 
inmediatamente la variable preferencias aparece en Test Variable List. 
 
Paso 5. Se da clic en OK y se muestran los resultados en tablas. 
PREFERENCIAS 
 Observed N Expected N Residual 
Pastelillos 15 15.0 .0 
Frituras 28 15.0 13.0 
Refrescos 10 15.0 -5.0 
Dulces 7 15.0 -8.0 
Total 60 
Sofía Rivera Aragón 
Mirna García Méndez 90 
Como se puede observar en la tabla 20, la X2 y la p difieren un poco de los 
resultados con la fórmula desarrollada, esto se debe a que en el SPSS las 
operaciones se realizan en forma precisa. 
Interpretación de resultados 
Se encontraron diferencias significativas X2 = 17.20, p = .001 en el consumo 
de alimentos chatarra en los niños preescolares, lo que significa que difieren en 
el consumo de estos productos. 
Pruebas para muestras relacionadas 
Estas pruebas implican dos medidas de una sola muestra. Se emplean cuando 
el investigador desea conocer si un tratamiento es mejor que otro o si 
dos tratamientos son diferentes. En este tipo de estudios se pueden em- 
TEST STATISTICS
 Preferencias
Chi-Squarea 17.200
 df 3
Asymp. Sig. .001
a.0 cells (.0%) have expected frequencies less than 5. The 
minimum expected cell frequency is 15.0. 
Estas tablas no se presentan en el reporte de investigación, los datos 
contenidos en ellas se pueden presentar en tablas en otro formato. 
TABLA 20 
DIFERENCIAS EN EL CONSUMO DE PRODUCTOS CHATARRA 
Pastelitos Frituras Refrescos Dulces X2 gl p 
15 28 10 7 17.20 3 .00 1 
N = 60. 
Pruebas de la estadística 
no paramétrica 
91 
plear dos grupos, sin embargo, los resultados que se obtengan pueden estar 
relacionados con un conjunto de eventos ajenos al tratamiento. Estos eventos se 
conocen como variables extrañas. Con la finalidad de controlar el efecto de 
estas variables extrañas, la persona puede fungir como su propio control, esto 
es, se le expone a ambas condiciones en diferentes ocasiones. Otra alternativa es 
el método de apareamiento, en el que se seleccionan pares de personas lo más 
semejantes posible en torno de las variables extrañas que puedan influir en los 
resultados del tratamiento. El inconveniente de este método es que depende de 
la capacidad del investigador para establecer que tan iguales son los pares 
(Siegel y Castellan, 2003). 
McNemar 
Es una prueba útil en los diseños antes-después (Álvarez, 1995) en los que cada 
sujeto se utiliza como su propio control. En la prueba de McNemar el objetivo es 
probar la significación de los cambios observados a partir de una tabla de 
contingencia 2x2 (Siegel y Castellan, 2003; Conover, 1980). 
Para probar la significancia de los cambios observados, los datos en la tabla 
expresan lo siguiente: 
Sofía Rivera Aragón 
Mirna García Méndez 
92
Los grados de libertad empleados en McNemar es 1. gl = 1. 
Para obtener resultados más precisos, se emplea la corrección por 
continuidad que permite eliminar la fuente de imprecisión que resulta de 
emplear una distribución continua para aproximarse a una distribución discreta 
(Siegel y Castellan, 2003). 
Con esta corrección, la fórmula se expresa de la siguiente manera: 
Pruebas de la estadística 
no paramétrica 93
Los signos positivo y negativo sólo se emplean para indicar que hubo un 
cambio sin connotación de bueno o malo. 
Como se observa en la tabla, A + D son las personas cuyas respuestas 
cambiaron. De esta manera, la Ho plantea que el número de cambios en cada 
dirección es el mismo. 
Sustituyendo la fórmula: 
suma 
frecuencia obtenida 
frecuencia esperada 
donde:
se obtiene lo siguiente: 
El signo | indica que al resultado de la resta de A - D, sin importar el signo + 
o - se le resta el 1. Por ejemplo, 6-15 = - 9, entonces se resta 9 - 1 = 8 
Reglas para su empleo 
• En mediciones nominales y ordinales. 
• Que el número total de cambios sea mayor a 10. 
• Cuando la frecuencia esperada es menor a 5, se debe usar otra prueba. 
Procedimiento 
1. Plantear las hipótesis estadísticas. 
2. Determinar la probabilidad con la que se trabajará p=05, p = . 0 1 . 
3. Distribuir los puntajes en la tabla de contingencia. 
4. Aplicar la fórmula. 
5. Plantear regla de decisión. 
Ejercicio 
Para evaluar la efectividad de un programa de intervención con 50 padres 
de familia de ciudad Nezahualcóyotl, se les preguntó si estaban de acuerdo o en 
desacuerdo con que sus hijos recibieran educación sexual en la escuela, tema a 
tratar como parte del programa a través de un taller. Antes del taller se les 
preguntó si estaban de acuerdo o en desacuerdo y al término del taller se les 
volvió a hacer la misma pregunta. 
Paso 1. Hipótesis 
Ho. La probabilidad de las madres que cambiaron de acuerdo a desacuerdo 
es igual a la probabilidad de las madres que cambiaron de desacuerdo a 
acuerdo en lo concerniente a que sus hijos reciban educación sexual en la 
escuela. 
H1. Después de haber asistido a un taller, las madres aceptan que sus hijos 
reciban educación sexual en la escuela. 
Paso 2. Nivel de significancia a emplear p = .05. 
Sofía Rivera Aragón 
Mirna García Méndez 94
Paso 5. Regla de decisión. 
X2 ≥ X2t H1 se acepta e Ho se rechaza. 
X2t = chi cuadrada tablas. En la tabla A del apéndice, se busca en la parte 
horizontal, el nivel de significancia previamente establecido .05, y en la parte 
vertical los gl, que en este ejemplo fue de 1. Esto resulta en que se acepta la H1. 
10.25 ≥ 3.84. Se acepta la H1. 
Interpretación de resultados 
Estos resultados indican que el taller influyó en la opinión, ya que las 
madres que estaban en desacuerdo con que sus hijos reciban educación 
sexual en la escuela, ahora en su mayoría están de acuerdo (X2 =10.25, p=.05) 
 Despues
 Desacuerdos Acuerdos
Antes Acuerdos 9 6
 Desacuerdos 5 30
Pruebas de la estadística 
no paramétrica 95 
Paso 3. Distribución de las respuestas de los padres antes y después del taller. 
Paso 4. Desarrollo de la fórmula. 
Ejercicio SPSS 
La base de datos contiene las respuestas de los 50 padres de familia; sin embargo, 
con fines prácticos en esta tabla únicamente se incluye la información de 20 
padres. La base de datos del paso 2, sólo incluye 10 de los 20 casos,

Continuar navegando

Otros materiales