Aplicacion de la estadística a la psicología

Psicología

•

UNAM

Saydi Herrera

30/7/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Psicología

254.842 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Ia edición, julio del año 2005
Ia reimpresión, junio del año
2012
©2005-2012 UNIVERSIDAD NACIONAL AUTÓNOMA DE
MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ZARAGOZA
©2005-2012
Por características tipográficas y de diseño
editorial
MIGUEL ÁNGEL PORRÚA, librero-editor
Derechos reservados conforme a
la ley
ISBN 970-701-587-X
Queda prohibida la reproducción parcial o total, directa o indirecta del
contenido de la presente obra, sin contar previamente con la
autorización por escrito de los editores, en términos de la Ley Federal del
Derecho de Autor y, en su caso, de los tratados internacionales
aplicables.
Esta investigación, arbitrada por pares académicos, se privilegia con
el aval de la institución propietaria de los derechos correspondientes.
A Osiris, Alan y Astrid, por lo que representan para mí. A
Javier y Monse, por ser lo más importante en mi vida.
En la realización de este libro participó un grupo de
personas con aportaciones que fueron valiosas para el
buen término de este proyecto: Cinthia Cruz del Castillo,
Angélica Romero Palencia, Gerardo Benjamín, Tonatiuh
Villanueva Orozco, Blanca Inés Vargas Núñez y Claudia
López Becerra.
También queremos agradecer a Argentina López
Becerra por ayudar a transcribir estos apuntes
MIRNA Y SOFÍA
Prólogo

La investigación en psicología es fundamental para el entendimiento del
comportamiento humano y para el desarrollo de programas e intervenciones
efectivas. Adicionalmente, la investigación representa un proceso complejo en el
que los fenómenos o constructos a investigar son multidimensionales,
multicausales y multideterminados. Hacer justicia a los eventos y problemáticas
estudiadas y asegurar la validez y confiabilidad de los hallazgos requiere de una
sofisticación conceptual y técnica profunda y sistemática. De hecho, es necesario
que diferentes investigadores indaguen distintos aspectos de un mismo problema,
obteniéndose así resultados que contribuyen a explicar el fenómeno de manera
integral.
La obtención de hallazgos contundentes y replicables implica una
conceptualización teórica sólidamente fundamentada y la realización de una serie
de pasos metodológicos y estadísticos sistematizados -protocolo científico- que
permitan sopesar la congruencia de los resultados con la realidad y su grado de
generalización. Como uno de estos pasos, el análisis estadístico de los datos,
implica la selección de pruebas estadísticas contingentes con el nivel de medición,
consistentes con el método planteado y aplicados e interpretados por el
investigador de manera apropiada.
Para los psicólogos que consumen investigación para sus intervenciones,
realizan investigaciones o están en formación, la tarea de elegir la prueba
estadística adecuada, requiere de apoyo didáctico. En este sentido, el que ese sea el
objetivo principal de este libro es un evento afortunado, lo cual sólo es superado
por el hecho de que su utilidad se multiplique al ser un texto planteado en
términos didácticos, sencillos y precisos, que les permita discernir la lógica
inherente a la estadística en general y a cada prueba en particular.
Con el propósito de arribar a un utensilio concreto, aplicable, práctico, claro y
útil, las autoras del texto desarrollan paso a paso las diferentes pruebas
estadísticas necesarias a la investigación psicológica, acompañadas de su manejo
minucioso a través del paquete estadístico para las ciencias sociales (SPSS),
acompañados de la forma correcta de interpretación de los resultados. Los
elementos de la obra hacen de ella una consulta indispensable, a partir de un
material básico y comprensible. Colateralmente, el libro ofrece la aplicación de la
estadística a partir de ejemplos relacionados a los problemas sociales del país.
Como punto final, además de recomendar ampliamente el uso de la obra, felicito a
las autoras y al programa PAPIME de la UNAM que a través del financiamiento del
proyecto EN314903 hizo este trabajo posible.
ROLANDO DÍAZ LOVING
Introducción

La curiosidad del ser humano por saber ¿por qué? y ¿para qué? de las
relaciones interpersonales, y cómo ocurren éstas en diferentes contextos -pareja,
familia, amigos, trabajo, escuela, etcétera- ha generado infinidad de explicaciones y
descripciones en tomo al tema. Algunas de estas explicaciones surgen de la vida
cotidiana y se asumen como hechos verdaderos, sin ser cuestionados; por ejemplo,
la aseveración de que las mujeres son emocionalmente débiles. Esta es una
afirmación compartida por muchos, sin embargo, carece de evidencia empírica y
sustento teórico que la respalde, elementos que marcan la diferencia entre las
aseveraciones populares y aquellas que están sustentadas teóricamente y que son
medidas rigurosamente.
En el ejemplo anterior surgen preguntas como, ¿todas las mujeres?, ¿las que
caen dentro de un rango de edad determinado?, ¿las solteras, casadas, viudas,
divorciadas o que viven en unión libre?, ¿las que tienen determinado nivel de
escolaridad?, ¿las que trabajan o las que son amas de casa?... De una afirmación
aparentemente simple emanan una serie de interrogantes, lo que conduce a uno de
los puntos centrales de la investigación: el objetivo que se quiere alcanzar, esto es,
para delimitar lo que se va a investigar es necesario tener claridad en el propósito
de la investigación.
En este escenario, la estadística es una herramienta que emplea el in-
vestigador para describir sus datos y para tomar decisiones. El tipo de prueba
estadística a usar dependerá del objetivo de la investigación, de su diseño, del
tamaño de la muestra y de sus hipótesis.
De esta forma, la estadística es una colección de hechos numéricos que
permiten hacer inferencias de una muestra a una población. Se clasifica en
descriptiva e inferential. La estadística inferencial a su vez se clasifica en no
paramétrica y paramétrica.
13
Así, la estadística es una herramienta imprescindible del psicólogo,
sobre todo cuando realiza investigación. Su aplicación en el campo de la
psicología no es nueva, tal como lo señala Downie y Heat (1973) quienes
refieren que en la década de 1880 Cattell se relacionó con estadísticos
europeos, evento que influyó en la aplicación de los métodos estadísticos
en el ámbito de la psicología.
De igual forma, tampoco es de sorprender la complejidad que re-
presenta comprender y aplicar las pruebas estadísticas a situaciones
específicas de investigación. Es el caso que al incursionar en el área de la
investigación surja una serie de interrogantes con relación a, ¿qué prueba
es la más adecuada para lo que se está investigando?, ¿el tipo de medición
elegido será el apropiado para la prueba elegida?, ¿el modelo estadístico
seleccionado: paramétrico o no paramétrico es congruente con el tamaño
de la muestra y con el tipo de medición empleado?
En fin, pueden ser muchas las dudas, y cuando se toman decisiones
inapropiadas los resultados y conclusiones derivados de esa investigación
pueden ser falsos, además de que se tiene el riesgo de cometer el error
estadístico tipo 1 (Alfa) o el error estadístico tipo 2 (Beta) los cuales se
describirán en este texto.
Precisamente este manuscrito tiene la intención de proporcionar a los
estudiantes y profesionales de la psicología un texto que incluya los ele-
mentos básicos de la estadística, descritos de una manera sencilla y apo-
yados con ejercicios, algunos de ellos, derivados de la investigación de la
psicología en México, tratando de evitar explicaciones complicadas, por lo
que las fórmulas que se presentan, así como el desarrollo de las mismas,
tienen como propósito que el lector conozca las operaciones que subya-
cen a cada una de éstas con la intención de que comprenda la lógica
mediante la cual se obtienen.
Al presente, por cuestiones prácticas es poco probable que el trata-
miento de los datos, derivados de una investigación,se realice en forma
manual -sobre todo cuando las muestras son grandes- lo que conduce a
utilizar el paquete estadístico SPSS que permite en poco tiempo obtener
Sofía Rivera Aragón
14 Mirna García Méndez
resultados precisos. Sin embargo, si las instrucciones dadas al SPSS fueron
erróneas, los resultados se verán alterados lo que conlleva a interpretacio-
nes equivocadas.
Con la intención de disminuir estos errores, después del desarrollo de
las fórmulas inherentes a los estadísticos incluidos en el libro, se exponen
ejercicios paso a paso de las pruebas estadísticas, a través del Statistical
Package for the Social Science (SPSS: paquete estadístico aplicado a las
ciencias sociales). En ambos casos -fórmulas desarrolladas y SPSS- cada
ejercicio concluye con la interpretación de los resultados.1
Con base en lo aquí expuesto, el libro inicia con la exposición de los ni-
veles de medición por considerarse fundamentales en la toma de decisiones
referentes a los pasos que proceden en la investigación. Posteriormente se
aborda lo relacionado con la estadística descriptiva en el capítulo 2, estadís-
tica que nos permite hacer una descripción de los hallazgos empíricos. En
este capítulo se hace énfasis en el tipo de distribución, medidas de tenden-
cia central y de variabilidad, a través de una serie de ejemplos que tienen
como objetivo facilitar la comprensión de los elementos expuestos.
En el capítulo 3 se expone lo que compete a la estadística inferen-
cial, la cual nos permite además de describir los datos encontrados, realizar
generalizaciones a partir de los hallazgos reportados en una muestra a una
población en términos de probabilidad. En esta parte del texto se presentan
los principios que sustentan a los dos grandes modelos estadísticos
derivados de la estadística inferencial: la estadística no para- métrica y la
estadística paramétrica.
Los capítulos 4 y 5 abordan de manera específica algunas de las
pruebas no paramétricas y paramétricas más empleadas por el investigador
social. En estos dos capítulos, la explicación de las pruebas es acompañada
por ejemplos que permitan una mejor comprensión de las mismas.
1Debido al uso de este sofware (SPSS), varias de las tablas reportadas en los diferentes
capítulos de este libro aparecerán en inglés.
Introducción 15
Como parte final pero no por ello menos importante, cabe destacar que el
contenido de este libro se basa en los apuntes de la cátedra sobre estadística,
dictada por la doctora Sofía Rivera Aragón, en el doctorado de psicología de la
Facultad de Psicología de la Universidad Nacional Autónoma de México. Es
conveniente denotar que para su publicación se contó con la autorización y
coautoría de la doctora Rivera Aragón.
Medición

Del o los objetivos de investigación derivan las fases subsiguientes del
proceso de investigación. Una de estas fases se refiere al tipo de medición
empleada para evaluar una o más variables de estudio, componente que tiene
una relación directa con la estadística empleada en el tratamiento de los
datos.
De esta manera la medición consiste en reglas que asignan símbolos a
objetos, de tal forma que a) representan numéricamente cantidades o
atributos, o b) definen si los objetos caen en las mismas o en diferentes
categorías con respecto a un atributo de medición. En esta definición, las
reglas se refieren a que la asignación de números sea explícita; y los atributos
denotan que la medición implica características particulares del objeto, esto
es, los objetos per se no pueden medirse, se miden sus atributos (Nunnally y
Bernestein, 1995). Nunnally y Bernestein, indican que los números
representan cantidades en escalas de medición, lo que significa que la
cuantificación implica qué tanto de un atributo está presente en un objeto.
En la literatura se mencionan cuatro niveles de medición, aunque en
psicología generalmente se emplean tres: nominal, ordinal e intervalar, los que
se describen a continuación.
Escalas de medición
Nominal
Es el nivel más bajo de medición de una variable en el que se le asignan
números a los objetos, personas o características que se deseen evaluar,
las cuales no pueden ordenarse o sumarse. Precisamente a todos los miem-
bros de un conjunto se les asigna el mismo valor numérico, e.g. al preguntarles a
100 ciudadanos del Distrito Federal, ¿para usted la infidelidad es positiva o
negativa? Se está empleando una medida nominal al registrar la frecuencia de las
respuestas, dándole el valor de 1 a la infidelidad positiva y el valor de 2 a la
infidelidad negativa, lo que se muestra en la tabla 1.
Esta medición coloca los casos dentro de categorías o conjuntos, y se cuenta la
frecuencia de ocurrencia, sin asignar el mismo valor a dos categorías, e.g. sexo, no
se puede clasificar a la misma persona como hombre y mujer.
Ordinal
Requiere que los objetos de un conjunto de variables puedan ser ordenados por
rangos respecto a una característica o propiedad. Los valores numéricos asignados
a los objetos ordenados se llaman valores de rango. En esta medición los números
no indican cantidades absolutas ni tampoco que los intervalos entre los números
sean iguales, por lo que marca la organización de los rangos pero no señala la
magnitud de las diferencias entre éstos, e.g. las etapas del desarrollo humano:
Niñez
Adolescencia
Adultez
Vejez
TABLA 1
OPINIÓN DE LOS CIUDADANOS DEL DISTRITO FEDERAL SOBRE LA INFIDELIDAD
Infidelidad Frecuencia
1 40
2 60
Sofía Rivera Aragón
20 Mirna García Méndez
Otro ejemplo es el ciclo de vida de la pareja de acercamiento-alejamiento
(Díaz-Loving, 1999):
1. Extraño/desconocido
2. Conocido
3. Amistad
4. Atracción
5. Pasión
6. Romance
7. Compromiso
8. Mantenimiento
9. Conflicto
10. Alejamiento
11. Desamor
12. Separación
13. Olvido
Como se puede observar en ambos ejemplos, no existe una distancia exacta
entre cada una de las etapas y tampoco se sabe con exactitud cuándo termina una
e inicia la siguiente.
Intercalar
Esta medición posee las características de las escalas nominales y ordinales, de
manera particular las de rango. Las distancias numéricamente iguales de los
intervalos representan distancias iguales en la propiedad de la variable que se
mide. En este nivel de medición se incluyen las escalas tipo Likert, e.g. la
clasificación de la inteligencia a través de la escala WAIS (Barragán, Benavides,
Brugman y Lucio, 1988) presentada en la tabla 2.
Tal como se observa en la tabla 2, existe la misma distancia entre los
diferentes niveles de medición de la inteligencia, lo que indica una distribución
igual de los intervalos de medición.
Medlción 21
De razón
Es el nivel más alto de medición de una variable. Es una medida poco empleada en
la psicología, por ende, no se hablará más de él.
Con base en lo expuesto, a continuación se presenta un ejemplo que involucra
tres de los cuatro niveles de medición: nomina], de rangos e intervalar.
Ejemplo
En una investigación que tiene por objetivo conocer la relación entre la
satisfacción marital, la escolaridad y el sexo. El sexo (hombres y mujeres) es una
variable nominal en la que a los hombres (H) se les asigna el valor numérico de 1 y
a las mujeres (M) se les asigna el valor numérico
2. El nivel de escolaridad (primaria, secundaria, preparatoria, licenciatura y
posgrado) es una variable ordinal que va de menor a mayor escolaridad, ordenada
de la siguiente manera:
Primaria 1
Secundaria 2
Preparatoria 3
Licenciatura 4
Posgrado 5
TABLA 2
CLASIFICACIÓN DE LA INTELIGENCIA EN ADULTOS
Coeficiente intelectual Clasificación
130 o más Muy superior
120-129 Superior
110-119 Normal brillante
90-109 Normal
80-89 Subnormal
70-79 Limítrofe
50-69 Deficiente mental superficial
30-49 Deficiente mental medio
29 o menos Deficiente mental profundoSofía Rivera Aragón
22 Mirna García Méndez
La satisfacción marital se medirá con el IMSM integrado por 47 enunciados
positivos, con intervalos de respuesta del 1 al 5 (Cortés, Reyes, Díaz-Loving, Rivera
y Monjaraz, 1994).
Me gusta mucho = 5 Me
gusta = 4
Ni me gusta, ni me disgusta = 3 Me
disgusta = 2 Me disgusta mucho = 1
Medición 23
TABLA 3
REPRESENTACIÓN DE LOS DIFERENTES NIVELES DE MEDICIÓN
Clasificación Definición Función Propiedad Estadística
empleada
Ejemplo
Nominal Categoriza
una variable.
Nombra
categorías.
Igualdad No
paramétrica.
Estado civil:
solteros, ca-
sados, unión
libre, viudos,
divorciados:
sexo: hombres y
mujeres.
Ordinal Ordena una
variable.
Jerarquiza las
categorías
> o <
(mayor o
menor)
No
paramétrica
Escolaridad:
primarla, se-
cundarla, pre-
paratoria.
Intervalo Conoce la
distancia entre
intervalos.
Cuantifica una
variable.
Cero
Relativo.
Paramétrica. Inteligencia:
limítrofe, nor-
mal, nomal
brillante, su-
perior.
Razón Conoce la
proporción
entre las va-
riables.
Cuantifica una
variable.
Cero
absoluto.
Paramétrica. Las medidas de
distancia:
metro, decá-
metro, hectó-
metro y
kilómetro.
Por sus características, este inventario evaluará la satisfacción marital de
manera intervalar, debido a que medirá las distancias o intervalos del constructo
de interés.
Las variables nominal (sexo) y ordinal (escolaridad) son generalmente
denominadas variables sociodemográficas o de clasificación por el investigador.
Ahora bien, si la satisfacción marital se mide preguntándoles a las personas si
están o no satisfechas con su relación de pareja, la respuesta será dicotómica Sí o
No, convirtiéndose la medición en nominal. Los resultados que se obtendrán serán
frecuencias en relación con el número de hombres y mujeres que están satisfechos
o insatisfechos maritalmente. Este ejemplo denota que el tipo de medición utili-
zada, estará en función de los objetivos que pretenda alcanzar el investigador.
De esta manera, se observa que cada una de las escalas de medición tiene
características y funciones específicas, las que se presentan en la tabla 3.
Estadística descriptiva
La estadística descriptiva permite conocer la distribución de los datos a partir de
la cuantificación de los atributos de una categoría o variable. De acuerdo con
Nunnally (1995) no necesariamente incluye la generalización.
Sus funciones son:
a) Conocer el tipo de distribución.
b) Representación gráfica.
c) Obtener medidas de tendencia central (toma de decisiones).
d) Calcular medidas de variabilidad.
Conocer el tipo de distribución
1. Frecuencia absoluta (f)
2. Frecuencia relativa (fr %)
3. Frecuencia ajustada (fa %)
4. Frecuencia acumulada (fa)
La frecuencia absoluta describe objetos, la relativa los ordena en porcentajes,
la ajustada recalcula las frecuencias absolutas y relativas, eliminando datos con
base en valores perdidos o missing, y la acumulada los ordena de mayor a menor o
viceversa.
Estas frecuencias se obtienen en el programa estadístico SPSS en cualquiera de
sus versiones. Después de haber elaborado una base de datos e insertado los datos
en bruto, se le pide al SPSS las frecuencias de la variable de estudio y despliega los
cuatro tipos de frecuencia en una tabla.
27
Para comprender la lógica de las operaciones involucradas en la
distribución de frecuencias, se expondrá un ejemplo a partir del cual se
explicará la forma en la cual se obtiene cada una de las frecuencias.
Ejemplo
Se encuesto con un cuestionario abierto a una muestra de 300 personas,
hombres y mujeres, sobre el significado del funcionamiento familiar. Una vez
que se obtuvieron los datos se procedió a su organización, lo que se hizo
mediante una distribución de frecuencias, tal como se observa en la tabla 4.
Esta tabla muestra el total de hombres y mujeres que participaron en la
investigación, sin embargo, para identificar la preferencia de hombres y
mujeres por uno u otro de los significados del funcionamiento familiar, se
obtuvieron las frecuencias absolutas de ocurrencia de respuesta por sexo.
Estos resultados se presentan en la tabla 5.
En la tabla 5 se enuncian las frecuencias absolutas (f) de ocurrencia de
respuesta de la categoría de análisis sexo: hombres (H) y mujeres (M), en
cada uno de los significados generales de funcionamiento familiar. En
este ejemplo la muestra no tiene una distribución igual en cuanto al nú-
mero de H y M incluidos, por lo que para comparar a los dos grupos aun
TABLA 4
TOTAL DE HOMBRES Y MUJERES QUE OPINARON SOBRE EL SIGNIFICADO DEL
FUNCIONAMIENTO FAMILIAR
Sexo f
Hombres 144
Mujeres 156
Total 300
Sofía Rivera Aragón
Mirna García Méndez 28
TABLA 5
FRECUENCIAS DEL SIGNIFICADO DE FUNCIONAMIENTO FAMILIAR EN HOMBRES Y
MUJERES
Hombres Mujeres
Significados generales f f
Organización y estructura 25 20
Emocional-valorativa 44 66
Afectivo-funcional 53 54
Funcional 16 13
Afectiva 6 3
total 144 156
cuando existen diferencias en su tamaño se emplea la frecuencia relativa (fr %).
La frecuencia relativa (fr %) se refiere a la ocurrencia de los niveles de una
categoría -en este ejemplo (H y M)- por cada 100 casos. Su cálculo se obtiene al
multiplicar cualquier proporción dada por 100 (Levin y Levin, 2002).
Siguiendo con el ejemplo de los significados generales del funcionamiento
familiar, para obtener la frecuencia relativa de los H que respondieron el
cuestionario, se multiplica 100 por 144 y el resultado se divide entre 300 que es el
total de personas que participaron en la investigación, y se extrae la fr que es de 48
por ciento.
La tabla 6 presenta que del total de la muestra, el 48 por ciento son hombres y
el 52 por ciento son mujeres.
Estadística descriptiva 29
Con respecto a las respuestas de la muestra en relación con los significados
del funcionamiento familiar, éstas varían tal como se observa en la tabla 5 por lo
que también se aplica la frecuencia relativa al igual que en la categoría de sexo. Los
datos se presentan en la tabla 7.
TABLA 7
FRECUENCIAS ABSOLUTA Y RELATIVA DEL SIGNIFICADO DE FUNCIONAMIENTO
FAMILIAR EN HOMBRES Y MUJERES
Hombres
f fr(%)
Mujeres
f r(%)
Organización y estructura 25 17.4 20 12.8
Emocional-valorativa 44 30.6 66 42.3
Afectivo-funcional 53 36.8 54 34.6
Funcional 16 11.1 13 8.3
Afectiva 6 4.2 3 1.9
Total 144 100 156 100
La frecuencia ajustada recalcula la frecuencia absoluta quitando datos o con
base en elementos perdidos que generalmente se computan con cero (en el SPSS
aparecen como missing). Estos elementos perdidos se refieren a los enunciados o
preguntas que la muestra no respondió. Con base en el ejemplo del significado del
funcionamiento familiar en H y M, la tabla 8 presenta las frecuencias absolutas,
las relativas y las ajustadas.
TABLA 6
FRECUENCIAS ABSOLUTA Y RELATIVA DE LA CATEGORÍA SEXO
Sexo f fr (%)
Hombres 144 48.0
Mujeres 156 52.0
Total 300 100
Sofía Rivera Aragón
30 Mirna García Méndez
TABLA 8
FRECUENCIAS ABSOLUTA, RELATIVA Y AJUSTADA DEL SIGNIFICADO DE
FUNCIONAMIENTO FAMILIAR EN HOMBRES Y MUJERES
Significados generales Hombres Mujeres
f fr (%) fa (%) f fr (%) fa (%)
Organización y estructura 25 17.4 17.4 20 12.8 20
Emocional-valorativa 44 30.6 30.6 66 42.3 86
Afectivo-funcional 53 36.8 36.8 54 34.6 140
Funcional 16 11.1 11.1 13 8.3 153
Afectiva 6 4.2 4.2 3 1.9 156
Total 144 100 100 156 100
En esta tabla la fr y fa (%) son iguales debido a que no hubo valores perdidos.
Con fines de ejemplificar la fa (%) la tabla 9 muestra las frecuencias del estado civil
de la muestra.
Tabla 9
FRECUENCIAS DEL ESTADO CIVIL DE HOMBRES Y MUJERES
Estado civil f fr(%) fa (%)
Casado 120 40.0 40.3
Soltero151 50.3 50.7
Unión libre 13 4.3 4.4
Divorciado 8 2.7 2.7
Separado 3 1.0 1.0
Viudo 3 1.0 1.0
Total 298 99.3 100.0
Valores perdidos
(missing) 0
2 .7
Total 300 100.0
Estadística descriptiva 31
La frecuencia acumulada (la) ordena los puntajes del total de casos de una
categoría. Se obtiene al sumar la frecuencia de un puntaje dado a la frecuencia de
la categoría debajo de ella. Al resultado de esta operación, se suma en forma
acumulativa el puntaje de la categoría debajo de ella, y así sucesivamente hasta
tener incluidos el total de los casos. Siguiendo el ejercicio de los significados de
funcionamiento familiar, la tabla 10 presenta las frecuencias absolutas, relativas,
ajustadas y acumuladas por hombres y mujeres.
Ejercicio SPSS
Para obtener los cuatro tipos de frecuencia en SPSS de las 300 personas, se realizan
los siguientes pasos:
Paso 1. En la base de datos se coloca el cursor en Analyze, se presiona el
botón izquierdo del mouse.
Paso 2. Al presionar Analyze, aparece un menú en el que se coloca el cursor
en Descriptive Statistics, se presiona con el botón izquierdo del mouse y aparece
otro menú, se coloca el cursor en Frequencies y una vez más se presiona con el
botón izquierdo del mouse.
TABLA 10
FRECUENCIAS ABSOLUTAS, RELATIVAS, AJUSTADAS Y ACUMULADAS DE HOMBRES Y
MUJERES CON RELACIÓN AL SIGNIFICADO DEL FUNCIONAMIENTO FAMILIAR
Significados
generales
Hombres Mujeres
f fr (%) fa (%) fa f fr(%) fa (%) fa
Organización
y estructura 25 17.4 17.4 17.4 20 12.8 12.8 12.8
Emocional-valorativa 44 30.6 30.6 47.9 66 42.3 42.3 55.1
Afectivo-funcional 53 36.8 36.8 84.7 54 34.6 34.6 89.7
Funcional 16 11.1 11.1 95.8 13 8.3 8.3 98.1
Afectiva 6 4.2 4.2 100.0 3 1.9 1.9 100.0
total 144 100 100 156 100 100
Sofía Rivera Aragón
Mirna García Méndez 32
Paso 3. Al presionar Frequencies, se abre un menú que contiene las
variables de la investigación, se marca con el botón izquierdo del mouse la
variable siggene (significados generales del funcionamiento familiar).
Estadística descriptiva 33
Paso 4. Una vez señalada la variable siggene, se coloca el cursor en el
icono que está entre las variables de estudio y variable(s), se presiona el bo-
tón izquierdo del mouse, de esta operación siggene aparece en el cuadro de
variable(s).
Paso 5. Se coloca el cursor en el icono de OK, se presiona el botón iz-
quierdo del mouse obteniéndose los cuatro tipos de frecuencias, en donde:
frequency es frecuencia absoluta, percent es frecuencia relativa, valid percent
es frecuencia ajustada y cumulative percent es frecuencia acumulada.
Sofía Rivera Aragón
34 Mima García Méndez
Estos resultados indican que los significados de funcionamiento familiar con
mayor ocurrencia de respuesta fueron el emocional-valorativo y el afectivo-
funcional.2
Una vez descritos los cuatro tipos de frecuencias, se proseguirá con la
distribución de frecuencias agrupadas, las que se emplean para incluir las
frecuencias absolutas en intervalos de clase (Levin y Levin, 2002; Downie y Heat,
1973). Estos intervalos de clase son comúnmente empleados cuando la
distribución de frecuencia es tan amplia que resulta poco práctica. Es el caso del
ejemplo de la tabla 11 que presenta una distribución de frecuencias por edad en
una muestra de
351 personas, que varía de 21 a 60 años.
La tabla 11 indica que se tiene una persona de 21 años, dos personas de 22
años, 13 personas de 23 años y así sucesivamente.
Con el propósito de que los datos tengan una presentación sencilla y clara, se
obtienen los intervalos de clase que para este caso es de cinco, tal como se observa
en la tabla 12. La decisión del tamaño del intervalo es responsabilidad del
investigador, quien generalmente parte de su base de datos y de los objetivos de su
investigación.
2Con fines didácticos se presentarán las tablas del SPSS, aunque éstas no se reportan en
una investigación, se abstraen los datos que el investigador desea resaltar y se muestran en
otro formato.
SIGNIFICADOS GENERALES
Valia Cumulative
Frequency Percent Percent Percent
Valid organización
y estructura 45 15.0 15.0 15.0
emocional-valorativa 110 36.7 36.7 51.7
afectivo-funcional 107 35.7 35.7 87.3
funcional 29 9.7 9.7 97.0
afectiva 9 3.0 3.0 100.0
Total 300 100.0 100.0
Estadística descriptiva 35
A su vez los intervalos de clase tienen un límite inferior y un límite superior
(véase tabla 13).
Como se observa en la tabla 13, el límite inferior del intervalo de edad 21-25 es
20.5 y su límite superior es 25.5, que también es el límite inferior del intervalo 26-
50, esto es, el límite superior de cada uno de los intervalos se convierte en el límite
inferior del intervalo subsiguiente.
TABLA 11
DISTRIBUCIÓN DE EDAD POR FRECUENCIAS EN HOMBRES Y MUJERES.
Edad f Edad f Edad f Edad f
21 1 31 15 41 8 51 2
22 2 32 18 42 1
1
52 5
23 13 33 16 43 7 53 6
24 13 34 13 44 7 54 1
25 11 35 16 45 4 55 2
26 17 36 9 46 7 56 0
27 1 1 37 18 47 4 57 2
28 13 38 14 48 3 58 0
29 19 39 15 49 8 59 0
30 15 40 13 50 8 60
Total
4
351
TABLA 12
DISTRIBUCIÓN DE EDAD POR INTERVALOS EN HOMBRES Y MUJERES
Intervalo de clase f
56-60 6
51-55 16
46-50 30
41-45 37
36-40 69
31-35 78
26-30 75
21-25 40
Total 351
Sofía Rivera Aragón
Mirna García Méndez 36
Representación gráfica
Los resultados que se obtienen de la investigación se pueden representar en tablas
o gráficas, pero nunca se deberán emplear ambas alternativas para presentar los
mismos datos; por ejemplo, si la escolaridad de la muestra se presenta en tablas,
ya no se utilizará la figura, porque ello implica repetir la información. Hay
investigadores que se inclinan por el uso de figuras debido a que atraen la atención
visual del observador.
Una de las características de las gráficas consiste en que se basan en una
recta numérica (véase gráfica 1).
TABLA 13
LÍMITES SUPERIOR E INFERIOR DE LOS INTERVALOS DE EDAD EN UNA
MUESTRA DE 351 SUJETOS
Limits inferior Intervalo de clase Límite superior
55.5 56-60 60.5
50.5 51-55 55.5
45.5 46-50 50.5
40.5 41-45 45.5
35.5 36-40 40.5
30.5 31-35 35.5
25.5 26-30 30.5
20.5 21-25 25.5

GRÁFICA 1
REPRESENTACIÓN DE LA RECTA NUMÉRICA
Estadístico descriptiva 37
Las gráficas que se utilizan con mayor regularidad son:
1. Barras
2. Pastel
3. Histograma
4. Ojivas
5. Polígonos de frecuencia
Las gráficas de barras y pastel se aplican únicamente a variables nominales y
ordinales; mientras que los histogramas, ojivas y polígonos de frecuencia se
emplean en variables ordinales, intervalares y de razón.
Gráfica de barra
En esta figura no hay continuidad en las barras cuando se emplea en datos
nominales, razón por la que están separadas. La gráfica 2 muestra el grado de
escolaridad de los 300 sujetos a los que se les aplicó el cuestionario abierto del
significado de funcionamiento familiar. Los números que aparecen al interior de
cada una de las barras son opcionales, se incluyen si el investigador quiere indicar
el número de sujetos que corresponde a cada nivel educativo. Así el número 22 que
aparece en la barra de primaria, indica que de la muestra total de 300 personas,
22 de ellas tienen educación primaria.
La gráfica 3 presenta las cinco categorías que resultaron de la aplicación del
cuestionario abierto del significado de funcionamiento familiar (organización y
estructura, emocional-valorativa, afectivo-funcional, funcional y afectiva) así como
la distribución de la muestra en cada categoría.
La diferencia entre las gráficas 2 y 3, es que en la gráfica 2 cada barra muestra
el número exacto de sujetos ubicados en cada grado escolar, mientras que en la
gráfica 3 se observa de manera general la distribución de la muestra en las cinco
categorías de funcionamiento familiar.La elección de una u otra figura está en
función de lo que el investigador quiera resaltar de sus resultados.
Sofía Rivera Aragón
Mirna García Méndez 38
GRÁFICA 2
NIVEL DE ESCOLARIDAD
GRÁFICA 3
DISTRIBUCIÓN DE LA MUESTRA EN LAS CATEGORÍAS DE
FUNCIONAMIENTO FAMILIAR
Estadística descriptiva 39
Gráfica de pastel o de sectores
Se utiliza con frecuencias absolutas y relativas, es útil para mostrar di-
ferencias de frecuencias en categorías de nivel nominal. La gráfica 4
presenta la variable ocupación de una muestra de 352 personas, hombres y
mujeres del Distrito Federal.
Gráfica 4
OCUPACIÓN DE HOMBRES Y MUJERES
Cada sección de la gráfica tiene el número de individuos agrupados por
cada uno de los cinco tipos de ocupación.
También con la figura de pastel se puede presentar la distribución de la
muestra con porcentajes, como se aprecia en la gráfica 5. Del total de las
352 personas que integran la muestra, su escolaridad se distribuye de la
siguiente manera: 18 por ciento tiene primaria, 36 por ciento secundaria,
31 por ciento preparatoria y 25 por ciento licenciatura.
Gráfica de histograma
Se emplean en variables continuas3 y se elaboran con base en el límite
inferior del intervalo. La gráfica 6 muestra los intervalos de edad de la
3 Una variable continua es aquella que asume un conjunto ordenado de valores dentro de un
rango (Kerlinger y Lee, 2001).
Sofía Rivera Aragón
40 Mirna García Méndez
GRÁFICA 5
NIVELES DE ESCOLARIDAD EN HOMBRES Y MUJERES
muestra de 351 sujetos de las tablas 12 y 13. Las barras están unidas por-
que denotan continuidad del intervalo de menor edad (21-25) al de mayor
edad (56-60).
GRÁFICA 6
INTERVALOS DE EDAD EN UNA MUESTRA DE 351
HOMBRES Y MUJERES
Estadística descriptiva 41
Otro ejemplo relacionado con los histogramas es el caso del cons-
tructed esperanza, medida por una escala cuyos intervalos de respuesta
van del 1 al 5. Esta escala se constituye por dos dimensiones: importancia y
probabilidad, cada una con 10 factores (Vargas, García-Méndez, Díaz-
Loving y Rivera, 2004). El histograma de la figura 7 muestra el com-
portamiento de uno de los factores de probabilidad -ayuda paterna- en una
muestra de 300 personas del D.E
GRÁFICA 7
NÚMERO DE PERSONAS POR INTERVALO DE RESPUESTA EN EL FACTOR DE AYUDA
PATERNA EN LA ESCALA DE ESPERANZA
Gráfica de ojiva o de polígono de
frecuencia acumulada
Se basa en la frecuencia absoluta y se grafica con el límite superior. En esta
figura, la línea que conecta los puntos es ascendente, razón por la que no
toca la línea base horizontal (Downie y Heath, 1973). La gráfica 8 presenta
los rangos de edad de una muestra de 351 personas, rangos distribuidos
con base en el límite superior presentado en la tabla 13 de este capítulo.
Sofía Rivera Aragón
42 Mirna García Méndez
GRÁFICA 8
RANGOS DE EDAD
Gráfica de polígonos de frecuencia
Se conoce también como curva. Es más fácil de graficar después de hacer
un histograma. Un ejemplo de polígonos de frecuencia se expone en la
gráfica 9, en una muestra de 168 parejas heterosexuales, cuyos años de
unión se distribuyeron por rangos.
Gráfica 9
RANGOS AÑOS DE UNIÓN
Estadística descriptiva 43
Obtener medidas de tendencia central
Es común en el ámbito de la investigación, querer saber lo típico o el
promedio en el que se encuentra la muestra de estudio, con la finalidad de
describirla en forma global. Este promedio o valor se conoce como medida
de tendencia central debido a que se encuentra en el centro de una
distribución en la que se localizan la mayoría de los puntajes de la muestra
(Levin y Levin, 2002). La forma de obtener este promedio es a través de las
medidas de tendencia central: media, mediana y moda expuestas en la
tabla 14.
1. Media → es un promedio.
2. Mediana → divide en dos a la muestra.
3. Moda → es el valor que se repite con mayor frecuencia.
Tabla 14
MEDIDAS DE TENDENCIA CENTRAL
Representación Nivel de medición Exactitud
Paramétrica
No paramétrica
X μ (media) Intervalar
Md (mediana) Ordinal
Mo (moda) Nominal
Exacta
Variable
Inestable
Como se observa en la tabla 14 es usual emplear letras latinas para re-
presentar las características de una muestra y las letras griegas para los
parámetros de una población (Downie y Heath, 1973). En el caso de la tabla
14, la X(media) es un estimador debido a que es un valor que representa
una característica de la muestra, y la μ (media) es un parámetro, porque es
un valor que representa las características de una población.
Estas medidas de tendencia central son empleadas en la toma de
decisiones e indican el punto medio de una distribución, tal como se
observa en la gráfica 10.
44
Sofía Rivera Aragón
Mirna García Méndez
GRÁFICA 10
DISTRIBUCIÓN NORMAL
Media
La media aritmética X es la medida de tendencia central más utilizada en la
investigación, se obtiene al sumar el total de puntajes obtenido por la muestra,
dividido entre el número total de la muestra (Clark-Carter, 1997; Levin y Levin,
2002; Downie y Heath, 1973). Su fórmula es:
Estadística descriptiva 45
La media.
La suma expresada por la letra griega sigma
Datos crudos
Número de casos
Donde:
Esta fórmula se emplea en datos no agrupados (datos crudos) en muestras
pequeñas.

Ejemplo 1
Conocer la media de edad de una muestra de diez sujetos
Cuando se trabaja con datos agrupados por frecuencias o por intervalos y con
muestras grandes, la media se obtiene con la siguiente fórmula:
La media.
La suma expresada por la letra griega sigma
Los puntajes en crudo de la muestra
Un puntaje multiplicado por su frecuencia de ocurrencia
La suma de los fx
Número de casos
Sofía Rivera Aragón
Mirna García Méndez 46

donde:
Ejemplo 2
Se aplicó a una muestra de 330 hombres y mujeres la escala de depresión de Zung
(1965) (SDS).4 La presencia o ausencia de depresión se evaluó con base en cuatro
niveles:
1 = < 50% sin depresión
2 = > 50% depresión leve
3 = > 60% depresión moderada
4 = > 70% depresión grave
Primero se obtienen las frecuencias de ocurrencia en cada uno de los niveles de
depresión.
Niveles de depresión f
1 264
2 45
3 14
4 7
Después se obtiene la fx, al multiplicar cada una de las frecuencias por el nivel
de depresión correspondiente.
4SDS son las siglas del nombre de la escala en inglés: Self-Rating Depression Scale.
Estadística descriptiva 47
Esta media de 1.3 indica que la mayoría de los 330 sujetos se ubican en el
nivel 1, lo que significa que en promedio la muestra no tiene depresión.
Ejemplo 3
Para obtener la media de años de unión de una muestra de 352 sujetos que
vivían con una pareja al momento de la investigación, los datos se agruparon en
intervalos. Una vez derivados los intervalos, se obtiene la marca de clase (Mx) o
punto medio de cada intervalo donde 33 es el, punto medio del intervalo 31-35
porque 33 + 2 = 35 y 33- 2 = 31.
Intervalo Mx
31-35 33
26-30 28
21-25 23
16-20 18
11-15 13
6-10 8
1-5 3
Enseguida se obtiene la frecuencia de ocurrencia (f) de cada intervalo, así en
el intervalo de 26-30 años de unión, se encuentran 24 personas.
Intervalo Mx f
31-35 33 8
26-30 28 24
21-25 23 34
16-20 18 49
11-15 13 84
6-10 8 110
1-5 3 43
Sofía Rivera Aragón
Mirna García Méndez 48
Posteriormente se multiplica cada frecuencia por su respectiva Mx y
se consiguen de esta manera las fx.
De esta manera se concluye que la media deaños de unión de esta muestra es
de 13.3.
Mediana
La mediana (Md) es el valor medio de la distribución, divide el total de los casos
en dos, razón por la que se dice que divide en dos a la muestra, dejando el mismo
número de casos a cada lado de ella (Downie y Heath, 1973).
Cuando se tiene un número impar de casos, la Md se ubica exactamente a la
mitad de la distribución. En los datos que a continuación se presentan, la Md de
edad de los 145 sujetos es de 21 años y le quedan tres rangos de edad hacia arriba
y tres rangos de edad hacia abajo.
Edad f
18 21
19 22
20 32
21 26
22 14
23 18
24 12
n = 145
Estadística descriptiva 49
Una vez obtenida la fa se localiza la posición de la Md 73 en la columna
de la fa. El número más cercano al 73 es el 70 por lo que la Md de edad es 21.
Si el número de casos es par, entonces se procede de acuerdo con el
siguiente ejemplo. En una muestra de 90 sujetos, la posición de la Md 45.5 se
ubica entre las fa 35-50 por lo que la Md es de 10.5 años de escolaridad,
situada a la mitad de la distribución.
Moda
La moda (Mo) es una medida de tendencia central para datos no agru-
pados, cuyo valor se presenta más veces. En el ejemplo anterior la Mo es
Edad f fa
18 21 145
19 22 124
20 32 102
21 26 70
22 14 44
23 18 30
24 12 12
n= 145
De acuerdo con Levin y Levin (2002) la posición del valor de la Md también
se puede obtener con la fórmula:

Posición de la Md
Siguiendo con el ejemplo de la edad:

Posición de la Md

Para localizar el número 73 se saca la frecuencia acumulada (fa) la cual se
revisó al inicio de este capítulo.
Sofía Rivera Aragón
Mirna García Méndez
50
10 años de escolaridad, debido a que su frecuencia es la más alta en la
distribución: son 15 los sujetos que tienen estos años de escolaridad.
Ejercicio SPSS
Para obtener las medidas de tendencia central en SPSS, se retomará el ejercicio de
los significados generales del funcionamiento familiar desarrollado para extraer
los cuatro tipos de frecuencias. Recuerde que después de realizar los pasos 1, 2, 3
y 4 en el SPSS se obtuvo un menú. En este menú, ahora se coloca el cursor en el
icono de statistics y se presiona el botón izquierdo del mouse:
Estadística descriptiva 51
Al presionar statistics aparece un menú en el que se coloca el cursor en cada
uno de los cuadros de las tres medidas de tendencia central de nuestro interés -
media, mediana y moda— se presiona en estos cuadros con el botón izquierdo
del mouse, enseguida se coloca el cursor en el ícono de continue que se
presiona con el botón izquierdo del mouse.
Al presionar el icono de continue reaparece el menú del paso 4 y se presiona el
icono OK.
Sofía Rivera Aragón
52 Mirna García Méndez
Después de presionado el icono de OK aparecen en una tabla las medidas de
tendencia central con sus respectivos valores.
El valor de la media, mediana y moda es de 2, lo que indica una
distribución normal de las respuestas de la muestra.
Calcular medidas de dispersión (variabilidad)
Las medidas de dispersión son importantes en la descripción de la dis-
tribución, debido a que indican el grado en que varían los datos con relación a
la parte central de la curva normal, lo que las convierte en un elemento
inseparable de las medidas de tendencia central; además estas medidas de
dispersión sólo pueden aplicarse a medidas de rango e intervalares. Las más
empleadas son:
1. Rango
2. Desviación estándar
3. Varianza
4. Sesgo
5. Curtosis
6. Error estándar
Rango (R)
El rango también conocido como recorrido (Mendenhall, 1982; Downie
y Heath, 1973) es la distancia entre el valor mínimo y el valor máximo de
Estadística descriptiva 53

STATISTICS
Significados generales
N Valid 300
Missing 0
Mean 2.4900
Median 2.0000
Mode 2.00
una distribución. Su cálculo es fácil y rápido, no requiere de fórmula y se puede
utilizar en medidas ordinales e intervalares. Su desventaja radica en su inestabilidad,
esto es, de una muestra a otra, presenta grandes variaciones, por lo que se
recomienda emplearse como una medida preliminar.
Un ejemplo de esta medida de variabilidad es conocer el rango de
rendimiento escolar de 42 alumnos, cuya calificación más alta fue de 9 y la más
baja de 2. El R se obtiene de la resta 9-2 esto es el R = 7.
Desviación estándar
(o = parámetro de la población) (s = estimador de la muestra)
La desviación estándar únicamente se puede emplear en medidas intervalares.
Es una puntuación que indica la distancia con relación a la media, razón por la
que la media no tiene significado sin la desviación. De esta forma, como se
observa en la gráfica 11, la desviación representa la variabilidad promedio de una
distribución.
GRÁFICA 11
REPRESENTACIÓN DE LA DESVIACIÓN ESTÁNDAR EN
UNA DISTRIBUCIÓN NORMAL

Sofía Rivera Aragón
54 Mirna García Méndez
Para entender la desviación estándar de la cual depende la significancia, es
necesaria la curva (véase gráfica 12) que representa el 100 por ciento de la
probabilidad. De esta manera, 100 por ciento es el área bajo la curva.
GRÁFICA 12
REPRESENTACIÓN DE LA SIGNIFICANCIA A PARTIR DE LA DESVIACIÓN
ESTÁNDAR EN UNA DISTRIBUCIÓN NORMAL
Estadística descriptiva 54
Suma de frecuencias de puntajes crudos elevados al cuadrado
n = Número total de casos
(X)2 = Media elevada al cuadrado
s = Desviación estándar
donde:
Su fórmula es:

Ejemplo
Para calcular la desviación estándar del número de hijos en una muestra de
176 parejas, se realiza lo siguiente:
1. Se obtiene la distribución de frecuencia (/)
Núm. de hijos (x) f
1 49
2 74
3 34
4 15
5 4
n = 176
2. Se multiplica cada frecuencia por el número de hijos, esto es, 49 parejas
tienen un hijo, se multiplica 49 X 1; 74 parejas tienen dos hijos, se multiplica 74 X
2, y así sucesivamente.
Núm. de hijos (x) f fx
1 49 49
2 74 148
3 34 102
4 15 60
5 4 20
n = 176 S/x = 379
3. Se multiplica cada fx por el número de hijos y así se obtienen las fx2.
Núm. de hijos (x) fx fx2
1 49 49
2 148 296
3 102 306
4 60 240
5 20 100
2/x2 = 991
Sofía Rivera Aragón
Mirna García Méndez 56
Varianza (s2 o σ2)
La varianza es la desviación estándar al cuadrado, indica una distancia con
respecto a la X, su aplicación es el análisis de varianza (Anova)5 e indica cuánto
de la variabilidad de la variable dependiente es explicada por la variable
independiente. De esta forma muestra qué tanto de la variabilidad de la variable
dependiente es explicada por las diferencias de los individuos, proceso al que se
le conoce como varianza de error.
5 Siglas en inglés del análisis de varianza.
Estadística descriptiva 57
De acuerdo con la fórmula de la desviación estándar
se toma del punto dos.
falta obtener la media por lo que

4. Una vez que se tiene la X = 2.15 hijos, ésta se eleva al cuadrado (X)2 — 4.62
y entonces:
Sesgo
El sesgo se refiere a la variación de una distribución, es el grado de asimetría de
la distribución observada por el número de casos agrupados en una sola
dirección. Su interpretación está asociada con el valor y el signo, esto es:
Valor - 4 a + 4
Signo + -
El signo implica el nivel de asimetría de la curva, cuando más cercana está al
cero, la curva es normal, cuando más cercana está al cuatro, la curva es asimétrica
o sesgada.
Ejemplos
Una muestra de 60 mujeres se clasificó por la actividad que realizaban de la
siguiente manera: 1. estudiantes, 2. empleadas, y 3. sin actividad. En la gráfica 13
se puede ver que la mayoría de la muestra era estudiante, lo que se refleja en el
sesgo positivo de la gráfica 13.
GRÁFICA 13
ACTIVIDADES REALIZADAS POR MUJERES
Sofía Rivera Aragón
58 Mirna García Méndez
Al indagar en torno a los elementos que intervienen en el funcionamientofamiliar en una muestra de 300 sujetos, se encontró que 232 reportaron que la
comunicación es un indicador que interviene en el funcionamiento familiar. Estos
hallazgos se observan en la gráfica 14 que muestra un sesgo negativo debido a que la
curva está cargada a la derecha.
GRÁFICA 14
LA COMUNICACIÓN COMO ELEMENTO DEL
FUNCIONAMIENTO FAMILIAR
Curtosis (K)
Es el nivel de picudez de una curva, esto es, su grado de elevación o
aplanamiento. A diferencia del sesgo, la curtosis es una z4 sobre el número de
sujetos.

Estadística descriptiva 59
La curtosis al igual que el sesgo depende del valor y del signo:
a) Valor. Si el cero va de + 4 a - 4 la curva es mesocúrtica.
b) Signo. Si es positivo se habla de una curva leptocúrtica.
Ejemplos
El número de hijos en una muestra de 176 parejas fluctuó entre uno y cinco,
predominando las parejas con dos hijos, tal como se observa en la gráfica 15, lo
que hace que la curva sea alta o picuda (leptocúrtica).
GRÁFICA 15
NÚMERO DE HIJOS
La gráfica 16, representa una curva mesocúrtica, esto es, una distribución
normal en una muestra de 60 mujeres, 30 con diagnóstico que indica problemas
de alimentación y 30 sin problemas alimenticios.
La gráfica 17, muestra una curva platocúrtica hipotética, que se caracteriza
por su distribución relativamente plana.
De esta manera se observa que el sesgo y la curtosis indican la asimetría, el
sesgo hacia uno u otro lado de la curva y la curtosis a través de la elevación de la
misma.
Sofía Rivera Aragón
60 Mirna García Méndez
Error estándar (σ o e)
El error estándar es la diferencia entre la media muestral y la media
poblacional, está vinculado al error de muestreo.
GRÁFICA 16
DIAGNÓSTICO DE PROBLEMAS EN LA ALIMENTACIÓN
GRÁFICA 17
CURVA PLATOCÚRTICA
Estadística descriptiva 61
Ejercicio SPSS
Para obtener las medidas de dispersión en SPSS de una muestra de 300 personas a
las que se les aplicó la escala de depresión de Zung (1965) se llevan a cabo los
siguientes pasos:
Paso 1. En la base de datos se coloca el cursor en analyze, se presiona el botón
izquierdo del mouse, aparece un menú en el que se coloca el cursor en descriptive
statistics y se presiona el botón izquierdo del mouse, nuevamente se muestra un
menú en el que se presiona con el botón izquierdo del mouse, frequencies.
Paso 2. Al presionar frequencies, se abre un menú que contiene las variables de
la investigación, se marca con el botón izquierdo del mouse la variable rangos
(niveles de depresión).
Paso 3. Una vez señalada la variable rangos, se coloca el cursor en el icono que
está entre las variables de estudio y variable(s), se presiona el botón izquierdo del
mouse, lo que resulta en que rangos aparece en el cuadro de variable(s).
Posteriormente se coloca el cursor en el icono de statistics y se presiona el botón
izquierdo del mouse.
Sofía Rivera Aragón
62 Mirna García Méndez
Paso 4. Al presionar el icono de statistics aparece un menú en el que se
colocará el cursor en cada uno de los cuadros de las tres medidas
de dispersión -desviación estándar, varianza y rango- para después presio-
nar en cada cuadro con el botón izquierdo del mouse. De igual forma se
Paso 3
Estadística descriptiva 63
Paso 5. Después de presionar las medidas de dispersión y la curtosis, se coloca
el cursor en el icono de continue y se presiona con el botón izquierdo del mouse, de
lo que resulta el menú del paso tres. En el menú del paso tres, se coloca el cursor
en el icono de OK, se presiona el botón izquierdo del mouse y aparecen las medidas
de dispersión y la curtosis con sus respectivos valores.
coloca el cursor en el cuadro de kurtosis y se presiona el botón izquierdo del mouse.
STATISTICS
Rangos
N Valid
Missing
330
22
Std. Deviation .6458
Variance .4171
Kurtosis 6.138
Std Error of Kurtosis .268
Range 3.00
Sofía Rivera Aragón
Mirna García Méndez 64
Los valores de la tabla del SPSS indican que de los 330 casos analizados, 22
quedaron fuera debido a que dejaron sin contestar varios de los reactivos que
incluye la escala. Los valores de la desviación estándar y la varianza indican una
distribución normal, la curtosis muestra que la mayoría de las personas se ubica
en uno de los cuatro rangos de depresión, y el rango señala que de los cuatro
intervalos de respuesta de la escala, el 3 fue el que obtuvo mayor frecuencia.
Como parte final de este capítulo, la tabla 15 presenta las pruebas de la
estadística descriptiva y los tipos de gráficas asociadas con el nivel de medición
revisados en el capítulo uno.
Estadística descriptiva 65

TABLA 15
ESTADÍSTICA DESCRIPTIVA

Medidas de
Gráficas tendencia central
Medidas de
dispersión
Correlación
Nominal Barras
Pastel
Moda No hay Coeficiente Phl
C de contingencia
V de Cramer
Ordinal Barras
Pastel
Moda
Mediana
No hay Tau b de Kendall
Tau c de Kendall
Gamma de KrusKal y
Godman
Spearman
Incertldumbre
Intervalar Ojiva
Polígonos de
frecuencia
Histograma
Moda
Mediana
Media
1. Rango
2. Error
3. Desviación
4. Varianza
5. Sesgo
6. Curtosis
Eta
Pearson
Estadística inferencial
La estadística inferencial se basa en la prueba de hipótesis, se define como un
conjunto de técnicas que permiten al investigador obtener conclusiones a partir
de una muestra para después ser generalizadas a una población. De este modo,
su principal función es la generalización en una población (parámetros)
habitualmente en términos de probabilidad (Nunnally y Bernstein, 1995) a partir
de las conclusiones obtenidas, resultado de la manipulación de variables en
muestras observadas.
Aplicaciones de la
estadística inferencial
a) Comparar parámetros. Un parámetro es cualquier característica de una
población.
b) Aplicar pruebas de hipótesis.
Hipótesis conceptual
Deriva del marco teórico, parte de una teoría, un modelo teórico o un
metanálisis. Son hipótesis que ya fueron planteadas por otro investigador.
Ejemplo
A mayor frustración mayor agresión (Dollar, Doob, Miller, Mowrer y Sears,
1939).
Hipótesis de trabajo
Estas hipótesis se refieren a lo que espera encontrar el investigador a partir
de un marco teórico.
69
Ejemplo
Existe relación entre el aprovechamiento escolar y la autoestima.
Hipótesis estadísticas
Se clasifican en nulas y alternas, presentan las siguientes características: 1.
implican la relación entre variables, y 2. se plantean sólo cuando se aplica
estadística en la investigación (véase tabla 16). Un punto importante de señalar
es que en los estudios exploratorios no se deberán proponer ninguna de estas
hipótesis (nulas y alternas).
TABLA 16
HIPÓTESIS ESTADÍSTICAS
Tipo Notación Definición Formas Función
Nula Ho Niega la relación o
diferencia entre
variables
a) Comparación
b) Relación
Diferencias entre grupos
Asociación entre variables
Alterna H1 Presencia de la
relación o la diferencia
a) Comparación
b) Relación
I. Con dirección. Indica que
uno de los parámetros es
más bajo o más alto que
otro.
II. Sin dirección. Sólo
compara grupos.
II. Con dirección. Indica
que las variables aumen-
tan o disminuyen.
II. Sin dirección. Sólo
establece relaciones.
Sofía Rivera Aragón
Mirna García Méndez 70
Ho de relación
V1 = Agresión (X)
v2 = Niveles de testosterona (Y)
Ho = No existe relación entre agresión y el nivel de testosterona en hombres.
Con notación estadística
Ho: rxy = 0
H1 de comparación sin dirección. Utiliza los dos lados de la curva.
Estadística inferencial 71
Ejemplos
Ho de comparación
Se identifica la variable dependiente (VD) y la independiente (VI) o de
clasificación (VE).
VD = Asertividad
vc = Sexo: hombres y mujeres
Ho = No existen diferencias estadísticamente significativas en la asertividad
entre hombres y mujeres.
Con notación estadísticaVD = Calidad de vida
vc = Estado civil: casados y solteros
H1 = Sí hay diferencias estadísticamente significativas en la calidad de vida
entre solteros y casados.
Con notación estadística
Los solteros tienen mayor calidad de vida que los casados. Con notación
estadística
Sofía Rivera Aragón
Mirna García Méndez 72
H1 de comparación con dirección. Se ocupa de un solo lado de la curva
H1 de relación sin dirección
V1 = identidad nacional (X)
V2 - Edad (Y)
H1 = Existe relación entre la identidad nacional y la edad en los uni-
versitarios.
Con notación estadística
H1 = rxy ≠ 0
H1 de relación con dirección
H1 = a mayor identidad nacional mayor edad en los universitarios
Con notación estadística
H1 = rxy > + 0
H1 = a mayor identidad nacional menor edad en los universitarios
Con notación estadística
H1 = rxy > - 0
Clasificación de la estadística inferencial
No paramétrico
Es una estadística de distribución libre, se basa en frecuencias, porcentajes y
rangos, estos últimos basados en rangos de ordenación los cuales son buenas
medidas de variabilidad para muestras pequeñas, no así para muestras grandes.
Las pruebas de la estadística no para- métrica se enfocan en las diferencias entre
las medianas y parten de un modelo que especifica únicamente condiciones muy
generales en torno a la distribución de la cual fue obtenida la muestra (Siegel y
Castellan, 2003).
Estadística inferencial 73
Ventajas
a) Se puede aplicar a muestras pequeñas en las que la n > 4.
b) Sus niveles de medición son nominal y ordinal. En el nivel nominal se
pueden tratar datos que impliquen clasificación (sexo: hombre o mujer). En
el nivel de medición ordinal, el investigador concluye que algunos sujetos
de investigación tienen más o menos del atributo medido, sin determinar
qué tanto más o qué tanto menos.
c) Si se aplica a variables intervalares, éstas deberán ser convertidas en
categorías. Por ejemplo:
d) Está libre de parámetros. Se refiere a que su distribución es libre.
Desventajas
Cuando se aplica a variables intervalares sin ser convertidas en categorías, se
infla el valor de la prueba y se comete el error estadístico conocido como error
tipo 1 o alfa que consiste en rechazar la Ho cuando es verdadera, situación que
conduce a conclusiones falsas.
Dadas las características de la estadística no paramétrica, existe una
diversidad de pruebas que pueden ser empleadas con base en los requisitos
citados. En la tabla 17 se presentan las pruebas no paramétricas más utilizadas,
así como una serie de elementos que facilitan la toma de decisiones con relación
a las condiciones que se deben cubrir para emplear una u otra prueba.
Sofía Rivera Aragón
Mirna García Méndez 74
TABLA 17
PRUEBAS DE LA ESTADÍSTICA NO PARAMÉTRICA
Prueba Objetivo Nivel de
medición
Diseño Muestreo Instrumentos
X2
Bondad de
ajuste
Conocer la
distribución de
la muestra
Nominal y
ordinal
De una muestra No
probabi-
lísticos
Cuestionarios:
abiertos cerrados
Jerarquización
observaciones
Por homo-
geneidad
Conocer si
existen dife-
rencias entre
dos o más gru-
pos
Nominal y
ordinal
De dos o más
muestras inde-
pendientes

Indepen-
dencia
Conocer si
existe relación
entre dos o más
variables
Nominal y
ordinal
De una muestra
Corrección de
Yates
Conocer dife-
rencias o aso-
ciación entre
variables en
muestras pe-
queñas
Nominal y
ordinal
De una muestra o
de dos muestras
independientes

McNemar Comparar si
existen dife-
rencias antes y
después de un
evento
Nominal y
ordinal
Pretest-postest
Antes-después
Una sola muestra
medida dos veces
No proba-
bilístico
Cuestionarios:
abiertos cerrados
jerarquización
observaciones
T de
Wilcoxon
Comparar si
existen dife-
rencias antes y
después de un
evento
Ordinal Pretest-postest
Antes-después
Una sola muestra
medida dos veces
No proba-
bilístico
Los mismos que
en X2 y McNemar
U de Mann
Whitney
Comparar si
existen dife-
rencias entre
dos grupos
Ordinal Dos muestras in-
depend ¡entes
No proba-
bilístico
Los mismos que
en las pruebas
a n t e r i o r e s ,
además de escalas
Análisis de
varlanza de
KrusKall Wa-
llis
Comparar si
existen dife-
rencias entre
tres o más gru-
pos
Ordinal Más de dos
muestras inde-
pendientes
Probabilís-
tico
Escalas
Estadística Inferencial 75
Paramétrica
La estadística inferencial paramétrica se sustenta en supuestos o parámetros
y para poder emplearla es necesario cubrir los siguientes principios:
1. Distribución normal.
Indica que los grupos tienen una curva normal o mesocúrtica (esta curva
se describe en el capítulo 2, figura 8). Con esta afirmación se asume
que las muestras (n) con las que se está trabajando se han extraído de
TABLA 17
(Continuación)
Prueba Objetivo Nivel de
medición
Diseño Muestreo Instrumentos
Análisis de
varianza de
Friedman
C o m p a r a r
tres o más
mediciones en
un grupo
Ordinal De medidas
r e p e t i d a s
Tres o más
muestras re-
lacionadas
No proba-
bilístico
Probabilís-
tico
Escalas
Spearman rho
(rs) coeficiente
de asociación
Conocer re-
laciones entre
dos variables
Ordinal De una sola
muestra
No proba-
bilístico
Probabllís-
tico
Escalas
Phi Coeficiente
de asociación
Conocer re-
laciones entre
dos variables
N o m i n a l .
Se aplica a
tablas de
contingencia
de 2x2 (tablas
pequeñas)
De una sola
muestra
No proba-
bilístico en
m u e s t r a s
grandes
Pruebas* com-
paradas que se
aplican en
C de con-
tingencia
Conocer re-
laciones entre
dos variables
N o m i n a l .
Se aplica a
tablas de
contingencia
mayores de
2x2 (tablas me-
dianas)
De una sola
muestra
No proba-
bilístico
Pruebas com-
paradas que se
aplican en X2
V de
Cramer
Conocer re-
laciones entre
dos variables
N o m i n a l .
Corrección a la
C de
contingencia
De una sola
muestra
No proba-
bilístico
Cuestionarios:
abiertos
cerrados
jerarquización
observaciones
*La prueba Phi y la C de contingencia dependen de la X2.
Sofía Rivera Aragón
Mirna O a roía Méndez 76
poblaciones normalmente distribuidas, si no es éste el caso, se dice que las
pruebas estadísticas que dependen del principio do normalidad están
viciadas, razón por la que las conclusiones obtenidas a partir de las
observaciones de estas muestras estarán en tela de juicio.
2. Homecedasticidad de varianza u homogeneidad de varianza.
La distancia entre la calificación de un grupo y los de otro grupo deben ser
iguales, esto es, la distancia de las X a todas las puntuaciones individuales.
Este principio supone que las varianzas dentro de los grupos son es-
tadísticamente las mismas, o sea, que las varianzas son homogéneas de un
grupo a otro (Kerlinger y Lee, 2001). Esta situación puede provocar el error
estadístico tipo 2 o beta, que consiste en aceptar la Ho cuando es falsa.
3. Selección y asignación aleatoria.
Sólo se aplican muestreos probabilísticos entendidos como la técnica en la
cual todos los sujetos tienen la misma probabilidad de ser elegidos. También
en la estadística paramétrica se utiliza el muestreo no probabilístico,
definido como aquel en el que las personas no tienen la misma probabilidad
de ser elegidos. Sin embargo, al emplear alguna de las técnicas de muestreo
no probabilístico es conveniente replicar los estudios. De acuerdo con
Kerlinger y Lee (2001) el muestreo probabilístico no es necesariamente
superior al no probabilístico en todas las situaciones. Refieren que en el
primero el énfasis está en el método y la teoría que lo sustenta, mientras que
en el segundo, el énfasis se encuentra en la persona que hace el muestreo.
Puesto que no es el propósito de este apartado profundizar en las técnicas
de muestreo, en la tabla 18 se mencionan algunas de ellas.
4. La variable dependiente debe ser medida a nivelintervalar.
Esto significa que las medidas deberán ser continuas con intervalos iguales,
ejemplo, las escalas tipo Likert de estilos y estrategias de poder (Rivera y
Díaz-Loving, 2001) y el inventario multifacético de satisfacción marital
(Cañetas, 2000). Ambas son pruebas con cinco intervalos de respuesta.
Estadística inferencial 77
La tabla 19 muestra las pruebas paramétricas más empleadas por el
investigador social, además de los criterios que se deben tomar en cuanta para
emplear una u otra prueba. La revisión en detalle de algunas de estas pruebas se
expondrá en el capítulo 5 de este texto.
TABLA 18
TÉCNICAS DE MUESTREO
Técnicas de muestreo probabilístico Técnicas de muestreo no
probabilístico
Aleatorio simple Accidental
Aleatorio con reemplazo Intencional
Estratificado Por cuota
Por conglomerado
Estratificado
TABLA 19
PRUEBAS DE LA ESTADÍSTICA PARAMÉTRICA*
Prueba Objetivo Nivel de
medición
Diseño Muestreo Instrumentos
Coeficiente
P r o d u c t o -
m o m e n t o de
Pearson
Relacionar dos
variables
Intervalar De una sola
muestra
C o r r e l a c i o -
nal bivariado
Proba bilis-
tico:
M u e s t r a
grande
Escalas
Prueba t de
student
Discrimina-
ción de
reactivos
VD a nivel
I n t e r v a l a
r
De dos muestras
independientes
Probabilís-
tico:
M u e s t r a
p e q ue ñ a n
< 3 0
Escalas
Comparar dos
grupos
VI {Nominal
VC {y
VE {Ordinal
De dos muestras
independientes

Comparar dos
condiciones o
mediciones
Prueba post hoc
del Anova
Dos muestras
relacionadas
pretest-pos- test
Antes-después
M u e s t r a
grande n >
30

Sofía Rivera Aragón
Mirna García Méndez
78
Prueba Objetivo Nivel de
medición
Diseño Muestreo Instrumentos
Anova
(análisis de
varianza)
a) simple de
una vía
Compara tres o
más grupos
La VD debe ser
in-ervalar
Tres o más
muestras in-
dependientes
Probabilisti-
co:
Muestra
grande
Escalas
b) factorial de
dos vías
Comparar dos o
más variables
Independientes
con tres o más
categorías
vi {Nominal
vc {y
ve {Ordinal
Factoriales Muestra
grande 15
sujetos míni-
mo por cel-
dilla

*VC se refiere a las variables de clasificación y VE a las variables de estímulo.

Pruebas de la estadística no
paramétrica
Cuando existe duda respecto a la normalidad de la población o
cuando la población no es normal es conveniente emplear una prueba no
paramétrica, que como ya se mencionó en el capítulo 3 no parten del principio
de normalidad. Asimismo, las pruebas no paramétricas se clasifican en tres
grupos: para una muestra simple, para muestras relacionadas y para muestras
independientes.
Debido a la amplia variedad de pruebas en cada uno de estos grupos, en
este capítulo sólo se describirán las de mayor uso en la investigación en
psicología.
Pruebas para una muestra simple
Generalmente las pruebas para una muestra simple son pruebas de bondad de
ajuste que tienen como objetivo conocer la distribución de la muestra.
Chi cuadrada (X2)
La chi cuadrada es la prueba más empleada en la investigación en psicología.
Esta prueba se aplica para comparar las frecuencias esperadas (poblacionales)
y las frecuencias obtenidas (muestra) y a partir de esta comparación decidir si
existen diferencias significativas. Las frecuencias esperadas se refieren a la
hipótesis nula (Ho) y las frecuencias obtenidas son los resultados alcanzados
por el investigador. De este modo, mientras mayor sea el valor de X2 menor es
la probabilidad de que las frecuencias obtenidas se deban a la población, esto
83
La fórmula para obtener las fe es
fe= N /k
donde:
N = número de personas.
k = número de categorías o columnas.
De esta manera, el procedimiento para obtener la X2 consiste en restar cada
frecuencia esperada de su correspondiente frecuencia obtenida, la diferencia de
esta resta, se eleva al cuadrado y se divide entre la frecuencia esperada, estos
resultados parciales se suman y se obtiene el valor de la chi cuadrada.
Una vez que se obtiene el valor de la chi cuadrada, se requiere conocer los
grados de libertad (gl) que se definen como la amplitud de variación contenida
en una condición de investigación, lo que significa la posibilidad de variación
(Kerlinger y Lee, 2001; Downie y Heath, 1973). Asimismo, junto con los grados
de libertad, se requiere de una tabla de valores de X2 para conocer de acuerdo
con los gl y al valor de la X2, si ésta es o no significativa.
Sofía Rivera Aragón
Mirna García Méndez
84
significa que el valor de chi cuadrada es significativo si la diferencia entre las
frecuencias esperadas y las frecuencias obtenidas es lo suficientemente grande
(Siegel y Castellan, 2003; Levin y Levin, 2002). Su fórmula es:
suma de todas las casillas, de la primera a la última.
frecuencia obtenida,
frecuencia esperada.
donde:
La fórmula para obtener los grados de libertad es:
gl = k - 1
donde:
k = número de columnas de la tabla de contingencia
También la X2 se utiliza en muestras independientes, en este caso se le
conoce como prueba de homogeneidad y su objetivo es conocer si existen
diferencias entre dos o más grupos.
Un tercer uso de esta prueba, es como prueba de independencia, aquí su
objetivo es conocer si existen relaciones entre dos o más variables en una
muestra.
Un cuarto uso es como prueba de corrección por continuidad de Yates, la cual le
da mayor precisión a la X2 cuando tiene fe pequeñas.
En los tres primeros casos -bondad de ajuste, homogeneidad, independencia- la chi
cuadrada se obtiene con la misma fórmula.
Reglas para su empleo
1. Las observaciones deben ser independientes, no se puede observar o
medir a la misma persona más de una vez.
2. El nivel de medición utilizado será nominal u ordinal.
3. Se aplicará en muestreos no probabilísticos.
4. La muestra deberá ser mayor a 20 {N > 20).
5. Si la muestra N < 20 entonces se utiliza la prueba de probabilidad exacta
de Fisher.
6. Las frecuencias esperadas deben ser mayores a 5.
7. Si la frecuencia esperada es > 5 y < 10, entonces se aplica la corrección por
continuidad de Yates.
8. Si la N > 20 y < 40, se aplica la prueba de corrección por continuidad de
Yates.
9. Si la tabla de contingencias es de 1 X i columnas, se aplica la X2 de
bondad de ajuste.
Pruebas de la estadística
no paramétrica 85
10. Si la tabla de contingencia ese de 2 x 2 y cumple los requisitos 7 y 8, se
aplica la prueba de corrección por continuidad de Yates.
Procedimiento
1. Plantear las hipótesis estadísticas.
2. Determinar la probabilidad con la que se trabajará: p = .05, p = .01.
3. Distribuir los puntajes en la tabla de contingencia.
4. Calcular las frecuencias esperadas:
5. Aplicar la fórmula.
6. Obtener los gl.
7. Plantear regla de decisión.
Este estudio tiene como propósito identificar el consumo de productos chatarra,
en una muestra de 60 niños preescolares de la ciudad de México, así como la
preferencia por alguno de estos productos. Entendiéndose por productos
chatarra: pastelitos, frituras, refrescos y dulces.
Paso 1. Hipótesis.
Ho: no existen diferencias significativas en el consumo de productos
chatarra en niños preescolares.
H1: existen diferencias significativas en cuanto al consumo de productos
chatarra por parte de los niños preescolares.
Paso 2. Nivel de significancia p = .05.
Paso 3. Distribución de los datos.
Pastelitos Frituras Refrescos Dulces N
fo fe
15 15
fo fe
28 15
fo fe
0 15
fo fe
7 15

60
Paso 4. Cálculo de fe.
Sofía Rivera Aragón
Mirna García Méndez 86
Paso 6. Obtener los grados de libertad.
gl = k - 1
gl = 4 - 1
gl = 3

Paso 7. Reglade decisión.
X2 ≥ X2t  H1 se acepta y Ho se rechaza.
X2t = chi cuadrada en tablas. En la tabla A del apéndice, se busca en la parte
horizontal, el nivel de significancia previamente establecido .05, y en la parte
vertical los gl, que en este ejemplo fue de 1. Esto resulta en lo siguiente:
17.18 ≥ 7.82. Se acepta la H1
Pruebas de la estadística
no paramétrica 87
Paso 5. Desarrollo de la fórmula.
Interpretación de resultados
Se encontraron diferencias significativas X2 = 1 7 . 1 8 , p = .05 en el consumo de
alimentos chatarra en los niños preescolares, lo que significa que difieren en el
consumo de estos productos.
Ejercicio SPSS
Se empleará el mismo ejercicio desarrollado por la fórmula de preferencias de
productos chatarra por niños preescolares.
Paso 1. Se crea una variable que se denominará preferencias e incluirá 5
niveles de respuesta: 1 = pastelitos; 2 = frituras; 3 = refrescos; y 4 = dulces.
Debido a que incluir las respuestas de los 60 niños en la base de datos implica
mucho espacio, únicamente se presentarán los datos de 10 niños, pero el análisis y
los resultados se llevarán a cabo con el total de las respuestas de los participantes.
De esta manera la base de datos queda así:
Sofía Rivera Aragón
Mirna García Méndez 88
Paso 2. Se coloca el cursor en Analyze, se presiona el botón izquierdo del mouse y
se muestra un menú en el que se coloca el cursor en Non-parametric test, aparece un
menú en el que se coloca el cursor en Chi- Square y se da clic.
Paso 3. Al hacer clic en Chi-Square se abre un menú.
Pruebas de la estadística
no paramétrica 89
Paso 4. En el menú del paso 3, se marca con el cursor la variable preferencias, se
da clic en el icono ubicado entre la variable preferencia y Test Variable List,
inmediatamente la variable preferencias aparece en Test Variable List.

Paso 5. Se da clic en OK y se muestran los resultados en tablas.
PREFERENCIAS
Observed N Expected N Residual
Pastelillos 15 15.0 .0
Frituras 28 15.0 13.0
Refrescos 10 15.0 -5.0
Dulces 7 15.0 -8.0
Total 60
Sofía Rivera Aragón
Mirna García Méndez 90
Como se puede observar en la tabla 20, la X2 y la p difieren un poco de los
resultados con la fórmula desarrollada, esto se debe a que en el SPSS las
operaciones se realizan en forma precisa.
Interpretación de resultados
Se encontraron diferencias significativas X2 = 17.20, p = .001 en el consumo
de alimentos chatarra en los niños preescolares, lo que significa que difieren en
el consumo de estos productos.
Pruebas para muestras relacionadas
Estas pruebas implican dos medidas de una sola muestra. Se emplean cuando
el investigador desea conocer si un tratamiento es mejor que otro o si
dos tratamientos son diferentes. En este tipo de estudios se pueden em-
TEST STATISTICS
Preferencias
Chi-Squarea 17.200
df 3
Asymp. Sig. .001
a.0 cells (.0%) have expected frequencies less than 5. The
minimum expected cell frequency is 15.0.
Estas tablas no se presentan en el reporte de investigación, los datos
contenidos en ellas se pueden presentar en tablas en otro formato.
TABLA 20
DIFERENCIAS EN EL CONSUMO DE PRODUCTOS CHATARRA
Pastelitos Frituras Refrescos Dulces X2 gl p
15 28 10 7 17.20 3 .00 1
N = 60.
Pruebas de la estadística
no paramétrica
91
plear dos grupos, sin embargo, los resultados que se obtengan pueden estar
relacionados con un conjunto de eventos ajenos al tratamiento. Estos eventos se
conocen como variables extrañas. Con la finalidad de controlar el efecto de
estas variables extrañas, la persona puede fungir como su propio control, esto
es, se le expone a ambas condiciones en diferentes ocasiones. Otra alternativa es
el método de apareamiento, en el que se seleccionan pares de personas lo más
semejantes posible en torno de las variables extrañas que puedan influir en los
resultados del tratamiento. El inconveniente de este método es que depende de
la capacidad del investigador para establecer que tan iguales son los pares
(Siegel y Castellan, 2003).
McNemar
Es una prueba útil en los diseños antes-después (Álvarez, 1995) en los que cada
sujeto se utiliza como su propio control. En la prueba de McNemar el objetivo es
probar la significación de los cambios observados a partir de una tabla de
contingencia 2x2 (Siegel y Castellan, 2003; Conover, 1980).
Para probar la significancia de los cambios observados, los datos en la tabla
expresan lo siguiente:
Sofía Rivera Aragón
Mirna García Méndez
92
Los grados de libertad empleados en McNemar es 1. gl = 1.
Para obtener resultados más precisos, se emplea la corrección por
continuidad que permite eliminar la fuente de imprecisión que resulta de
emplear una distribución continua para aproximarse a una distribución discreta
(Siegel y Castellan, 2003).
Con esta corrección, la fórmula se expresa de la siguiente manera:
Pruebas de la estadística
no paramétrica 93
Los signos positivo y negativo sólo se emplean para indicar que hubo un
cambio sin connotación de bueno o malo.
Como se observa en la tabla, A + D son las personas cuyas respuestas
cambiaron. De esta manera, la Ho plantea que el número de cambios en cada
dirección es el mismo.
Sustituyendo la fórmula:
suma
frecuencia obtenida
frecuencia esperada
donde:
se obtiene lo siguiente:
El signo | indica que al resultado de la resta de A - D, sin importar el signo +
o - se le resta el 1. Por ejemplo, 6-15 = - 9, entonces se resta 9 - 1 = 8
Reglas para su empleo
• En mediciones nominales y ordinales.
• Que el número total de cambios sea mayor a 10.
• Cuando la frecuencia esperada es menor a 5, se debe usar otra prueba.
Procedimiento
1. Plantear las hipótesis estadísticas.
2. Determinar la probabilidad con la que se trabajará p=05, p = . 0 1 .
3. Distribuir los puntajes en la tabla de contingencia.
4. Aplicar la fórmula.
5. Plantear regla de decisión.
Ejercicio
Para evaluar la efectividad de un programa de intervención con 50 padres
de familia de ciudad Nezahualcóyotl, se les preguntó si estaban de acuerdo o en
desacuerdo con que sus hijos recibieran educación sexual en la escuela, tema a
tratar como parte del programa a través de un taller. Antes del taller se les
preguntó si estaban de acuerdo o en desacuerdo y al término del taller se les
volvió a hacer la misma pregunta.
Paso 1. Hipótesis
Ho. La probabilidad de las madres que cambiaron de acuerdo a desacuerdo
es igual a la probabilidad de las madres que cambiaron de desacuerdo a
acuerdo en lo concerniente a que sus hijos reciban educación sexual en la
escuela.
H1. Después de haber asistido a un taller, las madres aceptan que sus hijos
reciban educación sexual en la escuela.
Paso 2. Nivel de significancia a emplear p = .05.
Sofía Rivera Aragón
Mirna García Méndez 94
Paso 5. Regla de decisión.
X2 ≥ X2t H1 se acepta e Ho se rechaza.
X2t = chi cuadrada tablas. En la tabla A del apéndice, se busca en la parte
horizontal, el nivel de significancia previamente establecido .05, y en la parte
vertical los gl, que en este ejemplo fue de 1. Esto resulta en que se acepta la H1.
10.25 ≥ 3.84. Se acepta la H1.
Interpretación de resultados
Estos resultados indican que el taller influyó en la opinión, ya que las
madres que estaban en desacuerdo con que sus hijos reciban educación
sexual en la escuela, ahora en su mayoría están de acuerdo (X2 =10.25, p=.05)
Despues
Desacuerdos Acuerdos
Antes Acuerdos 9 6
Desacuerdos 5 30
Pruebas de la estadística
no paramétrica 95
Paso 3. Distribución de las respuestas de los padres antes y después del taller.
Paso 4. Desarrollo de la fórmula.
Ejercicio SPSS
La base de datos contiene las respuestas de los 50 padres de familia; sin embargo,
con fines prácticos en esta tabla únicamente se incluye la información de 20
padres. La base de datos del paso 2, sólo incluye 10 de los 20 casos,